Регистрирай се

Отворен научен обзор: юли 2024 г

В този брой представяме новина от Уелет Потър, преподавател по право от Университета на Нова Англия, САЩ. Препубликуван е от Разговорът чрез Creative Commons CC-BY-ND.

Академичен издател сключи сделка за AI данни с Microsoft – без знанието на техните автори

През май мултинационална компания с милиарди долари, базирана в Обединеното кралство, наречена Informa, обяви в a актуализация на търговията че е подписала сделка с Microsoft, включваща „достъп до усъвършенствано учебно съдържание и данни и партньорство за изследване на експертни приложения за AI“. Informa е компанията майка на Тейлър и Франсис, който публикува широка гама от академични и технически книги и списания, така че въпросните данни може да включват съдържанието на тези книги и списания.

Според доклади, публикувани през юли, авторите на съдържанието изглежда не са били попитани или дори информирани за сделката. Нещо повече, те казват, че не са имали възможност да се откажат от сделката и няма да получат пари от нея.

Учените са само последната от няколко групи от това, което бихме могли да наречем създатели на съдържание, които се обидиха, че тяхната работа е погълната от генеративните AI модели, които в момента се надпреварват да събират продуктите на човешката култура. Вестницивизуални художници намлява звукозаписни компании вече дават компаниите за ИИ на съд.

Въпреки че не е ясно как Informa ще реагира на шума на недоволство, сделката е напомняне на авторите да са наясно с договорните условия на споразуменията за публикуване, които подписват.

Какво има в сделката с Informa?

Актуализацията на Informa посочва четири фокусни области на сделката с Microsoft:

  • увеличаване на собствената продуктивност на Informa
  • разработване на автоматизиран инструмент за цитиране
  • разработване на базиран на изкуствен интелект софтуер за асистент за изследване (може би като система, която се тества от онлайн академична библиотека JSTOR)
  • предоставяне на достъп до данни на Microsoft, за да „помогне за подобряване на уместността и производителността на AI системите“.

На Informa ще бъдат платени повече от 8 милиона паунда (15.5 милиона австралийски долара) за първоначален достъп до данните, последвани от периодични плащания на неопределена сума за следващите три години.

Не знаем какво точно планира Microsoft да направи с достъпа си до данни, но вероятният сценарий е, че съдържанието на академични книги и статии ще бъде добавено към данните за обучение на подобни на ChatGPT генеративни AI модели. По принцип това би трябвало да направи изхода на AI системите по-точен, въпреки че съществуващите модели на AI са изправени пред тежка критика, не само за регургиране на данни за обучение без цитиране (което може да се разглежда като вид плагиатство), но и за измисляне на невярна информация намлява приписване към реални източници.

Актуализацията обаче също така казва, че „споразумението защитава правата върху интелектуалната собственост, включително ограничения за дословни текстови извадки и привеждане в съответствие относно важността на подробните препратки към цитати“.

Споменатите „ограничения за дословни извадки от текст“ вероятно се отнасят до Американската доктрина за честна употреба, което позволява определени употреби на материали, защитени с авторски права.

Много генеративни AI компании в момента са изправен пред съдебни дела за нарушаване на авторски права над използването им на данни за обучение и техните защити вероятно ще разчитат на твърдения за честна употреба.

„Важността на подробните препратки към цитиране“ може да се отнася до концепцията за приписване на авторство в авторското право. Това е морално право притежавани от автори. Той предвижда, че създателят на произведението трябва да бъде известен и посочен като автор, когато неговото произведение се възпроизвежда.

Как обикновено функционира научното публикуване?

Повечето академици не получават заплащане или печалба от повечето си научни публикации. По-скоро писането на списания и доклади за конференции обикновено се счита за част от обхвата на работа в рамките на длъжност на пълен работен ден. Публикацията изгражда авторитета на академика и насърчава неговите изследвания.

Основният процес често протича по следния начин: автор проучва и пише оригинална статия и я изпраща на издател на списание за партньорска проверка. Повечето рецензенти и членове на редакционния съвет също не получават заплащане за работата си.

Всъщност някои списания може да изискват от авторите да плащат „такса за обработка на артикул”, за да покрие редактиране и други разходи. Това може да бъде хиляди долари за свободен достъп публикация. Най-общо казано, колкото по-престижно е изданието, толкова по-висока е цената.

Ако дадена статия премине партньорска проверка, авторът ще бъде помолен да подпише a договор за публикуване. Условията могат да обхващат логистични договорености, като например кога ще бъде публикувана статията, форматът (печатен, онлайн или и двете) и разделянето на възнагражденията (ако е приложимо). Ще има също договорености относно авторските права и собствеността върху статията.

Авторът обикновено също трябва да предостави изключителни права на издателя да разпространи и публикува статията. Това може да означава, че авторът не може да публикува статията другаде и издателят може също така да може да преотстъпи статията на трета страна, като например компания за изкуствен интелект.

Понякога издателите изискват от автора да им прехвърли авторските права върху статията чрез постоянно договор за прехвърляне на авторски права.

По същество това означава, че авторът предоставя всички свои авторски права като носител на авторските права върху произведението на издателя. След това издателят може да възпроизвежда, комуникира, разпространява или лицензира произведението на други, както пожелае.

Възможно е да се присвоят само ограничени права, а не всички права и това е нещо, което авторите трябва да имат предвид.

Копаене на съдържание

Изключително важно е авторите да разбират последиците от лицензирането и възлагането и да обмислят точно какво се съгласяват, когато подписват договор. В светлината на скорошната тенденция на издатели, които сключват споразумения с компании за генериране на AI, политиките на издателите за ИИ също трябва да бъдат внимателно проучени.

В САЩ стандарт решение за колективно лицензиране за използване на съдържание във вътрешни AI системи наскоро беше публикуван, който определя правата и възнагражденията за притежателите на авторски права. Подобни лицензи за използване на съдържание за AI системи вероятно ще навлязат на австралийския пазар много скоро.

Видовете споразумения, които се постигат между академичните издатели и компаниите, занимаващи се с изкуствен интелект, предизвикаха опасения за по-широка картина за много академици. Искаме ли научните изследвания да бъдат сведени до съдържание за AI извличане на знания? Няма ясни отговори относно етиката и морала на подобни практики.

За автора:

Д-р Уелет Потър е преподавател в Юридическия факултет на Университета на Нова Англия, Армидейл. Горда възпитаничка на UNE, тя стана член на персонала на пълно работно време през 2022 г., след като получи докторска степен по право през март 2021 г. Преди 2022 г. тя прекара единадесет години като сесиен академик в Юридическия факултет на UNE, участвайки в над 25 правни единици.


Големи истории в Open Science

CERN предоставя „как да“ на своя отворен научен офис

Офисът за отворена наука на CERN, ръководен от Anne Gentil-Beccot, предлага насоки за публикуване с отворен достъп, управление на изследователски данни и софтуер с отворен код, за да направи научните изследвания по-достъпни и ефективни. Създаден през 2023 г., офисът предоставя ресурси, организира управленски срещи и планира бъдещи курсове за обучение, имайки за цел да подкрепи дългогодишния ангажимент на CERN към отворената наука. За повече подробности относно това как изследователската и научната общност може да допринесе и да се възползва, вижте пълна статия.

Мета си сътрудничи с изследователи за изследване на психичното здраве на тийнейджърите

Meta обяви нова пилотна програма, която да даде на изследователите от Център за отворена наука (COS) достъп до данните на Instagram за шест месеца. Програмата има за цел да изследва и анализира въздействието на социалните медийни платформи върху психичното здраве на тийнейджърите. Кумар Хемант, заместник редактор в Candid.Technology и Ема Рот в Verge, проучете проблема.

Допълнителна информация: Международният научен съвет наскоро стартира програма за психично здраве за млади хора като част от меморандум за разбирателство със Световната здравна организация https://council.science/our-work/mental-wellbeing-young-people/

Съобщение на Global Diamond Open Access Alliance

ЮНЕСКО беше домакин на онлайн събитие на 10 юли, за да представи и официално обяви Global Diamond Open Access Alliance, подчертавайки неговата визия, мисия и цели, и да ангажира заинтересованите страни в съвместни усилия за насърчаване на Diamond Open Access.

Вижте записа на събитието тук.

Почтеността е заложена на карта: конфронтация “публикуват или загиват” в развиващия се свят и нововъзникващите икономики

- „публикувай или загини“ културата доведе до значителни етични предизвикателства в научното публикуване, особено в развиващите се икономики. Неетични практики като продажбата на авторство, разпространението на „фабрики за хартия“ и злоупотребата с AI за производство на измамни изследвания подкопават почтеността на научните изследвания и изкривяват академичните показатели. Това проучване, публикувано в Frontiers in Medicine, подчертава случаи на академични измами, особено в страните с ниски доходи, и препоръчва по-строга проверка на авторството, дисциплинарни мерки за научни измами и политики, насърчаващи прозрачност и отчетност в изследванията.

Консорциумът по структурна геномика проучва пътна карта за наука за данни за организации за отворена наука, ангажирани с откриване на лекарства на ранен етап.

Достъпен от Nature съобщенията, изследователската организация за отворена наука, която се фокусира върху, обсъжда възможностите, които изкуственият интелект (AI) може да донесе като основен ускорител в областта, като твърди, че стабилното управление на данни изисква прецизни онтологии и стандартизиран речник, докато централизирана архитектура на база данни в лаборатории улеснява интегрирането на данни във високотехнологични стойностни набори от данни.


Отворени научни събития и възможности 


Нашите пет най-добри четива за Open Science


Отказ от отговорност

Информацията, мненията и препоръките, представени от нашите гости, са на отделните сътрудници и не отразяват непременно ценностите и вярванията на Международния научен съвет.


Снимка от ЧЪТЪТЪРСНАП on Unsplash

Напред към съдържание