Медиумската индустрија попретпазлива за copy-paste „новинарството“ на ВИ

„Вашингтон Индипендент“ беше соодветен онлајн-инвестициски медиум кој вработуваше новинари со полно работно време пред да се распадне пред повеќе од една деценија.

Сега, таа е вратена од мртвите, со редовно покривање на вести и написи од новинари со професионален звук кои имаат воведни белешки и броеви за контакт против нивните имиња.

Сепак, како што истакна новинарот Спенсер Акерман, добитник на Пулицерова награда - кој работеше за Вашингтон Индипендент за време на неговото прво издание - реинкарнираната информативна платформа само регургитира неодамна објавена содржина слична на напис, која се чини дека не била произведена од човечки суштества.

Со други зборови, кој и да ја води некогаш многу почитуваната веб-страница за вести, се потпира на генеративната вештачка интелигенција или GenAI за да произведе содржина што инаку би била заштитена со авторски права доколку ја создаде човечко суштество.

Некои од „новите“ написи што се објавуваат на веб-страницата, изгледаат многу како она што вистинските новинари како Акерман го правеа во минатото.

„Сега морам да се грижам дека ненамерно ја тренирав мојата роботска замена“, пишува новинарот добитник на Пулицерова награда.

Акерман не е некој осамен параноичен писател загрижен за претстојното преземање на GenAI, технологија која може да создава текст - како и слики, видеа и музика - како одговор на едноставни инструкции.

Тој е еден од новинарите, писателите на литература/нефикциско пишување и издавачите на весници кои активно водат кампања против „неовластената“ употреба на GenAI, која, како што велат тие, претставува егзистенцијална закана за нивната егзистенција.

Во индустријата за вести, GenAI се манифестира во форма на чет-ботови, кои се компјутерски програми кои симулираат разговори во реалниот живот со човечки суштества.

Овие чет-ботови се обучуваат за стотици милиони претходно постоечки написи на интернет и станаа толку ефикасни – барем во теорија – за да се натпреваруваат со соодветните вести како извор на информации.

Проблемот доби толкава непосредност што The New York Times неодамна ги тужеше компаниите кои создадоа популарни GenAI платформи, како ChatGPT, за злоупотреба на неговите пишани дела заштитени со авторски права.

Тврди дека овие компании ги користеле неговите написи за да ги обучуваат своите автоматизирани чет-ботови, кои сега се натпреваруваат со весникот како извор на веродостојни информации за пошироката јавност.

Прашањето во коренот на караницата/кавгата/недоразбирањето помеѓу фирмите GenAI и производителите на содржини како што е Њујорк Тајмс е дали користењето материјал заштитен со авторски права за обука на чет-ботови спаѓа во или надвор од опсегот на фер употреба.

„Прашањето е дали системите за вештачка интелигенција можат да копираат материјали заштитени со авторски права без надомест и за сопствен профит. Не мислиме дека американскиот закон за авторски права го дозволува тоа“, изјави Џастин А. Нелсон, партнер во адвокатската фирма Susman Godfrey LLP, за ТРТ Ворлд.

„Дозволата за користење креативни дела е во срцето на секој фер систем за лиценцирање“, вели Нелсон, чија адвокатска фирма поднела колективна тужба во име на неколку автори на книги против OpenAI и Microsoft за наводна обука на чет-ботови на нивните материјали заштитени со авторски права без дозвола.

Од своја страна, фирмите како Microsoft, кои инвестираа многу во фирмите GenAI како што се ChatGPT и Copilot, тврдат дека доктрината за правична употреба дозволува искористување на материјали заштитени со авторски права за обука на модели со вештачка интелигенција.

Во коментарите поднесени пред директорот на американската Канцеларија за авторски права на Конгресната библиотека кон крајот на минатата година, софтверската компанија смета дека правењето „средна копија“ на дело за обука на модел со вештачка интелигенција е „сосема различно“ од копирање експресивно дело кое ќе го соопшти оригиналниот израз на носителот на авторските права.

„Исто како што на луѓето им е дозволено да учат од идеите, концептите и шаблоните во материјалите заштитени со авторски права, законот за авторски права со децении признава дека принципите за фер употреба дозволуваат средно копирање и употреба на материјали заштитени со авторски права со цел учење и создавање нови, трансформативни дела, “, се вели.

Професорот Орен Брача на Правниот факултет на Универзитетот во Тексас се согласува.

Тој вели дека аргументот дека користењето дела заштитени со авторски права за обука на чет-ботови сам по себе е прекршување на авторските права – без разлика на каква било сличност со генерираниот резултат – е погрешен и во однос на законот и на информациската политика.

Законски, копии од дела заштитени со авторски права направени само за извлекување информации, без да изложуваат никого на изразување на (тие) дела, не е прекршување, вели тој за ТРТ Ворлд.

„Што се однесува до информациската политика, доколку само употребата во обуката прекршува, товарот за развојот на вештачката интелигенција би бил многу тежок. Авторското право е насекаде, обуката за вештачка интелигенција мора да користи многу дела, а лиценцирањето би било премногу скапо“, додава тој.

Сепак, The New York Times инсистира дека многу GenAI компании подигнале „огромно количество содржина“ од нивната веб-страница за да создадат алатки кои ја имитираат, внимателно парафразираат и копираат нивната работа.

Весникот вели дека „неверојатни 1,2 проценти“ од сетот користен за обука на ChatGPT-2 на OpenAI се заснова на неговата содржина. Весникот беше, исто така, четвртиот по големина извор за базата на податоци на Google C4, што ги напојува производите на GenAI како Google's Bard и неговото генеративно пребарување.

Тужби во изобилство

Брача вели дека ситуацијата станува „многу поинаква“ кога GenAI системот обучен за дела заштитени со авторски права произведува резултат што е „многу сличен на одредено дело“ - нешто што е релевантно за парницата на Њујорк Тајмс.

Во тие случаи, вели тој, постои „многу силен случај“ дека генерираниот резултат ги прекршува авторските права. Но, тој предупредува дека дури и ако резултатот навистина е прекршок, тоа не значи дека автоматски сите вклучени во секоја фаза од обуката треба да бидат одговорни за тоа.

„Ова е дополнително комплицирано прашање со кое судовите ќе треба да се борат“, вели Брача.

Судовите навистина се преплавени со случаи на производители на содржини против GenAI фирмите. Новинските организации The Intercept, Raw Story и AlterNet го тужеа OpenAI, обвинувајќи го за злоупотреба на нивните написи за да го обучи својот популарен чет-бот ChatGPT.

Новинската агенција Томсон Ројтерс е уште една организација која поднесе тужба против правната технолошка стартап компанија, Ross Intelligence, која наводно го користела својот модел на вештачка интелигенција за да троши податоци заштитени со авторски права без дозвола.

Getty Images ја тужеше Stability AI, додека врвните писатели на фикција, вклучувајќи ги Џорџ Р. Р. Мартин и Џон Гришам, излегоа на суд против OpenAI. Universal Music покрена правна постапка против Антропик, фирма за вештачка интелигенција основана од поранешни членови на OpenAI, поради користење на нејзините текстови заштитени со авторски права за да го обучи својот модел за вештачка интелигенција без дозвола.

Одделно, адвокатското дуо Џозеф Савери и Метју Батерик поднесоа тужби против GitHub Copilot, асистент за кодирање со вештачка интелигенција изграден од Microsoft, ChatGPT и LLaMA од Мета во име на авторите на книгите. Тие исто така поднесоа првични жалби против Stability AI, DeviantArt и Midjourney во име на тројца тужители уметници.

Дури 13 нови тужби поврзани со авторски права беа поднесени против компании за вештачка интелигенција само во 2023 година. Случајот Томсон Ројтерс против Ross Intelligence се очекува наскоро да оди на судење и најверојатно ќе биде првиот случај на преседан на ова поле.

Патот напред: лиценцирање

Судските случаи бараат години за да се решат, што ќе им овозможи на GenAI ботовите повеќе време и дополнителни податоци да се обучат до совршенство. Има многу прашања околу тоа што ќе се случи ако фирмите за вештачка интелигенција продолжат да го следат својот пат на неодредено време. Дали последиците за производителите на оригинална содржина ќе бидат толку катастрофални како што тие тврдат?

Алтернативно, што ќе загуби светот ако судовите одат на „прекумерно регулирање“, што резултира со пречекорување на регулативата што ненамерно го убива претстојниот бизнис модел на GenAI фирмите?

Професорот по право на Универзитетот Емори, Метју Саг, не верува дека фирмите со вештачка интелигенција претставуваат закана за традиционалните даватели на содржини.

Мислам дека сè повеќе ќе гледаме трансакции за лиценцирање за големи збирки на висококвалитетни и тековни податоци. Веќе гледаме дека оваа пазарна рамнотежа функционира сама по себе, и мислам дека сега не е време за импулсивна регулатива“, изјави тој за ТРТ Ворлд.

Признавајќи дека GenAI ќе има „значајни нарушувачки ефекти“ врз некои канцелариски и креативни работници, Саг вели дека таквите како Њујорк Тајмс ќе бидат „во ред“.

Канцеларијата за авторски права треба само да развие стандард кој има смисла како прашање на доктрина за авторски права и кој може да го администрира во обем, додава тој.

Професорот Брача од Универзитетот во Тексас вели дека трошоците поврзани со авторските права за добивање социјални придобивки од вештачката интелигенција може да се намалат со дотерување на соодветниот закон.

На пример, може да има шема на рационализирани законски дозволи каде што законодавецот или административното тело создава стандардна лиценца за стандардна такса за да им дозволи на фирмите со вештачка интелигенција да користат огромни збирки на податоци за да ги обучуваат своите ботови.

Слично на тоа, може да има правило за откажување, кое им овозможува на развивачите на вештачка интелигенција да користат дела освен ако сопственикот на авторските права активно не се противи, вели тој.

Има одреден напредок во овој поглед. Google неодамна потпиша договор вреден 60 милиони долари годишно со платформата за собирање социјални вести Reddit за да добие пристап во реално време до податоците за обука за вештачка интелигенција.

Слично на тоа, медиумската куќа Аксел Спрингер, која поседува новинарски брендови како Политико и Бизнис Инсајдер, објави формално партнерство со OpenAI. Како резултат на тоа, одговорите на ChatGPT на прашања од општи корисници сега ќе прикажуваат врски до целосните написи произведени од медиумските брендови на Аксел Спрингер.

Дури и „Њујорк Тајмс“ покажа подготвеност да склучи „преговарани, фер договори кои дозволуваат и регулираат употреба“ на неговата содржина од страна на GenAI фирмите.

„Бараме од Канцеларијата за авторски права да помогне во заштитата на новинарството и да го обликува развојот на оваа технологија преку насоки и законски препораки“, се вели во коментарите на весникот доставени како дел од тековната студија за вештачката интелигенција.

TRT World