0:00
0:00
30. 3. 20253 minuty

Velký a ještě větší zloděj

Bianca Bellová

Jedna spřízněná autorka mě upozornila, že se jeden z mých knižních titulů v překladu nachází na portálu Library Genesis (známém jako LibGen), největší bezplatné knihovně světa, což by mě těšilo, kdyby to nebyla knihovna ilegální a agregovaná pirátským způsobem. Ze soudobých českých autorů zde lze najít tituly Patrika Ouředníka, Jáchyma Topola, Aleny Mornštajnové či Michala Ajvaze, ale i dalších známých jmen jako Václav Havel, Bohumil Hrabal či Milan Kundera. Nachází se zde okolo 7,5 milionu titulů knih jak beletristických, tak naučných, a 81 milionů odborných článků. Což je dost na portál, který už roky řeší problémy jak legální, tak logistické. Portál vznikl v Rusku v roce 2008 a je registrovaný v Rusku a Nizozemsku.

Ještě pozoruhodnější je skutečnost, že tuto ilegální platformu používala společnost Meta pro trénink svého vlajkového AI modelu Llama3. Zaměstnanci Mety stáli před zajímavým etickým problémem – aby byl jejich program konkurenceschopný s produkty, jako je ChatGPT, bylo třeba jej vycvičit na obrovském množství vysoce kvalitních textů. Legální získání všech těchto textů by trvalo příliš dlouho. Když navíc začali zaměstnanci zkoumat možnost nákupu licence k potřebným knihám, zjistili, že je i „nepřiměřeně drahá“. 

V dalším dokumentu předloženém soudu se uvádí citace jednoho z vrcholových manažerů, že „je pro Metu skutečně důležité se ke knihám dostat co nejdříve, protože knihy jsou důležitější než data z internetu“. V článku Alexe Reisnera v časopisu The Atlantic lze najít i odkaz na přísně tajný interní dokument, ve kterém se management obrací přímo na Marka Zuckerberga a žádá ho o rozhodnutí. S největší pravděpodobností se tedy tato krádež duševního vlastnictví děla s jeho posvěcením (a s vědomím právního rizika). 

↓ INZERCE

Jak uvádí Authors Guild (americký Ochranný autorský svaz), „Meta a další společnosti zabývající se vývojem umělé inteligence přesně věděly, co dělají, a přesto to udělaly. Proč? Protože knihy potřebují pro jejich kvalitní jazyk, styl, vyjadřování a dlouhé vyprávění – a raději je ukradly, než aby za ně zaplatily, jako to dělají u všech ostatních prvků vývoje AI, elektřiny a programování“. 

Předplaťte si Respekt a nepřicházejte o cenné informace.

Online přístup ke všem článkům a archivu

Články i v audioverzi a mobilní aplikaci
Možnost odemknout články pro blízké
od 150 Kč/měsíc