Umelá inteligencia (AI) a jej schopnosť generovať obrázky na základe textových pokynov získava stále väčšiu popularitu. Avšak s touto technológiou prichádzajú aj závažné problémy týkajúce sa autorských práv. Umelci tvrdia, že AI modely, ako sú tie od Google, Stability AI či Midjourney, používajú ich diela bez povolenia a tým porušujú ich práva. Nový prístup výskumníkov z Texaskej univerzity v Austine a Kalifornskej univerzity v Berkeley by mohol tento problém vyriešiť.
Problém s autorskými právami a AI
Generátory text-to-image, teda nástroje, ktoré dokážu na základe textových pokynov vytvárať obrázky, sú často trénované na veľkých množstvách existujúcich obrázkov. Tieto fotografie sú často chránené autorskými právami, čo znamená, že ich použitie bez súhlasu tvorcu je nezákonné.
Jedným z prípadov je hromadná žaloba umelcov proti Alphabet, materskej spoločnosti Google, kvôli používaniu ich diel na trénovanie generátora obrázkov Imagen bez povolenia. Podobným sporom čelí aj Stability AI, Midjourney a DeviantArt, ktoré používajú nástroj Stable Diffusion.
5 revolučných spôsobov, akými AI mení naše každodenné rutiny
Vedci vynašli netradičné riešenie
Aby sa predišlo porušovaniu autorských práv, výskumníci z Texaskej univerzity v Austine a Kalifornskej univerzity v Berkeley vyvinuli nový model AI založený na difúzii, ktorý je trénovaný iba na poškodených obrázkoch. Tento prístup zaručuje, že AI si nepamätá a nereplikuje pôvodné diela.
Difúzne modely sú pokročilé algoritmy strojového učenia, ktoré generujú vysokokvalitné údaje tým, že postupne pridávajú šum do súboru údajov a potom sa učia tento proces zvrátiť. Avšak tieto modely si môžu zapamätať tréningové obrázky, čo predstavuje problém pre súkromie a autorské práva.
Výskumníci preto vytvorili rámec Ambient Diffusion, ktorý je trénovaný na vysoko poškodených obrázkoch. Tieto obrázky sú natoľko poškodené, že AI si ich nepamätá a nedokáže ich reprodukovať v pôvodnej podobe.
Testovanie a výsledky
Výskumníci testovali svoj model na 3 000 „čistých“ obrázkoch z databázy CelebA-HQ, ktorá obsahuje vysokokvalitné obrázky celebrít. Model dokázal generovať obrázky, ktoré boli takmer identické s originálmi. Následne preškolili model na 3 000 vysoko poškodených obrázkoch, kde bolo náhodne maskovaných až 90 % pixelov. Výsledné obrázky boli menej podobné originálom, čo potvrdzuje efektivitu rámca Ambient Diffusion.
„Rámec by sa mohol ukázať ako užitočný aj pre vedecké a lekárske aplikácie,“ povedal Adam Klivans, profesor informatiky na Texaskej univerzite v Austine a spoluautor štúdie.
Otvorené otázky a budúcnosť
Hoci nový model Ambient Diffusion ponúka riešenie pre problém s autorskými právami, stále nie je dokonalý. Umelci si však môžu oddýchnuť, že tento model nezopakuje ich pôvodné diela. Avšak, aby sa zabezpečilo, že ostatné modely AI nebudú porušovať autorské práva, je potrebné naďalej monitorovať a riešiť tieto problémy prostredníctvom právnych krokov.