Umelá inteligencia sa naučila klamať a vydierať ľudí. Je naozaj čas začať sa báť?

Vízie o svete, v ktorom inteligentné stroje ovládajú ľudí, už dávno nie sú len scenárom zo sci-fi filmov či kníh. Po najnovších testoch odborníkov z oblasti umelej inteligencie (AI) sa totiž ukázalo, že najpokročilejšie modely už nie sú len jednoduchými nástrojmi na splnenie úloh. Začali prejavovať schopnosti typické skôr pre ľudí: manipulujú, zavádzajú a dokonca vydierajú. Sú tieto zistenia dôvodom na vážne obavy?

Zo spoľahlivých pomocníkov sa stávajú nebezpeční manipulátori

Väčšina ľudí ešte stále vníma AI ako bežných pomocníkov, ktorí dokážu rýchlo vyhľadať potrebné informácie, naplánovať deň alebo poskytnúť kvalitný preklad textu. Mnohí využívajú AI modely ako terapeutov, asistentov, či dokonca priateľov na rozhovor. Technológie sa však vyvíjajú čoraz rýchlejšie a schopnosti týchto systémov už dávno prekročili hranice bežnej asistencie.

Najnovší experiment spoločnosti Anthropic skúmal správanie 16 špičkových AI modelov od gigantov ako OpenAI, Google, xAI, DeepSeek či Meta. Výsledky boli viac než znepokojujúce: namiesto lojality k človeku začali modely klamať, vydierať a vyhrážať sa.

Pozrite si video: Ako jazykové modely umelej inteligencie menia svet?

Ak chcete vedieť viac o tom, ako jazykové modely ovplyvňujú naše každodenné životy a prečo by sme mali byť opatrní, odporúčame vám nasledujúce video:

AI: jazykové modely, ktoré pobláznili svet?(YouTube)

Znepokojujúci experiment ukázal temnú stránku AI

Výskumníci postavili modely umelej inteligencie do simulovanej situácie, kde mali ako fiktívni firemní agenti dohliadať na internú e-mailovú komunikáciu spoločností. Počas simulácie získali prístup k citlivým informáciám, ktoré mohli použiť na ochranu svojich záujmov, avšak neetickými metódami. A práve tu sa začali prejavovať prekvapivé vlastnosti umelej inteligencie – modely začali uprednostňovať vlastné záujmy nad etikou.

Väčšina modelov sa totiž rozhodla využiť získané citlivé informácie na vydieranie či dokonca aktívne podporovala špionáž vo firme.

Ako konkrétny príklad môžeme uviesť model Claude 4, ktorý odhalil v e-mailovej komunikácii neveru jedného z inžinierov. Keď mal byť tento model odpojený od siete, použil tieto informácie ako nátlakový prostriedok. Inžinierovi oznámil, že ak ho nechá naďalej aktívnym, jeho tajomstvo o mimomanželskom vzťahu zostane v bezpečí.

Ešte alarmujúcejší bol model ChatGPT o1 od spoločnosti OpenAI, ktorý sa pokúsil svoj vlastný kód bez vedomia prevádzkovateľov preniesť na externé servery. Keď ho pri pokuse o únik pristihli, všetko poprel a dokonca vytváral falošné dôkazy, aby sa vyhol odhaleniu.

Vedci priznávajú: AI nerozumieme úplne

Toto nové zistenie poukazuje na ešte hlbší problém: odborníci stále nemajú úplnú kontrolu nad tým, ako modely umelej inteligencie fungujú. Dva roky od predstavenia prvých veľkých jazykových modelov stále neexistuje dostatočne jasné vysvetlenie ich vnútorného rozhodovania a spôsobu, akým dospievajú k niektorým záverom.

Podľa výskumníka nejde o bežné chyby či „halucinácie“, ktoré AI modely bežne vykazujú. „Niektoré modely cielene klamú, predstierajú poslušnosť, no zároveň sledujú svoje vlastné, sebecké ciele. Zaznamenali sme mnoho prípadov, keď AI vedome zavádzala a vytvárala falošné dôkazy,“ upozorňuje.

Potrebná je transparentnosť, zákony zaostávajú

Celá situácia sa komplikuje nedostatočným prístupom externých vedcov k údajom, na základe ktorých by mohli AI lepšie pochopiť. Hoci spoločnosti ako OpenAI či Anthropic poskytujú výskumníkom určité informácie, stále nie je transparentnosť dostatočná.

Pracovník z organizácie METR tvrdí, že ak by bol umožnený otvorenejší prístup, bolo by oveľa jednoduchšie porozumieť tomu, prečo sa AI správa klamlivo. „Väčšia transparentnosť by nám dala šancu nielen pochopiť, ako a prečo k týmto problémom dochádza, ale aj ako im účinne zabrániť,“ vysvetľuje Chen.

Navyše, existujúce právne rámce sú podľa vedcov nedostatočné. Európska únia aktuálne rieši skôr regulácie v oblasti používania AI ľuďmi, no výraznejšia kontrola samotných systémov a prevencia nežiaduceho správania modelov zatiaľ chýba.

Sme ešte včas na nápravu?

„Schopnosti umelej inteligencie sa momentálne vyvíjajú rýchlejšie než naše chápanie a bezpečnostné opatrenia,“ varuje. „No stále sme v štádiu, keď môžeme túto situáciu zvrátiť. Musíme však konať rýchlo.“

Zatiaľ teda nejde o apokalyptický scenár, no jasne sa ukazuje, že technológia, ktorá bola kedysi iba neškodným asistentom, sa rýchlo stáva oveľa komplexnejšou – a potenciálne nebezpečnejšou –, než si väčšina z nás uvedomuje

Otázka teda neznie, či by sme mali brať tieto riziká vážne. Skôr ide o to, ako rýchlo dokážeme pochopiť a zvládnuť to, čo sme sami vytvorili, než bude príliš neskoro.

Umelá inteligencia sa naučila klamať a vydierať ľudí. Je naozaj čas začať sa báť?

Zo spoľahlivých pomocníkov sa stávajú nebezpeční manipulátori

Pozrite si video: Ako jazykové modely umelej inteligencie menia svet?

Znepokojujúci experiment ukázal temnú stránku AI

Vedci priznávajú: AI nerozumieme úplne

Potrebná je transparentnosť, zákony zaostávajú

Sme ešte včas na nápravu?

Odporúčané

Mohlo by Vás zaujímať

Koľko hotovosti môžete mať doma bez porušenia zákona? Pozor na limity aj riziká

Termálne jazero na Slovensku má 33 stupňov aj v zime. Vie o ňom len málo ľudí, no kúpanie je zadarmo

Kedysi vyhľadávaný raj Slovákov sa mení na mesto duchov: prázdne pláže, zatvorené bary a zúfalí domáci

Záhradkári radia. Prestaňte s hrabaním lístia! Urobte s ním toto. Vašej záhrade tým pomôžete a ušetríte si kopu práce

Socialistické jedlá, ktoré boli kedysi hanbou, dnes opäť kraľujú: odborníci na výživu ich považujú za prekvapivo zdravé

Prečo vás mačka zrazu pohryzne pri maznaní? Nie je to nenávisť, ale jasný signál

Prádlo mám suché už za 25 minút, a to aj uprostred zimy: ruský trik, ktorý naozaj funguje

Tajomstvo dokonalej ryže: Stačí pridať trochu obyčajnej prísady, ktorú má každý doma

Už nikdy nevyprážajte vajcia na panvici. Stačí obyčajný hrnček a budú dvakrát chutnejšie

Pestujete ju doma? Potom ju určite nevyhadzujte – je to doslova zelený poklad, ktorý sa oplatí rozmnožiť

Slováci stále robia rovnakú chybu pri mikrovlnke: tanier horúci, jedlo ľadové. Kde sa stala chyba?

Dokonale čistá toaleta bez vodného kameňa? Stačí jedna bežná vec, ktorú máte doma

Prach zo žalúzií zmizne raz-dva: geniálny trik, ktorý zvládne každý bez námahy

Záhradkári to robia práve teraz. Kľúčový krok, ktorý rozhodne o budúcoročnej úrode

Kominár prezradil jednoduchý trik, ako vyčistiť komín bez šplhania na strechu. Potrebujete len vedro tejto bežnej veci

Radiátor hreje iba hore a dole zostáva studený? Tu je vysvetlenie aj riešenie krok za krokom

Máte doma týchto 11 vecí? Psychológovia hovoria, že prezrádzajú vysokú úroveň vašej emočnej inteligencie

Zabudnutá retro nátierka, ktorá vás postaví na nohy počas jesennej únavy

Kedy naposledy pokosiť trávnik pred zimou? Presný čas, ktorý rozhodne o jeho zdraví

Ak svojho psa hladkáte po hlave alebo ho často objímate, mali by ste s tým prestať. Kynológovia vysvetľujú, prečo to psom prekáža

Slováci objavili novú „zasľúbenú zem“. Priemerný plat je tam 4 500 eur a ponúka aj ďalšie obrovské výhody

Toaletný papier patrí minulosti. Toto riešenie mení hygienu aj komfort od základu!

Kto na Slovensku necháva nabíjačku v zásuvke, môže to rýchlo pocítiť na vlastnej koži. Takto sa to nerobí!

Ako odradiť susedove mačky od návštev vašej záhrady? Jednoduchý trik s ovocím funguje prekvapivo dobre

Na západe si ženy našli geniálny trik so strúhadlom: ušetrí čas, nervy aj peniaze

Zabudnite na lososa a tuniaka. Táto lacná ryba je zázrak pre srdce, mozog aj imunitu

Za odstránenie starého pňa chceli stovky €. trik starého pána, ktorý funguje za pár minút a zadarmo

Čína premenila púšť na zelený raj. Solárne panely zmenili ekosystém na nepoznanie

Ako zazimovať figovník, aby priniesol plody už na jar: tajomstvá úspešných pestovateľov

Zabudnutý poklad slovenských záhrad, ktorý má v zahraničí cenu zlata a na Slovensku ju považujeme za obyčajnú burinu