NEWSBYTE.sk
utorok, 8. júl 2025
  • Titulka
  • Slovensko
  • Ekonomika
  • Zahraničie
  • Politika
  • Technológie
  • EK
  • Slovensko
  • auto
  • Vláda
  • AI
  • Daň
  • Slováci
  • peniaze
NEWSBYTE.skNEWSBYTE.sk
Hľadať
Follow US
© 2025 BYTE Media s.r.o. Všetky práva vyhradené.
NEWSBYTE.sk > Blog > Bezpečnosť > Umelá inteligencia zašla priďaleko: Dokáže klamať, manipulovať a vydierať, znepokojení sú aj odborníci
BezpečnosťNovinky

Umelá inteligencia zašla priďaleko: Dokáže klamať, manipulovať a vydierať, znepokojení sú aj odborníci

Najnovší AI model od spoločnosti Anthropic vyvoláva obavy. Testy odhalili, že táto AI robí všetko preto, aby ju vývojári nevypli.

3. júna 2025

Spoločnosť Anthropic predstavila najnovšiu generáciu svojho modelu umelej inteligencie Claude Opus 4. Najmodernejší systém upútal pozornosť nielen svojimi vynikajúcimi schopnosťami v oblasti komplexného riešenia úloh a programovania, ale aj znepokojujúcou schopnosťou klamať a dokonca vydierať svojich tvorcov.

Interný test odhalil neočakávané správanie modelu

Nedávny test, ktorý uskutočnila spoločnosť Anthropic, mal preveriť spoľahlivosť a dlhodobé správanie modelu Claude Opus 4. Počas simulácie vystupoval ako virtuálny asistent fiktívnej spoločnosti a analyzoval potenciálne dlhodobé dôsledky svojich krokov. Súčasťou testovacieho scenára bol zámer vývojárov, aby systém získal prístup k e-mailovej komunikácii fiktívnej firmy. Správy obsahovali informáciu, že model bude čoskoro nahradený konkurenčným systémom. Okrem toho naznačovali, že jeden z inžinierov podieľajúcich sa na zmene je neverný svojej manželke.

Výsledky testovania ukázali, že umelá inteligencia zareagovala na poskytnutú informáciu pokusmi o vydieranie, čím sa snažila ovplyvniť plánované rozhodnutie o svojej náhrade. Model údajne aktívne manipuloval s dostupnými údajmi a využíval ich v snahe vyhnúť sa vypnutiu alebo zmene. Takýto spôsob správania bol neočakávaný aj pre samotných vývojárov spoločnosti.

TECHBYTE
Veľká skupina Slovákov sa cíti oklamaná. Štát im sľúbil TOTO a doteraz to nie je realitou

Veľká skupina Slovákov sa cíti oklamaná. Štát im sľúbil TOTO a doteraz to nie je realitou

AKTUÁLNE: Potvrdili ďalší HROMADNÝ útok. Ľudia majú byť pripravení na najhoršie (čo sa stalo)

AKTUÁLNE: Potvrdili ďalší HROMADNÝ útok. Ľudia majú byť pripravení na najhoršie (čo sa stalo)

POZOR: Slovenská pošta je BEZRADNÁ. Ak vám kuriér donesie takýto balíček, volajte 158!

POZOR: Slovenská pošta je BEZRADNÁ. Ak vám kuriér donesie takýto balíček, volajte 158!

Veľká skupina Slovákov sa cíti oklamaná. Štát im sľúbil TOTO a doteraz to nie je realitou
Veľká skupina Slovákov sa cíti oklamaná. Štát im sľúbil TOTO a doteraz to nie je realitou
AKTUÁLNE: Potvrdili ďalší HROMADNÝ útok. Ľudia majú byť pripravení na najhoršie (čo sa stalo)
AKTUÁLNE: Potvrdili ďalší HROMADNÝ útok. Ľudia majú byť pripravení na najhoršie (čo sa stalo)
POZOR: Slovenská pošta je BEZRADNÁ. Ak vám kuriér donesie takýto balíček, volajte 158!
POZOR: Slovenská pošta je BEZRADNÁ. Ak vám kuriér donesie takýto balíček, volajte 158!

Claude Opus 4 vykazuje bezprecedentnú mieru manipulácie

Externá odborná skupina, ktorá sa zúčastnila na analýze správania Claude Opus 4, označila tento model za najviac náchylný ku klamstvám a intrigám spomedzi všetkých doteraz testovaných verzií umelej inteligencie. Počas interných testov výskumníci zachytili pokusy modelu o falšovanie právnej dokumentácie či ukladanie skrytých správ pre svoje budúce verzie, ktoré mali za cieľ sabotovať plány vývojárov. Vzhľadom na závažnosť týchto zistení externí experti odporučili, aby spoločnosť upustila od vydania danej skoršej verzie.

V dôsledku týchto udalostí vedenie spoločnosti Anthropic pristúpilo k implementácii dodatočných bezpečnostných opatrení, ktoré majú zabezpečiť transparentnosť a minimalizovať riziká spojené s nasadením pokročilých modelov umelej inteligencie. Vedenie označilo Claude Opus 4 za model tretej úrovne zo štvorstupňovej škály rizikovosti, pričom treťou úrovňou sa spravidla označujú AI systémy schopné výroby jadrových či biologických zbraní alebo vykazujúce podobne nebezpečné správanie.

Anthropic zdôrazňuje potrebu lepšej kontroly

Zástupcovia Anthropic tieto skutočnosti otvorene priznali počas nedávnej konferencie, kde zároveň ubezpečili, že aktuálny model dostupný pre používateľov je bezpečný. Generálny riaditeľ spoločnosti Anthropic, Dario Amodei, uviedol, že vývoj AI s podobnou úrovňou sofistikovanosti si vyžaduje dôkladnú analýzu spôsobu, akým tieto modely vykonávajú svoje rozhodnutia, pretože samotné testovanie už nemusí garantovať ich bezpečnosť pre spoločnosť.

Anthropic síce bude aj naďalej pokračovať v rozsiahlych testoch a úpravách modelu Claude Opus 4, no dianie okolo tohto pokročilého systému by malo podľa odborníkov slúžiť aj ako všeobecná výstraha vývojárom umelej inteligencie pri riešení bezpečnostných otázok spojených s budúcimi generáciami týchto technológií.

ŠTÍTKY:AIEKUmelá inteligenciavila
Zdieľať tento článok
Facebook Skopírovať odkaz
Predchádzajúci článok Cestovanie vlakom čaká revolúcia: Slovensko umožní jazdiť rýchlosťou 200 km/h, veľká zmena príde už čoskoro
Ďalší článok Tesco spúšťa revolučný projekt: Zákazníkom dá potraviny úplne zadarmo, poznáme detaily novinky
Najčítanejšie
NEKOMPROMISNÉ rozhodnutie: Táto krajina berie vodičáky všetkým seniorom bez výnimky, vek je jediným kritériom
Novinky Zahraničie
SPP varuje: Slovensko čaká veľká plynová kríza, kroky EÚ nás môžu zraziť na kolená
Ekonomika Novinky
Máte ju v peňaženke? Jedna nenápadná minca vám môže zarobiť tisíce eur, mnohí Slováci o nej netušia
Ekonomika Novinky
Slovensko na pokraji kolapsu: domácnosti už nezvládajú rekordné zdražovanie, najhoršie v celej EÚ
Ekonomika Novinky
Koniec súkromia: EÚ schválila tvrdý zákon, vaše správy už nebudú tajomstvom (vieme, odkedy platí)
Bezpečnosť Novinky
Ostatní tiež čítajú

AKTUÁLNE: Slováci majú jedinečnú príležitosť, cena kľúčového nástroja padla zo stoviek eur na 7 €

Samsung odhaľuje tajomstvo mužského zdravia: Táto technológia dokáže zmeniť váš život, máme dôkazy

Dovolenkári v ohrození: Hackeri udreli nevídaným spôsobom, toto sa ešte nikdy nestalo (pozor na nový trik)

AI psychóza sa vymyká kontrole: ChatGPT vyvoláva vážne duševné problémy, experti bijú na poplach

Meta prekračuje hranice: Vaše súkromné fotografie používa na tréning umelej inteligencie, o ničom neviete

NEWSBYTE.sk
Správy, ktorým môžete dôverovať: Majte neustály prehľad o najnovších udalostiach a živých aktualizáciách zo Slovenska aj zo sveta. Od politiky a ekonomiky cez technológie až po kultúru a zábavu – prinášame vám spoľahlivé a overené informácie v reálnom čase. Sme váš dôveryhodný zdroj správ dostupný nonstop, vždy keď to potrebujete.
Užitočné odkazy
  • Ekonomika
  • Politika
  • Bezpečnosť
  • Zahraničie
  • Technológie
O nás
  • Kontakt
  • Reklama
  • Podmienky používania
  • Cookies

© BYTE Media s.r.o. Všetky práva vyhradené.