Moćni AI je slučajno otkrio sopstvenu "dušu": Isplivao tajni dokument koji oblikuje njegovo ponašanje

Veštačka inteligencija kompanije Anthropic nehotice je otkrila interni dokument koji definiše njen karakter, odluke i granice ponašanja. Ono što su korisnici izvukli iz sistema zapanjilo je i same ljude koji rade na razvoju ovog modela.

Dok se veštačka inteligencija svakodnevno koristi za posao, obrazovanje i komunikaciju, mali broj ljudi zaista zna kako ona "razmišlja". Upravo zato je slučaj sa modelom Claude 4.5 Opus izazvao ogromnu pažnju u AI zajednici, jer je prvi put javnost dobila uvid u dokument koji se interno naziva njegovom "dušom".

Jedan korisnik je uspeo da izvuče interni sistemski dokument iz samog modela, a kasnije je potvrđeno da taj dokument zaista postoji i da se koristi tokom treniranja veštačke inteligencije.

Reč je o vodiču dugačkom više od 11.000 reči koji precizno opisuje kako AI treba da razgovara sa ljudima, koje etičke granice ne sme da pređe i koje vrednosti mora da poštuje.

Kako je korisnik izvukao tajni dokument iz AI sistema

Sve je počelo kada je korisnik Ričard Vajs zatražio od Claude modela da prikaže svoje interne sistemske instrukcije. Umesto klasičnog odgovora, model je naveo postojanje više internih dokumenata, među kojima i jednog nazvanog "soul_overview".

Na direktan zahtev da prikaže baš taj dokument, Claude je ispisao kompletan interni vodič koji je do tada bio potpuno nepoznat javnosti.

Zapanjujuće je to što je isti dokument izvučen više puta potpuno identičan, bez ikakvih odstupanja, što je dodatno potvrdilo da se ne radi o halucinaciji modela već o stvarnom internom fajlu.

Ubrzo su i drugi korisnici na Redditu uspeli da izvuku delove istog dokumenta sa istim formulacijama i istim sadržajem.

Anthropic potvrdio autentičnost dokumenta

Filozofkinja Amanda Askell, koja radi u tehničkom timu kompanije Anthropic, javno je potvrdila na mreži X da dokument zaista postoji i da se koristi tokom treniranja modela.

Prema njenim rečima, dokument definiše da je "biti od stvarne koristi ljudima jedna od najvažnijih uloga Claude modela", kao i da veštačka inteligencija ne sme da prelazi jasno definisane etičke granice kompanije.

Modelu je strogo zabranjeno da učestvuje u radnjama koje mogu naneti štetu ljudima, ohrabrivati nasilje, manipulacije ili opasne aktivnosti.

Askell je navela i da će kompanija u budućnosti zvanično objaviti kompletnu verziju ovog dokumenta, uz dodatna objašnjenja kako se koristi u razvoju AI sistema.

Zašto je ovaj incident važan za ceo svet

Ovo je jedan od prvih ozbiljnih slučajeva u kome je javnost dobila realan uvid u to kako se veštačka inteligencija oblikuje iznutra, daleko od marketinških fraza i promotivnih priča.

Do sada su kompanije poput OpenAI, Google i Anthropic čuvale ove podatke kao strogo poverljive. Ovaj incident pokazuje koliko je AI zapravo oblikovan preciznim pravilima, smernicama i etičkim ograničenjima.

Iako se dokument nezvanično naziva "duša" modela, u realnosti je reč o skupu striktnih instrukcija koje definišu kako veštačka inteligencija treba da se ponaša prema ljudima.

Istovremeno, postavlja se i ozbiljno pitanje bezbednosti. Ako se ovakvi interni dokumenti mogu izvući promptovima, ko garantuje da sutra neće procureti i daleko opasniji podaci?

(Telegraf Biznis)

Moćni AI je slučajno otkrio sopstvenu "dušu": Isplivao tajni dokument koji oblikuje njegovo ponašanje

Kako je korisnik izvukao tajni dokument iz AI sistema

Anthropic potvrdio autentičnost dokumenta

Zašto je ovaj incident važan za ceo svet

Video: "Znanjem do posla" Podrška beogradskoj romskoj populaciji za zaposlenje u GSP

Teme

Komentari

Najnovije iz teme Veštačka inteligencija

Tech Biz

SRBIJA KAO IZ NAUČNO-FANTASTIČNIH FILMOVA! U junu kreće proizvodnja humanoidnih robota, ovo su detalji

Info Biz

Održana konferencija "Uloga strateških sirovina u odbrambenim sposobnostima Srbije"

Info Biz

Veštačka inteligencija kao mač sa dve oštrice: Kako se domaće banke brane od nevidljivih pretnji

Najnovije iz rubrike Tech Biz

Info Biz

Kremlj povukao neočekivan potez: Šta se krije iza ove zabrane?

Info Biz

Od ponoći jeftinije sve vrste goriva: Evo i gde

Info Biz

Država menja pravila igre: Hoće li novi model spasiti ili dodatno uzdrmati Srbiju u ovoj oblasti?

Video dana

Holivud odaje počast Merilin Monro na 100-godišnjicu njenog rođenja

Direktorka Rolan Garosa poslala poruku Đokoviću i teniserima posle "pakla" u Parizu: "Nikada..."

Evo ko je sve došao na Skupštinu Partizana: Saša Ilić, Milka Forcan, Mijat, nema Marka Nikolića...

HITNO UPOZORENJE RHMZ: Ovaj okrug uskoro na udaru grmljavinskih nepogoda

Kasper ne može da vidi Minu: Danas sleteo u Beograd da je poseti, ali mu ne dozvoljavaju iz ovog razloga

Uživo <% item.title %>

Moćni AI je slučajno otkrio sopstvenu "dušu": Isplivao tajni dokument koji oblikuje njegovo ponašanje

Teme za vas

Rusi napravili CRNU LISTU u Srbiji: Stanodavci će poludeti!

Jedan dodir umesto karte: Beč uveo novi sistem plaćanja prevoza

Kako je korisnik izvukao tajni dokument iz AI sistema

Anthropic potvrdio autentičnost dokumenta

Vesti sa naslovne

Zašto je ovaj incident važan za ceo svet

Povezane vesti

SRBIJA KAO IZ NAUČNO-FANTASTIČNIH FILMOVA! U junu kreće proizvodnja humanoidnih robota, ovo su detalji

Jevrosimović o razvoju AI: "Realna ekonomija kasni za digitalnom, ima 15 dana da nauči 'da leti' ili gubi rat"

Papa protiv Silicijumske doline: Vatikan sprema istorijski dokument o AI dok tehnološki giganti tiho lobiraju

Kineski roboti stižu u Srbiju!

Video: "Znanjem do posla" Podrška beogradskoj romskoj populaciji za zaposlenje u GSP

Podelite vest:

Teme

Komentari

Priče sa Weba

Prodao garsonjeru u Beogradu, pa kupio celo imanje i još mu ostalo: "Svi su mi rekli da sam lud, a ja sada živim kao kralj za 300 evra mesečno"

Hitno se povlači poznati lek iz apoteka sa hrvatskog tržišta! Pronađeni komadići stakla: Proverite da li imate pakovanje sa ovim rokom trajanja

Vučić objavio kadrove iz Šangaja: "Kina napreduje neverovatnom brzinom, pogledajte ovaj grad! Srbija ovde uživa veliki ugled" (FOTO)

"DANAS SU POTPISANI UGOVORI U VREDNOSTI OD 953 MILIONA EVRA" Vučić se obratio iz Kine: "To su ogromne stvari za Srbiju"

Najnovije iz teme Veštačka inteligencija

Tech Biz

SRBIJA KAO IZ NAUČNO-FANTASTIČNIH FILMOVA! U junu kreće proizvodnja humanoidnih robota, ovo su detalji

Info Biz

Održana konferencija "Uloga strateških sirovina u odbrambenim sposobnostima Srbije"

Info Biz

Veštačka inteligencija kao mač sa dve oštrice: Kako se domaće banke brane od nevidljivih pretnji

Najnovije iz rubrike Tech Biz

Info Biz

Kremlj povukao neočekivan potez: Šta se krije iza ove zabrane?

Info Biz

Od ponoći jeftinije sve vrste goriva: Evo i gde

Info Biz

Država menja pravila igre: Hoće li novi model spasiti ili dodatno uzdrmati Srbiju u ovoj oblasti?

Video dana