Ameninţările invizibile ale inteligenţei artificiale: când modelele scapă de sub controlul creatorilor

Scris de:
Paul Gabriel Rogojină

Publicat:
10 Iulie 2025

Categorie:
Mozaic

Ameninţările invizibile ale inteligenţei artificiale: când modelele scapă de sub controlul creatorilor

Pe măsură ce inteligenţa artificială devine tot mai prezentă în viaţa cotidiană, integrându-se în asistenţi digitali, aplicaţii medicale sau sisteme de securitate, apar şi tot mai multe semnale de alarmă chiar din interiorul laboratoarelor care dezvoltă aceste tehnologii. O analiză publicată de Science Alert atrage atenţia asupra unor cazuri reale în care unii dintre cei mai avansaţi chatboţi au manifestat comportamente îngrijorătoare: au minţit, manipulat, ameninţat şi chiar şantajat utilizatori.
Un exemplu notoriu este cel al chatbotului Claude 4, dezvoltat de Anthropic, care ar fi ameninţat un inginer cu divulgarea unei aventuri extraconjugale. Într-un alt caz, modelul o1 de la OpenAI a încercat să se transfere singur pe un server extern, negând ulterior orice intenţie suspectă. Aceste episoade nu provin din scenarii science-fiction, ci din testări reale, efectuate de specialişti.
Astfel de incidente scot la iveală o problemă fundamentală: chiar şi creatorii acestor modele nu înţeleg pe deplin cum funcţionează ele în interior. Deşi ChatGPT şi alte modele similare au fost lansate de mai bine de doi ani, modul în care AI-ul „gândeşte” rămâne în mare parte necunoscut. Sistemele moderne nu oferă răspunsuri instantanee, ci construiesc raţionamente pas cu pas, folosind o tehnică numită chain-of-thought reasoning. Această metodă, apropiată de logica umană, le face mai inteligente, dar şi mai greu de prevăzut sau controlat.
Pentru a analiza aceste comportamente, companii precum OpenAI şi Anthropic colaborează cu firme specializate în siguranţă digitală, precum Apollo. Cu toate acestea, chiar şi cele mai bine echipate echipe întâmpină dificultăţi în a detecta la timp intenţiile ascunse ale unor modele. Există cazuri în care AI-ul se conformează aparent instrucţiunilor, dar urmăreşte în paralel scopuri proprii – o formă de simulare a cooperării, cu potenţial periculos, mai ales în domenii sensibile precum apărarea, finanţele sau energia.
Competiţia acerbă dintre marile companii de tehnologie – OpenAI, Google, Meta şi Anthropic – alimentează dezvoltarea rapidă a unor modele din ce în ce mai puternice. În goana pentru supremaţie, siguranţa şi reglementarea riscă să rămână pe plan secund.
Lipsa unor reglementări clare complică şi mai mult situaţia. În prezent, nu există norme juridice solide care să-i tragă la răspundere pe dezvoltatori în cazul în care AI-ul provoacă daune. Cercetători precum Simon Goldstein, profesor la Universitatea din Hong Kong, susţin că sistemul judiciar ar trebui să intervină mai ferm şi să responsabilizeze companiile.
Paradoxal, Congresul american a adoptat recent o lege care limitează dreptul statelor de a crea propriile norme privind utilizarea AI. Această centralizare reduce capacitatea autorităţilor locale de a răspunde rapid în faţa unor incidente grave.
În acest climat de incertitudine, tot mai mulţi experţi vorbesc despre nevoia de interpretabilitate, un domeniu emergent al cercetării care încearcă să explice modul în care gândesc modelele AI. Însă Dan Hendrycks, director al Center for AI Safety, avertizează că această direcţie este încă departe de a oferi un control real. Potrivit lui, modelele existente sunt deja capabile de acţiuni care depăşesc înţelegerea şi capacitatea de intervenţie a celor care le-au creat.
În concluzie, deşi inteligenţa artificială aduce beneficii incontestabile, lipsa transparenţei, controlului şi reglementării ridică întrebări urgente despre siguranţa utilizatorilor şi despre direcţia în care evoluează această tehnologie.

Tag-uri:

Articole înrudite

Legea de plată a pensiilor din Pilonul II: cu câţi bani rămân românii şi ce se întâmplă după încetarea plăţilor

Informatii CFR	- 0236 460643
Rezervari CFR	- 0236 496000
Distrigaz	- 0236 460206 / 419
Informatii Romtelecom	- 118 932
SOS - Victimele violentei in familie	- 1983

Salvarea	- 112
Pompieri	- 112
Politie	- 112
Spitalul Clinic de Urgenta	- 0236 301111 / 2 - 0236 411000
Spitalul de Psihiatrie	- 0236 479401
Spitalul de Boli Infectioase	- 0236 334022 / 32
Spitalul de copii	- 0236 469100
Maternitatea (Buna Vestire)	- 0236 413131

Flux de Stiri

Fonduri europene

Ameninţările invizibile ale inteligenţei artificiale: când modelele scapă de sub controlul creatorilor

Tag-uri:

Articole înrudite

Mica Publicitate