AI-ul poate memora lucruri pe care n-ar trebui să le știe. Dar poate fi făcut să le „uite”?

Modelele de inteligență artificială pot reține uneori fragmente din datele cu care au fost antrenate, inclusiv informații sensibile, iar aceasta devine o problemă tot mai serioasă pe măsură ce AI-ul intră în tot mai multe domenii ale vieții de zi cu zi. Un articol publicat în Science pune întrebarea direct: dacă un sistem AI a memorat ceva ce nu ar fi trebuit să păstreze, poate fi obligat să „uite”?

Tema este importantă pentru publicul larg fiindcă nu se referă doar la marile laboratoare de tehnologie, ci și la date personale, documente medicale, informații confidențiale sau materiale protejate de copyright. Cercetători de la MIT au arătat recent că și modelele folosite în context clinic pot prezenta risc de memorare și expunere a unor date sensibile despre pacienți, chiar atunci când scopul declarat al sistemului este unul benefic.

Aici intră în scenă un domeniu care a crescut rapid în ultimii ani: machine unlearning. Pe scurt, ideea este ca un model deja antrenat să poată fi modificat astfel încât influența unor date specifice să fie eliminată, fără a fi nevoie să refaci de la zero întregul antrenament. Un amplu survey publicat de ACM descrie machine unlearning drept o paradigmă prin care modelele sunt făcute să „uite” anumite date, tocmai pentru a răspunde la cerințe legate de confidențialitate, corectarea erorilor și ștergerea unor informații nedorite.

Problema este că „uitarea” la AI nu seamănă deloc cu uitarea umană. Un model de limbaj nu are amintiri în sensul obișnuit al cuvântului, dar poate păstra în parametrii săi urme statistice ale unor secvențe de text și, în anumite condiții, le poate reproduce. Science notează că noul instrument prezentat în articol ar putea ajuta cercetătorii să studieze mai bine tocmai acest proces: cum „dezveți” un model să mai scoată la suprafață materiale sensibile din datele de antrenare.

La prima vedere, soluția pare simplă: ștergi datele-problemă și gata. În practică, lucrurile sunt mult mai complicate. Reantrenarea completă a unui model mare după fiecare cerere de ștergere este extrem de costisitoare, motiv pentru care cercetătorii caută metode mai rapide și mai precise de unlearning. Mai multe survey-uri recente arată însă că acest proces vine aproape mereu cu compromisuri: modelul trebuie să uite ce nu mai are voie să păstreze, dar fără să-și piardă prea mult din utilitatea generală.

Iar aici apare una dintre cele mai mari dificultăți. Dacă „ștergi” prea agresiv, modelul poate începe să piardă și informații care nu aveau legătură cu materialul vizat. Un studiu prezentat la ICLR 2026 arată că unele metode recente de unlearning pot crea așa-numite „knowledge holes”, adică goluri de cunoaștere neașteptate: sistemul nu mai uită doar ce trebuia, ci slăbește și pe zone apropiate, perfect legitime.

Cu alte cuvinte, întrebarea nu este doar dacă AI-ul poate fi făcut să uite, ci și ce mai strici pe drum atunci când încerci asta. Din acest motiv, machine unlearning a devenit un subiect fierbinte nu doar în informatică, ci și în zona de politici publice, drepturi digitale și reglementare. În Europa, de pildă, ideea de ștergere a datelor și „dreptul de a fi uitat” pun presiune pe companii și cercetători să găsească metode credibile prin care modelele să nu păstreze la nesfârșit orice au absorbit.

Pentru publicul larg, miza este foarte concretă. Dacă un chatbot, un asistent medical sau un sistem automat de codare a fost antrenat pe materiale care conțin nume, parole, detalii financiare sau fragmente din documente private, simplul fapt că modelul „știe” acele lucruri poate deveni un risc. De aceea, cercetarea despre unlearning nu este doar o problemă tehnică pentru specialiști, ci o parte din discuția mai mare despre cât de sigur și de controlabil poate fi AI-ul în viața reală.

Pe scurt, articolul din Science surprinde foarte bine o tensiune centrală a erei AI: sistemele devin tot mai puternice tocmai pentru că absorb cantități uriașe de informație, dar aceeași capacitate poate deveni o vulnerabilitate atunci când rețin lucruri pe care nu ar fi trebuit să le păstreze. Iar în 2026, întrebarea nu mai este una teoretică. Tot mai mulți cercetători încearcă să afle nu dacă modelele memorează, ci cum pot fi făcute să uite în mod verificabil și fără efecte secundare prea mari.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *