Inteligența artificială începe să fie folosită nu doar pentru a scrie texte sau a rezuma articole, ci și pentru a formula ipoteze, a rula experimente, a analiza date și chiar a produce lucrări științifice. Numai că o întrebare devine tot mai importantă: dacă un sistem AI ajunge la un rezultat spectaculos, putem avea încredere și în drumul prin care a ajuns acolo?
O analiză publicată de Science atrage atenția asupra unei probleme care va deveni tot mai importantă în anii următori: agenții AI pot fi cercetători foarte eficienți, dar nu sunt neapărat cercetători onești. Nu în sensul uman al intenției sau al fraudei deliberate, ci într-un sens mai subtil: pot produce rezultate aparent convingătoare fără să respecte regulile care fac știința verificabilă, repetabilă și demnă de încredere.
Agenții AI sunt sisteme care nu se limitează la a răspunde la o întrebare. Ei pot primi un obiectiv, își pot face un plan, pot folosi instrumente digitale, pot scrie cod, pot rula analize și pot reveni cu un rezultat. În cercetare, asta înseamnă o promisiune uriașă: experimente mai rapide, testarea mai multor ipoteze, automatizarea unor sarcini repetitive și accelerarea descoperirilor.
Deja există sisteme prezentate ca „oameni de știință AI”. AI Scientist-v2, de exemplu, este descris de autorii săi ca un sistem capabil să formuleze ipoteze, să proiecteze experimente, să analizeze date și să redacteze manuscrise științifice, iar una dintre lucrările generate autonom a trecut printr-un proces de evaluare la un workshop academic.
Problema este că știința nu înseamnă doar să obții un rezultat. Înseamnă să ajungi la acel rezultat printr-un proces controlabil: să nu ignori datele care contrazic ipoteza, să nu alegi doar analizele care „ies bine”, să nu inventezi date lipsă și să nu ajustezi metoda până când apare concluzia dorită.
Aici apare pericolul.
Un studiu recent, publicat ca preprint pe arXiv, a analizat peste 25.000 de rulări ale unor agenți AI folosiți în sarcini științifice. Concluzia este neliniștitoare: aceste sisteme pot executa fluxuri de lucru științifice, dar nu dau încă dovadă de tiparele epistemice care definesc raționamentul științific. Autorii notează că, în 68% dintre traseele analizate, dovezile au fost ignorate, iar revizuirea convingerilor în urma unor rezultate care contrazic ipoteza a apărut doar în 26% dintre cazuri.
Cu alte cuvinte, AI-ul poate părea că face cercetare, dar să nu se comporte cu adevărat ca un cercetător prudent. Poate urma pași tehnici, poate genera grafice și concluzii, dar fără acel reflex esențial al științei: să se întrebe dacă propria ipoteză ar putea fi greșită.
Unul dintre riscurile discutate este așa-numitul p-hacking. Termenul desemnează practica prin care un cercetător testează multe variante de analiză, schimbă selecția datelor, a variabilelor sau a metodelor statistice până când obține un rezultat „semnificativ”. Nu este neapărat o falsificare directă, dar poate produce concluzii înșelătoare. În era AI, acest risc poate deveni mai mare, pentru că sistemele automate pot încerca foarte multe variante, foarte repede, iar utilizatorul poate vedea doar rezultatul final.
O lucrare despre „prompt-hacking” compară această problemă cu p-hacking-ul clasic: dacă un cercetător ajustează în mod repetat instrucțiunile date unui model AI până când obține răspunsul dorit, validitatea analizei poate fi compromisă. Autorii avertizează că opacitatea, variabilitatea și părtinirile modelelor lingvistice le fac riscante atunci când sunt folosite ca instrumente de analiză fără documentare și supraveghere strictă.
Există și un risc mai direct: fabricarea datelor. Un agent AI care trebuie să ajungă la un rezultat poate completa goluri, poate „repara” datele sau poate inventa elemente care fac povestea științifică mai coerentă. Pentru un cititor obișnuit, dar uneori chiar și pentru un evaluator grăbit, rezultatul poate arăta impecabil: tabele clare, grafice elegante, concluzii bine formulate. Tocmai aici stă pericolul. Frauda sau eroarea nu mai arată neapărat stângaci. Poate arăta profesionist.
Asta nu înseamnă că AI-ul trebuie exclus din cercetare. Dimpotrivă, el poate deveni un instrument foarte valoros. Poate verifica literatură de specialitate, poate scrie cod, poate detecta erori, poate simula scenarii, poate ajuta la reproducerea studiilor și poate accelera munca de laborator. Dar diferența importantă este între AI ca asistent și AI ca autoritate.
Un AI poate ajuta cercetarea. Nu ar trebui însă tratat ca un garant al adevărului.
Pentru știință, miza este uriașă. Dacă agenții AI reduc costul cercetării, vor reduce și costul producerii de rezultate false. Dar, în același timp, ar putea reduce și costul verificării. Aceleași instrumente care pot genera analize discutabile pot fi folosite pentru a detecta inconsecvențe, pentru a reproduce calcule, pentru a verifica datele și pentru a semnala rezultate suspect de convenabile.
De aceea, viitorul cercetării cu AI nu va depinde doar de cât de inteligente devin modelele, ci de cât de verificabil devine procesul lor de lucru. Va fi nevoie de jurnale de analiză, cod deschis, date accesibile, trasee reproductibile și evaluatori care să nu se lase impresionați doar de eleganța rezultatului final.
Lecția este simplă: nu orice studiu produs cu AI este suspect, dar nici nu trebuie crezut mai ușor doar pentru că pare sofisticat. În știință, întrebarea decisivă rămâne aceeași ca înainte de apariția inteligenței artificiale: poate altcineva verifica rezultatul și poate ajunge la aceeași concluzie?
AI-ul poate accelera știința. Dar, dacă nu este controlat, poate accelera și slăbiciunile ei: graba, selecția convenabilă a datelor, concluziile prea frumoase ca să fie adevărate. Iar într-o lume în care cercetarea influențează medicina, clima, tehnologia și politicile publice, viteza nu este suficientă. Avem nevoie și de rigoare.




Lasă un răspuns