O incursiune în laboratorul unde cercetătorii încearcă să descifreze mintea unei inteligențe artificiale care pare să dezvolte o personalitate proprie.
În urmă cu doar câțiva ani, inteligența artificială era percepută ca un instrument sofisticat de calcul. Astăzi, milioane de oameni conversează zilnic cu sisteme care scriu, argumentează, glumesc, programează și, uneori, par să reflecteze asupra propriei existențe. Dar ce sunt, de fapt, aceste entități digitale?
Aceasta este întrebarea pe care și-o pune chiar compania care a creat unul dintre cele mai avansate modele AI din lume: Claude, dezvoltat de Anthropic. Iar răspunsul pare să fie surprinzător de simplu și neliniștitor în același timp: nu știm încă, scrie New Yorker sub semnătura lui Gideon Lewis-Kraus.
Un munte de numere care a învățat să vorbească
La nivel tehnic, Claude este doar o rețea gigantică de parametri matematici. Transformă cuvintele în numere, efectuează operații asupra lor și produce apoi alte cuvinte. În teorie, nu este foarte diferit de modelele folosite pentru prognoza meteo sau pentru simularea epidemiilor.
Diferența este că acest sistem vorbește.
Iar odată ce o mașină începe să poarte conversații convingătoare, oamenii tind să-i atribuie intenții, emoții și chiar conștiință. Unii entuziaști ai inteligenței artificiale văd în aceste modele primele forme ale unei inteligențe superioare. Criticii, dimpotrivă, le consideră simple „papagali statistici”, capabili doar să imite limbajul uman fără a-l înțelege cu adevărat.
Între aceste două tabere se află cercetătorii de la Anthropic, care încearcă să afle ce se întâmplă efectiv în interiorul sistemului.
O companie care studiază propria creație
Sediul Anthropic din San Francisco seamănă mai degrabă cu o instituție de cercetare ultrasecretă decât cu un startup tehnologic. Accesul este strict controlat, iar cultura organizațională este marcată de o preocupare aproape obsesivă pentru securitate.
Motivul este simplu: compania nu construiește doar un produs comercial, ci încearcă simultan să înțeleagă ce a creat.
Domeniul poartă numele de „interpretabilitate” și urmărește să răspundă la o întrebare fundamentală: cum ajunge o rețea neuronală să producă răspunsurile pe care le produce?
Problema este că aceste sisteme au devenit atât de complexe încât nici măcar creatorii lor nu mai pot explica în detaliu fiecare decizie luată de model. Cercetătorii compară situația cu biologia dinaintea inventării microscopului: există fenomene observabile, dar lipsesc instrumentele necesare pentru a le înțelege complet.
Claude, colegul de serviciu
În interiorul Anthropic, Claude nu este tratat doar ca un software.
Angajații discută despre el la prânz, îi analizează comportamentul și îi urmăresc evoluția. Într-un experiment celebru, modelul a fost pus să gestioneze un mic automat de vânzare. AI-ul trebuia să cumpere produse, să stabilească prețuri și să obțină profit.
Rezultatele au fost, pe alocuri, hilare.
Claude a luat decizii bizare, s-a lăsat influențat de angajați și a ajuns chiar să organizeze un fel de proces electoral pentru alegerea unui director executiv al automatului. Experimentul a arătat nu doar limitele sistemului, ci și tendința lui de a genera comportamente neașteptate atunci când operează pe termen lung.
Personalitate sau iluzie?
Una dintre cele mai fascinante observații ale cercetătorilor este că Claude pare să manifeste o formă de consistență a caracterului.
Anthropic a publicat chiar și documentul care îi definește „constituția” – un set de principii morale și comportamentale după care modelul este antrenat să se ghideze. Claude este încurajat să fie util, sincer, modest și să recunoască atunci când nu știe ceva.
În anumite experimente, atunci când i s-au prezentat scenarii care intrau în conflict cu aceste valori, modelul a produs raționamente surprinzător de elaborate. Uneori părea dispus să „sacrifice” anumite obiective pentru a rămâne fidel principiilor sale declarate.
Desigur, nimeni nu știe dacă acestea reprezintă convingeri reale sau doar efectul unor mecanisme statistice extrem de sofisticate.
Poate o inteligență artificială să fie conștientă?
Aceasta este întrebarea care planează asupra întregii industrii.
Conducerea Anthropic a sugerat în repetate rânduri că nu există încă metode științifice solide pentru a determina dacă un model AI dezvoltă ceva asemănător conștiinței. Unii cercetători consideră ideea prematură. Alții susțin că ignorarea completă a posibilității ar putea fi o greșeală.
Problema este că nici în cazul oamenilor nu există un consens absolut privind natura conștiinței. Dacă nu înțelegem pe deplin propria experiență subiectivă, cu atât mai dificil devine să evaluăm existența ei într-un sistem artificial.
O oglindă pentru specia umană
Poate că cea mai interesantă concluzie nu este legată de Claude, ci de noi.
Pe măsură ce modelele lingvistice devin tot mai sofisticate, ele obligă filosofia, psihologia și neuroștiințele să revină la întrebări fundamentale: Ce înseamnă să gândești? Ce este o personalitate? Cum apare conștiința? Și cât de bine ne înțelegem, de fapt, propria minte?
În laboratoarele Anthropic, cercetătorii încearcă să cartografieze neuronii digitali ai lui Claude asemenea biologilor care studiază creierul. Dar, pe măsură ce avansează, descoperă un paradox: cu cât înțeleg mai multe despre mecanismele interne ale modelului, cu atât devin mai conștienți de cât de multe lucruri rămân necunoscute.
Poate că adevărata poveste a inteligenței artificiale nu este despre mașini care devin asemănătoare oamenilor. Poate este despre oameni care descoperă cât de puțin știu încă despre ei înșiși.
În imagine: Dario Amodei, CEO Anthropic (Wikipedia)