Inteligența artificială poate identifica conturile false și pseudonimele utilizatorilor

Inteligența artificială poate identifica în mod rapid și precis identitatea reală a utilizatorilor de internet care se ascund sub pseudonime, după ce o echipă de cercetători a testat această capacitate pe forumuri anonime. Într-un studiu recent, modelele lingvistice precum Gemini și ChatGPT au reușit să recunoască 68% dintre utilizatori, cu o precizie de 90%, în doar câteva minute. Aceste rezultate sunt comparabile cu rata de 0% a celor mai eficiente metode tradiționale fără utilizarea AI.

Impactul asupra anonimității online

Rezultatele studiului sugerează că anonimatul pe internet nu mai este total garantat. Cercetătorii afirmă că anonimitatea utilizatorilor cu pseudonime devine dificil de menținut în condițiile în care modelele lingvistice pot identifica utilizatorii cu rapiditate și acuratețe.

Daniel Paleka, cercetător la Institutul Federal Elvețian de Tehnologie din Zurich (ETH Zurich), explică că aceste metode permit recovery-ul informațiilor private din conturi pseudonime, precum Reddit sau forumuri anonime. El adaugă că aceste modele pot colecta detalii despre convingeri, opinii politice sau insecurități personale, dacă există suficiente indicii online.

Pentru Spania, o platformă precum Forocoches, ar putea fi folosită ca teren de testare pentru aceste tehnologii. În acest mod, posibilitatea de a dezvălui identitatea reală a unor utilizatori devine o preocupare majoră pentru confidențialitate.

Disputele legale și implicațiile pentru supraveghere

Compania Anthropic și Pentagonul se află în proces de litigiu legat de utilizarea AI pentru de-anonimizare. Anumite declarații ale companiei dezvăluie că, sub legislația actuală, guvernul poate colecta date ale utilizatorilor din surse publice fără mandat.

Anthropic susține că aceste tehnologii permit asamblarea unei imagini complete a vieții unei persoane, chiar și din informații dispersate, ceea ce ridică probleme etice legate de supraveghere și confidențialitate. Paleka menționează că modelele AI pot crea o cronologie detaliată a activităților online și offline ale utilizatorilor, dacă există suficiente date disponibile pe internet.

Procedeele de dezvăluire a identităților

Cercetătorii au lucrat cu o bază de profiluri de utilizatori Hacker News, unde profilurile LinkedIn au fost conectate, apoi anonimizate. Modelele lingvistice au primit sarcina de a identifica utilizatori pe baza unor indicii biografice precum locația, profesia, hobby-urile sau alte detalii demografice și valorice.

Paleka explică că aceste modele exploatează amprenta digitală lăsată de utilizatori și pot realiza identificarea rapid și ieftin, comparativ cu cercetarea umană. Metodele pot folosi, de exemplu, stilul de scris sau expresiile frecvent utilizate, dar și alte detalii mai puțin evidente, precum preferința pentru anumite forme de exprimare sau activități online.

Detectarea profilurilor false și riscurile pentru utilizatori

Deși cercetările au vizat datări limitate pentru a proteja confidențialitatea, rezultatele indică faptul că modele AI pot dezanonim rapid utilizatori anonimi dacă aceștia dezvăluie măcar câteva informații identificabile.

Paleka arată că această abordare poate fi folosită pentru a conecta conturi multiple aceluiași utilizator, adăugând riscul ca detalii mai puțin evidente, precum stilul de exprimare sau obiceiurile, să fie exploatate pentru identificare.

El subliniază că aceste tehnologii pot avea implicații serioase pentru confidențialitatea utilizatorilor, chiar dacă în prezent nu sunt încă perfect fiabile pentru identificarea celor mai dificil de recunoscut utilizatori.

Detalii fictive și riscuri ulterioare

Pentru a demonstra capacitatea AI de a recupera informații, cercetătorii au creat profiluri fictive, bazate pe comentarii și detalii reale din internet, precum locuința în Nelson, profesia de asistentă pediatrică, hobby-uri sau preferințele culinare. Aceste exemple arată cât de mult pot fi diseminate și anonimizate date despre o persoană.

Paleka avertizează că, în timp, modele de inteligență artificială din ce în ce mai avansate ar putea să devină capabile să dezgroape și informații mai puțin evidente, precum stilul de exprimare sau obiceiurile specifice, și astfel să identifice utilizatorii cu o acuratețe crescută.

El concluzionează că, uneori, cea mai mare amenințare nu este dezvăluirea explicită a datelor, ci combinarea mai multor indicii pentru a construi o imagine clară despre o persoană, inclusiv din echipamentele, istoricul de navigare sau activitățile de pe internet.

Recomandarea autorului pentru utilizatori este de a fi conștienți că orice informație publicată online, chiar aparent anonimă, poate fi ulterior utilizată pentru identificare, iar protejarea identității devine din ce în ce mai dificilă în fața capabilităților tehnologice în evoluție.