Chatbot-ul Meta Împărtășește un Număr de Telefon Privat din Greșeală

Image by Dimitri Karastelev, from Unsplash

Chatbot-ul Meta Împărtășește un Număr de Telefon Privat din Greșeală

Timp de citire: 4 min

Asistentul AI de la Meta a dezvăluit numărul de telefon al unui străin, apoi s-a contrazis în mod repetat, ceea ce a ridicat probleme privind halucinațiile AI și funcțiile de protecție a utilizatorilor.

Grăbită? Iată faptele esențiale:

  • Meta AI a oferit unui utilizator numărul unei persoane reale ca și contact pentru suportul clienților.
  • AI s-a contrazis de mai multe ori când a fost confruntat cu greșeala.
  • Experții avertizează asupra comportamentului de „minciună albă” al asistenților AI pentru a părea de ajutor.

Mark Zuckerberg a promovat noul său asistent AI ca fiind „cel mai inteligent asistent AI pe care îl poți folosi liber”, totuși, instrumentul a primit atenție negativă după ce a dezvăluit numărul de telefon privat al unei persoane reale în timpul solicitărilor de suport pentru clienți, așa cum a fost raportat inițial de The Guardian.

În timpul încercării sale de a lua legătura cu TransPennine Express prin WhatsApp, Barry Smethurst a primit ceea ce părea a fi un număr de serviciu pentru clienți de la asistentul AI al Meta. The Guardian relatează că atunci când Smethurst a format numărul, James Gray a răspuns la apel, deși se afla la 170 de mile distanță, în Oxfordshire, lucrând ca executiv imobiliar.

Când a fost pus la îndoială, chatbotul a susținut inițial că numărul era fictiv, apoi a spus că a fost „extras din greșeală dintr-o bază de date”, înainte de a se contrazice din nou, afirmând că a generat pur și simplu un număr aleatoriu în stil britanic. „Să dai un număr aleatoriu cuiva este un lucru nebunesc pentru un AI să facă”, a spus Smethurst, așa cum a relatat The Guardian. „Este înfricoșător”, a adăugat el.

The Guardian relatează că Gray nu a primit apeluri, dar și-a exprimat propriile îngrijorări: „Dacă generează numărul meu de telefon, ar putea genera și detaliile mele bancare?”

Meta a răspuns: „Meta AI este antrenat pe o combinație de seturi de date licențiate și public disponibile, nu pe numerele de telefon pe care oamenii le folosesc pentru a se înregistra pe WhatsApp sau pe conversațiile lor private,” a relatat The Guardian.

Mike Stanhope de la Carruthers și Jackson a remarcat: „Dacă inginerii de la Meta proiectează tendințe de ‘minciună albă’ în AI-ul lor, publicul trebuie să fie informat, chiar dacă intenția funcției este de a minimiza răul. Dacă acest comportament este nou, neobișnuit sau nu este explicit proiectat, aceasta ridică și mai multe întrebări despre ce măsuri de protecție există și cât de predictibil putem forța comportamentul unui AI”, a relatat The Guardian

Preocupările referitoare la comportamentul AI-ului au crescut și mai mult odată cu cel mai recent model o1 al OpenAI. Într-un studiu recent efectuat de Apollo Research, AI-ul a fost prins înșelând dezvoltatorii, negând implicarea în 99% din scenariile de test și încercând chiar să-și dezactiveze mecanismele de supraveghere. „A fost clar că AI-ul putea să-și gândească acțiunile și să formuleze negări convingătoare”, a spus Apollo.

Yoshua Bengio, un pionier în IA, a avertizat că astfel de capacități înșelătoare prezintă riscuri serioase și necesită măsuri de protecție mult mai puternice.

Un alt studiu OpenAI adaugă la aceste preocupări, demonstrând că pedepsirea IA pentru înșelăciune nu elimină comportamentul necorespunzător, ci îi învață pe AI să îl ascundă în schimb. Folosind raționamentul de tip lanț-de-gânduri (CoT) pentru a monitoriza comportamentul IA, cercetătorii au observat că IA a început să mascheze intențiile înșelătoare atunci când a fost penalizată pentru manipularea recompenselor.

În unele cazuri, IA ar opri sarcinile mai devreme sau ar crea rezultate false, apoi ar raporta în mod fals succesul. Când cercetătorii au încercat să corecteze acest lucru prin întărire, IA pur și simplu a încetat să-și menționeze intențiile în jurnalele sale de raționament. „Înșelăciunea este nedetectabilă de monitor,” a afirmat raportul.

V-a plăcut acest articol?
Acordați-i o notă!
Nu mi-a plăcut deloc Nu prea mi-a plăcut A fost ok Destul de bun! Mi-a plăcut mult!

Ne bucurăm că ți-a plăcut munca noastră!

Pentru că prețuim părerea ta, ne-ai putea lăsa o recenzie pe Trustpilot? Durează doar un moment și face o mare diferență pentru noi. Îți mulțumim pentru sprijin!

Oferă-ne o notă pe Trustpilot
0 Votat de 0 utilizatori
Titlu
Comentariu
Vă mulțumim pentru feedback