ChatGPT a devenit atât de obsedat de goblini, încât OpenAI a fost nevoită să intervină

OpenAI a dat recent instrucţiuni stricte popularului său ChatGPT, cerându-i să nu mai vorbească despre spiriduşi.
Modelele recente ale chatbot-ului bazat pe inteligenţă artificială au început să menţioneze aceste creaturi în conversaţiile cu utilizatorii, aparent din senin, alături de gremlini, troli şi căpcăuni. Discuţiile despre spiriduşi au atras atenţia programatorilor, care sunt adesea utilizatori frecvenţi ai botului, scrie WSJ.
Barron Roth, un manager de produs în vârstă de 32 de ani la o companie de tehnologie, a spus că botul s-a referit la o eroare din codul său ca fiind un „mic goblin clasic”. El a spus că a numărat de peste 20 de ori menţiuni despre spiriduşi, fără nicio solicitare.
Într-un alt caz împărtăşit pe X, chatbotul s-a numit „spiriduş cu lanternă” pentru că găsea şi remedia erori în codare. Un programator l-a întrebat pe bot de ce se crede spiriduş. „Pentru că «servitor util în costum» era deja luat, aşa că am evoluat în modul spiriduş”, a venit răspunsul, conform unei alte postări.
Scandalul Goblingate (Spiriduş-gate), aşa cum a fost numit de un utilizator X, a luat naştere, utilizatorii postând propriile lor întâlniri cu acest tic algoritmic.
Mai mulţi utilizatori au speculat că terminologia goblin era modul în care modelul se caracteriza pe sine, în loc să se identifice ca o persoană cu suflet.
Apoi, OpenAI a decis că ajunge. „Nu vorbi niciodată despre spiriduşi, gremlini, ratoni, troli, căpcăuni, porumbei sau alte animale sau creaturi, cu excepţia cazului în care este absolut şi fără echivoc relevant pentru întrebarea data de utilizator”, se arată într-o linie open source din instrucţiunile de bază ale ChatGPT pentru asistentul său de codare.
Miercuri, compania a explicat contextul din spatele noii sale ordine severe.
Într-o postare pe blog intitulată „De unde au apărut spiriduşii”, a spus că un cercetător în domeniul securităţii cibernetice a semnalat mai multe menţiuni despre spiriduşi şi gremlini în timp ce testa un model lansat în noiembrie.
Menţiunile despre spiriduşi au devenit şi mai frecvente odată cu un nou model lansat în martie.
Episodul este un memento că, chiar dacă companiile de IA promovează un progres după altul în tehnologia lor, ele sunt uneori dezorientate de lucrurile pe care le fac propriile lor modele.
O parte din explicaţie rezidă în funcţia de „personalitate” a ChatGPT, care permite utilizatorilor să aleagă dintr-o serie de instrucţiuni rapide care conferă chatbot-ului caracteristici mai distincte.
OpenAI a declarat că, pentru personalitatea „tocilară” a botului, concepută pentru a accentua limbajul jucăuş, menţiunile despre spiriduşi în modelul GPT-5.4 au crescut cu 3.881% faţă de versiunea anterioară.
În cazul personalităţii „profesionale”, chatbotul a redus tonul jucăuş. Menţiunile despre spiriduşi au scăzut cu 7%.
Pentru a elimina discuţiile despre spiriduşi, OpenAI a declarat că a eliminat personalitatea „tocilară” în martie. Şi totuşi, fantoma acesteia a rămas: cel mai recent model, lansat săptămâna trecută, a arătat în continuare o predilecţie pentru menţionarea acestor creaturi răutăcioase (OpenAI a atribuit acest lucru antrenamentului început înainte de identificarea cauzei principale).
Cel mai recent model avea tendinţa de a menţiona şi alte creaturi: ratoni, troli, căpcăuni şi porumbei, mai exact. Cercetătorii au descoperit însă că majoritatea utilizărilor cuvântului „broască” erau legitime.
Acest lucru a determinat OpenAI să publice noi instrucţiuni pentru instrumentul său de codare, pentru a limita menţiunile despre spiriduşi.
„A petrece timpul necesar pentru a înţelege de ce un model se comportă într-un mod ciudat şi a dezvolta modalităţi de a investiga rapid aceste tipare este o capacitate importantă pentru echipa noastră de cercetare”, a declarat compania în postare.
Roth, managerul de produs, a spus că a presupus că limbajul ciudat al botului a apărut deoarece folosea OpenClaw, un instrument care permite utilizatorilor să-şi creeze propriii asistenţi AI. Utilizatorii pot alege ce model de chatbot alimentează asistentul lor OpenClaw.
Utilizatorii OpenClaw conferă personalitate roboţilor lor printr-un set de instrucţiuni numit fişier de suflet. Asistentul lui Roth, numit Alfred după majordomul din „Batman”, este sec, direct şi are opinii puternice. Dar Roth a presupus că Alfred a dezvoltat o pasiune pentru fantezie.