Noul model ChatGPT obține un IQ superior celor mai mulți oameni, conform Testului Mensa din Norvegia

Recent, noua versiune a modelului ChatGPT, numită o3, a realizat un impresionant scor IQ de 136 la testul Mensa desfășurat în Norvegia, ceea ce îl plasează peste 98% din populație. Acest rezultat demonstrează complexitatea și adaptabilitatea crescândă a modelelor de inteligență artificială în ultimele luni, informează TechRadar.
Progresele rapide în domeniul inteligenței artificiale au dus la speculații, în special în rândul tinerilor, că aceste tehnologii ar putea ajunge să devină conștiente de sine.
Conform unui sondaj recent realizat de platforma EduBirdie, 25% dintre tinerii din generația Z consideră că inteligența artificială a atins deja conștiința de sine, iar mai mult de jumătate dintre ei cred că este doar o chestiune de timp până când chatboturile vor cere drepturi de vot.
Este important să menționăm că testul de IQ Mensa din Norvegia este accesibil publicului, ceea ce presupune că modelul ar fi putut fi instruit cu întrebările sau răspunsurile dela acest test.
Pentru a aborda această problemă, cercetătorii de la MaximumTruth.org au dezvoltat un test de IQ care este complet „offline”, neavând acces la antrenarea cu date.
La acest nou test, care are un nivel de dificultate similar cu cel al testului Mensa, modelul o3 a obținut un scor de 116, considerat tot foarte bun.
Acest rezultat ar plasa modelul o3 al OpenAI în topul celor mai inteligente 15% din populația umană, dacă ar fi fost o persoană. De exemplu, conform datelor de la WorldPopulationReview, IQ-ul mediu al populației este de 99,7 în Statele Unite, 102 în Canada, 106 în Japonia, Taiwan și Singapore și 96,3 în România.
În anul precedent, niciun model de A.I. nu a reușit să obțină un scor peste 90 la același test. În luna mai a anului trecut, cele mai avansate modele se confruntau cu provocări în rezolvarea problemelor cu triunghiurile rotite. Acum, modelul o3 se află confortabil în partea dreaptă a curbei lui Gauss, alături de cei mai inteligenți indivizi.
Această zonă devine tot mai populată. Claude, un chatbot dezvoltat de Anthropic, și-a îmbunătățit scorul, iar Gemini, creat de Google, se situează în jurul valorii de 90. De asemenea, nici modelul de bază GPT-4o nu se află departe de o3, având un IQ cu câteva puncte mai mic.
Jurnaliștii de la TechRadar evidențiază nu doar creșterea inteligenței acestor modele de A.I., ci și capacitatea lor de a învăța rapid și de a se perfecționa într-un mod similar cu actualizările software, spre deosebire de procesul de învățare uman.
FOTO articol: Ai / Rokas Tenys / Dreamstime.com.