Compania din spatele ChatGPT criticată după revendicarea medaliei de aur la Olimpiada Internațională de Matematică

Compania din spatele ChatGPT criticată după revendicarea medaliei de aur la Olimpiada Internațională de Matematică
ChatGPT, FOTO: Boarding1now, Dreamstime.com

Modelele de inteligență artificială create de echipele de la DeepMind și OpenAI au obținut recent o realizare notabilă: medalia de aur la Olimpiada Internațională de Matematică, conform informațiilor publicate de Gizmodo.

Ambele organizații au declarat că au câștigat o medalie de aur la competiția din acest an, considerată una dintre cele mai exigente destinate elevilor de liceu care doresc să își demonstreze abilitățile în matematică.

Olimpiada reunește cei mai talentați elevi din întreaga lume și le oferă provocarea de a rezolva o serie de probleme matematice complexe. Participanții au de susținut două examene de câte patru ore și jumătate, în două zile consecutive, și trebuie să rezolve un total de șase probleme, fiecare având punctaje diferite în funcție de corectitudinea soluțiilor.

Modelele dezvoltate de DeepMind și OpenAI au reușit să rezolve corect cinci din cele șase probleme, acumulând un scor total de 35 din 42 de puncte posibile, suficient pentru a obține medalia de aur. Totodată, 67 de elevi din 630 au reușit să câștige această distincție.

OpenAI nu a fost invitată la Olimpiada Internațională de Matematică

„Există însă un detaliu important care nu ține de rezultate, ci de comportamentul companiilor”, subliniază Gizmodo.

DeepMind a fost invitată oficial la IMO și a anunțat medalia de aur printr-un articol pe blog, după ce organizația a publicat rezultatele pentru elevi.

În schimb, OpenAI nu a participat efectiv la olimpiadă. Compania a folosit problemele disponibile public și le-a abordat pe cont propriu, anunțând un rezultat corespunzător medalei de aur, care nu poate fi validat de IMO, având în vedere că nu a fost înscrisă oficial.

De asemenea, OpenAI a comunicat scorul său în weekend, înainte de publicarea oficială a rezultatelor, în ciuda cererii din partea IMO ca această realizare să nu umbrească succesul elevilor.

De ce sunt relevante rezultatele echivalente medaliei de aur pentru elevi

Modelele utilizate pentru rezolvarea problemelor au avut aceleași condiții ca participanții: un timp de 4,5 ore pentru fiecare examen și fără acces la instrumente externe sau internet.

Este remarcabil faptul că ambele companii au folosit modele de inteligență artificială generaliste, în loc de unele specializate, care, în trecut, au demonstrat performanțe mult mai bune.

Un alt aspect interesant este că modelele care au obținut rezultatul necesar nu sunt disponibile publicului. Modelele accesibile au avut performanțe foarte slabe la aceste teste.

Cercetările efectuate pe Gemini 2.5 Pro, Grok-4 și OpenAI o4 au demonstrat că niciunul dintre aceste modele nu a reușit să obțină mai mult de 13 puncte, sub pragul de 19 necesar pentru o medalie de bronz.

Două concluzii semnificative privind testarea modelelor A.I. pe problemele de matematică

Există încă multe întrebări despre aceste rezultate, iar performanțele slabe ale modelelor publice sugerează o diferență semnificativă între instrumentele accesibile și cele mai avansate, alimentând astfel concepții legitime legate de dificultatea extinderii sau disponibilității acestor modele superioare.

„Însă, există două concluzii majore: modelele experimentale devin din ce în ce mai eficiente în probleme de raționament, iar OpenAI este condusă de indivizi care nu au putut să aștepte momentul potrivit pentru a-și asuma meritele adolescenților”, conchid jurnaliștii de la Gizmodo.

FOTO articol: Boarding1now, Dreamstime.com.

Recomandari
Show Cookie Preferences