OpenAI revine în domeniul inteligenţei artificiale cu sursă deschisă, anunţând lansarea a două noi modele disponibile gratuit: gpt-oss-120b şi gpt-oss-20b. Acestea pot fi descărcate prin platforma Hugging Face şi sunt prezentate ca unele dintre cele mai performante modele „open-weight” disponibile în prezent.
Modelul gpt-oss-120b, mai puternic, este optimizat pentru a rula pe o singură placă video Nvidia, în timp ce versiunea mai mică, gpt-oss-20b, poate fi folosită chiar şi pe laptopuri cu cel puţin 16GB RAM. Este pentru prima dată din 2019, de la GPT-2 încoace, când OpenAI publică un model cu acces liber, marcând o schimbare importantă de strategie.
Ambele modele pot colabora cu sisteme AI mai performante din cloud. Dacă utilizatorul încearcă o sarcină care depăşeşte capacităţile modelului local, acesta poate redirecţiona cererea către un model închis, operat de OpenAI, ceea ce le oferă o flexibilitate tehnică sporită.
Lansarea survine într-un context competitiv tot mai accentuat. Companii chineze precum DeepSeek şi Alibaba au câştigat teren în comunităţile de dezvoltatori prin modele AI deschise, iar presiunile din partea acestora au influenţat vizibil poziţia OpenAI. În plus, administraţia Trump a îndemnat companiile americane să adopte o abordare mai deschisă pentru a promova tehnologia în acord cu valorile democratice.
CEO-ul Sam Altman a recunoscut anterior că OpenAI a făcut o greşeală prin reticenţa de a oferi acces deschis la modelele sale. Noile lansări par să încerce o corectare parţială a acestei direcţii.
În testele de performanţă, modelele gpt-oss au obţinut rezultate notabile. În evaluarea Codeforces, gpt-oss-120b a înregistrat un scor de 2622, iar gpt-oss-20b a atins 2516, depăşind modelele open-source ale DeepSeek, dar rămânând în urma celor din seriile o3 şi o4-mini ale OpenAI. În testul „Humanity’s Last Exam”, scorurile au fost de 19% şi, respectiv, 17,3%.
Totuşi, un punct slab semnificativ îl reprezintă rata ridicată de halucinaţii – răspunsuri incorecte, oferite cu încredere aparentă. În testul intern PersonQA, modelele au generat răspunsuri halucinante în peste 49% dintre cazuri, un nivel considerabil mai mare decât cel al modelelor comerciale oferite de OpenAI.
Din punct de vedere tehnic, gpt-oss a fost antrenat folosind metode moderne precum mixture-of-experts (MoE), care activează doar anumite seturi de parametri în funcţie de context, precum şi prin învăţare prin întărire pe infrastructură Nvidia. Modelele sunt exclusiv textuale şi nu oferă funcţii de procesare a imaginilor sau sunetului.
Lansate sub licenţa Apache 2.0, gpt-oss-120b şi gpt-oss-20b pot fi utilizate liber, inclusiv în aplicaţii comerciale, fără a necesita aprobarea OpenAI. Totuşi, compania a ales să nu publice datele de antrenament, invocând riscuri legale, mai ales în contextul proceselor în curs privind utilizarea materialelor protejate prin drepturi de autor.
Prin această mişcare, OpenAI îşi reafirmă prezenţa în ecosistemul open-source, într-un moment în care competiţia globală din zona AI se intensifică, iar transparenţa devine tot mai mult un criteriu de încredere în industrie.