OpenAI a anunțat oficial, în aprilie, lansarea unei noi familii de modele AI sub denumirea Omni, odată cu introducerea versiunilor o3 și o4 Mini.
Aceste modele sunt rezultatul unui efort tehnologic de a construi o arhitectură unificată, capabilă să proceseze în mod nativ nu doar text, ci și imagine, audio și video — în cadrul unui singur model, fără a recurge la subsisteme dedicate fiecărui tip de input. Este o direcție care marchează tranziția de la modele specializate pe un singur format la o abordare mai apropiată de modul în care oamenii înțeleg și combină informația multimodală.
o3 și o4 Mini – adaptate pentru utilizări diferite
Modelul Omni 3 (o3) este conceput pentru a fi operat în centre de date, având o arhitectură optimizată pentru performanță scalabilă și eficiență în procesarea complexă. În același timp, Omni 4 Mini (o4 Mini) este un model de dimensiuni reduse, destinat funcționării pe dispozitive locale, precum telefoane mobile sau laptopuri, oferind în același timp o capacitate remarcabilă de raționament și interacțiune.
Conform OpenAI, aceste modele au fost instruite folosind metode îmbunătățite de „alignment”, menite să crească fiabilitatea și siguranța comportamentului în interacțiuni diverse, de la întrebări factuale la solicitări conversaționale sau generative.
Cum sunt testate modelele AI
Un punct important în comunicatul OpenAI este Tau-bench, un set de teste care evaluează cât de bine se descurcă modelele AI în sarcini cu un grad ridicat de complexitate, similare celor întâlnite în aplicații reale. În special, modelul trebuie să înțeleagă o solicitare și să decidă ce acțiuni să execute dintr-un set predefinit de funcții.
Unul dintre domeniile analizate este retail-ul, ales tocmai pentru relevanța practică a acestui sector. În acest context, o4 Mini a obținut un scor de 65,6%, depășind alte modele de dimensiuni similare și apropiindu-se de performanța modelului mai mare, o3. Acest rezultat sugerează că modele compacte, gândite pentru rulare locală, pot deja face față cu succes unor cerințe complexe din mediul comercial.
Performanța în retail și implicațiile pentru comerțul online
Rezultatele obținute de modelul o4 Mini în testele Tau-bench, în special scorul de peste 65% în sarcini din domeniul retail, indică o capacitate solidă de înțelegere și decizie în contexte comerciale concrete.
Acest tip de performanță, demonstrat în scenarii cu un grad ridicat de complexitate, are relevanță directă pentru eCommerce, unde sarcini precum interpretarea comenzilor vocale, clasificarea vizuală a produselor sau automatizarea conversațiilor cu clienții sunt deja parte din infrastructura operațională.
Prin integrarea unor modele ca o4 Mini, aceste funcționalități ar putea deveni mai eficiente, mai rapide și mai ușor de implementat, fără a mai depinde de sisteme cloud sau soluții separate pentru fiecare tip de input. Astfel, AI-ul capătă un potențial real de a simplifica arhitectura aplicațiilor comerciale, contribuind la o experiență de cumpărare mai fluidă și mai naturală.
În final, modelele Omni sunt încă într-o etapă incipientă de adoptare, dar direcția este clară: dezvoltarea unei infrastructuri AI unificate, multimodale și scalabile, capabilă să funcționeze eficient atât la nivel de aplicații mobile, cât și în ecosisteme enterprise.
Dincolo de cifre și arhitectură, ceea ce propune OpenAI este o schimbare de paradigmă — o inteligență artificială care poate procesa lumea într-un mod mai apropiat de oameni, combinând înțelegerea vizuală, auditivă și textuală într-o singură entitate logică.