OpenAI introduce procesarea Flex: prețuri mai mici pentru sarcini AI cu timpi mai lungi de răspuns

OpenAI încearcă să țină pasul cu Google și Anthropic prin lansarea seriei GPT 4.1
Photo by Levart_Photographer on Unsplash

OpenAI a introdus recent procesarea Flex, o opțiune API care reduce costurile de utilizare ale modelelor AI, în schimbul unor timpi de răspuns mai lenti și a unei posibile indisponibilități ocazionale a resurselor, transmite TechCrunch.

Această opțiune este disponibilă în versiune beta pentru modelele o3 și o4-mini, care sunt destinate sarcinilor de prioritate mică și non-producție, precum evaluările modelelor, îmbogățirea datelor și sarcinile asincrone.

Procesarea Flex permite reducerea costurilor API cu aproximativ 50%.

Pentru modelul o3, prețul este de 5 dolari per milion de tokeni de intrare (echivalentul a aproximativ 750.000 de cuvinte) și 20 de dolari per milion de tokeni de ieșire, în comparație cu prețul standard de 10 dolari per milion de tokeni de intrare și 40 de dolari per milion de tokeni de ieșire.

Pentru o4-mini, prețurile sunt și mai scăzute: 0,55 dolari per milion de tokeni de intrare și 2,20 dolari per milion de tokeni de ieșire, față de prețurile standard de 1,10 dolari și 4,40 dolari pentru aceleași unități de măsură.

Această lansare vine într-un context în care prețurile pentru modelele avansate de AI au continuat să crească, iar OpenAI se confruntă cu o concurență tot mai mare din partea altor companii din domeniu.

Recent, Google a lansat Gemini 2.5 Flash, un model de raționament care oferă performanțe comparabile sau chiar mai bune decât modelul R1 de la DeepSeek, la un cost mult mai scăzut pentru tokenii de intrare.

În plus, OpenAI a anunțat că dezvoltatorii din categoriile 1-3 ale ierarhiei de utilizare trebuie să completeze un proces de verificare a identității pentru a accesa modelul o3.

Categoriile sunt determinate în funcție de suma cheltuită pe serviciile OpenAI, iar această verificare a identității are scopul de a preveni utilizarea abuzivă a serviciilor și de a asigura respectarea politicilor de utilizare ale companiei.

Astfel, procesarea Flex se adresează în special utilizatorilor care au sarcini de procesare cu prioritate mică, care nu necesită timpi rapizi de răspuns și care sunt dispuși să accepte anumite limitări de resurse pentru a beneficia de prețuri mai scăzute.

Aceasta reprezintă o opțiune interesantă pentru dezvoltatori care lucrează cu evaluări, teste sau sarcini care pot fi realizate într-un timp mai lung și care nu au un impact direct asupra producției în timp real.

Total
0
Shares
Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Citește si...