Microsoft lansează MAI-Image-1, primul generator de imagini dezvoltat intern

Sediu Microsoft
Photo by efes on Pixabay

Primul generator de imagini AI dezvoltat intern de Microsoft, MAI-Image-1, este acum disponibil în două produse, Bing Image Creator și Copilot Audio Expressions, relatează The Verge.

Urmărește cele mai noi producții video TechRider.ro

- articolul continuă mai jos -

Compania a anunțat modelul în octombrie. Șeful Microsoft AI, Mustafa Suleyman, a scris într-o postare pe X că modelul text-imagine va fi „disponibil în curând” în UE.

Suleyman a adăugat că modelul „excelează cu adevărat” în generarea de imagini cu scene din natură și cu alimente, precum și în iluminarea artistică și detaliile fotorealiste.

Microsoft a publicat mai multe detalii pe blogul său: „MAI-Image-1 excelează în generarea de imagini fotorealiste, cum ar fi iluminarea (de exemplu, lumina reflectată, reflexiile), peisajele și multe altele. Acest lucru este valabil în special în comparație cu multe modele mai mari și mai lente. Combinația dintre viteză și calitate înseamnă că utilizatorii își pot vedea ideile pe ecran mai repede, le pot parcurge rapid și apoi își pot transfera munca către alte instrumente pentru a continua perfecționarea.”

MAI-Image-1 de la Microsoft va crea, de asemenea, artă generată de IA pentru a însoți poveștile audio generate de IA în „modul poveste” al platformei text-to-speech, Copilot Audio Expressions.

În august, Microsoft a anunțat primele sale modele AI interne – modelul de vorbire MAI-Voice-1 și modelul bazat pe text MAI-1-preview. La momentul respectiv, compania a declarat că intenționează să utilizeze MAI-1-preview în asistentul său AI Copilot în anumite cazuri nespecificate, un semn că Microsoft s-ar putea îndepărta de dependența sa de modelele OpenAI. În prezent, Microsoft afirmă că chatbotul Copilot trece la cel mai recent model GPT-5 al OpenAI, oferind în același timp modelele AI Claude ale Anthropic ca opțiuni pentru utilizatori.

MAI-Image-1 este listat ca unul dintre cele trei modele AI disponibile pe site-ul web și în aplicația de creare a imaginilor Bing. Celelalte două modele, DALL-E 3 și GPT-4o, sunt de la OpenAI.

  • Ștefan Munteanu este un jurnalist specializat în domenii variate precum tehnologie, inteligență artificială, securitate cibernetică și apărare. Articolele sale acoperă noutățile din industrie, analize și impactul tehnologiei asupra societății. El este pasionat de inovațiile digitale și are un interes puternic pentru cele mai recente evoluții geopolitice.

Total
0
Shares
Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Citește si...