En ny era för ChatGPT:s bildhantering

OpenAI har på tisdagen presenterat en uppgraderad bildmotor för ChatGPT, som enligt företaget innebär ett betydande framsteg inom textåtergivning och förmågan att hantera mer komplexa förfrågningar. Den nya versionen, kallad ChatGPT Images 2.0, lovar att bredda användningsområdena för AI-genererade bilder.

Stöd för fler format och funktioner

Den uppdaterade motorn stöder nu en rad olika bildformat och aspektförhållanden, vilket ger användarna större flexibilitet. Dessutom införs två lägen: ett standardläge och ett "tänkläge" med inbyggd resonemangsförmåga. Standardversionen är tillgänglig för alla användare, medan tänkläget är reserverat för betalande prenumeranter.

Utvecklare kommer också att kunna integrera den nya modellen via ett API, vilket öppnar upp för nya tillämpningar och innovationer.

Utmaningar och fördröjningar

En nackdel med den ökade komplexiteten är att bilderna kan ta längre tid att generera, särskilt i tänkläget. Trots detta menar OpenAI att fördelarna överväger nackdelarna, särskilt för professionella användningsområden.

En ny viral potential

Historien visar att nya AI-modeller ofta leder till virala ögonblick och ökad användning. Google fick stor uppmärksamhet för sin Nano Banana-modell förra året, och OpenAI själva upplevde en liknande effekt när deras tidigare modell lanserades och skapade bland annat bilder i Studio Ghibli-stil som spreds snabbt.

OpenAI:s produktchef Adele Li uttryckte under en pressbriefing att företaget inte kan förutspå vad som kommer att bli nästa stora trend, men förväntar sig att den nya modellen kommer att generera egna virala bilder. "Vi tror att vi kommer att få ytterligare ett sådant ögonblick här", sade Li.

Professionella tillämpningar i fokus

Utöver den kreativa potentialen betonar OpenAI att den nya modellen är väl lämpad för professionellt arbete. Den kan användas för att skapa annonser, affischer och prototyper, vilket gör den till en värdefull resurs för designers och marknadsförare. "Det handlar inte bara om att skapa vackra bilder, utan om att vara en kreativ assistent", förklarade Li.

"Det handlar inte bara om att skapa vackra bilder, utan om att vara en kreativ assistent." – Adele Li, produktchef på OpenAI

Vad händer härnäst?

Med den nya bildmotorn tar ChatGPT ytterligare ett steg mot att bli en mer mångsidig och kraftfull AI-verktyg. Frågan är om den kommer att leda till nya virala trender eller om konkurrenterna snart kommer ikapp. En sak är dock säker: utvecklingen inom AI fortsätter att accelerera, och användarna kan se fram emot ännu fler innovationer framöver.

Källa: Axios