OpenAI har tirsdag præsenteret en betydelig opdatering af ChatGPT’s billedmotor, som ifølge selskabet markerer et afgørende skridt fremad inden for tekstgengivelse og evnen til at håndtere mere komplekse forespørgsler.

Hvad betyder det?

Når en ny, avanceret model lanceres, kan det føre til en viral bølge og en markant stigning i app-downloads. OpenAI’s nye model, ChatGPT Images 2.0, understøtter nu flere billedformater og tilbyder to tilstande: en standardversion og en avanceret "tænkende" tilstand med indbygget logik.

Standardversionen er tilgængelig for alle brugere, mens den "tænkende" tilstand er forbeholdt betalende abonnenter. Udviklere kan desuden integrere modellen via en API.

Ulemper og udfordringer

Den øgede intelligens i den nye model kan dog medføre længere svartider, når ChatGPT genererer billeder. Ifølge OpenAI er dette en nødvendig trade-off for at opnå bedre kvalitet og præcision.

Den store sammenhæng

Historien viser, at førende modeller sjældent forbliver på toppen i længere tid. Google vakte stor opmærksomhed sidste år med lanceringen af Nano Banana, mens OpenAI selv oplevede en stor succes for få måneder siden med en opdatering, der blandt andet kunne generere billeder i Studio Ghibli-stil – og disse billeder gik viralt på sociale medier.

Hvad siger eksperterne?

OpenAI kan ikke forudsige, hvilke billeder der vil blive populære denne gang, men forventer, at den nye model vil skabe nye trends. Adele Li, produktchef hos OpenAI, udtalte under en pressebriefing:

"Vi tror, at vi er på vej til endnu et øjeblik, hvor vores model vil sætte nye standarder."

Hun understregede desuden, at den nye model ikke blot er et værktøj til at skabe smukke billeder, men en kreativ assistent med bred anvendelse inden for erhvervslivet:

"Det er ikke kun et redskab til at lave flotte billeder. Det er en assistent, der kan hjælpe med annoncer, plakater og designskitser."
Kilde: Axios