Neue Funktionen: Was das ChatGPT-Bildmodell 2.0 kann

OpenAI hat sein Bildmodell in der Version 2.0 aktualisiert und bietet nun bessere Typografie, direkten Webzugriff sowie eine integrierte Denkfunktion. Die neue Version unterstützt zudem verschiedene Seitenverhältnisse und ist in zwei Modi verfügbar: Standard und „Denken“.

Während der Standardmodus für alle Nutzer zugänglich ist, bleibt die Denkfunktion kostenpflichtigen Abonnenten vorbehalten. Die KI soll damit präzisere und kontextbewusstere Bilder generieren können.

Praktische Tests: Wo die KI überzeugt

In einem eintägigen Test setzte ein Redakteur das neue Modell auf verschiedene Aufgaben an – mit teils beeindruckenden Ergebnissen:

  • Persönliche Erinnerungen: Eine Nutzerin bat um ein Gedenkbild für ihren verstorbenen Katze inklusive Spielzeug. Die KI erstellte eine hochpersonalisierte Trauerkarte, die wie ein professionell gestaltetes Kondolenzschreiben wirkte.

  • Fotos bearbeiten: Hochzeitsfotos wurden in ein altmodisches Fotoalbum mit Ecken transformiert – eine kreative Lösung für nostalgische Effekte.

  • Grafikdesign: Für ein fiktives Event in Washington Square Park erstellte die KI einen Poster-Entwurf mit einem „Mike Allen-Doppelgänger“-Wettbewerb. (Anmerkung: Die Veranstaltung war rein fiktiv.)

  • Infografiken: Eine humorvolle „Gegenargumente gegen Süßmais“-Infografik sollte Kollegen überzeugen – allerdings ohne Erfolg. Der Geschmack blieb umstritten.

  • Raumplanung: Ein chaotisches Schlafzimmer wurde digital aufgeräumt. Die KI zeigte eine aufgeräumte Version des Raums – was beim Partner jedoch eher als „Spott“ wahrgenommen wurde.

  • Sportler-Porträts: Bilder von Softball- und Fußballspielen wurden zu personalisierten Trading Cards mit Namen, Position und Teamlogo umgewandelt.

Grenzen der KI: Wo sie noch an ihre Grenzen stößt

Trotz der Fortschritte gibt es weiterhin Schwächen:

  • Zeitaufwand: Die Denkfunktion verlängert die Generierungszeit deutlich. Nutzer müssen Geduld mitbringen.

  • Genauigkeit: Bei der Erstellung einer fiktiven Zeitung („Smart Brevity Times“) wurden zunächst veraltete Artikel verwendet. Erst beim zweiten Versuch wurden aktuelle Headlines integriert – das Ergebnis wirkte jedoch wie ein grober Entwurf.

  • Ästhetik: Ein angeforderter Mahjong-Schummelzettel war inhaltlich korrekt, aber optisch unfertig und wenig ansprechend.

Fazit: Nützliches Tool mit Potenzial – aber noch nicht perfekt

Das aktualisierte Bildmodell von ChatGPT zeigt deutliche Verbesserungen in Sachen Präzision, Kreativität und Kontextverständnis. Besonders im kreativen Bereich oder für schnelle Entwürfe kann die KI bereits jetzt überzeugen. Allerdings sind die Ergebnisse nicht immer fehlerfrei, und die Denkfunktion erfordert Geduld.

„Die neuen Funktionen sind ein großer Schritt nach vorn, aber die KI ist noch nicht bereit für professionelle Anwendungen ohne menschliche Nachbearbeitung.“ – Testredakteur

Für Privatnutzer und gelegentliche Anwender bietet das Tool bereits jetzt einen echten Mehrwert. Unternehmen sollten jedoch weiterhin kritisch prüfen, ob die Ergebnisse ihren Qualitätsansprüchen genügen.

Quelle: Axios