إطلاق ChatGPT Images 2.0: ثورة في إنشاء الصور ودعم اللغات غير اللاتينية
بعد عام من إطلاق OpenAI ميزة إنشاء الصور داخل ChatGPT، كشفت الشركة عن الإصدار الثاني من هذه الأداة، والذي تصفه بأنه قفزة نوعية في مجال نماذج توليد الصور. يركز التحديث بشكل كبير على تحسين القدرة على فهم التعليمات بدقة، rendering النصوص الكثيفة، وترتيب العناصر في المشهد بشكل متناسق.
أول مرة، أضافت OpenAI قدرات استدلالية للنموذج، مما يسمح له بالبحث على الويب والتحقق من مخرجاته، مما يزيد من موثوقيته في الدقة والتناسق والتماسك البصري. وقال متحدث باسم الشركة:
«يهدف هذا التحديث إلى جعل إنشاء الصور أكثر دقة وموثوقية، خاصة في المهام التي تتطلب دقة عالية».
تحسين كبير في دعم اللغات غير اللاتينية
أعلنت OpenAI أن الإصدار الجديد حقق تقدمًا ملحوظًا في معالجة النصوص غير اللاتينية، مع دعم محسّن للغات اليابانية والكورية والصينية والهندية والبنجالية. كما تم تحسين قدرة النموذج على التقاط الخصائص الفريدة لكل لغة بصرية، مما يجعله أكثر فائدة في مهام مثل تصميم الألعاب ووضع السيناريوهات.
مرونة أكبر في الأبعاد والدقة
أضاف ChatGPT Images 2.0 مرونة أكبر في نسب الأبعاد، حيث يمكن للمستخدمين الآن إنشاء صور تتراوح نسبتها بين 3:1 (عرض) و1:3 (طول). كما يدعم النموذج دقة تصل إلى 2K، ويمكنه إنتاج ما يصل إلى 8 صور في وقت واحد.
اختبارات عملية: من القطط البيكسلية إلى المانجا اليابانية
قبل إطلاق الإصدار رسميًا، حصل فريقنا على فرصة لاختبار ChatGPT Images 2.0. في الاختبار الأول، طلبنا من النموذج إنشاء صورة لقطّة صدفية بأسلوب بيكسل آرت لألعاب بوكيمون من الجيل الثالث. ورغم أن نماذج الذكاء الاصطناعي غالبًا ما تواجه صعوبة في هذا الأسلوب، إلا أن النتيجة كانت مرضية للغاية.
في الاختبار الثاني، طلبنا تحويل الصورة إلى PNG شفافة، وهي مهمة قد تواجه بعض النماذج صعوبة فيها. نجح النموذج في ذلك، رغم اختلاف الصورة النهائية عن الأولى قليلاً. أما في الاختبار الثالث، طلبنا إنشاء مانجا من أربع صفحات تصور قطتنا تستمتع بيوم مشمس بجانب جدول في مدينة جميلة. أظهرت النتائج قدرة النموذج على التعامل مع مهام معقدة مثل المانجا اليابانية.
قال أحد أعضاء فريق الاختبار:
«استغرق النموذج وقتًا أطول في المهمة الثانية، لكن النتيجة النهائية كانت مرضية. كما نجح في إنشاء صور شفافة، وهو ما قد يكون تحديًا لبعض النماذج الأخرى».
مقارنة مع منافسين آخرين
بمجرد أن يتمكن المزيد من المستخدمين من اختبار النموذج، ستتضح المقارنة مع أدوات مثل Google’s Nano Banana 2. ومع ذلك، فإن التحسينات التي قدمتها OpenAI في دعم اللغات غير اللاتينية والمرونة في الأبعاد والدقة تجعل ChatGPT Images 2.0 خيارًا قويًا للمبدعين والمصممين.