GPT-5.5: הדור הבא של AI מבית OpenAI
OpenAI הודיעה ביום חמישי על שחרור GPT-5.5, המערכת החזקה ביותר שלה עד כה. לדברי החברה, הדגם החדש יאפשר לקודקס – סוכן הקידוד שלה – לבצע משימות מורכבות באופן עצמאי וללא הנחיה אנושית. בנוסף לקידוד, המערכת החדשה תומכת גם בעבודה מדעית, כולל יצירת השערות חדשות ובדיקתן.
יכולות עצמאיות ומשימות רב-שלביות
GPT-5.5 מהווה צעד משמעותי ביכולות האוטונומיות של מערכות AI. לדברי OpenAI, המערכת יכולה להשלים משימות מורכבות במחשב ללא צורך בהתערבות אנושית. בבלוג הרשמי נכתב: "GPT-5.5 מייצג צעד לקראת מערכות AI שיכולות להשלים משימות רב-שלביות במחשב ללא הדרכה אנושית".
ביצועים יוצאי דופן במבחני תקן
במבחן Terminal-Bench 2.0, המודד יכולות עבודה מורכבות בשורת פקודה, GPT-5.5 השיג ציון של 82.7% – גבוה משמעותית מ-GPT-5.4 (75.1%), מ-Opus 4.7 של Anthropic (69.4%) ו-m-Gemini 3.1 Pro של גוגל (68.5%). במבחן OSWorld-Verified, הבודק יכולת הפעלה עצמאית של מחשב, הוא השיג 78.7% לעומת 75% של GPT-5.4 ו-78% של Opus 4.7 של Anthropic.
שיפור משמעותי בקידוד ובפתרון בעיות
על פי OpenAI, למעלה מ-4 מיליון מפתחים משתמשים בקודקס מדי שבוע. מנכ"ל החברה, גרג ברוקמן, אמר במהלך שיחה עם עיתונאים כי GPT-5.5 יאפשר לקודקס לייצר קוד ממוקצע ולבצע פרויקטי קידוד ברמתו של מהנדס תוכנה בכיר. המערכת נמדדה במבחן SWE-Bench Pro, הבודק פתרון בעיות אמיתיות ב-GitHub, והצליחה לפתור 58.6% מהמשימות בסיבוב אחד בלבד.
מפתחים שהשתתפו בבדיקות מוקדמות דיווחו כי GPT-5.5 מפגין הבנה עמוקה יותר של "צורת" מערכת תוכנה, יכולת לאבחן תקלות בקוד ולזהות את מיקום התיקון הנדרש, כמו גם את ההשפעה הפוטנציאלית על שאר קוד הבסיס.
תחרות גוברת בתחום סייעני הקידוד
השקת GPT-5.5 מגיעה זמן קצר לאחר שחרור GPT-5.4, ומדגישה את המאמץ של OpenAI לשמור על הובלה מול המתחרים, במיוחד בתחום סייעני הקידוד – אחד התחומים המרכזיים להשפעה עסקית של AI. קצב השחרורים המואץ נובע מכך שמערכות AI עצמן משמשות לפיתוח מערכות AI חדשות.
קיימות השערות כי GPT-5.5 עשוי לכלול עד 10 טריליון פרמטרים, אך ברוקמן סירב לאשר זאת.
זמינות והגרסאות השונות
GPT-5.5 יוצא כעת למשתמשי מנויי Plus, Pro, Business ו-Enterprise ב-ChatGPT ובקודקס. גרסת GPT-5.5 Pro, המציעה דיוק גבוה יותר, זמינה למשתמשי המנויים ברמות Pro, Business ו-Enterprise.