OpenAI, siber savunma uzmanlarına yönelik daha az kısıtlamaya sahip GPT-5.5 modelini (kod adı: Spud) tanıttığını duyurdu. Şirket, modelin yalnızca onaylanmış siber savunma ekiplerine sunulduğunu belirtti.

Neden Önemli?

Yapılan son siber güvenlik testleri, GPT-5.5 modelinin yazılım hatalarını bulma ve istismar etme konusunda Anthropic'in Mythos Preview modeline oldukça yakın performans gösterdiğini ortaya koydu. Bu durum, Silikon Vadisi ve Beyaz Saray'da yapay zeka modellerinin kötü niyetli kullanıcılara ulaşmasını engelleme yöntemleri üzerine acil tartışmalar başlattı.

Gelişmeler

OpenAI, GPT-5.5-Cyber modelinin sınırlı bir ön izlemesini, kritik altyapıların güvenliğini sağlamaktan sorumlu onaylı siber savunma ekiplerine açtı. Modelin yetenekleri hakkında bilgisi olan bir kaynak, Axios'a yaptığı açıklamada GPT-5.5-Cyber'in Mythos ile benzer performans gösterdiğini belirtti. Son yapılan bir testte Mythos'un hafifçe öne çıktığı görüldü.

Onaylanan siber savunma ekipleri, OpenAI'nin Trusted Access for Cyber programı kapsamında en yüksek erişim seviyesine sahip olduklarında, halka açık modele kıyasla daha az kısıtlamaya sahip bir GPT-5.5 versiyonunu kullanabilecek. Bu model, hata avcılığı, kötü amaçlı yazılım inceleme ve saldırıların tersine mühendislik çalışmaları için kullanılabilecek. Ancak kimlik bilgisi hırsızlığı veya kötü amaçlı yazılım oluşturma gibi eylemler hala engellenecek.

Modelin Yetenekleri

  • Hata kanıtları oluşturma: Keşfedilen hataların kavram kanıtlarını yazma.
  • Simülasyon testleri: Kuruluşların güvenlik duruşunu değerlendirmek için simülasyonlar çalıştırma.
  • Kod anlama: Bilinmeyen kodları analiz etme.
  • Etkilenen yüzeyleri haritalama: Güvenlik açıklarının bulunduğu alanları belirleme.
  • Yama inceleme: Yazılım hatalarını düzeltmek için yapılan yamaları değerlendirme.

Büyük Resim

Gelişmiş yapay zeka modelleri, işletim sistemlerinden web tarayıcılarına kadar teknolojideki zayıflıkları bulma ve istismar etme konusunda giderek daha yetkin hale geliyor. İngiltere AI Security Institute tarafından geçtiğimiz hafta yapılan bir açıklamada, GPT-5.5'in 32 adımlı simüle edilmiş bir kurumsal siber saldırıyı 10 testten 2'sinde tamamladığı belirtildi. Mythos ise aynı testi 10 testten 3'ünde başardı. Mythos'tan önce hiçbir yapay zeka modeli bu testi başarıyla tamamlayamamıştı.

Farklı Yaklaşımlar

OpenAI ve Anthropic, siber yeteneklere sahip modellerini kullanıma sunarken, teknolojinin kötü niyetli hackerlar ve düşmanca hükümetlerin eline geçmesini engellemek için farklı stratejiler izliyor. Anthropic, Mythos'a yaklaşık 40 kuruluşun erişimine izin verirken, bu şirketlerin bir kısmı Project Glasswing kapsamında modelin test edilmesiyle ilgili bilgi alışverişinde bulunuyor. OpenAI ise daha açık bir yaklaşım benimseyerek, ileri düzey modellerini daha sıkı korumalarla yayınlarken, aynı zamanda erişim başvurusunda bulunan şirketlere daha az kısıtlamaya sahip bir versiyon sunuyor.

Önümüzdeki Süreç

Beyaz Saray, federal hükümetin gelecekteki model yayınlarında nasıl yer alabileceğine dair bir dizi yürütme eylemi üzerinde aktif olarak çalışıyor. Bu gelişmeler, kritik altyapıların güvenliğinin sağlanması yarışını hızlandırıyor.

Kaynak: Axios