ביום חמישי האחרון הודיעה OpenAI על פיתוח מודל שפה גדול חדש בשם GPT-Rosalind, אשר עבר הכשרה ממוקדת בזרימות העבודה הנפוצות ביותר בביולוגיה. השם ניתן לכבוד המדענית רוזלינד פרנקלין, אשר תרומתה למחקר מבנה ה-DNA הייתה מכרעת.

בניגוד למודלים מדעיים אחרים שפותחו על ידי חברות טכנולוגיה מובילות, אשר נוטים להיות כלליים ומתאימים למגוון תחומים, GPT-Rosalind מתמקד באופן ספציפי בביולוגיה. לדברי יוניון וונג, מנהלת המוצרים למדעי החיים ב-OpenAI, המודל נועד להתמודד עם שני אתגרים מרכזיים העומדים בפני חוקרים בתחום:

  • מערכי נתונים עצומים: עשרות שנים של מחקר גנומי וביוכימיה של חלבונים יצרו כמויות אדירות של מידע, אשר קשה לעיתים קרובות לחוקרים בודדים לעבד ולהבין במלואן.
  • התמחויות ספציפיות: ביולוגיה כוללת תחומים רבים עם שיטות ומונחים ייחודיים, כך שחוקר המתמחה בתחום אחד עלול להתקשות בהבנת ספרות ממחקר בתחום אחר.

המודל עבר הכשרה על 50 זרימות עבודה ביולוגיות נפוצות ועל גישה למאגרי מידע ביולוגיים ציבוריים מרכזיים. כתוצאה מכך, GPT-Rosalind מסוגל להציע מסלולים ביולוגיים סבירים ולסייע בקביעת מטרות תרופתיות פוטנציאליות.

"אנו מחברים בין גנוטיפ לפנוטיפ באמצעות מסלולים ידועים ומנגנוני רגולציה, מנבאים תכונות מבניות או תפקודיות של חלבונים, ומנצלים הבנה מכנית זו כדי לקדם את המחקר הביולוגי", הסבירה וונג.

המודל החדש מצטרף למגמה ההולכת ומתרחבת של שימוש בבינה מלאכותית בתחום הביולוגיה, אשר נועדה לייעל תהליכי מחקר מורכבים ולהפוך אותם לנגישים יותר לחוקרים בתחום.

מקור: Ars Technica