أطلقت شركة غوغل هذا الربيع نماذج Gemma 4 مفتوحة المصدر، والتي تعد بتقديم مستوى جديد من القوة والأداء للحوسبة المحلية، مما يمكّن المستخدمين من تشغيل الذكاء الاصطناعي على أجهزتهم الخاصة بدلاً من الاعتماد على أنظمة السحابة العامة.

الآن، تأتي غوغل بابتكار جديد لتعزيز سرعة هذه النماذج، حيث أعلنت عن إصدار مسرعات تجريبية تعتمد على تقنية التنبؤ المتعدد للكلمات (Multi-Token Prediction - MTP) لنماذج Gemma. وتقول غوغل إن هذه النماذج الجديدة تستفيد من تقنية فك التشفير الاستدلالي (Speculative Decoding) للتنبؤ بالكلمات المستقبلية، مما يسرع من عملية توليد النصوص مقارنة بالطرق التقليدية التي تعتمد على توليد كلمة تلو الأخرى بشكل تسلسلي.

تقنية MTP: كيف تعمل على تسريع Gemma 4؟

تعتمد تقنية MTP على مبدأ التنبؤ المسبق، حيث تقوم النماذج بتخمين عدة كلمات مستقبلية في آن واحد بدلاً من توليد كلمة واحدة تلو الأخرى. هذا النهج يقلل من الوقت المستغرق في عمليات التوليد المتكررة، مما يؤدي إلى تسريع ملحوظ في الأداء.

وتشير غوغل إلى أن هذه التقنية لا تزال في مرحلة تجريبية، لكنها قد تحدث ثورة في كيفية استخدام نماذج Gemma المحلية، خاصة في الأجهزة ذات الموارد المحدودة.

الأساس التقني: Gemma 4 بين السحابة والحوسبة المحلية

تعتمد نماذج Gemma 4 على نفس التكنولوجيا الأساسية التي تقف وراء نموذج Gemini الرائد من غوغل، لكنها مصممة لتعمل محلياً على أجهزة المستخدمين بدلاً من الاعتماد على وحدات معالجة الرسومات (TPU) الخاصة بغوغل. وعلى الرغم من أن Gemini يعمل على وحدات TPU فائقة السرعة في مراكز البيانات، إلا أن Gemma 4 تم تكييفها لتشغيلها على أجهزة محلية، بما في ذلك وحدات معالجة الرسومات الاستهلاكية بعد تطبيق تقنيات التكميم (Quantization).

وتتيح هذه الميزة للمستخدمين تشغيل نماذج الذكاء الاصطناعي محلياً دون الحاجة إلى مشاركة بياناتهم مع أنظمة السحابة الخارجية، مما يعزز الخصوصية والأمان.

تغييرات في الترخيص: Gemma 4 تحت رخصة أباتشي 2.0

أحدثت غوغل تغييراً ملحوظاً في ترخيص نماذج Gemma 4، حيث انتقلت من الترخيص المخصص السابق إلى رخصة أباتشي 2.0 مفتوحة المصدر، والتي تعد أكثر مرونة وسهولة في الاستخدام. هذا التغيير يفتح الباب أمام المطورين لاستخدام Gemma 4 في مشاريعهم بحرية أكبر، سواء لأغراض تجارية أو غير تجارية.

التحديات والقيود: لماذا نحتاج إلى MTP؟

على الرغم من مزايا Gemma 4، إلا أن هناك قيوداً inherente في الأجهزة المحلية التي قد تحد من أدائها. فمعظم الحواسيب الشخصية وأجهزة الهواتف الذكية لا تمتلك موارد كافية لتشغيل نماذج الذكاء الاصطناعي الكبيرة بدقة كاملة. وهنا تأتي تقنية MTP كحل لزيادة السرعة والكفاءة، مما يسمح للمستخدمين بالاستفادة من قدرات Gemma 4 حتى على الأجهزة ذات الموارد المحدودة.

وتأمل غوغل أن تساهم هذه التطورات في جعل الذكاء الاصطناعي المحلي أكثر انتشاراً وسهولة في الاستخدام، مما يمهد الطريق أمام تطبيقات جديدة في مجالات مثل الترجمة الفورية، المساعدات الشخصية، وحتى الألعاب.

المصدر: Ars Technica