جوجل تتحدى OpenAI وتطلق نموذج الذكاء الاصطناعي Gemini 1.5

بالتزامن مع إطلاق شركة OpenAI لنموذج الذكاء الاصطناعي Sora الخاص بتحويل النص إلى فيديو، كشفت جوجل مؤخرًا عن أحدث طراز للذكاء الاصطناعي. وهو Gemini 1.5، والذي يَعِد بإحراز تقدم كبير في الأداء والكفاءة. حيث يعتمد نموذج الجيل التالي هذا على نجاح Gemini 1.0 Ultra، ومع قدراته المحسنة، من المتوقع أن يحدث ثورة في مجال الذكاء الاصطناعي. في هذه المقالة، سنستكشف الميزات والتحسينات الرئيسية لـ جيميني 1.5 وتطبيقاته والاعتبارات الأخلاقية المحيطة بتطويره.

تحسينات الأداء في Gemini 1.5

يمثل Gemini 1.5 قفزة كبيرة إلى الأمام في تكنولوجيا الذكاء الاصطناعي، حيث يتضمن تحسينات مبتكرة عبر مختلف جوانب تطوير النماذج والبنية التحتية. أحد التحسينات الرئيسية هو تقديم بنية خليط الخبراء (MoE)، مما يجعل جيميني 1.5 أكثر كفاءة في التدريب والخدمة. كما تعتمد هذه البنية على أبحاث Google الرائدة حول بنية Transformer وMoE. بالتالي يتيح لـ جيميني 1.5 تعلم المهام المعقدة بسرعة أكبر مع الحفاظ على الجودة.

إصدار Gemini 1.5 Pro

يتضمن الإصدار الأولي من Gemini 1.5 Pro، وهو نموذج متعدد الوسائط متوسط الحجم مُحسّن لقابلية التوسع عبر المهام المتنوعة. فعلى الرغم من صغر حجمه، يقدم Gemini 1.5 Pro أداءً مشابهًا لـ 1.0 Ultra ويقدم ميزات مذهلة لفهم السياق الطويل. كما أنه بفضل إمكاناته المحسنة، يمكن لـ Gemini 1.5 Pro تحليل وتصنيف وتلخيص كميات كبيرة من المحتوى ضمن موجه معين. بالتالي يمكّنه ذلك من فهم الموضوعات المعقدة والتفكير فيها.

نافذة السياق الموسعة والميزات التجريبية

يقدم Gemini 1.5 Pro نافذة سياق قياسية تحتوي على 128000 رمز مميز. مما يسمح لها بمعالجة كميات هائلة من المعلومات، بما في ذلك مقاطع الفيديو والصوت وقواعد التعليمات البرمجية والنص. بالإضافة إلى ذلك، يمكن للمطورين وعملاء المؤسسات تجربة نافذة سياق موسعة تصل إلى مليون رمز مميز. كما تتيح نافذة السياق الموسعة هذه لـ Gemini 1.5 Pro معالجة كميات أكبر من المعلومات. مما يؤدي إلى مخرجات أكثر اتساقًا وملاءمة وإفادة.

مميزات Gemini 1.5

يتميز جيميني 1.5 بالعديد من الميزات الرئيسية التي تميزه عن سابقاته ونماذج الذكاء الاصطناعي الأخرى في السوق:

بنية عالية الكفاءة: بناءً على أبحاث Google المكثفة حول بنية Transformer وMoE، يتعلم جيميني 1.5 المهام المعقدة بسرعة أكبر بينما يكون أكثر كفاءة في التدريب والخدمة.
سياق أكبر وقدرات مفيدة: بفضل سعة نافذة السياق المتزايدة، يمكن لـ جيميني 1.5 معالجة كميات أكبر من المعلومات، مما يؤدي إلى مخرجات أكثر اتساقًا وأهمية وفائدة.
التفكير والفهم المعقد: يتفوق جيميني 1.5 Pro في تحليل وتصنيف وتلخيص كميات كبيرة من المحتوى، مما يمكنه من فهم الموضوعات المعقدة والتفكير فيها.
الفهم متعدد الوسائط: يمكن لـ جيميني 1.5 أداء مهام الفهم والاستدلال المتطورة عبر طرائق مختلفة، بما في ذلك الفيديو، مما يعزز قدراته في تحليل أنواع متنوعة من البيانات.
حل المشكلات ذات الصلة باستخدام كتل التعليمات البرمجية الأطول: يتمتع جيميني 1.5 Pro بمهارة خاصة في مهام حل المشكلات عبر مجموعات أطول من التعليمات البرمجية، مما يوفر حلولاً وتعديلات وتفسيرات مفيدة.
الأداء المحسن: يتفوق جيميني 1.5 Pro على سابقه في معظم المعايير ويحافظ على الأداء العالي حتى مع وجود نافذة سياق موسعة.

اختبار الأخلاق والسلامة

تلتزم Google بتطوير الذكاء الاصطناعي الأخلاقي وتضمن خضوع نماذج Gemini لاختبارات أخلاقية وسلامة واسعة النطاق قبل إصدارها. كما تقوم الشركة باستمرار بتحسين النماذج للتخفيف من المخاطر المحتملة وضمان النشر المسؤول. ومن خلال إعطاء الأولوية للسلامة، تهدف جوجل إلى نشر نماذج الذكاء الاصطناعي التي يمكن أن تفيد المجتمع حقًا مع تقليل أي ضرر محتمل.

التوفر والتسعير

تتوفر حاليًا معاينة محدودة لـ Gemini 1.5 Pro للمطورين وعملاء المؤسسات من خلال AI Studio وVertex AI. كما تخطط Google لتقديم مستويات تسعير بناءً على حجم نافذة السياق، مما يسمح للمستخدمين باختيار الخيار الأنسب لاحتياجاتهم. وستتاح للمختبرين الأوائل الفرصة لتجربة نافذة سياق المليون رمز مميز دون أي تكلفة خلال فترة الاختبار.

المصدر