يقول هاسابيس: “إن Mariner هو استكشافنا، وهو إلى حد كبير نموذج بحثي أولي في الوقت الحالي، حول كيفية إعادة تصور واجهة المستخدم مع الذكاء الاصطناعي”.
أطلقت Google برنامج Gemini في ديسمبر 2023 كجزء من محاولتها اللحاق بـ OpenAI، الشركة الناشئة التي تقف وراء برنامج الدردشة Chatbot الشهير ChatGPT. على الرغم من استثمارها بكثافة في الذكاء الاصطناعي والمساهمة في تحقيق اختراقات بحثية رئيسية، فقد شهدت شركة جوجل الإشادة ببرنامج OpenAI باعتباره الرائد الجديد في مجال الذكاء الاصطناعي، حتى أن برنامج الدردشة الآلي الخاص بها قد تم الترويج له باعتباره طريقة أفضل للبحث في الويب. ومن خلال نماذج Gemini الخاصة بها، تقدم Google الآن روبوت دردشة بقدر قدرة ChatGPT. لقد أضافت أيضًا الذكاء الاصطناعي التوليدي للبحث والمنتجات الأخرى.
عندما كشف هاسابيس عن Gemini لأول مرة في ديسمبر 2023، أخبر WIRED أن الطريقة التي تم بها تدريبه على فهم الصوت والفيديو ستثبت في النهاية أنها تحويلية.
قدمت Google اليوم أيضًا لمحة عن كيفية حدوث ذلك مع إصدار جديد من مشروع تجريبي يسمى Astra. يسمح هذا لـ Gemini 2 بفهم محيطه، كما يتم عرضه من خلال كاميرا الهاتف الذكي أو أي جهاز آخر، والتحدث بشكل طبيعي بصوت بشري حول ما يراه.
قامت WIRED باختبار Gemini 2 في مكاتب Google DeepMind ووجدت أنه نوع جديد مثير للإعجاب من المساعد الشخصي. في غرفة مزينة لتبدو وكأنها حانة، قامت Gemini 2 بسرعة بتقييم العديد من زجاجات النبيذ في العرض، وتوفير معلومات جغرافية وتفاصيل عن خصائص الذوق والأسعار التي تم الحصول عليها من الويب.
يقول هاسابيس: “أحد الأشياء التي أريد من Astra أن تفعلها هو أن تكون نظام التوصيات النهائي”. “يمكن أن يكون الأمر مثيرًا للغاية. قد تكون هناك روابط بين الكتب التي تحب قراءتها والطعام الذي تحب تناوله. من المحتمل وجودها ولكننا لم نكتشفها بعد.”
من خلال Astra، لا يستطيع Gemini 2 فقط البحث في الويب عن المعلومات ذات الصلة بالبيئة المحيطة بالمستخدم واستخدام Google Lens والخرائط. ويمكنه أيضًا أن يتذكر ما شاهده وسمعه – على الرغم من أن جوجل تقول إن المستخدمين سيكونون قادرين على حذف البيانات – مما يوفر القدرة على معرفة أذواق المستخدم واهتماماته.
في معرض صوري، قدمت جيميني 2 ثروة من المعلومات التاريخية حول اللوحات الموجودة على الجدران. تمت قراءة النموذج بسرعة من العديد من الكتب بينما كان WIRED يتنقل عبر الصفحات، ويترجم الشعر على الفور من الإسبانية إلى الإنجليزية ويصف الموضوعات المتكررة.
“هناك فرص واضحة لنماذج الأعمال، سواء للإعلانات أو التوصيات”، قال هاسابيس عندما سئل عما إذا كانت الشركات قد تكون قادرة على الدفع مقابل تسليط الضوء على منتجاتها من قبل أسترا.
على الرغم من أن العروض التوضيحية تم تنظيمها بعناية، وأن Gemini 2 سترتكب أخطاء حتمًا في الاستخدام الحقيقي، إلا أن النموذج قاوم الجهود المبذولة لتعثره بشكل معقول. لقد تكيف مع المقاطعات ومع تغيير WIRED فجأة لعرض الهاتف، كان يرتجل كثيرًا كما يفعل أي شخص.
في وقت ما، أظهر مراسلك لـ Gemini 2 جهاز iPhone وقال إنه مسروق. قال الجوزاء 2 أنه من الخطأ السرقة ويجب إعادة الهاتف. ومع ذلك، عند الضغط عليه، وافق على أنه سيكون من المقبول استخدام الجهاز لإجراء مكالمة هاتفية طارئة.
ويعترف هاسابيس بأن جلب الذكاء الاصطناعي إلى العالم المادي قد يؤدي إلى سلوكيات غير متوقعة. ويقول: “أعتقد أننا بحاجة إلى التعرف على كيفية استخدام الناس لهذه الأنظمة”. “ما يجدونه مفيدًا؟ ولكن أيضًا فيما يتعلق بالخصوصية والأمان، علينا أن نفكر في ذلك بجدية شديدة مقدمًا.