جوجل تكشف عن Whisk، أداة الصور الإبداعية المدعومة من Gemini

جوجل تكشف عن Whisk، أداة الصور الإبداعية المدعومة من Gemini
Diya Poddar
18 ديسمبر 2024, 11:57 ص
  • على عكس محرري الصور التقليديين، يركز Whisk على الاستكشاف الإبداعي بدلاً من النتائج المثالية.
  • يشير إطلاق Whisk إلى المنافسة المتزايدة مع Sora من OpenAI.
  • يتوفر تطبيق Whisk في البداية للمستخدمين في الولايات المتحدة، ومن المقرر توفير تحديثات أخرى.

أصبحت المنافسة في صناعة التكنولوجيا في مجال الذكاء الاصطناعي أكثر تنافسية بعد أن أطلقت Google أداة Whisk، وهي أداة مصممة لإنشاء صور فريدة من الصور التي يحملها المستخدمون.

تم الكشف عن تطبيق Whisk من خلال Google Labs، وهو يسمح للمستخدمين في الولايات المتحدة بإعادة مزج الموضوعات والأنماط والإعدادات في صور مرئية جديدة دون الحاجة إلى مطالبات نصية.

ويعتمد على التقدم الذي أحرزته Google DeepMind في مجال الذكاء الاصطناعي، مع عرض تقنيات Gemini وImagen 3.

وتسلط هذه الخطوة الضوء على تركيز جوجل على تقديم أدوات الذكاء الاصطناعي التي يمكن الوصول إليها في حين تتنافس مع مجموعة OpenAI من المنتجات الاستهلاكية، بما في ذلك أداة تحويل النص إلى فيديو Sora.

ما هو Whisk وكيف يعمل؟

تقدم Whisk مفهومًا جديدًا للإبداع المدعوم بالذكاء الاصطناعي.

يمكن للمستخدمين تحميل الصور التي تمثل الموضوعات أو الإعدادات أو الأنماط.

وتعمل المنصة على معالجة هذه المدخلات باستخدام Gemini، وهو نموذج مؤسسة الذكاء الاصطناعي من Google والذي تم إطلاقه في ديسمبر 2023، والذي يقوم بإنشاء ترجمات للمحتوى.

يتم تغذية هذه التسميات التوضيحية إلى Imagen 3 التابع لبرنامج DeepMind، وهو برنامج لتحويل النص إلى صورة.

على عكس محرري الصور التقليديين، يركز Whisk على الاستكشاف الإبداعي بدلاً من النتائج المثالية.

إنه يسمح للمستخدمين بإعادة مزج الفئات - مثل تحويل صورة إلى لعبة محشوة أو دبوس مينا أو ملصق - عن طريق ضبط المدخلات أو دمج النص لتوجيه تفاصيل محددة.

وتؤكد جوجل أن المخرجات تلتقط "جوهر" الموضوع، مما يعني أنه قد تحدث بعض الاختلافات، مثل تغييرات في تصفيفة الشعر أو لون البشرة.

الخبرة التي اكتسبتها شركة DeepMind من خلال الفوز بجائزة نوبل تدعم شركة Whisk

تستفيد Whisk من التطورات المتطورة من DeepMind، قسم الذكاء الاصطناعي الذي استحوذت عليه Google في عام 2014.

ساهمت أبحاث الذكاء الاصطناعي التي أجرتها شركة DeepMind في حصول اثنين من موظفيها على جائزة نوبل في الكيمياء لعام 2024 لاكتشافهما بنية البروتين.

ويؤكد هذا على سمعة المختبر في تجاوز الحدود التكنولوجية، والتي تمتد الآن إلى التطبيقات الإبداعية مثل Whisk.

وتضع Whisk أيضًا Google في موقع رائد في مجال الذكاء الاصطناعي الصديق للمستهلك.

وفي حين واجهت أداة تحويل النص إلى صورة الأولية Gemini انتقادات بسبب إنتاج صور غير دقيقة تاريخيًا، تهدف Whisk إلى تجنب الوقوع في أخطاء مماثلة من خلال التركيز على المخرجات المجردة والاستكشافية بدلاً من النسخ الدقيقة.

ابتكارات الذكاء الاصطناعي تحفز المنافسة بين عمالقة التكنولوجيا

يسلط كشف شركة Google عن منتج Whisk الضوء على استراتيجيتها الأوسع للهيمنة على المنتجات الاستهلاكية التي تعتمد على الذكاء الاصطناعي.

المنافسة شرسة، حيث قدمت شركة OpenAI مؤخرًا تطبيق Sora، وهو برنامج لتحويل النص إلى فيديو.

تهدف Google إلى تعزيز ميزتها من خلال دمج Whisk مع قدرات Gemini وImagen 3، مما يشير إلى التحول نحو أدوات الذكاء الاصطناعي الديناميكية ومتعددة الوسائط.

ويرى دان إيفز، محلل الأسهم في شركة ويدبوش للأوراق المالية، أن شركة ويسك هي جزء من "صندوق الكنز" الخاص بشركة جوجل في عروضها لعام 2025، إلى جانب تعاونها مع سامسونج وكوالكوم على نظام تشغيل أندرويد جديد.

وتظهر هذه المبادرات جهود Google للحفاظ على الميزة في مجال الذكاء الاصطناعي المربح والتنافسي للغاية.

لقد استحوذت أدوات الذكاء الاصطناعي التوليدي مثل Whisk على خيال الجمهور ولكنها واجهت أيضًا التدقيق.

على سبيل المثال، أثارت المشكلات السابقة التي واجهتها جيميني مع مخرجات الصور غير الدقيقة تاريخيًا مخاوف بشأن موثوقية الذكاء الاصطناعي.

تسعى Whisk إلى التغلب على هذه التحديات من خلال التركيز على الإبداعات الخيالية الموجهة للمستخدم.

مع استمرار Google في تحسين عروضها، فإن الطرح الأولي للأداة كموقع ويب للمستخدمين في الولايات المتحدة سيوفر منصة اختبار مهمة للتحديثات والإصدارات المستقبلية.

طموحات جوجل في مجال الذكاء الاصطناعي

ويشير ظهور Whisk إلى تطور أوسع في كيفية استخدام الذكاء الاصطناعي لإبداع المستهلك.

من خلال التركيز على الواجهات سهلة الاستخدام ودمج التقنيات المتقدمة مثل Gemini، تهدف Google إلى إضفاء الطابع الديمقراطي على الوصول إلى الذكاء الاصطناعي التوليدي.

ومع ذلك، لا تزال المنافسة شديدة، مع قيام المنصات المتنافسة بدفع حدود ما يمكن للذكاء الاصطناعي تحقيقه.