مع تزايد المحتوى المرئي على يوتيوب، أصبح من الصعب متابعة كل الفيديوهات الطويلة، ولحسن الحظ، يُمكنك الاستفادة من أدوات الذكاء الاصطناعي مثل Gemini من جوجل لتوفير الوقت والحصول على ملخصات دقيقة وسريعة لمقاطع الفيديو.
في ظل كثرة الفيديوهات الطويلة والمحتوى المتكرر، أصبح من الضروري وجود أدوات تُمكن المستخدم من استخلاص المعلومات الجوهرية من دون مشاهدة المحتوى كاملًا، وتحديدًا بدأت أداة Gemini من جوجل تلعب هذا الدور بذكاء.
من خلال إصدارها الجديد "Gemini Flash 2.0"، توفر جوجل وسيلة فعالة لتلخيص مقاطع الفيديو على يوتيوب بشكل مباشر، مما يُتيح للمستخدم توفير عشرات الدقائق أو حتى الساعات أسبوعيًا.
لبداية استخدام هذه الميزة، يجب أولًا معرفة مكانها وطريقة تفعيلها وهذا من خلال التالي:
إذا كنت تستخدم Gemini على الويب، افتح المحادثة الجديدة، ثم من الزاوية اليسرى العلوية اختاري نموذج Flash 2.0 (تجريبي).
أما على الهواتف، سواء Android أو iOS، فقط افتح القائمة المنسدلة من أعلى المحادثة واختاري النموذج ذاته.
الميزة تتيح لك ببساطة لصق رابط أي فيديو يوتيوب، وسيقوم Gemini بتحليل محتواه والرد بملخص فوري، ويُفضل استخدام الواجهة عبر المتصفح لسهولة التنقل بين علامات التبويب وسحب الروابط مباشرة.
وفق موقع "wired" تم اختبار Gemini في تلخيص مقطع قصير مدته 4.5 دقائق من كواليس فيلم "فندق جراند بودابست" للمخرج ويس أندرسون.
رغم أن الذكاء الاصطناعي تمكن من تحديد اسم الفيلم وبعض التفاصيل العامة بدقة، فإنه فشل في تحديد هوية المتحدثين رغم عرض أسمائهم على الشاشة، مما يُشير إلى أن Gemini لا يقرأ المحتوى البصري بعد.
لكن في المقابل، أظهر أداءً جيدًا في تلخيص الصوتيات، خاصة عند الحديث عن التحديات الإنتاجية للفيلم، مع توفير تواريخ وأحداث مرتبة زمنيًا.
تم اختبار الأداة كذلك على مقابلة من القناة الرابعة البريطانية مع مبتكري مسلسل "Black Mirror"، استطاع Gemini استخراج المواضيع المطروحة وتوفير ملخصات للطروحات مع تحديد دقيق للطوابع الزمنية، مما يجعله مفيدًا جدًا للصحفيين أو الباحثين.
لكن مثل الحالات السابقة، لم يتعرف على الخلفية أو مكان التصوير أو حتى الإيماءات غير الملفوظة، لأن النموذج لا يُحلل الصور أو اللقطات المرئية بعد.
يوجد بعض نقاط القوة والضعف التي توجد في تلخيص مقاطع فيديو يوتيوب باستخدام Gemini وهي كما يلي:
تلخيص سريع ودقيق للمحتوى الصوتي أو النصوص المصاحبة.
طوابع زمنية تجعل الرجوع للنقطة المهمة سهلًا.
دعم مجاني متاح للجميع، دون الحاجة لاشتراك مدفوع.
محدودية في تحليل المشاهد أو العناصر المرئية داخل الفيديو.
الاعتماد الكلي على جودة التعليق الصوتي أو النص.
بعض الأخطاء في التفاصيل الدقيقة مثل أسماء الأشخاص أو الأحداث الفرعية.
رغم أنها ليست مثالية تمامًا، تُعتبر Gemini خيارًا ممتازًا لتوفير الوقت واستخلاص الأفكار الأساسية من الفيديوهات التعليمية، والوثائقية، والمقابلات الطويلة. وكلما كان النص الصوتي واضحًا ومنظمًا، كان الأداء أدق.
لكن في الفيديوهات التي تعتمد على الصور أو الرسوم التوضيحية دون شرح صوتي، فربما تظل الحاجة لمشاهدتها يدويًا قائمة.