المدونات
نستخدم نمط بث مباشر جديد عبر الإنترنت بدلاً من التعليم التقليدي. يمكنك إيقاف تشغيل ميزة "لحظات مميزة" لامتلاك فيديو بفضل منتجات منشئي المحتوى. إذا لم تظهر لك إحدى "اللحظات المميزة"، فهذا يعني أنها غير مفعلة لهذا الفيديو. يمكنك العثور على نتائج بحث للفيديوهات من خلال البحث عبر الإنترنت. تعرف على الطريقة وستعرف المعلومات المتاحة. إذا كنت متخصصًا وتبحث عن إمكانية الوصول إلى أبحاث YouTube لتناسب بحثك التعليمي، فيمكنك الاستفادة من برنامج المتخصصين على YouTube.
توجيه ملفات بيانات قواعد البيانات
يُقدّم هذا البرنامج ميزة "عمق الفيديو" التي تُراعي اتساع الفيديو (الإصدار الثاني)، ويتم تطبيقها على مقاطع فيديو طويلة دون المساس بالجودة أو الاتساق أو وظيفة التعميم. إذا كنتَ منشئ محتوى فيديو، يمكنكَ إضافة علامات "اللحظات المهمة" إلى مقاطع الفيديو الخاصة بكَ باستخدام أدوات التصميم أو من خلال تعريفات الفيديو. لعرض تفاصيل مُحددة، حاول تمييز مقاطع فيديو مُعينة بـ"اللحظات الرئيسية". في النهاية، قم بإجراء تحليل لجميع المعايير باستخدام النصوص التالية.
قم بتنزيل مقاطع الفيديو المُنشأة
يرجى وضع مجموعة البيانات التي تم تنزيلها في المسار src/r1-v/Video-R1-data/. تشير هذه الكفاءة إلى ضرورة أن تتمكن نماذج التعليم من التفكير في هياكل أكثر تعقيدًا. على سبيل المثال، حقق Video-R1-7B دقة ممتازة بلغت 35.8% في معيار VSI-bench الخاص skrill طرق الدفع عبر الإنترنت باحتياجات الفيديو المكانية، متجاوزًا بذلك النموذج الاقتصادي الحصري GPT-40. مع الأخذ في الاعتبار الفجوة الحتمية بين المعرفة والتحليل، نلاحظ انخفاضًا في السرعة بين نموذج البث المباشر والنموذج غير المتصل بالإنترنت (على سبيل المثال، انخفضت قيمة d1 الجديدة من ScanNet من 0.926 إلى 0.836).

هذا بالإضافة إلى الفيديو البسيط المفيد لتعزيز معايير الأداء العامة. قد يقوم برنامج Gemini بحذف مقاطع الفيديو عندما يجد أي من خياراتنا مخالفة محتملة لشروط خدمة Google، مثل حظر المحتوى غير المرغوب فيه. لا تقم بإنشاء أو نشر مقاطع فيديو بهدف خداع أو مضايقة أو إفساد الآخرين. استخدم تقديرك قبل أن تثق أو ترفع أو تستمتع بالفيديوهات التي تنشئها باستخدام برنامج Gemini.
استكشاف الأخطاء وإصلاحها لتجربة مقاطع الفيديو
يعمل الكود الخاص بنا مع الإصدار التالي، يُرجى الحصول عليه من هنا. أعتقد أن السبب هو أن التصميم الأحدث يتخلى أولاً عن أسلوب السببية السابق، والذي قد يكون مُعقدًا للغاية. يُبرز هذا أهمية القدرة السببية الصريحة في إصلاح مقاطع الفيديو، ويؤكد فعالية التعلم الآلي في مهام الفيديو. يتفوق Video-R1 بشكل ملحوظ على الإصدارات السابقة في جميع الاختبارات المعيارية.
يمكنك إنشاء أفلام قصيرة في غضون دقائق معدودة باستخدام تطبيقات Gemini التي تتضمن Veo step 3.step 1، وهي جميع أدواتنا الحالية لإنشاء مقاطع الفيديو بالذكاء الاصطناعي. يؤدي ضبط النموذج الجديد في بيئة البث المباشر عبر الإنترنت إلى تحسين الأداء بشكل ملحوظ. وبالمقارنة مع معظم النماذج الأخرى القائمة على الانتشار، يتميز هذا النموذج بمعدل استدلال أقصر، وعدد أقل من المتغيرات، ودقة أعلى في النطاق الموحد.
العمل مع الاستدلال على الفيديو
بعد ذلك، قد يظهر نوع المحولات الخاص بنا Qwen2.5-VL في سلسلة Transformers، مما قد يؤدي إلى مشاكل أو تناقضات متعلقة بالإصدار. ملف Videos-R1-260k.json الأحدث مخصص لتعليم التعلم المعزز، بينما ملف Videos-R1-COT-165k.json مخصص لبدء التشغيل البارد لـ SFT. يتقارب النموذج تدريجيًا نحو خطة استدلال أفضل وأكثر استقرارًا. ومن اللافت للنظر أن منحنى طول الاستجابة الجديد ينخفض في بداية تعليم التعلم المعزز، ثم يتوسع ببطء. تُظهر مكافأة الدقة اتجاهًا تصاعديًا، مما يدل على أن التصميم يتحسن باستمرار في القدرة على إنشاء حلول صحيحة أقل من التعلم المعزز.
- يؤدي ضبط التصميم الجديد في إعدادات البث عادةً إلى تحسين الأداء العام بشكل كبير.
- إذا كنت تواجه مشكلة في تشغيل مقاطع الفيديو على يوتيوب، فجرب إجراءات حل المشكلات التالية لحل المشكلة.
- على سبيل المثال، يحقق Video-R1-7B دقة جيدة تبلغ 35.8٪ لعداد VSI القياسي للسبب المكاني لمقاطع الفيديو، متجاوزًا تصميم GPT-4o الاقتصادي والخاص.
- لتحقيق عوامل الكفاءة، قمت بتقييد عدد إطارات الأفلام إلى 16 إطارًا أثناء عملية المعالجة.
- إذا كنت ترغب في إجراء دراسة تعليق Cot بنفسك، فراجع الملف src/generate_cot_vllm.py

مع ازدياد مهاراتك في التحرير، قد ترغب في شراء برنامج تحرير أكثر تطورًا. إذا كنت سباكًا محليًا وتبحث عن برنامج تحرير، فابدأ بالتفكير في التحرير الآن. إليك بعض اقتراحات كيا حول الخطوات الأساسية الـ 12 الجديدة للتحرير، والتي ستساعدك على تطبيق نصائحهم على أرض الواقع. بعد الانتهاء من تصويرك الأول، كيف يمكنك تحويل لقطات الفيديو إلى فيديو احترافي؟ يمكنك استخدام الفيديو التالي لاختبار ما إذا كانت الخيارات تعمل بشكل صحيح.
يمكنك أيضًا استخدام البرنامج التالي لزيادة سرعة vLLM في تعليم التعلم المعزز. نظرًا للقيود الحالية على موارد الحوسبة، أقدم أحدث تصميم للخطوة 1.2 ألف فقط من خطوات التعلم المعزز. إذا كنت ترغب في تخطي عملية SFT، فلدينا أيضًا أحد نماذج SFT الخاصة بنا من Qwen2.5-VL-SFT.


