CREATE ACCOUNT

مسار للأبحاث

إجمالي سكان البلدان العربية 498,214,000
تاريخ اليوم: 5 نوفمبر، 2025 11:07 م
  • لماذا مسار
  • عن المؤسس
  • آراء
  • التنمية الفكرية 
    • ألغاز رياضية / منطقية
    • ألغاز في قصص
    • التفكير الناقد
    • ومضات معرفية
    • البحث الذكي
  • الدراسات والأبحاث
    • دراسات عالمية وعربية
    • أرقام عالمية وعربية
    • أبحاث في اللغة العربية
  • الذكاء-المعرفة-الحكمة
    • أقوال عالمية
    • أقوال عربية
    • أقوال عبد القادر الكاملي
    • حوار المفكرين العابر للزمن
  • استشراف المستقبل
    • مستقبل الأعمال
    • مستقبل السياسة والمجتمع
    • مستقبل الثقافة والفنون
    • مستقبل الرياضة
  • تواصل
  • تسجيل الدخول
تسجيل دخول
مسار للأبحاث
الأربعاء, 05 يونيو 2024 / Published in آراء |

الفيديو التوليدي: هل يغير صناعة الأفلام؟

نشر للمرة الأولى بتاريخ 20-5-2024
بدأ إدخال تقنيات المعالجة الرقمية ضمن الأفلام الروائية الطويلة، عام 1973 مع فيلم وست وورلد (Westworld)، الذي يعتبر أول فيلم روائي طويل استخدم الصور المولدة بالحاسوب (Computer-generated imagery) واختصاراً (CGI). عالج الفيلم بعض الصور الفوتوغرافية المتحركة رقمياً بحيث تظهر منقطة، من أجل محاكاة ما تراه الروبوتات التي تظهر في الفيلم. طبعاً كانت المعالجة بسيطة وبدائية.

تمثل ثلاثية سيد الخواتم (The Lord of the Rings) التي بدأ عرضها عام 2001، نقطة انعطاف في تاريخ السينما من حيث استخدام تقنيات حاسوبية متقدمة، أبرزها إصدارة متطورة من تقنية الصور المولدة بالحاسوب (CGI) لإنشاء العديد من المشاهد والشخصيات التي لا تنسى في هذه الثلاثية. واستخدمت الثلاثية أيضاً برنامج ماسيف (MASSIVE) الذي تم تطويره خصيصاً لها، لتوليد مشاهد المعارك الضخمة التي تضم آلاف الشخصيات الفردية، والتي تسمح لكل شخصية رقمية في هذه الجيوش بأن تفكر وتتفاعل وتقاتل بشكل مستقل. وكان تطوير شخصية جولوم (Gollum) في الفيلم نقطة بارزة في تاريخ المؤثرات البصرية واستخدام تقنية التقاط الحركة (Motion Capture) في الأفلام. شملت العملية مزيجاً من التمثيل الحي، وتقنيات متقدمة في التقاط الحركة، ومهارات عالية في الرسوميات الكمبيوترية، حيث ارتدى الممثل العراقي الأصل آندي سركيس بزة مجهزة بمجسات استشعار تقوم بتسجيل حركات جسمه وتعابير وجهه ونقلها إلى الشخصية الرقمية جولوم.

تحويل النصوص إلى صور (Text to Image)

جاءت القفزة الحقيقية نحو “تحويل النص إلى صورة” باستخدام الذكاء الاصطناعي والتعلم الآلي عام 2016، حينما قام سكوت ريد وفريقه بتطوير نموذج يمكنه توليد صور معقولة من أوصاف نصية مفصلة. استخدم هذا النموذج مزيجاً من الشبكات العصبية الالتفافية (CNNs) التي تحلل الصور إلى بكسلات تعطى كل منها قيمة تصنيفية، والشبكات العصبية المتكررة (RNNs)، جنباً إلى جنب مع تقنية التعزيز المشروط (Conditioning Augmentation) لتحسين جودة وتنوع الصور التي تم إنشاؤها.

أظهر عمل هذا الفريق إمكانية توليد صور متماسكة ومتنوعة للطيور والزهور من الأوصاف النصية، وهو ما كان جهداً رائداً في تحويل النص إلى الصورة.

مهدت أعمال هذه الفريق الطريق أمام تطوير أنظمة أكثر تقدماً مثل دال إي (DALL-E) من أوبن أيه آي (OpenAI) في عام 2021، من خلال إنشاء صور إبداعية ودقيقة للغاية من أوصاف نصية معقدة.

الفيديو التوليدي نقطة انعطاف جديدة في تاريخ السينما

في منتصف فبراير/شباط 2024، دعت شركة أوبن أيه آي مجموعة من صانعي الأفلام وخبراء التكنولوجيا لتجربة نموذج الفيديو التوليدي الجديد الذي طورته عبر تقنية تحويل النص إلى فيديو (Text-to-Video)، وأطلقت عليه اسم سورا (Sora)، وذلك بهدف تجربته والتعرف على إمكانياته ومزاياه وعيوبه. أدهش سورا الحاضرين ووصفه مارك روسينوفيتش، المدير التنفيذي للتكنولوجيا في مايكروسوفت، بأنه “مذهل ومخيف في نفس الوقت”، وأضاف “أعتقد أنه يمثل نهاية الواقع كما نعرفه”.

ومنذ ذلك الحين وحتى اليوم” أتاحت الشركة للجمهور مشاهدة العديد من مقاطع الفيديو التي أنشأها سورا، منها مقطع دعائي لفيلم يعرض مغامرات رجل فضاء بالغ من العمر 30 عاماً، وموقع بناء مملوء بالعمال والمعدات والآلات الثقيلة، وكنغر يرقص الديسكو، ومدينة طوكيو وهي مكسوة بالثلج وتعج بالحركة، وجراء تلعب في الثلج، وغيرها. يمكنكم الاطلاع عليها عبر حساب سام ألتمان على موقع إكس (تويتر سابقاً)، أو على موقع يوتيوب (www.youtube.com/watch?v=HK6y8DAPN_0).

ظهرت الدفعة الأولى من النماذج التي يمكنها تحويل النص إلى فيديو في أواخر عام 2022، من شركات ميتا وغوغل ورنواي (Runway) وغيرها، لكن نتائجها كانت مشوشة، ومشوهة، ولم يستغرق الفيديو الواحد منها سوى بضع ثوانٍ.

توليد الفيديو من النص او تحويل النص إلى فيديو عملية معقدة تتطلب دمج تقنيات الذكاء الاصطناعي التوليدي، والتعلم الآلي، ومعالجة الوسائط المتعددة. ويعتقد الخبراء أن سورا هو الأفضل حتى الآن نظراً لوضوحه العالي وواقعيته المذهلة لدرجة توقع معها بعض المراقبين المتحمسين وفاة هوليوود كما نعرفها. يمكن أن تصل مدة مقاطع الفيديو التي يولدها سورا حالياً إلى دقيقة واحدة، وتتكون من مشاهد معقدة وشخصيات متعددة وأنواع مختلفة من الحركة مع تفاصيل دقيقة.

أزمات قانونية وأخلاقية حالية ومستقبلية

تواجه كل من اوبن إيه آي وغوغل والشركات الأخرى التي تطور نماذج الذكاء الاصطناعي التوليدي مشكلات قانونية تتعلق باستخدام بيانات المواقع الإخبارية، ومواقع الفيديو، ووسائل التواصل الاجتماعي، والمنتديات، وقوعد بيانات الكتب، لتدريب برمجيات الذكاء الاصطناعي التوليدي على إنتاج النصوص والصور والفيديوهات، دون الحصول على اذن مسبق، ما يمثل انتهاكاً للخصوصية وحقوق النشر. وكان رد هذه الشركات على هذه الاتهامات بأن البيانات التي تستخدمها للتدريب متاحة للجمهور، لكن هذا لم يقنع صحيفة نيويورك تايمز التي رفعت دعوى قضائية ضد شركة أوبن إيه آي، زاعمة أنها استخدمت أعمالها لتدريب برمجياتها، وانتهكت بذلك حقوقها في النشر والطباعة. وتوجد مشكلة أخرى تواجه هذه الشركات هي التزييف العميق الذي نما بسرعة مع تطور الذكاء الاصطناعي التوليدي، إذ تزداد المخاوف من احتمال إضافة مقاطع فيديو مزيفة في مجالات عديدة تؤثر على الانتخابات والأسواق المالية، بل والحياة الشخصية.

مستقبل صناعة الترفيه

عقد سام ألتمان في شهر مارس/آذار الماضي سلسلة من الاجتماعات مع المدراء التنفيذيين في هوليوود حاول اقناعهم فيها بأن سورا لن يدمر صناعة السينما، خاصة مع تزايد المخاوف بشأن فقدان الوظائف لصالح الذكاء الاصطناعي والذي كان أحد أسباب إضرابات الممثلين والكتاب العام الماضي، وأدى حينها إلى تعطل الإنتاج التلفزيوني لبعض الوقت. ويبدو أن بعض الاستوديوهات تقبلت فكرة أن استخدام هذه الأداة بعناية في الإنتاج، يمكنها أن توفر الوقت. لكن الممثل والمخرج الأمريكي تايلر بيري قال إنه يخشى تأثير الذكاء الاصطناعي على الصناعات الإبداعية وأنه أوقف التوسع الذي سبق وخطط له في أحد استوديوهات الإنتاج الخاصة به بسبب سورا.

تتفوق سورا حالياً على البرامج المنافسة في مجال إنشاء الفيديو عبر النص. لكن العديد من الشركات الأخرى تعمل حالياً على تحسين تقنياتها المشابهة، حيث يتوقع أن تطرح برامج منافسة لسورا خلال الأشهر المقبلة.

عبد القادر الكاملي

You must be logged in to post a comment.

البحث في الموقع

روابط سريعة

  • آراء
  • ألغاز رياضية منطقية
  • ألغاز في قصص
  • التفكير الناقد
  • ومضات معرفية
  • البحث الذكي
  • دراسات عالمية وعربية
  • أرقام عالمية وعربية
  • أبحاث في اللغة العربية
  • أقوال عالمية
  • أقوال عربية
  • أقوال عبد القادر الكاملي
  • حوار المفكرين العابر للزمن
  • استشراف مستقبل الأعمال
  • استشراف مستقبل السياسة والمجتمع
  • استشراف مستقبل الثقافة والفنون
  • استشراف مستقبل الرياضة
  • خريطة الموقع
  • إخلاء مسؤولية
  • الشروط والأحكام
  • سياسة الخصوصية
  • حقوق النشر
  • إنضم إلينا
  • تسجيل الدخول

جميع الحقوق محفوظة مسار للأبحاث © 2024 | تصميم وتطوير رينكلار

TOP
error: محتوى الموقع محمي وفق سياسية "حقوق النشر" الخاصة بمسار
مسار للأبحاثLogo Header Menu
  • لماذا مسار
  • عن المؤسس
  • آراء
  • التنمية الفكرية 
    • ألغاز رياضية / منطقية
    • ألغاز في قصص
    • التفكير الناقد
    • ومضات معرفية
    • البحث الذكي
  • الدراسات والأبحاث
    • دراسات عالمية وعربية
    • أرقام عالمية وعربية
    • أبحاث في اللغة العربية
  • الذكاء-المعرفة-الحكمة
    • أقوال عالمية
    • أقوال عربية
    • أقوال عبد القادر الكاملي
    • حوار المفكرين العابر للزمن
  • استشراف المستقبل
    • مستقبل الأعمال
    • مستقبل السياسة والمجتمع
    • مستقبل الثقافة والفنون
    • مستقبل الرياضة
  • تواصل
  • تسجيل الدخول