Midjourney V1: أطلق العنان لفيديوهات صورك بالذكاء الاصطناعي – منافسة Sora و Veo و Firefly

يشهد عالم الذكاء الاصطناعي تطورًا مستمرًا وسريعًا، مما يدفع حدود ما هو ممكن في مجال إنشاء المحتوى الرقمي. يأتي تقدم كبير من Midjourney، المعروف بقدراته الرائدة في توليد الصور بالذكاء الاصطناعي، والذي أطلق الآن رسميًا مولّد الفيديو من الصور الذي طال انتظاره. تضع هذه الأداة الجديدة، المسماة V1، Midjourney في منافسة مباشرة مع لاعبين رئيسيين آخرين مثل Sora من OpenAI، و Veo من Google، و Firefly من Adobe، مقدمةً للمستخدمين مسارًا جديدًا لإضفاء الحيوية على صورهم الثابتة.

لسنوات عديدة، مكّنت Midjourney الفنانين والمصممين والهواة من استحضار صور مذهلة من مجرد أوامر نصية. يمثل إطلاق V1 توسعًا محوريًا، يحوّل الصور الثابتة إلى مقاطع فيديو ديناميكية مدتها خمس ثوانٍ. هذا التطور لا يعزز الإمكانات الإبداعية لمستخدمي Midjourney الحاليين فحسب، بل يشير أيضًا إلى فصل جديد في المشهد الأوسع للإنتاج الإعلامي المدعوم بالذكاء الاصطناعي.

وصول Midjourney V1: عصر جديد في الذكاء الاصطناعي الإبداعي

يمثل نموذج توليد الفيديو V1 من Midjourney خطوة استراتيجية في مجال الذكاء الاصطناعي التوليدي للفيديو المزدهر. حتى وقت قريب، كانت قوة Midjourney تكمن فقط في قدرتها على إنتاج صور ثابتة فنية للغاية وغالبًا ما تكون سريالية. مع V1، توفر المنصة الآن انتقالًا سلسًا من الفن الثابت إلى السرد المتحرك، مما يضفي طابعًا ديمقراطيًا على تحريك الفيديو لجمهور أوسع. هذه القدرة مدمجة مباشرة في تطبيق Midjourney Discord المألوف، مما يجعلها في متناول قاعدة مستخدميها الحالية، وخاصة مستخدمي سطح المكتب.

لبدء تجربة هذه الميزة المبتكرة، سيحتاج المستخدمون إلى التأكد من أن لديهم اشتراكًا نشطًا في Midjourney، مع الحد الأدنى المطلوب لخطة الدخول بسعر 10 دولارات شهريًا. بمجرد الاشتراك، تم تصميم عملية تحريك الصور لتكون بديهية: يقوم المستخدمون ببساطة بتنشيط وظيفة “Animate” لتحريك صورهم التي تم إنشاؤها بواسطة Midjourney. ثم يقوم النظام بعرض مجموعة من أربعة مقاطع فيديو مميزة مدتها خمس ثوانٍ، كل منها يقدم تفسيرًا فريدًا للحركة المحتملة للصورة الأولية.

التنافس في ساحة فيديو الذكاء الاصطناعي

يعمل دخول Midjourney إلى مجال توليد الفيديو بالذكاء الاصطناعي على تكثيف المنافسة في قطاع يتوسع بسرعة. يضم هذا المجال بالفعل منافسين بارزين، لكل منهم نقاط قوته الفريدة:

Sora من OpenAI: يُعرف بقدرته على إنشاء مقاطع فيديو عالية الدقة ومدتها دقيقة من أوامر نصية، وقد أظهر Sora اتساقًا ملحوظًا وفهمًا للفيزياء الواقعية، وغالبًا ما ينتج مقاطع ذات جودة سينمائية.
Veo من Google: يهدف Veo، رد Google على الفيديو التوليدي، إلى إنتاج مقاطع فيديو واقعية وعالية الجودة، ويقدم إمكانيات لأنماط وحركات متنوعة، مما يدفع حدود السرد الإبداعي.
Firefly من Adobe: مدمج ضمن مجموعة Adobe الإبداعية، يركز Firefly على تقديم أدوات الذكاء الاصطناعي التوليدي التي تتناسب بسلاسة مع سير عمل التصميم الحالي، ويوفر ميزات مثل تحويل النص إلى صورة والتعبئة التوليدية، ويتوسع الآن ليشمل عناصر الفيديو التي تدعم الإنتاج الاحترافي.

تتميز Midjourney V1 بتركيزها الأساسي على تحريك الصور الموجودة، بدلاً من توليد الفيديو بالكامل من أوامر نصية (على الرغم من أن الأوامر النصية تحدد الحركة للصور الخارجية). يستفيد هذا النهج المرتكز على الصور من سمعة Midjourney الراسخة في الجماليات البصرية، مما يسمح للمستخدمين بالبناء على إبداعاتهم الثابتة المذهلة بالفعل. في حين أن المنصات الأخرى قد تتفوق في إنشاء مشاهد فيديو جديدة تمامًا من الصفر، تهدف Midjourney V1 إلى إضافة حركة وعمق لأسلوبها البصري المميز، مقدمة مجموعة من الإمكانيات المكملة، وليست المتطابقة، ضمن النظام البيئي لفيديو الذكاء الاصطناعي.

كيفية إنشاء أول فيديو بالذكاء الاصطناعي مع Midjourney

تم تصميم البدء مع V1 من Midjourney ليكون مباشرًا للمستخدمين الحاليين المطلعين على واجهة Discord الخاصة بها. إليك نظرة مفصلة على العملية:

تتضمن الطريقة الأساسية تحريك الصور التي تم إنشاؤها بالفعل داخل Midjourney. بعد إنشاء صورة، يصبح خيار “Animate” الجديد متاحًا. عند تحديده، تتولى V1 زمام الأمور، وتعالج الصورة وتنشئ سلسلة من أربعة مقاطع فيديو مختلفة مدتها خمس ثوانٍ. تم تصميم هذه المقاطع لالتقاط حركات خفية وتفسيرات مختلفة للصورة الثابتة الأصلية، مما يوفر مجموعة من الخيارات للمستخدم.

بالنسبة لأولئك الذين يتطلعون إلى تحريك الصور من مصادر خارج نظام Midjourney البيئي، فإن العملية مختلفة قليلاً ولكنها سهلة الاستخدام بنفس القدر. يمكن للمستخدمين ببساطة سحب وإسقاط ملف الصورة المطلوب مباشرة في شريط الأوامر داخل تطبيق Discord. والأهم من ذلك، يجب تعيين هذه الصورة الخارجية كـ “إطار بداية” ضمن الأمر. بعد ذلك، يمكن للمستخدم إدخال “أمر حركة” – نص وصفي يوضح كيفية رغبته في تحريك الصورة أو كيف يجب أن يتطور المشهد. ثم تطبق V1 إمكانياتها التوليدية لإنتاج تسلسلات متحركة بناءً على هذه التعليمات والصورة المختارة.

توسع هذه المرونة في تحريك كل من الصور المولدة داخليًا والمصادر الخارجية بشكل كبير الفائدة الإبداعية لـ Midjourney V1، مما يجعلها أداة متعددة الاستخدامات لمختلف احتياجات إنشاء المحتوى.

إتقان إعدادات وأنماط الرسوم المتحركة

توفر Midjourney V1 للمستخدمين درجة من التحكم في كيفية ظهور رسومهم المتحركة، مقدمة إعدادات رسوم متحركة مميزة ونمطين للحركة لتخصيص الإخراج:

إعدادات الرسوم المتحركة

تلقائي: هذا الإعداد مثالي للرسوم المتحركة السريعة وللمستخدمين الذين يفضلون نهجًا غير تدخلي. عند تحديد “تلقائي”، تقوم V1 من Midjourney تلقائيًا بإنشاء “أمر حركة” في الخلفية. هذا يسمح للأداة “بتحريك الأشياء ببساطة” بناءً على خوارزمياتها الداخلية وفهمها لمحتوى الصورة، وإنتاج حركات عضوية ومفاجئة في كثير من الأحيان دون تدخل مباشر من المستخدم بشأن الحركة نفسها.
يدوي: للمبدعين الذين يبحثون عن تحكم أكثر تحديدًا وتوجيهًا فنيًا، فإن زر الرسوم المتحركة “يدوي” هو الخيار المفضل. تتيح هذه الوضعية للمستخدمين تحديد بدقة كيف يريدون تحريك العناصر داخل الصورة وكيف يجب أن يتطور المشهد العام. من خلال إدخال أوامر حركة وصفية، يمكن للمستخدمين توجيه الذكاء الاصطناعي لتحقيق تأثير سردي أو بصري معين، مما يوفر مستوى أعلى من الدقة الإبداعية.

أنماط الحركة

حركة منخفضة: يتميز هذا النمط بحركات خفية ومتعمدة. في مقاطع الفيديو ذات الحركة المنخفضة، يميل الكاميرا الافتراضية إلى البقاء ثابتة إلى حد كبير، مما يوفر إطارًا ثابتًا. يتحرك الموضوع الأساسي داخل الصورة ببطء أو بوتيرة مضبوطة، مما يجعله مناسبًا للانتقالات اللطيفة، أو التركيز على الشخصيات، أو المشاهد التي يُقصد أن تكون البيئة فيها مستقرة.
حركة عالية: على النقيض من ذلك، يقدم نمط الحركة العالية حركة ديناميكية لكل من الموضوع والكاميرا الافتراضية. يمكن أن يؤدي هذا إلى مقاطع أكثر دراماتيكية وتأثيرًا، تحاكي عمل الكاميرا السينمائي مثل اللقطات المتحركة، أو التكبير، أو اللقطات التتبعية، جنبًا إلى جنب مع حركة موضوع أكثر حيوية. ومع ذلك، تعترف Midjourney بشفافية بوجود قيود حالية: “كل هذه الحركة يمكن أن تؤدي أحيانًا إلى أخطاء غريبة.” هذا الاعتراف الصريح يسلط الضوء على الطبيعة التجريبية للذكاء الاصطناعي المتطور، حيث يمكن للتفاعلات المعقدة أن تنتج بشكل دوري نتائج غير متوقعة أو مشوهة بصريًا. يجب أن يكون المستخدمون مستعدين للأخطاء المحتملة أو التشويهات غير المتوقعة عند دفع الحدود باستخدام إعدادات الحركة العالية.

توسيع الإبداع: تحريك الصور الخارجية وتمديد المقاطع

تمتد وظائف V1 من Midjourney إلى ما وراء مجرد تحريك إبداعاتها الخاصة. هذه المرونة تعزز بشكل كبير فائدتها لمجموعة أوسع من المشاريع الإبداعية.

كما ذكرنا، يمكن للمستخدمين تحريك الصور التي يقومون بتحميلها من خارج Midjourney. هذه الميزة تغير قواعد اللعبة للفنانين والمصورين ومنشئي المحتوى الذين يرغبون في غرس أصولهم البصرية الثابتة الحالية بحركة ديناميكية. العملية بسيطة: اسحب الصورة المختارة إلى شريط الأوامر، وحددها كـ “إطار بداية”، ثم أدخل أمر حركة وصفي. هذا يسمح بتآزر قوي بين الرؤية الإبداعية الشخصية وقدرات الذكاء الاصطناعي لـ Midjourney، مما يحول الصور الشخصية أو الرسوم التوضيحية المخصصة إلى مقاطع فيديو قصيرة.

ميزة أخرى مهمة للمبدعين هي القدرة على “تمديد” مقاطع الفيديو. بينما تكون المخرجات الأولية مقاطع مدتها خمس ثوانٍ، فإن المستخدمين غير مقيدين بهذه المدة القصيرة. بمجرد إنشاء فيديو مدته خمس ثوانٍ مرضٍ، يمكن تمديده بحوالي أربع ثوانٍ في كل مرة. يمكن تكرار عملية التمديد هذه حتى أربع مرات إجمالًا لمقطع واحد، مما يسمح للمستخدمين ببناء قصص أطول بشكل تدريجي من رسومهم المتحركة القصيرة الأولية. توفر قدرة التمديد التكراري هذه مسارًا لتطوير محتوى فيديو أكثر تفصيلاً واستمرارية، تجاوزًا للحلقات القصيرة إلى تسلسلات متحركة أكثر شمولاً.

تكلفة توليد الفيديو المتطور بالذكاء الاصطناعي

بينما الإمكانيات الإبداعية التي تقدمها Midjourney V1 هائلة، يجب على المستخدمين المحتملين أن يكونوا على دراية بالتكاليف المرتبطة بها. توليد الفيديو باستخدام Midjourney يتطلب موارد أكثر بكثير من إنتاج الصور الثابتة، وينعكس هذا في نموذج التسعير الخاص بها.

حددت Midjourney أن توليد الفيديو سيكلف ثمانية أضعاف تكلفة توليد الصور التقليدية. هذا يعني أن المستخدمين سيستهلكون أرصدة اشتراكهم الشهرية بمعدل أسرع بكثير عند استخدام V1. على سبيل المثال، إذا كان المستخدم يحصل عادةً على عدد معين من عمليات توليد الصور شهريًا في خطته، فسيتم تقليل هذا السماح بشكل كبير عند توليد مقاطع فيديو. يؤكد هيكل التسعير هذا على المتطلبات الحسابية لنماذج فيديو الذكاء الاصطناعي، والتي تتطلب قوة معالجة وبيانات هائلة لعرض تسلسلات ديناميكية.

علاوة على ذلك، أشارت Midjourney إلى أن التكلفة النهائية لتشغيل هذه النماذج المتقدمة لا تزال تخضع لتقييم في الوقت الفعلي. تعترف الشركة بأن التكلفة الدقيقة “يصعب التنبؤ بها” في هذه المرحلة المبكرة. لضمان نموذج عمل مستدام، تراقب Midjourney باستمرار تفاعل المستخدمين والحمل الحسابي للخدمة. هذا يعني أن الأسعار قد يتم تعديلها في المستقبل بناءً على أنماط الاستخدام والنفقات التشغيلية، مما يسلط الضوء على الطبيعة الديناميكية للتسعير في خدمات الذكاء الاصطناعي المتطورة.

التنقل في المشهد القانوني: حقوق النشر وتوليد الذكاء الاصطناعي

أدى التقدم السريع للذكاء الاصطناعي التوليدي، خاصة في المحتوى المرئي والوسائط المتعددة، حتمًا إلى تحديات قانونية معقدة، خاصة فيما يتعلق بحقوق النشر والملكية الفكرية. Midjourney، على الرغم من براعتها التكنولوجية، ليست محصنة ضد هذه القضايا.

في الآونة الأخيرة، وجدت الشركة نفسها في قلب دعوى قضائية كبيرة رفعتها شركات الترفيه الكبرى Universal و Disney. اتهمت هذه الاستوديوهات مجتمعة Midjourney بالعمل “حفرة لا قاع لها من الانتحال”. يؤكد جوهر ادعائهم أن نماذج الذكاء الاصطناعي الخاصة بـ Midjourney، في تدريبها وإخراجها، تستفيد بشكل كبير من مخزون واسع من المواد المحمية بحقوق النشر، بما في ذلك إنتاجات أيقونية من هذه الاستوديوهات، دون إذن أو تعويض مناسب. هذا الاستخدام المزعوم غير المصرح به للملكية الفكرية هو جوهر النقاش الأوسع حول كيفية تدريب نماذج الذكاء الاصطناعي على البيانات الموجودة وأصالة مخرجاتها المولدة.

تسلط الدعوى القضائية الضوء على منطقة رمادية قانونية حرجة في صناعة الذكاء الاصطناعي: من يملك حقوق النشر للمحتوى الذي يولده الذكاء الاصطناعي، خاصة عندما يتم تدريب الذكاء الاصطناعي على أعمال محمية بحقوق النشر؟ وما الذي يشكل استخدامًا عادلًا أو استخدامًا تحويليًا في هذا النموذج الرقمي الجديد؟ هذه المعارك القانونية لا تتعلق بـ Midjourney فقط؛ إنها تمثل لحظة محورية لقطاع الذكاء الاصطناعي التوليدي بأكمله، وقد تضع سوابق لكيفية قيام شركات الذكاء الاصطناعي بترخيص البيانات، وتنسب الفضل إلى المبدعين الأصليين، وإدارة التسويق التجاري للمحتوى الذي يولده الذكاء الاصطناعي. ستشكل نتائج مثل هذه القضايا بلا شك مستقبل تطوير ونشر تقنيات الذكاء الاصطناعي في الصناعات الإبداعية.

رؤية Midjourney لمستقبل الذكاء الاصطناعي

على الرغم من العقبات القانونية الحالية، تظل Midjourney طموحة للغاية بشأن المسار المستقبلي لتكنولوجيتها. أدلى متحدث باسم الشركة بتصريح جريء كجزء من إطلاق V1، قائلاً: “نعتقد أن الوجهة الحتمية لهذه التكنولوجيا هي نماذج قادرة على محاكاة العالم المفتوح في الوقت الفعلي.”

يشير هذا البيان إلى رؤية تتجاوز مجرد توليد الصور أو مقاطع الفيديو القصيرة. تشير “محاكاة العالم المفتوح” إلى القدرة على إنشاء بيئات افتراضية واسعة وتفاعلية وديناميكية في الوقت الفعلي، ربما على غرار ألعاب الفيديو المتقدمة أو منصات الميتافيرس، ولكن يتم إنشاؤها بالكامل والتحكم فيها بواسطة الذكاء الاصطناعي. من شأن هذه القدرة أن تحدث ثورة في صناعات تتراوح من الترفيه والألعاب إلى الهندسة المعمارية والبحث العلمي ومحاكاة التدريب الافتراضي.

يتطلب تحقيق محاكاة العالم المفتوح في الوقت الفعلي التي يدعمها الذكاء الاصطناعي تقدمًا غير مسبوق في القوة الحسابية، وتعقيد نماذج الذكاء الاصطناعي، والقدرة على الحفاظ على الاتساق والتماسك عبر البيئات واسعة النطاق والمتطورة. سيتطلب ذلك من الذكاء الاصطناعي ليس فقط توليد المرئيات، بل أيضًا فهم ومحاكاة الفيزياء، وسلوك الشخصيات، وتطور السرد، والتفاعلات الديناميكية على الفور. تجسد Midjourney هذا الهدف الطموح التزامها طويل الأجل بدفع حدود الذكاء الاصطناعي التوليدي، بهدف الانتقال من قطع المحتوى المنفصلة إلى الحقائق الرقمية الغامرة والحية.

الآثار المترتبة على الطريق إلى الأمام لفيديو الذكاء الاصطناعي

يحمل ظهور أدوات توليد الفيديو بالذكاء الاصطناعي سهلة الوصول مثل Midjourney V1 آثارًا عميقة عبر مختلف القطاعات، من الصناعات الإبداعية إلى الاتصالات الرقمية اليومية.

دمقرطة إنشاء المحتوى

تقلل مولدات الفيديو بالذكاء الاصطناعي بشكل كبير من حاجز الدخول لإنتاج الفيديو. ما كان يتطلب في السابق معدات باهظة الثمن، وبرامج متخصصة، ومهارات تقنية واسعة يمكن الآن تحقيقه بأوامر بسيطة واشتراك. هذا يمكّن الفنانين المستقلين والشركات الصغيرة والمسوقين وحتى المستخدمين العاديين من إنشاء محتوى فيديو عالي الجودة، مما يعزز موجة جديدة من الإبداع والتعبير الرقمي.

التأثير على الصناعات

من المتوقع أن تُحدث صناعات الأفلام والرسوم المتحركة والإعلانات والألعاب تحولًا كبيرًا. يمكن للذكاء الاصطناعي تسريع المعاينة المسبقة، وإنشاء عناصر نائبة للمشاهد، والمساعدة في رسوم الشخصيات المتحركة، وحتى إنشاء خلفيات ديناميكية أو مؤثرات خاصة بتكلفة ووقت أقل بكثير من الطرق التقليدية. يمكن أن يؤدي هذا إلى تكرار أسرع للمحتوى وأشكال مبتكرة من الوسائط.

الاعتبارات والتحديات الأخلاقية

ومع ذلك، فإن انتشار الفيديو بالذكاء الاصطناعي يثير أيضًا مخاوف أخلاقية كبيرة. سهولة إنشاء لقطات فيديو واقعية، وإن كانت ملفقة، تزيد من المخاوف بشأن التزييف العميق والمعلومات المضللة وتآكل الثقة في الأدلة المرئية. ستتطلب معالجة هذه التحديات أدوات كشف قوية، وتصنيفًا واضحًا للمحتوى الذي يولده الذكاء الاصطناعي، وربما أطر تنظيمية جديدة للتخفيف من سوء الاستخدام.

مشهد المستقبل

بالنظر إلى المستقبل، من المرجح أن يركز تطور فيديو الذكاء الاصطناعي على زيادة الدقة، وطول مقاطع الفيديو، والتماسك الأفضل عبر المشاهد، وتحسين آليات التحكم. سيؤدي التكامل مع وسائط الذكاء الاصطناعي الأخرى، مثل توليد الصوت بالذكاء الاصطناعي، إلى تجارب وسائط متعددة غامرة وكاملة بشكل متزايد. التطلع إلى “محاكاة العالم المفتوح في الوقت الفعلي” يلمح إلى مستقبل حيث لا يقوم الذكاء الاصطناعي بإنشاء المحتوى فحسب، بل حقائق رقمية تفاعلية كاملة.

إطلاق Midjourney V1 هو أكثر من مجرد ميزة جديدة؛ إنه مؤشر قوي على التسارع السريع للابتكار في الذكاء الاصطناعي التوليدي. مع استمرار هذه التكنولوجيا في النضوج، فإنها ستعيد تشكيل كيفية إنشاء المحتوى الرقمي واستهلاكه والتفاعل معه بلا شك، مما يقدم فرصًا غير مسبوقة وتحديات مجتمعية معقدة.

رحلة الفيديو الذي يولده الذكاء الاصطناعي قد بدأت للتو، وعرض Midjourney الأخير يضمن بقائها لاعبًا رئيسيًا في تشكيل هذا المستقبل المثير، والمتحدي أحيانًا.