Grok Imagine في الاستوديو: ما الفائدة منه فعلًا
xAI أطلقت نموذج فيديو + صور مضبوطًا للسوشيال. أضفناه إلى القائمة وحدّدنا مَن يلجأ إليه بدلًا من HappyHorse أو Veo أو FLUX.
- فيديو
- صور
- إصدارات
هبط Grok Imagine في وقت سابق من هذا الأسبوع وردّة فعلنا الأولى كانت: هل نحتاج نموذجًا آخر للصور والفيديو؟ كان لدينا FLUX.2 Pro و Nano Banana 2 للصور الثابتة؛ كان لدينا قائمة فيديو تغطّي بالفعل السينمائي والاجتماعي والاقتصادي. الجواب الصادق أنّنا لم نكن متأكّدين — حتى قضينا بضعة أيام نمرّر برومبتات حقيقية ونراقب ما يعود.
أضفناه إلى الاستوديو اليوم. إليك لماذا، وما الذي ليس له.
ما الذي ضُبط له Grok Imagine
النموذج مدرَّب على مزيج مختلف عن منافسيه. شيئان يبرزان مباشرة:
اجتماعي بالفطرة. نسب العرض إلى الارتفاع الافتراضية 9:16 و 1:1 دون جدال؛ القواعد البصرية أقرب لما ينشره الناس فعلًا منه لما يطمحون إليه. درجات البشرة، الإضاءة، العفويّة — يُنتج مقاطع وصورًا تبدو كأنّها من هاتف أحدهم، لا من moodboard.
سريع ورخيص. التوليد حوالي 4–6 ثوانٍ على برومبتاتنا النموذجية مقابل 25–40 لـ Veo. تكلفة الأرصدة أقرب إلى Hailuo منها إلى Veo. هذا يجعله صالحًا فعلًا لحلقة التكرار عالية الحجم — مسوّدة، قرار، استبدال — التي تتطلّبها تدفّقات السوشيال.
أين يتفوّق على البدائل
ثلاث فئات ملموسة من اختباراتنا:
-
مقاطع بإحساس واقعي لـ X والفيديو القصير. أشخاص يكلّمون الكاميرا، لقطات b-roll، لحظات «يوم في الحياة». جودة لِب-سِنك في HappyHorse أفضل؛ سينماتوغرافيا Veo أحدّ؛ لكن للمقاطع التي تحتاج أن تبدو عفوية، Grok يفوز.
-
مسوّدات واستكشاف. حين لا تعرف بعد ما اللقطة، Grok هو ما تطلبه. تكلفة التكرار منخفضة بما يكفي لتوليد عشرة خيارات، اختيار التكوين الذي يعجبك، ثمّ ترقيته إلى نموذج أثقل للنهائي.
-
ميمات، ردّات فعل، صور سريعة الإنجاز. الجانب البصري يتعامل مع نوع النكتة التركيبية التي تميل النماذج الفوتوريالية إلى المبالغة في تحليلها. إن أردت إوزّة في بدلة سهرة، Grok سيعطيك إوزّة في بدلة سهرة دون التشكيك في خياراتك.
أين لا يتفوّق
ليس نموذج المخرجات السينمائية. حركات الكاميرا غير دقيقة، سحب التركيز معدوم، والمقاطع الأطول تكشف اللحامات. إن كنت تصنع شيئًا يحتاج أن يصمد بدقّة 4K على تلفاز، فهذا ليس هو.
ولا هو نموذج التايبوغرافي أو الملصقات. كمعظم نماذج الصور التي ليست Nano Banana 2 أو GPT Image 2، يُنتج شيئًا يبدو نصًّا من بعيد، ثم ينهار عند التمحيص.
ولا يولّد صوتًا متزامنًا. المقاطع صامتة — تضيف الصوت لاحقًا في post أو توجّه إلى HappyHorse إن كان الصوت-الفيديو المشترك مطلبًا.
كيف نوجّهه
في الاستوديو، يظهر «Grok Imagine» في كلٍّ من منتقي الصور ومنتقي الفيديو. منطق توصية المنتقي يقترحه الآن حين:
- نسبة عرضك 9:16 أو 1:1 (بشكل اجتماعي).
- برومبتك يحوي كلمات مثل casual، handheld، real، raw، iPhone، vlog، POV، unfiltered.
- سبق أن رقّيت مسوّدة Grok إلى نموذج أثقل في نفس الخيط (نعدّ ذلك تصويتًا بالثقة بأن هذه الأداة المناسبة للمهمّة).
يمكنك دائمًا تجاوز التوصية. هدف المنتقي ليس أن يكون محقًّا — بل أن يكون ضغطة مفتاح واحدة عن الصواب.
ملاحظة على مقايضات xAI
Grok Imagine مثير للاهتمام جزئيًّا لأن xAI تعقد مقايضات مختلفة عن المختبرات الأخرى. المنافسون يتسابقون على تاج القياس. xAI تتسابق على زرّ النشر — على ماذا يضغط شخص ما توليد فعلًا، يوميًّا، لينشره على السوشيال. هدف تحسين مختلف ينتج منتجًا مختلفًا بشكل ذي معنى.
ليس لنا حصان في أيٍّ من هذه السباقات. عملنا أن نضع الأداة الصحيحة على بُعد ضغطة مفتاح. لذا: مسوّدات وسوشيال، الجأ إلى Grok. لقطات سينمائية، الجأ إلى Veo. فيديو متزامن الصوت، الجأ إلى HappyHorse. صور ثابتة بنصّ حقيقي، الجأ إلى Nano Banana 2 أو GPT Image 2.
تلك هي القائمة كاملة، تفعل ما يجيده كل نموذج.
وجدت خطأً أو تريد الاعتراض؟ راسلنا .