كيفية كتابة توجيهات فعالة لتوليد الصور باستخدام الذكاء الاصطناعي؟

Eric White

Eric White

10/22/2024

#Tutorial
كيفية كتابة توجيهات فعالة لتوليد الصور باستخدام الذكاء الاصطناعي؟

في عالم توليد الصور باستخدام الذكاء الاصطناعي، تعتبر التوجيهات التي تكتبها بمثابة فرشاة الرسام. إن تعلم كيفية صياغة توجيهات فعالة أمر بالغ الأهمية لتحويل أفكارك البصرية إلى واقع. أدرك أن نتائج التوجيهات هي نوع من الفن وليس هناك صواب أو خطأ مطلق، ولكن في الاستخدامات الواقعية، ما زلنا نرغب في التحكم في الصور التي يولدها الذكاء الاصطناعي لتناسب رغباتنا. لهذا السبب استخدمت كلمة "فعالة" في العنوان. والآن، دعونا نبدأ.

المبادئ الرئيسية لكتابة توجيهات فعالة للصور

1. كن وصفيًا ومفصلاً

تعمل مولدات الصور بالذكاء الاصطناعي من خلال فهم العلاقة بين النص والصور. يتم تدريبها على مجموعات بيانات ضخمة حيث يتم إقران الصور بتعليقات وصفية. عندما تقدم توجيهًا للصورة، يبحث الذكاء الاصطناعي عن العناصر المرئية التي تتطابق بشكل أفضل مع وصفك بناءً على تدريبه. اقرأ المزيد عن كيفية عمل مولدات الصور بالذكاء الاصطناعي.

كلما كان توجيهك أكثر وصفية وتفصيلاً، كلما تمكن الذكاء الاصطناعي من فهم وتطابق بيانات التدريب الخاصة به بشكل أفضل وإنشاء الصورة التي تريدها. غالبًا ما يؤدي التوجيه الغامض إلى نتيجة غير متوقعة أو عامة، حيث يكون لدى الذكاء الاصطناعي معلومات أقل تحديدًا للعمل بها.

عندما لا تتضمن تفاصيل كافية في توجيهك، سيملأ الذكاء الاصطناعي الفجوات بـ "تخميناته" الخاصة بناءً على بيانات التدريب الخاصة به. بينما قد يؤدي هذا أحيانًا إلى نتائج مفاجئة ومثيرة للاهتمام، إلا أنه في كثير من الأحيان ينتج صورًا خارجة عن سيطرتك وقد لا تتطابق مع رؤيتك. توفر التوجيهات التفصيلية للصور المزيد من التحكم في النتيجة النهائية.

توجيه سيء: "قطة"

توجيه جيد: "قطة سيامية أنيقة ذات عيون زرقاء، جالسة على عتبة نافذة، تغمرها أشعة الشمس الدافئة"

A cat. Generated by FLUX.1 Dev

A cat. Generated by FLUX.1 Dev

A sleek Siamese cat with blue eyes, sitting on a windowsill, bathed in warm sunlight. Generated by FLUX.1 Dev

A sleek Siamese cat with blue eyes, sitting on a windowsill, bathed in warm sunlight. Generated by FLUX.1 Dev

في التوجيه السيء، لدى الذكاء الاصطناعي معلومات قليلة جدًا للعمل بها، مما قد يؤدي إلى صورة قطة عامة أو حتى عناصر غير متوقعة يربطها الذكاء الاصطناعي بالقطط. يوفر التوجيه الجيد تفاصيل محددة عن مظهر القطة والإعداد والإضاءة، مما يعطي الذكاء الاصطناعي تعليمات واضحة لتوليد صورة أكثر دقة وحيوية وتحكمًا تتطابق مع قصدك.

هل تحتاج إلى مساعدة في توسيع توجيهك؟ جرب مولد التوجيهات الخاص بنا

إذا لم يكن لديك فكرة عن كيفية إضافة تفاصيل وصفية إلى توجيهك، يمكنك تجربة مولد توجيهات الصور الخاص بنا لتوليد توجيه من فكرة بسيطة ثم تنقيحه كما تريد.

الفكرة الأصلية: "كلب"

التوجيه المولد: "صورة واقعية لكلب، واقف في حالة تأهب مع آذان منتصبة، فرو متوسط الطول بدرجات البني والأبيض، عيون لامعة ومنتبهة، أنف رطب قليلاً، يلهث قليلاً مع تعبير مسترخٍ، موضوع في حقل عشبي تحت سماء زرقاء صافية، أشعة الشمس تلقي ظلالاً ناعمة على الفرو، الخلفية تتضمن أشجارًا بعيدة وتلاً منحدرًا بلطف، الجو هادئ وسلمي، الأسلوب يشبه التصوير الطبيعي، البعد البؤري 50 مم، النبرة العاطفية هادئة ومراقبة."

2. ضع الموضوع الرئيسي أولاً

تعطي معظم نماذج الذكاء الاصطناعي وزنًا أكبر للكلمات في بداية التوجيه. وضع موضوعك الرئيسي أو العناصر الأكثر أهمية أولاً في توجيهك سيساعد الذكاء الاصطناعي على توليد صور تتطابق مع قصدك.

يوفر هذا النهج العديد من الفوائد:

  1. يضمن أن يعطي الذكاء الاصطناعي الأولوية للعناصر الأكثر أهمية
  2. يحسن احتمالية توليد صور تتطابق مع قصدك
  3. يقلل من فرصة سوء فهم الذكاء الاصطناعي أو تجاهل التفاصيل الرئيسية

توجيه يضع البيئة أولاً: "مدينة مزدحمة بأضواء النيون وناطحات السحاب، بطل خارق يحلق في السماء"

توجيه يضع البطل الخارق أولاً: "بطل خارق يحلق في السماء فوق مدينة مزدحمة بأضواء النيون وناطحات السحاب"

A bustling metropolis with neon lights and skyscrapers, a superhero soaring through the sky. Generated by FLUX.1 Dev

A bustling metropolis with neon lights and skyscrapers, a superhero soaring through the sky. Generated by FLUX.1 Dev

A superhero soaring through the sky over a bustling metropolis with neon lights and skyscrapers. Generated by FLUX.1 Dev

A superhero soaring through the sky over a bustling metropolis with neon lights and skyscrapers. Generated by FLUX.1 Dev

في التوجيه الثاني، تم وضع البطل الخارق كموضوع رئيسي في بداية التوجيه، مما يضمن أن يعالج الذكاء الاصطناعي هذا العنصر أولاً ويعطيه بروزًا في الصورة المولدة.

نصيحة: عند وصف المشاهد المعقدة، استخدم الفواصل في التوجيه لفصل العناصر المختلفة مع الحفاظ على المحتوى الأكثر أهمية في المقدمة:

"بطل خارق يحلق في السماء فوق مدينة مزدحمة، أضواء النيون، ناطحات سحاب شاهقة، سماء الغسق، بحيرة في المدينة"

A superhero soaring through the sky over a bustling metropolis, neon lights, towering skyscrapers, twilight sky, lake in city. Generated by FLUX.1 Dev

A superhero soaring through the sky over a bustling metropolis, neon lights, towering skyscrapers, twilight sky, lake in city. Generated by FLUX.1 Dev

بهذه الطريقة، يمكنك الحفاظ على أولوية الموضوع مع تضمين تفاصيل خلفية غنية.

3. استخدم توجيهات باللغة الإنجليزية للحصول على أفضل النتائج

تم تدريب معظم نماذج توليد الصور بالذكاء الاصطناعي بشكل أساسي على مجموعات بيانات باللغة الإنجليزية. هذا يعني أن التوجيهات باللغة الإنجليزية غالبًا ما تنتج نتائج أكثر دقة واتساقًا مقارنة باللغات الأخرى. يكمن السبب في عملية تدريب الذكاء الاصطناعي:

  1. مجموعة بيانات أكبر: اللغة الإنجليزية لديها مجموعة أكبر بكثير من أزواج النص والصورة المستخدمة للتدريب.
  2. فهم أفضل: نماذج الذكاء الاصطناعي لديها فهم أكثر دقة للكلمات والعبارات الإنجليزية.
  3. تفسيرات متسقة: من غير المرجح أن يتم تفسير التوجيهات الإنجليزية بشكل خاطئ أو إنتاج نتائج غير متوقعة.

في حين أن بعض نماذج توليد الصور تدعم الآن التوجيهات متعددة اللغات، إلا أن حجم البيانات غير الإنجليزية في مجموعات بيانات التدريب الخاصة بها عادة ما يكون أصغر بكثير مقارنة بالبيانات الإنجليزية. نتيجة لذلك، قد لا تعمل التوجيهات باللغات الأخرى غير الإنجليزية بنفس الاتساق أو الفعالية مثل التوجيهات الإنجليزية. للحصول على أفضل النتائج، لا يزال يُنصح باستخدام التوجيهات الإنجليزية في معظم الحالات.

ملاحظة: قمنا بترجمة التوجيهات في الدروس التعليمية لفهم أفضل، لذلك قد ترى بعض التوجيهات غير الإنجليزية في دروسنا التعليمية، ولكننا نستخدم دائمًا توجيهات إنجليزية عند توليد الصور.

لست جيدًا في اللغة الإنجليزية؟ جرب المترجم الخاص بنا

هل أنت لست جيدًا في اللغة الإنجليزية؟ لا تقلق! يمكنك استخدام مترجم توجيهات الصور المدمج لدينا للمساعدة في صياغة توجيهاتك. ما عليك سوى كتابة توجيهك بلغتك الأم، واستخدام أداتنا لترجمته إلى اللغة الإنجليزية للحصول على أفضل النتائج.

4. صيغ التوجيهات الشائعة وأفضل الممارسات

عند صياغة توجيهات للصور لتوليد الصور بالذكاء الاصطناعي، من الضروري اتباع هياكل وأفضل الممارسات معينة لتحقيق النتائج المثلى. فيما يلي بعض الإرشادات الرئيسية:

الهيكل الأساسي للموضوع الرئيسي

يتبع هيكل التوجيه الأساسي هذا النمط: [الموضوع] + [الفعل/الحالة] + [السياق/الإعداد]

مثال: "أسد مهيب (الموضوع) يزأر (الفعل) في سافانا عند غروب الشمس (الإعداد)"

A majestic lion roaring on a savannah at sunset. Generated by FLUX.1 Dev

A majestic lion roaring on a savannah at sunset. Generated by FLUX.1 Dev

تقنيات التوجيه المتقدمة

للتوجيهات الأكثر تعقيدًا، ضع في اعتبارك إدراج:

  • معدلات الأسلوب: "منظر مدينة سايبربانك على غرار فيلم بليد رانر، فن رقمي"
  • تفاصيل محددة: قم بتضمين معلومات حول التكوين والمنظور والألوان والإضاءة والملمس
  • زوايا الكاميرا: "تم التصوير بعدسة واسعة الزاوية"
  • النبرة العاطفية: صف مزاج أو جو المشهد
  • مراجع الفنانين: "على طريقة مايكل أنجلو"
  • الإضاءة: "ضوء الصباح الناعم"
  • الملمس: "ملمس رخام ناعم"
  • المادة: "سطح معدني مصقول"
  • التكوين والمنظور: "منظر من الأعلى"

تحليل مثال لتحسين التوجيه

دعونا نرى مثالاً على تحسين التوجيه:

الفكرة: "نسر"

التوجيه: "شخصية نسر شرس بأسلوب الأنمي الياباني النابض بالحياة، يذكرنا بخلفيات استوديو جيبلي التفصيلية الممزوجة مع مشاهد الأكشن الجريئة في أنمي الشونين. للنسر عيون مبالغ فيها ومعبرة مع لمعة حازمة، وريشه مصمم بخطوط حادة وديناميكية توحي بالحركة. أجنحته منتشرة على نطاق واسع، تملأ الإطار بامتداد مثير للإعجاب. يرتدي النسر قطعة درع صغيرة مستوحاة من الساموراي على صدره، مما يضيف عنصرًا خياليًا. تتميز الخلفية بمزيج من العناصر اليابانية التقليدية مثل أزهار الكرز وجبل فوجي، متناقضة مع أفق طوكيو المستقبلي. تهيمن الألوان الساطعة والمشبعة على المشهد، مع تأثيرات إضاءة دراماتيكية وخطوط سرعة تؤكد على قوة النسر ورشاقته. يخلق التكوين العام إحساسًا بالطاقة والحركة، النموذجي لمشاهد الأنمي المليئة بالأكشن."

Generated by FLUX.1 Dev

Generated by FLUX.1 Dev

دعونا نحلل هذا التوجيه لفهم هيكله وفعاليته:

1.الموضوع الرئيسي والأسلوب: "شخصية نسر شرس بأسلوب الأنمي الياباني النابض بالحياة"

  • يحدد بوضوح الموضوع والأسلوب الفني العام

2.مراجع الأسلوب المحددة: "يذكرنا بخلفيات استوديو جيبلي التفصيلية الممزوجة مع مشاهد الأكشن الجريئة في أنمي الشونين"

  • يوفر مراجع أسلوب ملموسة لتوجيه الذكاء الاصطناعي

3.وصف مفصل للموضوع: "للنسر عيون مبالغ فيها ومعبرة مع لمعة حازمة، وريشه مصمم بخطوط حادة وديناميكية توحي بالحركة. أجنحته منتشرة على نطاق واسع، تملأ الإطار بامتداد مثير للإعجاب."

  • يقدم تفاصيل محددة عن مظهر النسر ووضعيته

4.عناصر إضافية: "يرتدي النسر قطعة درع صغيرة مستوحاة من الساموراي على صدره، مما يضيف عنصرًا خياليًا."

  • يقدم ميزات فريدة لجعل الصورة أكثر إثارة للاهتمام

5.وصف الخلفية: "تتميز الخلفية بمزيج من العناصر اليابانية التقليدية مثل أزهار الكرز وجبل فوجي، متناقضة مع أفق طوكيو المستقبلي."

  • يضع المشهد بمزيج من العناصر التقليدية والحديثة

6.اللون والإضاءة: "تهيمن الألوان الساطعة والمشبعة على المشهد، مع تأثيرات إضاءة دراماتيكية وخطوط سرعة"

  • يحدد لوحة الألوان وأسلوب الإضاءة

7.التكوين والمزاج: "يخلق التكوين العام إحساسًا بالطاقة والحركة، النموذجي لمشاهد الأنمي المليئة بالأكشن."

  • يصف التكوين المطلوب والنبرة العاطفية

يجمع هذا التوجيه بفعالية جميع العناصر الرئيسية التي ناقشناها: إنه وصفي ومفصل، يضع الموضوع الرئيسي أولاً، يستخدم مراجع أسلوب محددة، ويتضمن معلومات عن التكوين واللون والمزاج.

من خلال تقسيم التوجيه إلى هذه المكونات، يحصل الذكاء الاصطناعي على دليل واضح لتوليد صورة معقدة وجذابة بصريًا.

الخاتمة

إن صياغة توجيهات فعالة للصور باستخدام الذكاء الاصطناعي هي مهارة تجمع بين الإبداع والفهم التقني. خلال هذا الدليل، استكشفنا المبادئ الرئيسية التي يمكن أن تعزز بشكل كبير مهاراتك في كتابة التوجيهات:

  1. كن وصفيًا ومفصلاً في توجيهاتك
  2. أعط الأولوية للموضوع الرئيسي بوضعه أولاً
  3. استخدم اللغة الإنجليزية للحصول على أفضل النتائج
  4. اتبع صيغ التوجيهات الشائعة وأفضل الممارسات
  5. قم بتضمين معدلات الأسلوب والتفاصيل المحددة وعناصر التكوين

تذكر أن جودة توجيهك تؤثر مباشرة على الصورة التي يولدها الذكاء الاصطناعي. من خلال تقديم تعليمات واضحة ومفصلة والاستفادة من التقنيات التي ناقشناها، يمكنك توجيه الذكاء الاصطناعي لإنشاء صور تتوافق بشكل وثيق مع رؤيتك.

يتطلب إتقان كيفية كتابة توجيهات فعالة للصور الممارسة والتجريب. لا تخف من تكرار توجيهاتك، وتجربة مجموعات مختلفة من العناصر لتحقيق النتيجة المرجوة. مع اكتساب الخبرة، ستطور فهمًا بديهيًا لكيفية تأثير مكونات التوجيه المختلفة على الصورة النهائية.