(عاد/ روسيا) متابعات:
شهدت تقنيات إنشاء الصور بالذكاء الاصطناعي نقلة نوعية مع إطلاق نموذج Images 2.0 من شركة OpenAI، الذي يقدم تحسينات كبيرة في قدرة النماذج على توليد النصوص داخل الصور بدقة أعلى من أي وقت سابق، ما يقلص الفجوة بين المحتوى البشري والمحتوى المنتج آلياً.
ووفق تقرير لموقع TechCrunch، فإن النموذج الجديد يمثل تطوراً مهماً في معالجة واحدة من أبرز نقاط الضعف في النماذج السابقة، وهي أخطاء الكتابة داخل الصور.
مميزات نموذج gpt image 2
في الإصدارات السابقة من نماذج توليد الصور، كانت النصوص تظهر بشكل غير دقيق أو مشوه، خاصة في العناصر البسيطة مثل القوائم أو الملصقات. أما الآن، فأصبح بالإمكان إنتاج محتوى بصري متكامل، مثل قوائم الطعام أو المواد الإعلانية، بجودة قريبة من التصميم الاحترافي الجاهز للاستخدام.
ويعود هذا التحسن إلى تطور أساليب توليد الصور، حيث كانت النماذج تعتمد على “نماذج الانتشار” التي تعيد بناء الصورة من الضوضاء، ما كان يحد من دقة النصوص داخل الصورة.
تقنيات أكثر تقدماً
تتجه الأبحاث الحديثة نحو استخدام نماذج أكثر تطوراً مثل النماذج التتابعية، التي تعمل بطريقة مشابهة لنماذج اللغة، ما يسمح بتحسين دقة العناصر الدقيقة مثل النصوص والرموز داخل الصور.
ورغم أن OpenAI لم تكشف بشكل تفصيلي عن البنية التقنية للنموذج، فإنها أكدت أن Images 2.0 يمتلك قدرات “تفكير متقدمة” تمكّنه من تنفيذ مهام متعددة، مثل توليد عدة صور من طلب واحد ومراجعة النتائج قبل عرضها.
لغات متعددة واستخدامات إبداعية
يوفر النموذج الجديد دعماً محسناً للغات غير اللاتينية، بما في ذلك اليابانية والكورية والهندية والبنغالية، ما يعزز قدرته على خدمة أسواق عالمية متنوعة ويوسع نطاق استخدامه التجاري والإبداعي.
بفضل التطور الجديد، أصبح بإمكان المستخدمين إنشاء مواد تسويقية متكاملة، ورسوم كرتونية متعددة المشاهد، وتصميمات واجهات مستخدم دقيقة، مع الحفاظ على جودة التفاصيل الصغيرة مثل الأيقونات والنصوص الدقيقة، وهي من أبرز التحديات التي واجهت النماذج السابقة.
إطلاق تدريجي
من المتوقع إتاحة Images 2.0 لجميع مستخدمي ChatGPT وCodex، مع ميزات إضافية للمشتركين المدفوعين، إلى جانب إطلاق واجهة برمجية جديدة باسم gpt-image-2، سيتم تسعيرها وفق جودة ودقة الصور الناتجة.
يعكس هذا التطور تسارع المنافسة بين شركات الذكاء الاصطناعي، مع دخول مرحلة جديدة يصبح فيها توليد الصور والنصوص داخلها أكثر دقة وواقعية، ما يعيد تشكيل مستقبل المحتوى الرقمي والإبداعي عالمياً.























