أنظمة الذكاء الاصطناعي المدربة على الصور المُنشأة بواسطة ذكاء اصطناعي آخر تُنتج أخطاءً وتشويشاً
يؤدي استخدام الصور المُنشأة بواسطة الذكاء الاصطناعي لتدريب الذكاء الاصطناعي بسرعة إلى إنشاء حلقة ذاتية الاستهلاك تسوء فيها النتائج سواء من حيث الجودة أو التنوع البصري
بقلم جيريمي هسو
مع امتلاء الإنترنت بالصور المُنشأة بواسطة الذكاء الاصطناعي Artificial Intelligence (اختصاراً: الذكاء الاصطناعي AI) لوجوه بشرية وصور قطط غريبة، يتزايد خطر إنشاء حلقة ذاتية الاستهلاك Self-consuming AI loop تتكون من أنظمة الذكاء الاصطناعي التوليدية Generative Ais التي تتدرب بشكل أساسي على صورها الاصطناعية الخاصة. قد يؤدي ذلك إلى انخفاض كبير في جودة أو تنوع هذه الصور.
ستشكل هذه الظاهرة تحدياً لمعظم شركات التكنولوجيا، باستثناء أكبر شركات التكنولوجيا، القادرة على تنظيف وتصفية مجموعات بيانات التدريب على الذكاء الاصطناعي AI المأخوذة من الإنترنت. ويقول ريتشارد بارانيوك Richard Baraniuk من جامعة رايس Rice University في تكساس: «سيكون هناك منحدر زلق لاستخدام البيانات التوليدية، إما عن قصد أو عن غير قصد».
أظهر بارانيوك وزملاؤه كيف يمكن أن تؤثر حلقة الذكاء الاصطناعي ذاتية الاستهلاك في أنظمة الذكاء الاصطناعي التوليدية، بما في ذلك نمذجات مُولِّد الصور StyleGAN التي تنشئ صوراً في خطوة واحدة، ونمذجات الانتشار Diffusion models التي تستخدم العديد من الخطوات لإنتاج صورة واضحة تدريجياً. فدرّب الفريقُ الذكاءَ الاصطناعي AI على الصور المُنشأة بواسطة الذكاء الاصطناعي AI أو الصور الحقيقية – تتكون الأخيرة من 70 ألف وجه بشري مأخوذ من خدمة الصور عبر الإنترنت على منصة الصور Flickr.
أولاً، تم تدريب كل ذكاء اصطناعي AI بشكل حصري ومتكرر على الصور المُنشأة بواسطة الذكاء الاصطناعي AI والتي تم التقاطها من الأجيال السابقة. في غضون بضعة
أجيال، ظهرت أنماط بصرية متموجة على الوجوه البشرية التي أنتجها مولد الصور StyleGAN، في حين صارت نتائج مُولِّد الصور المنتشرة ضبابية بشكل متزايد.
يمكن إبطاء انخفاض جودة الصورة عن طريق اختيار الصور الأعلى جودة من تلك المُنشأة بواسطة الذكاء الاصطناعي AI، وذلك لاستخدامها في التدريب. لكن هذا يمكن أن يؤدي إلى ظهور صور أكثر تشابهاً – فقد رصد فقدان التنوع هذا في صور StyleGAN الذي أوجد في النهاية بحراً من الوجوه البشرية التي بدت متشابهة إلى حد كبير في كل من ملامح الوجه ولون البشرة.
يقول جوزويه كاسكو رودريغيز Josue Casco-Rodriguez، من جامعة رايس وأحد أعضاء الفريق: «سيكون من المغري دائماً التضحية بالتنوع من أجل أن تكون الجودة الجمالية النمذجة الأكثر شيوعا».
في سيناريو آخر، أخفى الباحثون مجموعة ثابتة من الصور الحقيقية في مجموعات التدريب التي تضمنت الصور المُنشأة بواسطة الذكاء الاصطناعي AI. فهذا مشابه للطريقة التي يستخدم بها الباحثون أحياناً البيانات المُنشأة بواسطة الذكاء الاصطناعي AI لملء مجموعات التدريب الصغيرة. لكن هذه الاستراتيجية أخّرت فقط انخفاض جودة الصورة أو مدى تنوعها.
أخيراً، درّبوا ذكاء اصطناعي AI على مجموعة من الصور المُنشأة بواسطة الذكاء الاصطناعي AI آخر ومجموعة دائمة التغير من الصور الحقيقية. وقد أدى ذلك إلى نتائج واعدة في تجنب الانخفاض في الجودة أو التنوع – ولكن فقط طالما كانت كمية البيانات المُنشأة بواسطة الذكاء الاصطناعي AI المستخدمة في التدريب محدودة بحد معين.
تتماشى هذه النتائج مع الأبحاث الحديثة الأخرى حول التراجع في فائدة الذكاء الاصطناعي AI عندما تتعلم هذه البرامج من أنظمة الذكاء الاصطناعي الأخرى، كما يقول إليا شوميلاف Ilia Shumailav من جامعة أكسفورد University of Oxford.
لكن شوميلاف يظل متفائلاً بشأن استخدام البيانات التوليدية في تدريب الذكاء الاصطناعي AI. سيكون المفتاح هو التأكد من أن أي بيانات منشأة بواسطة الذكاء الاصطناعي AI هي عالية الجودة وخالية من الأخطاء المنهجية التي يمكن أن تؤثر تأثيرا كبيرا في النتائج بالمستقبل.
ستواجه المؤسسات الصغيرة التي لا تمتلك موارد غوغل Google أو مايكروسوفت Microsoft أكبر التحديات في تنظيف تصفية الصور المُنشأة بواسطة الذكاء الاصطناعي AI والمأخوذة من الإنترنت. يقول عضو الفريق سينا المحمد Sina Alemohammad، في جامعة رايس أيضاً، إن الجهود المبذولة لتطوير العلامات المائية Watermarks التي تسمح للأشخاص بالتعرف بسهولة على الصور المُنشأة بواسطة الذكاء الاصطناعي AI يمكن أن تساعدنا في هذا الخصوص. ولكن العلامات المائية المخفية يمكن أن تؤدي في الواقع إلى تدهور جودة الصور المُنشأة بواسطة الذكاء الاصطناعي AI إذا تم التغاضي عنها. يقول محمد: «أنت خاسر إذا فعلت، وخاسر إذا لم تفعل… لكن من الأفضل بالتأكيد وضع علامة مائية على الصورة».
© 2023, New Scientist, Distributed by Tribune Content Agency LLC