يتحسن الذكاء الاصطناعي في الرياضيات إذا طلبت إليه التظاهر بأنه في ستار تريك
تختلف روبوتات الدردشة في إجاباتها اعتماداً على الصياغة الدقيقة المستخدمة لتحفيزها، ويبدو الآن أن تلقين الذكاء الاصطناعي بالإجابة كما لو كان كابتن ستار تريك يعزز قدرته الرياضياتية
بقلم كريس ستوكل- ووكر
يبدو أن توجيه روبوت محادثة يعمل بالذكاء الاصطناعي AI chatbot للإجابة على الأسئلة كما لو كان ذلك في البرنامج التلفزيوني ستار تريك Star Trek يؤدي إلى تحسين قدرته الرياضياتية، على الرغم من ألا أحد متأكد تماماً من السبب.
لقد أدرك الأشخاص الذين يستخدمون برامج الدردشة الآلية مثل ChatGPT بالفعل أنه يمكن تحسين جودة المخرجات من خلال تلقين Prompt الذكاء الاصطناعي بتبني شخصية معينة، أو عن طريق رشوتها أو تهديدها. وبدلاً من استخدام التجربة والخطأ لاكتشاف أي من هذه التلقينات هي الأكثر فعالية، تحول ريك باتل Rick Battle وتيجا غولابودي Teja Gollapudi في شركة البرمجيات في أم ويير VMware في كاليفورنيا إلى نمذجات اللغات الكبيرة Large language models (اختصاراً: النمذجات LLMs) التي تشغل روبوتات الدردشة. فقد استخدموها لضبط التلقينات التي أنشأها الإنسان ثم قيموا فعاليتها في حل مجموعة من أسئلة الرياضيات في المدرسة الابتدائية تسمى المعيار GSM8K.
قدّم الباحثون 60 موجهاً Initial prompts لثلاثة نمذجات LLMs: واحدة طورتها شركة ميسترال Mistral الفرنسية، التي دخلت مؤخراً في شراكة مع ميكروسوفت Microsoft، ونسختان من نمذجات Llama2، من صنع شركة ميتا Meta. بعد ذلك تمّ تكليف أنظمة الذكاء الاصطناعي بتحسين صياغة الرسائل لجعلها أكثر فعالية.
على سبيل المثال، من التلقين الأولي «أنت عالم رياضيات خبير. حل المسألة الرياضية التالية خذ نفساً عميقاً وفكر جيداً»، قد يضيف التلقين المحسّن بواسطة الذكاء الاصطناعي متطلبات لتحديد أي افتراضات، أو للإبلاغ عن أي ثغرات مستخدمة.
وتم بعد ذلك تغذية تلك التلقينات الناتجة مرة أخرى إلى أنظمة الذكاء الاصطناعي في محاولة لمعالجة أسئلة GSM8K، والتي تتطلب عمليات حسابية بسيطة لحلها، ولكنها تستغرق ما بين خطوتين إلى ثماني خطوات لإكمالها.
في جميع الحالات تقريباً، أنتجت نمذجات الذكاء الاصطناعي تلقينات أنتجت إجابات صحيحة لأسئلة GSM8K أكثر من التلقينات التي أنشأها الإنسان. يقول باتل: «في رأيي، لا ينبغي لأحد أن يحاول كتابة تلقين بخط اليد مرة أخرى… دع النمذجة تفعل ذلك نيابة عنك».
ومع ذلك، فإن تكليف برنامج الدردشة الآلي بكتابة التلقينات لمساعدة برنامج الدردشة الآلي نفسه في الإجابة عن أسئلة الرياضيات يمكن أن يؤدي إلى بعض النصائح غير العادية. فعلى سبيل المثال، طلب التلقين ذو الدرجة الأعلى التي أنشأتها النمذجة Llama2-70B، إلى برنامج الدردشة الآلي أن يتبنى شخصية قبطان سفينة الفضاء ستار تريك، وتدوين الإجابات في «سجل الكابتن» Captain’s Log الخاص به – وهو شيء أُنشئ تلقائياً بالكامل بواسطة الذكاء الاصطناعي ولم تقترحها التلقينات الأولية.
يقول باتل إن سبب إنتاج الذكاء الاصطناعي لمثل هذه التلقينات غير العادية هو «السؤال الذي تبلغ تكلفته 64 مليون دولار… إلى حد ما»، الإجابة هي: «أنا لا أهتم، فقط أعط النمذجة ما تريدها». ومع ذلك، وبالتفكير بطريقة علمية أكثر، يعتقد باتل أنه نتاج للبيانات التي تدربت النمذجة عليها، ربما مع ستار تريك يظهر محتوى الرحلة في كثير من الأحيان مع المعلومات الصحيحة. «من يعرف؟ هناك الكثير من مراجع ستار تريك على الإنترنت».
تقول كاثرين فليك Catherine Flick من جامعة ستافوردشاير Staffordshire University بالمملكة المتحدة: «الشيء الأساسي الذي يجب أن نتذكره منذ البداية هو أن هذه النمذجات هي عبارة عن صناديق سوداء… لن نعرف أبداً سبب قيامها بما تفعله؛ لأنها في نهاية المطاف عبارة عن مزيج من الأوزان والاحتمالات، وفي النهاية تظهر النتيجة».
ومع ذلك، على الرغم من أن التلقين الذي يحمل سمة ستار تريك كانت الأكثر نجاحاً، تقول كل من فليك وباتل إنه لا ينبغي عليك التعامل مع ChatGPT أو برامج الدردشة الأخرى على أنها «قائد» Commander في أي وقت قريب.
تقول فليك: «هناك شيء واحد مؤكد: النمذجة لا تحمل سمة ستار تريك… إنها لا تفهم أي شيء أفضل أو أسوأ عند تحميلها مسبقاً بالتلقينات، فهي تصل فقط إلى مجموعة مختلفة من الأوزان واحتمالات قبول المخرجات مقارنة بما يفعله مع التلقينات الأخرى».
وبدلاً من ذلك، فإن الاستجابة للاكتشاف تخبرنا عن أنفسنا وتصوراتنا للذكاء الاصطناعي أكثر من أداء الذكاء الاصطناعي، كما تعتقد فليك. تقول: «إنها تظهر نتيجة ممتعة، لكنها نتيجة محض صدفة، وتتوافق مع الرغبة في أن تكون النمذجات LLMs خيالاً علمياً ينبض بالحياة».
© 2024, New Scientist, Distributed by Tribune Content Agency LLC