يستخدم العلماء الذكاء الاصطناعي لفك تشفير الكلمات والجمل بمسح الدماغ
يمكن للتكنولوجيا العصبية الناشئة أن تساعد يوماً ما المرضى المشلولين على التواصل - ولكنها قد تثير أيضاً مخاوف تتعلق بالخصوصية
يمكن لتقنية تعتمد على الذكاء الاصطناعي Artificial Intelligence (اختصاراً: الذكاء AI) أن تترجم عمليات مسح الدماغ إلى كلمات وجمل، حسبما أفاد فريق من علماء الأعصاب الحاسوبيين Computational neuroscientists. ويقول الباحثون إن التكنولوجيا الجديدة قد تساعد في نهاية المطاف الأفرادَ الذين يعانون إصاباتِ الدماغ أو الشلل على استعادة القدرة على التواصل، على الرغم من أنها في المراحل المبكرة وبعيدة عن الكمال.
يقول مارتن شريمبف Martin Schrimpf، عالم الأعصاب الحاسوبي من معهد ماساتشوستس للتكنولوجيا Massachusetts Institute of Technology والذي لم يشارك في العمل: «تُظهر الدراسة أنه باستخدام الأساليب الصحيحة والنمذجات الأفضل، يمكننا في الواقع فك شيفرة ما يفكر فيه المريض».
أنشأت فرق بحثية أخرى وصلات بين الدماغ والحاسوب Brain-computer interfaces (اختصاراً: الوصلات BCI) لترجمة نشاط دماغ المريض المصاب بالشلل إلى كلمات مثلا. ومع ذلك، تعتمد معظم هذه الأساليب على أقطاب كهربائية مزروعة في دماغ المريض. وكانت المناهج غير الباضعة Noninvasive method التي تعتمد على طرق مثل تخطيط كهربية الدماغ Electroencephalogram (اختصاراً: التخطيط EEG)، والتي تقيس نشاط الدماغ بأقطاب كهربائية متصلة بفروة الرأس، أقل نجاحاً. ويقول شريمبف إن الوصلات BCI المستندة إلى التخطيط EEG كانت قادرة حتى الآن فقط على فك رموز العبارات ولا يمكنها إعادة بناء لغة متماسكة. فقد ركزت مؤشرات الوصلات BCI السابقة أيضاً على الأفراد الذين يحاولون التحدث أو التفكير في التحدث، لذلك اعتمدوا على مناطق من الدماغ تشارك في إنتاج حركات مرتبطة بالكلام Speech-related movements، ونجحوا في استخلاص الكلمات فقط عندما كان الشخص يتحرك أو يحاول التحرك.
الآن، طور ألكساندر هوث Alexander Huth، عالم الأعصاب الحاسوبي من جامعة تكساس بأوستن University of Texas at Austin، وزملاؤه الوصلات BCI استناداً إلى التصوير بالرنين المغناطيسي الوظيفي Functional magnetic resonance imaging (اختصاراً: التصوير fMRI)، فينظرون مباشرة في أكثر في المناطق المنتجة للغة بهدف فك تشفير الكلام الُمتخيل Imagined speech. فهذه الطريقة غير الباضعة، المستخدمة استخداماً شائعاً في أبحاث علم الأعصاب، تتعقب التغيرات في تدفق الدم داخل الدماغ لقياس النشاط العصبي.
كما هي الحال مع جميع الوصلات BCI، كان الهدف هو ربط كل كلمة أو عبارة أو جملة بالنمط المعين لنشاط الدماغ الذي تثيره. لجمع البيانات الضرورية، أجرى الباحثون مسحاً ضوئياً لأدمغة ثلاثة مشاركين بينما استمع كل منهم لما يقرب من 16 ساعة من البودكاست (المدوّنات الصوتية) Bodcast لسرد القصص مثل The Moth Radio Hour وNew York Times’s Modern Love. باستخدام هذه البيانات، أنتج الباحثون مجموعة من الخرائط لكل موضوع حددت كيف يتفاعل دماغ الشخص عندما يسمع كلمة أو عبارة أو معنى معيناً. نظراً لأن التصوير fMRI يستغرق بضع ثوانٍ لتسجيل نشاط الدماغ، فإنه لا يلتقط كل كلمة محددة، بل يلتقط الفكرة العامة مع كل عبارة وجملة، كما يقول هوث. استخدم فريقه بيانات التصوير fMRI لتدريب الذكاء الاصطناعي AI على التنبؤ بكيفية تفاعل دماغ فرد معين مع اللغة.
في البداية، كافح النظام لتحويل عمليات مسح الدماغ إلى لغة. ولكن، بعد ذلك، دمج الباحثون أيضاً نموذج GPT للغة الطبيعية Natural language model GPT للتنبؤ بالكلمات التي قد تأتي بعد الأخرى. باستخدام الخرائط التي تم إنشاؤها من عمليات المسح ونمذجة اللغة، مروا بعبارات وجمل مختلفة مُحتَملة لمعرفة ما إذا كان نشاط الدماغ المتوقع يطابق نشاط الدماغ الفعلي. وإذا كان الأمر كذلك، فإنهم يسجّلون هذه العبارة وينتقلون إلى العبارة التالية.
بعد ذلك، استمع المشاركون إلى البودكاست غير المستخدم في التدريب. وشيئاً فشيئاً، أنتج النظام كلمات وعبارات وجمل، وأنتج في النهاية أفكاراً تتطابق بدقة مع ما كان يسمعه الشخص. وكانت التكنولوجيا جيدة خاصةً في فهم جوهر القصة، حتى ولو لم تكن دائماً تفهم كل كلمة فهماً صحيحاً.
كما أنها تعمل أيضاً عندما يحكي أحد الأشخاص قصة أو يشاهد مقطع فيديو. في إحدى التجارب، شاهد المشاركون فيلماً صامتا بينما حاول النظام فك شيفرة ما كانوا يفكرون فيه. عندما شاهد فرد فيلماً كرتونياً يركل فيه تنين شخصاً ما، قال النظام: «لقد طرحني أرضاً». حدث كل هذا دون أن يُطلب إلى المشاركين التحدث. يقول هوث: «هذا يوضح حقاً إن ما توصلنا إليه هنا هو شيء أعمق من مجرد لغة». «النظام يعمل على مستوى الأفكار».
يمكن للنظام في يوم من الأيام أن يساعد الأفراد الذين فقدوا قدرتهم على التواصل بسبب إصابة الدماغ أو السكتة الدماغية أو متلازمة المُنْحَبِس Locked-in syndrome، وهو نوع من الشلل يكون فيه الأفراد واعين، ولكنهم مشلولون. ومع ذلك، لن يتطلب ذلك فقط تطوير التكنولوجيا باستخدام المزيد من بيانات التدريب، ولكن أيضاً جعلها أكثر سهولة. فالاعتماد على التصوير fMRI يجعل هذا النظام مكلفاً ومرهقاً للاستخدام، ولكن هوث يقول إن هدف الفريق هو أن يكون قادراً على القيام بذلك باستخدام تقنيات تصوير أسهل وأكثر قابلية للحمل مثل التخطيط EEG.
على الرغم من أنه لم نقترب بعد من القدرة على فك رموز الأفكار التلقائية في العالم الحقيقي، إلا أن التقدم يثير مخاوف من أنه مع التحسين، قد تحاكي التكنولوجيا نوعاً من قراءة العقل. ويقول هوث متذكرا: «عندما نجح هذا العمل في الواقع قلنا يا إلهي، هذا مرعب نوعاً ما». للبدء بمعالجة هذه المخاوف، اختبر المؤلفون ما إذا كانت وحدة فك التشفير التي تدربت على فرد واحد ستعمل على شخص آخر أم لا. يبدو أن الموافقة والتعاون أمران حاسمان أيضاً، لأنه إذا قاوم الأفراد، أثناء أداء مهمة مثل العد بدلاً من الانتباه للبودكاست، فلن يستخلص النظام أي معنى من نشاط دماغهم.
ومع ذلك، لا تزال الخصوصية مصدرَ قلق أخلاقي كبير لهذا النوع من التكنولوجيا العصبية، كما تقول نيتا فرحاني Nita Farahany، اختصاصية أخلاقيات علم الأحياء في جامعة ديوك Duke University. يجب على الباحثين دراسة الآثار المترتبة على عملهم وتطوير إجراءات وقائية ضد سوء الاستخدام في وقت مبكر. «نحن بحاجة إلى أن يشارك الجميع في ضمان أن يحدث ذلك أخلاقياً»، كما تقول. «يمكن أن تكون التكنولوجيا تحويلية حقاً للأشخاص الذين يحتاجون إلى استعادة القدرة على التواصل مجددا، ولكن الآثار المترتبة على بقيتنا عميقة».
بقلم: كلوديا لوبيز لوريدا
ترجمة: Google Translate
تنقيح: فريق تحرير مجلة العلوم
المصادر العلمية:
doi: 10.1126/science.adi5182
نبذة عن الكاتبة:
كلوديا لوبيز لوريدا Claudia Lopez Lloreda
صحافية علمية تغطي علوم الأعصاب والصحة العقلية وعلم النفس.
حقوق المقالة:
©2023, American Association for the Advancement of Science. All rights reserved