الترجمة الآلية مازالت هدفا بعيد المنال

2006-04-04

0 264 8 دقائق

الترجمة الآلية مازالت هدفا بعيد المنال^(*)

تبعث الطرائق الإحصائية الأمل بانتشال الترجمة الآلية من الدوامة.

<G.ستكس>

أسطورة الصوديوم نيپال آسيا: الأسد، الساحرة، خزانة ملابس الروح الشريرة «تفتقر أصلا الروح الشريرة تمتنع عن الثلاثية» غني بالنكهة الشاعرية والفنية، ولم تسمح أيضا «بود هارلي» القصة المتسلسلة لديها المسرة اللامنتهية التيار التحتي سيكون إعصاريا.

إن الهراء في الفقرة السابقة ما هو إلا ترجمة من الصينية إلى الإنكليزية أجريت باستخدام Altavistas Babelfish وهو مُترجِم آليّ شائع الاستخدام، تستضيفه آلتاکيستا على شبكة الإنترنت. وبلغة إنكليزية متماسكة، وُضعت، باللغتين الصينية والانكليزية في موقع صحيفة China Post التايوانية على الوِب، تُقرأ هذه الفقرة على النحو التالي:
إن «سجلات نارنيا» لا تداني، من حيث رؤيتها الشعرية، ثلاثية «سيِّد الخواتم» ولا تُضمر الخفايا المظلمة التي تجعل سلسلة «هاري پوتّر» ساحرة بلا حدود.

توضح هذه الفقرة أن الترجمة الآلية أو MT، كما يُرمز إليها أحيانا، هي من أكثر فروع حقل الذكاء الاصطناعي⁽¹⁾تخلفا، على ما يجابه هذا الحقل من مصاعب كأداء، إذ يكفي ورود اسم علمٍ في النص، أو بضع عبارات مُصاغة بعناية، لتضليل برمجيات الترجمة الآلية بصورة تامّة. ومع ذلك، فخلال السنوات القليلة الماضية، أَدخلت مقاربةٌ بحثية جديدة الحياةَ ثانية في أوصال الترجمة الآلية؛ إذ يقدِّر مطورو برمجيات الترجمة الآلية أن طرائق القوّة الساحقة في الحوسبة⁽²⁾ ـ وهي طرائق لتحديد احتمال مطابقة كلمة أو عبارة ما في إحدى اللغات لكلمة أو عبارة في لغة أخرى ـ ستُقرِّب، في آخر المطاف، الترجمة الآلية من الأداء البشري.

أصعب من لعبة الشطرنج^(**)

إن التزايد المستمر في قدرات العتاد الحاسوبي (الكيان الصلب) والخوارزميات البرمجية اليوم قد مكّن الحاسوب من التفوق على أساطين الشطرنج. ولنتذكّر انتصار حاسوب شركة IBM الفائقsupercomputer المدعو Deep Blue على <G.كاسپاروک> عام 1997. لكن، بصورة عامة، فإن الترجمة الآلية لم تشهد إلا تقدما متقطعا خلال سنيّها الخمسين ـ بل إن بعض النقّّاد يرون سماحة لا تستحقها الترجمة الآلية حتى في هذا التشخيص.

ففي عام 1954 استعرضت الشركة IBM وجامعة جورج تاون ترجمة ما يفوق ستّين جملة من اللغة الروسية إلى اللغة الإنكليزية. وذكر البيان الصحفي الذي أصدرته الشركة IBM بتاريخ 8/1/1954، باعتزاز: «تمت اليوم لأول مرة ترجمة اللغة الروسية إلى الإنكليزية بوساطة دماغ إلكتروني.» وترقّبت الجهات العسكرية كما توقع علميّو الحوسبة استخدام الترجمة الآلية على نحو روتيني خلال خمس سنوات، لكن لم تتحقّق توقعاتهم.

وفي عام 1966 أعلنت اللجنة الاستشارية لمعالجة اللغة الآليّة، التي تدعمها حكومة الولايات المتحدة، أنّ الإنسان قادر على القيام بالترجمة على نحو أسرع وأدقّ وبنصف التكلفة التي تقتضيها الترجمة الآلية. واختتمت الدراسة بالقول: «في المنظور المباشر أو المتوقع ليس هناك من أمل بالوصول إلى ترجمة آلية ذات فائدة.»

ومن ثم شحّت الموارد المالية المخصصة لأبحاث الترجمة الآلية ولم يتحقق سوى تقدّم متواضع خلال العقود التالية. وفي أواخر الستينات دعمت القوات الجويّة الأمريكية شركة صغيرة تدعى سيستران Systran صممت مُترجما آليّا ـ استُخدمت نسخته المتوافرة على الإنترنت في ترجمة الفقرة الأولى الواردة في مطلع هذه المقالة ـ للتعامل على نحو أوليّ مع الكم الهائل من الوثائق الروسية المطلوب ترجمتها إلى الإنكليزية حينذاك.

ويرتكز مُترجم الشركة سيستران إلى قواعد حول اللغة الأصل⁽³⁾ واللغة الهدف⁽⁴⁾ باللغة المنشودة، كما هي الحال في منظومةُ الدماغ، الأصلية التي وضعتها الشركة IBM، مستندة إلى ست قواعد بدائية تحكم النحو syntaxوالدلالة semantics وما شابه. فعلى سبيل المثال، يمكن أن تترجم الكلمة “o”بالروسية من قبل حاسوب701 إلى اللغة الإنكليزية بالكلمتين “of” أو “about”. فإذا تلت الكلمة “o” الكلمة”nauka” أي (العلم أو “science” بالإنكليزية)، فإن الحاسوب يبحث عن القاعدة المناسبة التي تشير عليه بترجمة “o” إلى “of”بالإنكليزية ـ أي إن العبارة الروسية”nauka o” تترجم إلى الإنكليزية “science of”بدلا من”science about”.

تعتبر الشركة سيستران، التي تتخذ باريس مقرا لها، أكبر شركة للترجمة الآلية في العالم. ومع أن لائحة زبائنها تضمّ گوگل Google و ياهو Yahoo و AOLالتي تمتلكها الشركة تايم وارنَر Time Warner، فإن عائداتها السنوية لم تتجاوز13 مليون دولار عام2004 ـ وهذا ضمن سوق للترجمة بفروعها تُقدّر قيمتها الإجمالية في كافّة أنحاء العالم بعشر بلايين دولار سنويا. ويقول <D.ساباتاكاكيس> [رئيس مجلس إدارة سيستران ومديرها]: «إننا صغار جدا، لكننا الأكبر.»

http://oloommagazine.com/images/Articles/2006/6-7/60.gif

^(***)لا مزيد من القواعد

يجهد الخبراء واللغويون العاملون في منظومات الترجمة الآلية المستندة إلى القواعد، لصياغة معاجم ضخمة وقواعد تتعلق بالجوانب النحويّة والدلاليّة لتوليد نصٍّ مترجم إلى اللغة الهدف. وتتضمن المنظومات التي باتت متوافرة في الأسواق عشرات الآلاف من قواعد النحو لمجموعة تضم مئات الآلاف من الكلمات.

وابتداء من أواخر عام 1980 وَضعت الشركة IBM منظومة للترجمة من الفرنسية إلى الإنكليزية سميَّت كانديد Candide لا تتطلب معرفة لا بالقواعدgrammar ولا بالنحو syntax. وقد تجنبت المنظومة تبنّي القواعد مفضِّلةً النظر إلى نصوص مترجمة، ومطابقة الكلمات بين اللغتين (تقوم المنظومات الأكثر حداثة باستخدام عبارات كاملة بدلا من مجرد كلمات) وتستنبط في نهاية المطاف احتمالات ـ استنادا إلى نظريّة بايز Bayes ـ لتقدير ما إذا كانت كلمة إنكليزية توفّر ترجمة صحيحة للكلمة التي تقابلها بالفرنسية.

وقد توجّهت مقاربة أخرى، اقتصرت على تحليل عدد كبير من النصوص باللغة الإنكليزية، لتقدير ما إذا كانت الكلمة التي تُرجِمت إلى الإنكليزية تتناسب من حيث قواعد اللغة مع ما يحيط بها من كلمات، بحيث يمكن استخدام الكلمة أو العبارة التي تمتلك الاحتمال الأكبر، من حيث تناسبها مع ما يحيط بها من كلمات، في «فكّ رموز» أو ترجمة النصوص مستقبلا ـ ومن ثم ضمّ الكلمات المترجمة الواحدة مع الأخرى لبناء وثائق مكتملة. فإذا أظهرت الإحصاءات أن الكلمة pouderie، مثلا، تقابل اعتياديا كلمة «ثلج هبّاب» blowingsnow فإن هذا يعتبر، من حيث المبدأ، غاية الأرب.

وقد توقفت الشركة IBM في نهاية المطاف عن متابعة جهودها في هذا المضمار. ففي أواخر التسعينات كانت ترجمة صفحة واحدة فقط تستغرق يوما كاملا. لكن الظروف أخذت بالتحوّل بعدئذ. فقد ولّدت شبكة الإنترنت نموا سريعا في النصوص الضّخمة التي وضعت بلغتين. كما فرضت الإنترنت الحاجة إلى الترجمة على نحو لم يكن من المستطاع تلبيتها على الإطلاق من قبل البشر.

وفي عام 1999 عقدت المؤسسة الوطنية للعلوم (NSF) ورشة عمل في جامعة جونز هوپكنز استهدفت الوصول إلى مجموعة من الأدوات البرمجية التي يمكن تعميمها ضمن المجتمع العلميّ. وقد اجتذب هذا الحدث الاهتمام وحفّز نشاطا جديدا في مضمار الترجمة الآلية. وفي عام 2002 أسّس واحد من المشاركين في ورشة العمل هذه، وهو <K.نايت> [من الجامعة .U.C.S] مع <D.ماركو> [من الجامعة ذاتها] شركة أسموها لانگويج ويکر Language Weaver (أو نسّاج اللغة)، وهي الشركة الوحيدة للترجمة الإحصائية. وتدّعي هذه الشركة حاليا أن بإمكانها ترجمة 5000 كلمة في الدقيقة من الإنكليزية إلى العربية والفارسية والفرنسية والصينية والإسبانية، وبالعكس.

^(****)گوگل رابحة

وظّفت گوگل < F.أوك> وهو أحد المشاركين في ورشة العمل المذكورة آنفا وخريج الجامعة .U.C.S وفي صيف عام 2005، تفوّقت منظومة گوگل التي صمّمها <أوك> والتي كانت وقتها في الطور التجريبيّ، على منافساتها، كالمنظومة التي وضعتها الشركة IBM، لتربح الجوائز في جميع الفئات التي تضمنتها مسابقة نظّمها المعهد الوطنيّ للمعايير والتقانة، لترجمة مئة برقية من برقيات الأنباء من العربية أو الصّينية إلى الإنكليزية. وقد ذكر <أوك> أن إدخال نصوص تقابل في مجموعها مضمون مليون كتاب إلى برمجيات الترجمة الآلية كان مفتاحا لتحسين الأداء. ويقابل <أوك> أداء منظومة الترجمة الآلية، التي تستخدمها گوگل (سيستران) حاليا، بالمنظومة التجريبية التي صاغها هو وزملاؤه.

منظومة گوگل/سيستران: «الطبيب يشير، إن النواة البرّاقة تعيد التنظيم تستعيد عافيتها الـ تقريبا شهر واحد.»

منظومة گوگل التجريبية: «صرّح الأطباء أن <أكيهيتو> مُلزَم ببرنامج من الراحة يستغرق قرابة شهر.»

لقد وضع الاهتمام الذي ولّدته الترجمة الآلية الإحصائية سيستران في موقع دفاعيّ. ويعلّق <ساباتاكاكيس> بالقول «إنّك تحتاج إلى قواعد عند تعلّمك لغة أجنبية ما، ولا يتعلم المرء لغة بالطرق الإحصائية وحدها.» ويقول ساباتاكاكيس إن سيستران تستخدم طرقا إحصائية عندما تطور منظومات للترجمة الآلية للعمل ضمن حقول ضيّقة، مثلا، من أجل ترجمة وثائق براءات الاختراع. لكن تبنّي طرق إحصائية على الصورة التي يتبعها حاليا فريق <أوك> يكاد أن يكون تقنية للتسويق. ومازالت الشركة تستخدم خمسين موظفا في البحث والتطوير، من بينهم لُغَويّون. ويتابع <ساباتاكاكيس> «إن الفرق الرئيسي بين سيستران وگوگل هو ادعاء الأخيرة أنها لا تحتاج إلى الصينيين أصلا لتطوير تطبيقات صينية بفضل السحر والجمال اللذين يميزان منظومتها،» ويضيف «إن لم نعمل مع بعض خبراء اللغة الصينية، فإن منظومتنا قد تحتوي أخطاء جسيمة.»

ترجمةآليةإحصائية^(*****)

أثبتت الطرق الإحصائية كفاءة تفوق ما لغيرها من طرق الترجمة الآلية المؤتمتة التي تستند إلى قواعد صاغها المترجمون البشر.
وتستغل الطرق الجديدة للترجمة الآلية القوة الهائلة التي تمتلكها الحواسيب حاليا، فتحلل بسرعة فائقة نصوصا مترجمة أصلا لتحدد الاحتمال أن كلمة أو عبارة في اللغة الواحدة تطابق نظيرة لها في اللغة الأخرى.

إن الحدود التي تميِّز الفريقين أحدهما من الآخر قد بدأت تفقد وضوحها، لأن الباحثين في مضمار الترجمة الآلية الإحصائية قد بدؤوا بإدخال تقنيات تأخذ بالاعتبار البنية النحوية للجملة. وتتجاوز هذه الأساليب تدخّل خبراء اللغة؛ فيمكن لنموذج نحويّ أن يقدّر احتمال الحاجة إلى إعادة ترتيب عبارة مؤلّفة من اسم وصفة عند ترجمتها من الإنكليزية إلى الفرنسية. ويقول <نايت> [من شركة لانگويج ويفر]: «إن الاعتماد على عبارات بدلا من كلمات مُنفردة يسمح للطرق الإحصائية أن تعالج الجوانب النحويّة، بحيث تتجنّب ترجمة اسمه، على سبيل المثال، عندما يرد ضمن نص ما، ب«الفارس.»

http://oloommagazine.com/images/Articles/2006/6-7/110.gif

هل يمكن للترجمة الآلية أن تقدم ما يفوق مجرد فكرة تقريبية عن محتوي نص وضع بلغة أجنبية؟

وتضمّ مؤسسة أبحاث مايكروسوفت مجموعة كبيرة من الإخصائيين في اللغات الطبيعية، عملت خلال الأعوام الست الماضية في مضمار الترجمة الآلية. في البدء، تركز اهتمام هذه المجموعة على المنظومات المستندة إلى القواعد⁽⁵⁾. لكنها تستخدم التقنيات الإحصائية في أعمالها بصورة متزايدة. وقد استخدمت مايكروسوفت المقاربات الإحصائية بالدرجة الأولى عندما قامت قبل فترة وجيزة بترجمة مواقع خدمات الزبائن إلى اثنتي عشرة لغة، من ضمنها الروسية والعربية والصينية، ولم يتم تحرير النص بعد الترجمة. ويَلْحظ <ريتشاردسون> [الباحث الرئيسي في وحدة معالجة اللغة الطبيعية] «لابد من الاعتراف بأن بعض أجزاء النص المترجم مستهجن، لكن هناك أجزاء أخرى جيدة للغاية.» ويضيف «إن النص المترجم باستخدام المقاربة الإحصائية يُقارن، بل ربما بدأ يفوق، المستوى الذي وصلت إليه المنظومات القاعديّة التي كنا نستخدمها في الماضي.»

فهم لب الموضوع^(******)

على أية حال، فإن جميع هذه التقنيات تطرح التساؤل حول ما إذا كانت الترجمة الآلية ستهزم الإنسان في مهنة الترجمة التي استأثر بها حتى الآن مضاهية ما قام به ديپ بلو Deep Blue حاسوب الشركة IBM، الذي صُمِّم ليلعب الشطرنج. فهل تستطيع الآلة أن توفّر ما يفوق مجرد فهم لبّ نصٍّ وُضع بلغة أجنبية، أو مجرد تكوين فكرة عامة عن مضمونه؟ يقول < K.هندزل> وهو متحدث باسم رابطة المترجمين الأمريكيين: «إن التفاؤل الراهن لا يعدو كونه استمرارا لعقود من الادعاءات المبالغ بها، والمرتكزة، مثلا، على فكرة «ترجمة آلية كليا ومتفوقة النوعية»، التي يُرَمّزها الإخصائيون بالأحرف الأولى من العبارة المقابلة باللغة الإنكليزية: fully automatic high-quality translation، أو اختصاراFAHQT. ويضيف <هندزل> قائلا: «إن فهم فكرة النص، الذي يمكن للترجمة الآلية أن تقدمه، يساعد على التعامل مع كميات هائلة من النصوص الأجنبية، مادام المرء قد أدرك أن الناتج غير موثوق، من حيث المضمون.» فالترجمة التقريبية محفوفة بالمخاطر. ويورد على سبيل المثال ترجمة من العربية إلى الإنكليزية تذكر «اشتباكا» بين جانبين، مما استثار اهتمام موظفي الأمن. لكن النص كان يشير إلى لعبة لكرة القدم، وليس إلى هجوم إرهابيّ أو معركة وشيكة.

ويلحظ <K.دکلن> [المدير التنفيذي لمركز جامعة ستانفورد لدراسات اللغة والمعلومات] أن الترجمة الآلية لن تضاهي أبدا ما يمكن أن يقوم به اللغويّ من البشر. ويضيف <دکلن> «إن استخدام التقنيات الإحصائية، المصحوب بالمُعالِجات السريعة والذاكرة السريعة الكبيرة السعة، يعني أننا سنشهد منظومات للترجمة تستطيع العمل بصورة مقبولة في العديد من الظروف، إلا أن الترجمة السلسة التي يمكن للإنسان الخبير القيام بها، فهي في نظري أمر لا يمكن للآلة تحقيقه.»

ويعارض <نايت> [الرائد في مضمار الترجمة الإحصائية] هذه النظرة ويشير إلى التقدّم الذي تم إحرازه خلال هذا العقد. وهو لا يَتوقّع حدودا لما يمكن أن تحرزه التقانة، التي ستتوصل حسب اعتقاده إلى ترجمة من مستوى يضاهي ما يقوم به الإنسان لجميع النصوص، ربما باستثناء النصوص الشعرية. وقد عرض <نايت> نماذج غير معلّمة لترجمات قام بها مترجمون من البشر إلى جانب ترجمات آلية فالتبس على المستمعين التفريق بين هذين النوعين من النصوص. ويقول <نايت> «دعونا لا نخدع أنفسنا ـ هنالك الكثير من الأخطاء في الترجمات التي يقوم بها المترجم البشري. ومستوى هذه الترجمات ليس بالجودة التي قد يتخيلها المرء.» ولكن لكي يبرهن الرواد في حقل الترجمة الإحصائية أن ترويجهم للمجموعة الراهنة من أدوات الترجمة الآلية يتجاوز حملة المبيعات المعتادة، لابد أن يبينوا أن أدواتهم هذه تحقق الآن فكرة «الترجمة الآلية كليا من نوعية متفوقة.» وعندئذ فقط ستتجاوز التقانة، كما يعبّر <ريتشاردسون> من شركة مايكروسوفت، مجرد «وعود بتحقيق الترجمة الآليّة.»

المؤلف

Paul Davies

باحث في الفيزياء النظرية والكونيات (الكسمولوجيا) cosmologist والبيولوجيا الفلكية astrobiologist. يشغل حاليا منصب مدير مركز بيوند، وهو مركز أبحاث في جامعة ولاية أريزونا متخصص في تحري الأسئلة العلمية العظيمة. وقد ألَّف أو شارك في تأليف 27 كتابا، وآخر أعماله كتاب بعنوان الكنز الكوني: ما الذي يجعل كوننا مناسبا للحياة بالضبط Cosmic Jackpot: Why Our Universe Is Just Right for Life (Houghton Mifflin, 2007)

مراجع للاستزادة

The History of Machine Translation in Nutshell.Online at Jihn Hutchins’s Web site:http://ourword.compuserve.com/homepages/WJHutchins/nutshell.htm

A Statistical MT Tutorial Workbook.Kevin Knight

Online at www.isi.edu/natural-language/mt.wkbk.rtf

The Candide System for Machine Translation.Adam L. Berger et al

Oline at hhtp://acl.idc,upenn.edu/H/H94/h94-1028.pdf

(*) THE ELUSIVE GOAL OF MACHINE TRANSLATION

(**) Tougher Than Chess

(***) No More Rules

(****) Google Is a Winner

(*****)Statistical Machine Translation

(******)العنوان الأصلي: Getting the Gist

(1) artificial intelligence.

(2) brute-force computing methods

(3) source

(4) target

(5) rule-based systems أو المنظومات القاعدية..

2006-04-04

0 264 8 دقائق

اشترك معنا بإدخال إيميلك الشخصي

كيف تُجري الحيوانات عمليات مقايضة فيما بينها

العلم وراء لعبة سودوكو

مقالات ذات صلة

نيورالينك: ماذا فائدة الشرائح الدماغية ولماذا يُصنِّعها إيلون ماسك؟

كيف يفك العلماءُ الرموزَ التاريخيةَ للكشف عن الأسرار المفقودة

الوعد الفريد بـ «حواسيب حيويّةٍ» مصنوعةٍ من الكائنات الحية

مختبر الحكومة الأمريكية يستخدم GPT-3 لتحليل الأوراق البحثية

اترك تعليقاً إلغاء الرد