قرارات أصلح بفضل العلم
قرارات أصلح بفضل العلم(*)
يمكن للرياضيات أن تساعد على التوصل إلى قرارات في الطب والصناعة تُمكّن
من تحسين الكثير من التشخيصات الطبية مما يؤدي في معظم الأحيان إلى إنقاذ أرواح المرضى.
<A .J. سويتس> ـ <M .R. داوز> ـ <J. موناهان>
تشيع القرارات التشخيصية من النوع (نعم/لا)، ليس فقط في الطب وإنما في معظم الحقول الأخرى. ومع ذلك لا تلقى الاهتمام الكافي تلك الطرائق الإحصائية ذات الفائدة المثبتة في تحسين دقة القرار المتخذ. |
يتفحص الطبيب صورة شعاعية للثدي حائرًا فيما إذا كانت البقعة الغامضة أمامه ورمًا. وينظر مجلس العفو في إمكانية الإفراج عن مجرم. ويساور القلق أحد فنيي صيانة الطائرات حول مجموعة من قراءات الفحص بالموجات فوق الصوتية متسائلاً عمَّا إذا كانت تشير إلى شرخ خطير في جناح الطائرة؟
كل هؤلاء يتصارعون مع قرارات تشخيصية diagnostic decisions؛ إذ عليهم أن يقرروا ما إذا كانت حالة ما موجودة (أو ستحدث) وذلك على الرغم من عدم اكتمال أو غموض الأدلة المتوافرة. وتكثر هذه المشكلات في قطاع الصحة، السلامة العامة، الأعمال، البيئة، القضاء، التعليم، الصناعة، معالجة المعلومات، الجيش والحكومة. وقد يكون الأمر بالغ الأهمية؛ ففي كثير من الحالات قد يتسبب قرار خاطئ في سقوط ضحايا.
ومما قد يثير العجب، أن سيرورة اتخاذ القرارات التشخيصية هي نفسها من حيث الجوهر في جميع المجالات. وهكذا فإن الطرائق التي تُحسّن هذه السيرورة في مجال ما يُمكن عادة أن تكون مفيدة في مجالات أخرى. وثمة طريقتان على الأقل من هذا النوع؛ إنما للأسف بقيتا مجهولتين أو غير مطبَّقتين في كثير من المجالات. إحداهما تزيد من الدقة، وبالتالي تزيد من احتمال كون أي قرار متخذ هو الصحيح. أما الأخرى فتحسن من كفاءة سيرورة اتخاذ القرار، لضمان عدم كون عدد الحالات الصحيحة المكتشفة على حساب عدد غير معقول من التشخيصات الإيجابية الخاطئة “إنذارات خاطئة” false positive. إن هذه الطرائق طرائق إحصائية، لكن ليس هناك ما يخشاه من يتخوفون من الرياضيات، لأن المنطق الأساسي لهذه الطرائق سهل الفهم.
إن هذا لا يعني أن يكون المشخصون diagnosticians دائمًا تحت رحمة المعادلات الرياضياتية. ففي حقول معينة (كالطب السريري والتنبؤ بالطقس) تفيد هذه الطرائق بشكل أمثل باعتبارها “رأيًا ثانيًا” يمكن أن يستنير به المقرر من دون أن تكون لهذا الرأي الكلمة الفصل. وفي حقول أخرى كثيرًا ما يكون التحليل الإحصائي أكثر دقة من الأحكام الشخصية، حتى لو اتُّخذت من قبل محترفين من ذوي الخبرة على مستوى عال.
في هذه المقالة نُركز على الحالات التشخيصية التي تقتصر على الخيار ما بين احتمالين: نعم أو لا (هل هناك ورم؟ هل هناك خلل في جناح الطائرة؟). ولا شك في أن العالم مليء بالمشكلات التي تنطوي على طيف أوسع من الخيارات، غير أن القرارات المهمة من النوع (نعم/لا) هي الأعم.
أدوات التجارة (عدة الشغيل)(1)
لو وفرت الاختبارات التشخيصية دائمًا إجابات مباشرة، لانتفت الحاجة إلى وجود طرائق إحصائية تساعد على اتخاذ القرارات. لكن في الواقع تكون نتائج الاختبارات التشخيصية diagnostic tests عادة بحاجة إلى تفسير. كمثال بسيط يقاس ضغط السائل داخل العين لتقصي ما إذا كان الشخص مصابًا بالزَّرَق (الگلوكوما) glaucoma، وهو مرض يُفقد البصر عن طريق تدميره العصب البصري optic nerve وأجزاء أخرى من العين. إن قراءة منخفضة جدًّا للضغط تُعني أن العين سليمة، في حين تُعني قراءة مرتفعة وجود الزرق، ويكمن الغموض في القراءات الوسيطة التي تعجز عن تمييز المصابين من الأصحاء.
يستطيع علم الإحصاء statistics أن يزيل بعض الغموض. لنفترض، من أجل التوضيح فقط، أن ضغط العين هو الاختبار التشخيصي الوحيد للزرق. ولنفترض أيضًا أن قيم الضغط تحت 10 على المقياس المعياري تُعني دائمًا عدم وجود المرض، وأن القيم فوق 40 تشير دائمًا إلى وجوده؛ أما القيم بين 10 و 40 فيمكن أن توجد عند المرضى وعند الأصحاء أيضًا.
للتعامل مع هذا الغموض يقوم المحللون analysts أولاً بتحديد جمهرة من الأشخاص ذوي قيم ضغط معروفة. ثم يقومون بتحديد أي من هؤلاء الأشخاص ظهرت لديهم مشكلات في الرؤية تميز الزرق خلال فترة معينة. بعدها يقومون بحساب احتمال إصابة الأشخاص بالزرق بالنسبة إلى كل قيمة ضغط، وفي النهاية يقومون، اعتمادًا على هذه الاحتمالات (إضافة إلى اعتبارات أخرى سنناقشها لاحقًا)، بوضع حد فاصل cut point موضوعي (أو عتبة تشخيصdiagnostic threshold)، بحيث تعني قيم الضغط المساوية أو التي تتجاوز هذه العتبة وجود المرض، وتنفي القيم الأصغر من العتبة وجوده.
بالطبع قد لا يزودنا اختبار وحيد بالمعلومات التي توفرها مجموعة من الاختبارات. ولزيادة الدقة التشخيصية، يقوم المحللون بتجميع بيانات من عدة اختبارات كل منها يزودنا بمعلومات مميزة، مع إيلاء القياسات الأكثر قدرة على التنبؤ بالحالة قيد الدراسة وزنًا أكبر. هذا وإن الخوارزميات algorithmsالرياضياتية، التي تحدد بموجبها الاختبارات الأفضل لتشكل جزءًا من العملية التشخيصية التي تحدد إمكانية وجود الحالة المرضية، بناء على محصلة نتائج متعددة، تُعرف بقواعد التنبؤ الإحصائية statistical prediction rules.
ولا تشكل البيانات الموضوعية تمامًا، كقيم الضغط، جميع المعلومات التي يمكن استخدامها لزيادة دقة قواعد التنبؤ الإحصائية (SPRs)؛ فالانطباعات الشخصية بعد تحويلها إلى قيم عددية، يمكن أن تُضم إلى تلك المعلومات. ويمكن جعلها موضوعية بعمل، مثلاً، قائمة شاملة للمعايير الذاتية (الحسية)percptual criteria (مثل قياس وعدم انتظام وحمة محتملة التسرطن(2))، التي يمكن تصنيفها وفق تدريج من 1 إلى 5 مثلاً.
وعند توافر أكثر من قاعدة تنبؤ إحصائية، يتعين على صانعي القرار اختيار أيها الأكثر دقة. ويمكن مجابهة هذا التحدي أيضًا بشكل موضوعي. يمكن تقييم الدقة الكلية لقواعد التنبؤ الإحصائية عبر مراجعة ما يسمى المنحنيات ROCcurves ROC (الخاصية العملياتية للمستقبِل receiver operating characteristic). وقد استعمل مثل هذه المنحنيات للمرة الأولى في الحرب العالمية الثانية لتقييم قدرة الرادارات على تمييز الإشارات التي تشير إلى وجود طائرات للعدو عن التداخلات العشوائية (الضجيج).
تدرس البرامج القادرة على توليد المنحنيات ROC ماذا يحدث لو اختيرت قيمة معينة من اختبار تشخيصي (أو مجموعة من الاختبارات) كعتبة تشخيصية diagnostic threshold من أجل قرار من النوع (نعم/لا). أي ما نسبة الأشخاص الذين سيتعرفهم الاختبار بنجاح ممن لديهم الحالة المرضية بالفعل (إيجابيات صحيحة، أو إصابات)؟ وما هي نسبة الأشخاص الأصحاء الذين سيتم تعرفهم بشكل خاطئ على أنهم مصابون (إيجابيات خاطئة، أو إنذارات خاطئة)؟
يقوم البرنامج بعدها برسم منحنٍ يعبر عن نسبة الإيجابيات الصحيحة إلى الإيجابيات الخاطئة من أجل كل عتبة. وتكون النتيجة منحنيًا مقوسًا bowedcurve، يرتفع من الزاوية السفلية اليسرى، عندما تكون النسبتان المئويتان تساويان الصفر، إلى الزاوية العلوية اليمنى، عندما تساويان 100. وبقدر ما يكون تقوس المنحني أكبر بقدر ما تكون القاعدة الإحصائية أكثر دقة، لأن نسبة الإصابات إلى الإنذارات الخاطئة تكون أعلى.
إن الإيجابيات الصحيحة والخاطئة ليستا بالطبع جميع الاحتمالات الممكنة لاختبار ما. فتشخيص من النوع (نعم/لا) بالنسبة إلى أي عتبة تشخيصية سينتج أيضًا سلبيات صحيحة true negatives (الأشخاص غير المصابين الذين سيُستبعدون بنجاح) وسلبيات خاطئة false negatives أو إخفاقات (الأشخاص الذين يتم تعرفهم بشكل خاطئ على أنهم أصحاء). ولكن هذه النتائج هي مكملة تمامًا للنتيجتين الآنفتي الذكر، لهذا يمكن تجاهلها عند تشكيل المنحنيات ROC. إن معدل نجاح (إيجابية صحيحة) يعادل 80% مثلاً، يُعني تلقائيًّا أن معدل الإخفاق هو 20%.
بما أن قلة فقط من الطرائق التشخيصية تستطيع بشكل مطلق تمييز الأصحاء من الأشخاص المصابين بحالة مرضية معينة، يجب على المؤسسات تحديد أهمية تعرف جميع أو معظم الحالات الإيجابية الصحيحة ـ لأن زيادة هذه الحالات تأتي على حساب زيادة في الإنذارات الخاطئة؛ أي على هذه المؤسسات وضع عتبة منطقية بالنسبة إلى الحالة المرضية موضع البحث.
وبالعودة إلى مثال الزرق، يستطيع الأطباء بالنظر إلى قيم الضغط فقط اكتشاف جميع حالات الزرق تقريبًا إذا ما اختاروا عتبة تشخيصية منخفضة، مثلاً القيمة 10. فقد بينت العينة الاختبارية أن جميع المصابين بالزرق كانت قيم الضغط لديهم أعلى من هذا الحد. ولكن قيمة حدية كهذه تعني أن الكثيرين من الأصحاء سيتم تصنيفهم بين المرضى، مما يعني تعرضهم غير الضروري للقلق والمعالجات المختلفة. وللتقليل ما أمكن من هذه الأخطاء يمكن أن يقوم الأطباء بتحديد عتبة متشددة strict ـ كضغط العين 35؛ وفي هذه الحالة فإن قلة يسيرة من الأصحاء في العينة المدروسة تكون قيم ضغط العين لديها بهذا الارتفاع. لكن معيارًا متشددًا كهذا سيؤدي إلى إغفال أكثر من نصف المصابين بالزرق؛ وبالتالي إلى حرمانهم من العلاج الضروري.
اتخاذ قرارات أصلح، خطوة خطوة(3)
كيف يستطيع متخذو القرار التأكد من أن الاختبارات التشخيصية التي يستعملونها أدق ما يمكن، بحيث تؤدي على أحسن وجه مهمة فرز الأفراد الأصحاء عن المصابين؟ ثمة طريقة رئيسية لذلك تنطوي على تشكيل ما يدعى المنحنيات ROC. وتتضح هذه المقاربة بشكل أفضل عن طريق إعطاء مثال عليها. تصور الخطوات التي يتبعها المحلل من أجل تقييم كفاءة تشخيص الزَّرَق glaucoma عن طريق قياس الضغط في عين المصاب بهذا المرض.
الخطوة 1 ابحث عن عينة كبيرة من الأشخاص تكون قراءات الضغط وتشخيص الزرق معروفة لديهم. افصل الأصحاء عن المصابين بالزرق، ثم ارسم الخط البياني الذي يمثل عدد المصابين المقابل لكل قيمة ضغط. يُظهر المنحني الناتج الموافق لهذه المجموعة المفترضة أن قيم الضغط بين 10 و 40 لا تُمكن بشكل حاسم من تمييز الأصحاء عن المصابين بالزرق.
الخطوة 2 قم بحساب احتمال كون التشخيص “نعم” لمريض جديد من أجل قيم تساوي أو تفوق عتبة معينة صحيحًا. احسب هذه الاحتمالات وذلك بتحديد المرضى في العينة الأصلية الذين سيكون تشخيصهم صحيحًا إذا ما استعملت هذه العتبة. أدناه، تمثل المنطقة تحت المنحني 100% من كل مجموعة. فلو كانت العتبة 20، لكان التشخيص صحيحًا بالنسبة إلى 90% من الأشخاص المصابين بالزرق (إيجابيات صحيحة)، كما سيصنف 50% من الأصحاء خطأ على أنهم مصابون بالزرق (إيجابيات خاطئة). ……………………………………………….
الخطوة 3 قم بتشكيل المنحني ROC برسم معدل الإيجابيات الصحيحة مقابل معدل الإيجابيات الخاطئة، وذلك من أجل كل عتبة ممكنة. إذا كان المنحني خطًّا مستقيمًا فإن احتمال كون الاختبار التشخيصي صحيحًا هو 2/1 (ليس أفضل من احتمال الحصول على صورة أو كتابة (طرة أو نقش) بعد قذف قطعة نقود في الهواء). وبقدر ما يزيد تقوس المنحني إلى اليسار، بقدر ما يعني هذا زيادة في الدقة (أي نسبة أعلى من الإيجابيات الصحيحة إلى الإيجابيات الخاطئة). وتُحدد الدقة A accuracy بالضبط أكثر بوساطة مساحة المنطقة تحت المنحني، التي تزداد بازدياد تقوس المنحني. إن طريقتنا في تحديد الزرق تبعًا لما سبق هي متوسطة الدقة.
الخطوة 4 إذا كانت الدقة مقبولة اختر عتبة من أجل التشخيص (نعم/لا). واختر عتبة تعطي معدلاً جيدًا من الإيجابيات الصحيحة من دون أن تولد معدّلا غير مقبول من الإيجابيات الخاطئة. إن كل نقطة من المنحني تمثل عتبة معينة، حيث الأكثر تشددًا في أسفل اليسار والأكثر مرونة في أعلى اليمين. تحد العتبات المتشددة (الجزء السفلي من المُنَزَّل داخل الشكل أدناه) من الإيجابيات الخاطئة وذلك على حساب إغفال كثير من المصابين، في حين تزيد العتبات المرنة (المُنَزَّل العلوي) من احتمال اكتشاف المصابين وذلك على حساب توليد الكثير من الإيجابيات الخاطئة. إن اختيار العتبة المثلى لجمهرة معينة يعتمد على عوامل مثل خطورة الحالة، ومعدل انتشارها في هذه الجمهرة، ووجود إجراءات علاجية للمصابين بهذه الحالة، إضافة إلى التكاليف المادية والمعاناة وغيرها المترتبة على الإنذارات الخاطئة.
|
لهذا يقوم صانعو القرار، عند تحديدهم عتبة معينة، بموازنة اعتبارات مختلفة كعواقب إغفال الحالات المرضية، والإنذارات الخاطئة، إضافة إلى مدى انتشار الحالة المرضية قيد الدراسة في المجموعة السكانية المفحوصة. ولحسن الحظ، تم تطوير بعض القواعد العامة والوسائل الإحصائية للمساعدة على إيجاد النقطة الحدية المثلى. فمثلاً، إن انتشارًا واسعًا لحالة مرضية معينة بين السكان أو وجود منفعة كبيرة من وراء تعرف الحالات المرضية الصحيحة يحبذ اختيار عتبة منخفضة؛ وفي المقابل، يفضل اختيار عتبة متشددة في الأمراض القليلة الانتشار أو عندما تكون تكلفة الإنذارات الخاطئة باهظة.
ومع أن استخدام قواعد التنبؤ الإحصائية والمنحنيات ROC من قبل المشخصين قليل جدًّا في معظم الأحيان، فهناك أمثلة كثيرة من واقع الحياة تشهد على أهميتها، ويأتي أحد أوضح الدلائل في هذا الصدد من علم الأمراض النفسية psychiatry.
يُطلب إلى الأطباء النفسيين وعلماء النفس السريريين بشكل متزايد تحديد ما إذا كان الأشخاص المحتجزون أو المضطربون نفسيًّا ميالين إلى العنف؛ حيث يتعين تحديد ومعالجة الأشخاص الذين من المرجح تعريضهم حياة الآخرين للحظر، وذلك من أجل المصلحة الخاصة لهؤلاء وسلامة الآخرين. وفي الوقت نفسه، فإن التدخل في حياة الأشخاص الذين ليسوا بحاجة إلى رعاية أمر غير مقبول.
ومما يدعو إلى الحيرة أن أكثر الدراسات حذاقة والتي أجريت عام 1993 حول تقييمات الأطباء السريريين التي تمت من دون معاونة، قد كشفت نقصًا كبيرًا في الدقة. فلم يكن تشخيصهم للمرضى المتعاقبين على قسم الإسعاف في أحد مستشفيات المدينة للأمراض النفسية، أفضل من الصدفة في التنبؤ بأي من المريضات سوف ترتكب أعمال عنف في المجتمع في الأشهر الستة اللاحقة. أما معدل نجاحهم في التنبؤ عند المرضى من الرجال فقد كان أفضل بقليل.
وقد أدت هذه النتائج إلى تطوير عدد من قواعد التنبؤ الإحصائية لتحديد احتمال ارتكاب شخص ما أعمال عنف. ويشتمل دليل تقييم خطر العنف ViolenceRisk Appraisal Guide VRAG ، وهو أحد أكثر الأدلة التي جرت دراستها على قياس 12 متغيرًا variable، من ضمنها علامات على قائمة خيارات لمظاهر تشير إلى اضطراب نفسي ومعايير تقييم وجود خلل في التكيف maladjustment خلال مرحلة الدراسة الابتدائية.
وفي اختبار لتحديد قدرة القاعدة على التنبؤ حول ما إذا كان المجرمون، الذين سُمِح لهم بمغادرة مستشفى يحظى بحراسة مشددة، سيرتكبون أعمال عنف في السنوات اللاحقة، قسّم الدليل VRAG هؤلاء إلى مجموعتين: مجموعة كبيرة الخطورة ومجموعة قليلة الخطورة، وقد تبين أن 555% من المجموعة الكبيرة الخطورة مقابل 19% من المجموعة القليلة الخطورة قاموا بارتكاب أعمال عنف جديدة ـ وهو مستوى دقة أعلى بكثير من الصدفة. وقد أظهرت قاعدة تنبؤ إحصائي جديدة دقة أكبر في توقع العنف بين المرضى من غير المجرمين الموشكين على مغادرة مؤسسات العلاج النفسي. ومع ذلك يواصل المعنيون الجدل حول ما إذا كان على الأطباء التعامل مع هذه القواعد على أساس استشاري أو اتخاذ القرارات اعتمادًا على الإحصاء فحسب.
تشخيص أفضل للسرطان(4)
لقد حققت قواعد التنبؤ الإحصائية أيضًا نجاحات مهمة في الدراسات الهادفة إلى مساعدة أطباء الأشعة radiologists على تشخيص سرطان الثديbreast cancer. ففي إحدى هذه الدراسات، قام أطباء الأشعة العاملون في مستشفيات عامة بتقييم تصوير الثدي (الماموگرام) mammograms بطريقتهم الشخصية المعتادة. ثم جرى تقييم الصور نفسها بعد عدة أشهر باستعمال استمارة للمظاهر الشكلية (مثل درجة عدم وضوح حواف الكتلة) طورها شعاعيون مختصون في مراجعة صور الماموگرام. بعدها تم، بوساطة قاعدة تنبؤ إحصائية، تحويل معدلات الحدوث إلى احتمالات تحدد إمكانية وجود سرطان الثدي عند كل مريض. قام أطباء الأشعة بمراجعة هذه الاحتمالات لكنهم اتخذوا قرارهم في النهاية بناء على تقييمهم الشخصي. وقد قدمت البيانات الإضافية عونًا مهمًّا؛ فقد كان أطباء الأشعة العامون الذين أخذوا في اعتبارهم البيانات الإحصائية أكثر دقة، بحيث ضاهوا الاختصاصيين الذين استعملوا الاستمارة.
تقارن المنحنيات ROC الدقة التي نحصل عليها بقياس واحد أو أكثر من المتحولات التالية لتقدير مدى تفاقم سرطان الپروستاته: عمر المريض، مستوى المستضد prostate-specific antigen PSA في الدم، عدوانية الورم (الممثلة بمؤشر گليسون) ومظهر الورم اعتمادًا على التصوير بالرنين المغنطيسي (MRI). أثبتت الطريقة التي تأخذ بعين الاعتبار جميع المتحولات الأربعة (المنحني العلوي) أنها الأفضل. |
يستعمل الأطباء الذين يعالجون سرطان الپروستاته prostate cancer قواعد التنبؤ الإحصائية على نطاق واسع. وتلقى قاعدة إحصائية معينة تفحصًا جديًّا. فعندما يتم تشخيص سرطان الپروستاته سريريًّا (اعتمادًا على الفحص، وعلى خزعة إبرة بسيطة واستقصاءات غير باضعة(5)) لدى مريض ما، يُطرح السؤال حول أفضل علاج لحالته [انظر: “محاربة سرطان الپروستاته”،مجلة العلوم، العددان 6/7(1999) ، ص 20]؛ حيث لن يكفي استئصال الغدة المصابة جراحيًّا أو العلاج الشعاعي المُركز عليها تمامًا (للحد من التأثيرات الجانبية) من أجل التخلص من الورم إذا ما كان قد امتد إلى خارج الغدة أو إلى أجزاء أخرى من الجسم. لهذا يسعى الأطباء عادة إلى تحديد حالة الورم قبل المباشرة بأي علاج. لكن لسوء الحظ، فإن العديد من الأورام التي تبدو للوهلة الأولى محصورة في الپروستاته، يتبين لاحقًا أنها متقدمة أكثر.
ولسنوات عديدة، كان لدى الأطباء بعض الطرائق الجيدة لمعرفة ما إذا كان لدى شخص مرض ينحصر حقيقة في منطقة محددة من جسمه أو لا. وحديثًا صار بإمكان الأطباء والمرضى تكوين تصور أكثر وضوحًا من خلال الرجوع إلى جداول الاحتمالات التي نُشرت في 14/5/ 1997 بمجلة الجمعية الطبية الأمريكيةJAMA.
لقد استند الباحثون الذين وضعوا هذه الجداول إلى وجود ثلاثة طرق تقصٍّ. لكل منها قدرة تنبؤ مستقلة: “المرحلة السريرية” للورم (ويعتمد تحديدها على استقصاءات غير باضعة لحجم الورم وامتداده)، مستوى پروتين معين في الدم (PSA، أو مستضد الپروستاته النوعي prostate-specific antigen) مؤشّر گليسونGleason score (يدل على مدى عدوانية الورم وذلك اعتمادًا على تحليلات مجهرية لعينة خزعة من الورم). وهكذا طور الباحثون قاعدة تنبؤ تأخذ في الحسبان عمليًّا جميع التراكيب الممكنة للنتائج من أجل هذه المتغيرات الثلاثة، وقام هؤلاء بحساب احتمال كون التشخيص المبدئي بعدم وجود انتشار سرطاني صحيحًا. ومن ثم قاموا بتصنيف هذه الاحتمالات ضمن جداول سهلة الاستعمال.
فرصة طيبة لهطول الأمطار(6)
من الخطأ الاعتقاد بأن العاملين في الحقل الطبي وحدهم الذين يستعملون قواعد التنبؤ الإحصائية. ففي الواقع، تبنى اختصاصيو الأرصاد الجوية هذه الطرائق لتوقع الطقس منذ أكثر من 25 عامًا.
فمصلحة الأرصاد الوطنية National Weather Service تقوم بشكل روتيني بإدخال بيانات تتعلق بالطقس ضمن برامج إحصائية صُممت لتقدير احتمال حدوث العواصف والأعاصير والأمطار الغزيرة في مختلف أنحاء البلاد. ثم تقوم هذه المصلحة بنقل هذه التنبؤات الموضوعية إلى اختصاصيي الأرصاد المحليين، الذين يقومون بدورهم بتعديل هذه التنبؤات على ضوء بيانات جديدة أو عوامل يعتقدون أن البرامج الحاسوبية لم تعطها الاهتمام اللازم.
كما قامت مجموعات أخرى بتبني هذه الطرائق، ومن ضمنها لجان القبول في الجامعات. ففي مثال نموذجي، تقوم اللجنة من هذه اللجان بتوقع درجات السنة الأولى اعتمادًا علي متغيرين اثنين: درجات الثانوية العامة ودرجات امتحانات القدرات الجامعية، على افتراض أنه يتعين عمومًا قبول الطلبة الذين تتجاوز معدلاتهم مستوى عاليًا محددًا مسبقًا وعدم قبول الطلبة الذين تقل معدلاتهم عن مستوى منخفض محدد مسبقًا. ومن ثم تقوم اللجنة بتقييم شخصي لمؤهلات المتقدمين الذين لم يُبت في قبولهم أو عدمه اعتمادًا على قاعدة التنبؤ الإحصائية في الكلية المعنية.
مسألة ذوق(7)
توصل المهندسون المعماريون إلى تطبيق غير عادي لقواعد التنبؤ الإحصائية. وتتعلق القاعدة الهندسية المعمارية بدور الأوپرا وقد تم تطويرها بمساعدة قادة الأوركسترا الذين قاموا بتقييم نوعية الصوت الشاملة في 23 من هذه المنشآت؛ واستحسن هؤلاء دور الأوپرا في بوينس أيرس، درسدين، ميلانو وطوكيو. فقام مهندسو الصوت بإجراء قياسات فيزيائية لبعض الخواص الصوتية في كل من الدور 23 ـ مثل التأخير الزمني بين سماع الصوت وارتداده، وتبعثر موجات الصوت الناجم عن عدم انتظام في الأسقف والجدران. ثم أجري تحليل إحصائي بعد ذلك لتحديد الخواص التي أدى تضافرها إلى إعطاء دور الأوپرا المفضلة صوتها المميز، وكذلك لتحديد الصفات الصوتية المميزة الأكثر أهمية. ويمكن الآن استخدام القاعدة الإحصائية الناتجة في بناء دور الأوپرا مستقبلاً.
|
تقوم إحدى كليات الحقوق بتقييم موضوعي لمتغيرين بعد أن كانا يُقيّمان شخصيًّا وهما: مستوى المؤسسة التعليمية في المرحلة ما قبل الجامعية ومعدل تضخم الدرجات في تلك المؤسسة. إضافة إلى المعدل العام لدرجات الطالب المتقدم ودرجاته في امتحان الأهلية (القدرات) المطلوب من أجل كلية الحقوق، تأخذ القاعدة في الاعتبار متوسط درجات جميع الطلبة من معهد الطالب المتقدم الذين خضعوا للاختبار نفسه ومتوسط المعدل العام لدرجات الطلبة من ذلك المعهد الذين تقدموا لكلية الحقوق. تتنبأ الصيغة المعدلة لقاعدة التنبؤ بدرجات الطالب في السنة الأولى بكلية الحقوق بشكل أفضل تمامًا من الصيغة ذات المتحولين.
عتبات شائكة(8)
استعرضنا إلى الآن قصص النجاح فقط. ولعل قيمة التحليلات الإحصائية تتضح أكثر ما يمكن من أمثلة الإخفاق في تطبيقها لتحديد عتبات تشخيص منطقية ـ مثلاً لاختبارات تقصي ڤيروس نقص المناعة البشري humanimmunodeficiency virus HIV المسبب لمرض الإيدز AIDS.
يعتمد المسح الاستقصائي screening للڤيروس HIV أولاً على اختبار بسيط نسبيًّا لتحري وجود أضداد antibodies الڤيروس في الدم، وهي جزيئات تُنتَج عندما يبدأ جهاز المناعة بالاستجابة للڤيروس. ولكن أضدادا من هذا النوع تظهر أحيانًا لأسباب أخرى غير العدوى بالڤيروس HIV. لهذا إذا كانت نتيجة فحص الأضداد إيجابية (قياسًا إلى عتبة مستوى الأضداد)، تقوم المختبرات عادة بإجراء اختبار آخر أكثر تعقيدًا. إن الهدف من إجراء اختبارين لتحري وجود الأضداد هو الحد من الإيجابيات الخاطئة. لكن هذين الاختبارين يطرحان إشكالية تكمن في الاختلاف اللامنطقي في دقتها وعتبتيهما. فتباين عتبات التشخيص يمكن أن يُفْهم لو كان كل اختبار يخص جمهرة محددة، لكن الوضع ليس كذلك بالنسبة إلى اختباري أضداد الڤيروس HIV.
تكون عتبات اختبارات الڤيروس HIV التشخيصية مزعجة بطريقة أخرى أيضًا؛ فقد حُددت في البدء لتمييز تلوث الدم المتبرع به، ثم أُبْقيت على حالها عندما بوشر باستعمالها لتعرف الأشخاص المصابين بالڤيروس. إن التخلص من كيس دم نظيف بسبب نتيجة إيجابية خاطئة خطأ بسيط؛ أما إقلاق شخص سليم ونصحه بإجراء فحوص إضافية من أجل تشخيص احتمال العدوى بالڤيروس HIV فهو خطأ كبير مؤلم. والأسوأ من هذا استخدام العتبات الأصلية نفسها بشكل غير منطقي على المتبرعين بالدم المنتمين إلى مجموعات تتفاوت بشكل كبير من حيث معدلات العدوى بالڤيروس؛ حيث يتوجب إرساء عتبة منخفضة للمجموعات العالية الخطورة (لرفع معدل الكشف)، ولو على حساب ازدياد معدل الإيجابيات الخاطئة.
لقد شهدت السنوات الأخيرة تطوير اختبارات مؤكِّدة أكثر دقة وعلاجات مضادة للڤيروس HIV تطيل حياة وصحة المصابين بالعدوى. ونتيجة لذلك صارت التشخيصات الإيجابية الخاطئة أكثر ندرة، كما أن المصابين صاروا مستفيدين أكثر من تشخيص حالتهم مقارنة بما كانت عليه الحال في السابق. لقد عنت هذه التطورات أن المشكلة التشخيصية تحولت ممن نعتبره إيجابيًّا إلى مَنْ نستقصي.
لقد حان الوقت لكي يخفض الأطباء عتبة قرارهم حول متى نستقصي؛ أي عليهم ألا ينتظروا إلى حين يراجع المرضى بأعراض واضحة للإصابة. إننا نذهب حتى للقول بأن كل بالغ يجب أن يستقصى وأن على الهيئات الحكومية أخذ المبادرة للتشجيع على هذا الاستقصاء.
وهناك نقص خطير أيضًا في تطبيق الطرائق الموضوعية لتحديد عتبات التشخيص في بعض مجالات صناعة الطيران. فعلى هذه الصناعة أن تقوم دائمًا بتشخيص الحالات الخطيرة القليلة الحدوث نسبيًّا، كشرخ الأجنحة والأخطار التي تهدد الحياة أثناء الرحلات الجوية. إن ثمن إغفال شرخ في الأجنحة كبير وواضح، حيث يمكن أن يودي بحياة المسافرين في حالة سقوط الطائرة. ومن جهة أخرى، فإن قرارًا مبنيًّا على إيجابية خاطئة يُخرج الطائرة من الخدمة من دون مبرر، مؤديًا إلى إرباكات وخسائر مادية. وللوهلة الأولى تحبذ موازنة المنافع والخسائر اختيار عتبة منخفضة، مقدمة الأرواح على الدولارات. غير أن مثل تلك الشروخ نادرًا ما يحدث؛ وعليه فإن اختيار عتبة منخفضة سيؤدي إلى عدد غير عملي من الإنذارات الخاطئة. لسوء الحظ لم يقم أحد للآن بدراسة هذا الموضوع بمساعدة الطرائق الإحصائية المتاحة.
يعاني مقتنو أجهزة الإنذار في قمرة الملاحين cockpit alarms (كشركات الطيران والجيوش) أيضًا صعوبة تحديد عتبة اتخاذ القرار. تصدر هذه الأجهزة أثناء الرحلات الجوية تنبيها لأسباب متعددة ـ عندما تحدد أجهزة الاستشعار أن طائرة أخرى قريبة جدًّا، أو أن الطائرة نفسها أصبحت قريبة جدًّا من الأرض، أو أن أحد المحركات ينطفئ أو أن ريحًا شديدة تهدد منطقة الهبوط. ولكن هذه الأجهزة تصدر الإنذارات بكثرة، غالبًا لأن أجهزة الاستشعار ليست عالية الدقة ولأن عتبة التنبيه التي وضعت لهذه الأجهزة منخفضة. ولا يحبذ الملاحون الاستجابة لهذه الإنذارات من دون ضرورة، لأن عمل هذا يمكن أن يكون مشوشًا تمامًا. وقد أدى هذا الوضع إلى ظهور مخاوف من أن العدد الكبير من الإنذارات الخاطئة سيجعل الملاحين يهملون أو يبطئون في الاستجابة إلى خطر حقيقي. ومع هذا فإلى اليوم لم يجبر أحد صانعي هذه الأجهزة على الأخذ في الاعتبار معدل الإنذارات الخاطئة عندما يقومون بتحديد عتبة الإنذار لكل واحد من هذه الأجهزة.
التماس(9)
لا شك أن قواعد التنبؤ الإحصائية قادرة على تحسين دقة القرارات التشخيصية في الكثير من الحالات، كما تُمكن معادلات تحديد عتبات القرار من تحسين فائدة هذه القرارات. لكن للطرائق الإحصائية محاسن أخرى. فعند وضع معايير للنواحي البارزة التي يجب تقييمها من أجل عمل تشخيص، تُمكّن طرائق التنبؤ المختصين من تحديد النواحي البارزة التشخيصية الرئيسية بسرعة. كما توفر لصانعي القرار إمكانية التباحث بسهولة ودقة حول الانطباعات الذاتية، وتساعد أيضًا على تدريب المستجدين في هذا المضمار.
مع ذلك فإن هذه القواعد غالبًا ما تواجه مقاومة، خاصة إذا ما نُظِر إليها على أساس أنها تحل محل أو تقلل من أهمية الأطباء السريريين. كما يفضل المشخّصون(10) الإحساس بأنهم يصدرون قراراتهم التشخيصية وتوصياتهم عن إدراك وفهم وأنهم قادرون على عرض سيرورات أفكارهم. لهذا قد يكون من الصعب إدراج نتائج قاعدة تنبؤ إحصائية في هذا السياق، وبخاصة إذا ما كانت الفكرة من إجراء هذا التحليل غير واضحة لذاتها.
ومع فهمنا لجميع هذه المخاوف، فإننا نعتقد بأن الفوائد التي نجنيها من الوسائل الإحصائية تستوجب أخذها بعين الاعتبار من قبل صانعي القرار الذين يتحكمون في حياة ومستقبل الآخرين. ?
المؤلفون
John A. Swets – Robyn M. Dawes – John Monahan
تعاون المؤلفون مؤخرًا في كتابة تقرير أكثر تخصصًا حول هذا الموضوع نشر في عدد افتتاحي من مجلة تصدرها الجمعية الأمريكية لعلم النفس وتعنى بمراجعة الأبحاث حول المواضيع الملحة ذات الاهتمام الواسع في هذا العلم (انظر مراجع للاستزادة). سويتس باحث رئيسي فخري في BBN للتقانة في كمبريدج بولاية ماساتشوستس وباحث مساعد متقدم في الأشعة بمستشفى Brigham and Womens Hospital في بوسطن ومحاضر في السياسة الصحية في كلية طب جامعة هارڤارد. وداوز أستاذ Charles J. Queenan, Jr. في قسم علم الاجتماع في جامعة كارنيگي ميلون ومؤلف كتاب “اختيار عقلاني في عالم غير مؤكد”(3). أما موناهان فهو عالم نفس وأستاذ كرسي دوهرتي للقانون في جامعة ڤيرجينيا ومدير شبكة البحوث حول الصحة العقلية والقانون في مؤسسة جون وكاثرين ماك آرثر.
مراجع للاستزادة
COMBINATION OF PROSTATE-SPECIFIC ANTIGEN, CLINICAL STAGE, AND GLEASON SCORE TO PREDICT PATHOLOGICAL STAGE OF LOCALIZED PROSTATE CANCER. A. W. Parilri et al. in Journal of the American Medical Association, Vol. 277, No. 18, pages 1445-1451; May 14, 1997.
THINK HIV: WHY PHYSICIANS SHOULD LOWER THEIR THRESHOLD FOR HIV TESTING. Kenneth A. Freedberg and Jeffrey H. Samet in Archives of Internal Medicine, Vol. 159, No. 17, pages 1994-2003; September 27, 1999.
PSYCHOLOGICAL SCIENCE CAN IMPROVE DIAGNOSTIC DECISIONS. John A. Swets, Robyn M. Dawes and John Monahan in Psychological Science in the Public Interest (supplement to Psychological Science), Vol. 1, No. 1, pages 1-26; May 2000.
Scientific American, October 2000
(*) Better Decisions through Sciences
(1) Tools of the Trade
(2)possibly malignant mole
(3)Better Decision Making, Step by Step
(4)Better Cancer Diagnoses
(5)noninvasive tests
(6)Good Chance of Rain
(7)A Question of Teste
(8) Thorny Thresholds
(9)A Plea
(10)diagnosticians
(11)Rational Choice in Uncertain World