طلب خدمة
استفسار
×

التفاصيل

اخطاء البيانات الاحصائية

2022/12/15   الكاتب :د. بدر الغامدي
عدد المشاهدات(1058)

خطأ البيانات

 

يمكن أن تؤدى الأخطاء فى البيانات إلى أخطاء احصائية ، الأمر الذي يؤدي إلى أخطاء في تفسير البيانات وتحليلها. فى هذه المقالة سوف نقوم بتوضيح بعض المغالطات والأخطاء الشائعة ، مع أمثلة من الحياة الواقعية ، مع توضيح كيفة تجنبها. وفيما يلي عرض لهذه الأخطاء الشائعة فى البيانات

الخطأ الأول: قطف الكرز Cherry Picking

 

ومعناها بأن يقوم الباحث باختيار النتائج التي تناسب مطالبته واستبعاد النتائج التي لا تتناسب معها. أسوأ الأمثلة وأكثرها ضررًا على عدم الأمانة في التعامل مع البيانات. غالبًا ما يسلط الأشخاص الضوء فقط على البيانات التي تدعم قضيتهم ، بدلاً من كامل النتائج. غالبا ما ينتشر هذا الخطأ في النقاشات العامة والسياسية حيث يمكن للجانبين تقديم البيانات التي تدعم موقفهم.

بشكل عام ، عندما يتم تلقي البيانات من جهة ثانية ، تكون هناك فرصة للشخص بأن يختار البيانات التي يريد مشاركتها فقط وذلك لتشويه الحقيقة لأي رأي يروج له. عندما تكون في الطرف المتلقي للبيانات ، من المهم أن تسأل نفسك: "ما الذي لم يتم إخباري به؟".

الخطأ الأول: قطف الكرز Cherry Picking

الخطأ الثاني: جرف البيانات Data Dredging

 

تجريف البيانات هو الفشل في الاعتراف بأن الارتباط الذى استنتجته كان في الواقع نتيجة للصدفة. تكون نتائج الاختبارات الاحصائية ذات أهمية فقط عند تحديد الفروض مُسبقًا. من الناحية التاريخية ، كانت هذه مشكلة في التجارب السريرية حيث قام الباحثون "بتجريف" نتائجهم وتبديل ما كانوا يختبرونه من أجله.

وذلك يفسر سبب ثبوت خطأ العديد من النتائج المنشورة في المجلات العلمية. لتجنب ذلك ، أصبح الآن من الضروري تسجيل التجارب السريرية، مع الإشارة مسبقًا إلى النتائج التى تتطلع إليها الاختبارات.

الخطأ الثالث: تحيز البقاء على قيد الحياة Survivorship Bias

 

وتعنى استخلاص النتائج من مجموعة غير كاملة من البيانات ، لأن هذه البيانات "نجت" من بعض معايير الاختيار. عند تحليل البيانات ، من المهم أن تسأل نفسك عن البيانات التي لا تمتلكها. في بعض الأحيان ، يتم حجب الصورة الكاملة لأن البيانات التي حصلت عليها هى البيانات المتبقية من مجموعة مختارة من البيانات.

على سبيل المثال ، في الحرب العالمية الثانية ، سئل الفريق عن المكان الأفضل لتركيب الدروع في الطائرة. الطائرات التي عادت من المعركة كانت بها ثقوب الرصاص في كل مكان باستثناء المحرك وقمرة القيادة. قرر الفريق أنه من الأفضل تركيب الدروع حيث لا توجد أثر لثقوب الرصاص ، لأن الطائرات التي تم الإطلاق عليها في تلك الأماكن لم تعد.

 

الفرق بين البيانات الأولية والثانوية

الفرق بين البيانات الأولية والثانوية

الخطأ الرابع: تأثير الكوبرا Cobra Effect

 

وتحدث عندما تكون النتائج عكسية، ويُطلق عليها المكافأة الضارة. يحدث تأثير الكوبرا عندما تؤدي المكافأة لحل مشكلة ما إلى عواقب سلبية غير مقصودة. تم تسمية هذا الخطأ بهذ الأسم استنادا على قصة حدثت عام 1800، عندما أرادت الإمبراطورية البريطانية تقليل وفيات لدغات الكوبرا في الهند. قدموا مكافأة مالية لكل جلد كوبرا يتم إحضاره إليهم لتحفيز صيد الكوبرا. لكن بدلاً من ذلك ، بدأ الناس في زراعتها. عندما أدركت الحكومة أن المكافأة لم تكن مجدية ، قاموا بإزالتها حتى أطلق مزارعو الكوبرا ثعابينهم ، مما أدى إلى زيادة عدد الثعابين. عند تحديد الحوافز أو الأهداف ، تأكد من أنك لا تشجع السلوك الخاطئ عن طريق الخطأ.

الخطأ الخامس: السببية الخاطئة False Causality

 

وتعني الافتراض الخاطئ عند وقوع حدثين معًا أن أحدهما قد تسبب في الآخر. غالبًا ما يقودنا الارتباطات بين شيئين على الاعتقاد بأن أحدهما تسبب في حدوث الآخر. ومع ذلك ، غالبًا ما تكون مصادفة أو أن هناك عاملًا ثالثًا قد تسبب فى هذا التأثير. لا تفترض أبدًا العلاقة السببية بسبب الارتباط وحده - اجمع دائمًا المزيد من الأدلة.

الخطأ الخامس: السببية الخاطئة False Causality

الخطأ السادس: التلاعب Gerrymandering

 

وتعنى التلاعب عمدًا للحصول على النتائج المرغوبة. مثل ممارسة التلاعب عمدًا بحدود الدوائر السياسية من أجل التأثير على نتيجة الانتخابات. في العديد من الأنظمة السياسية ، من الممكن التلاعب باحتمالية انتخاب حزب على آخر من خلال إعادة تحديد الدوائر السياسية - بما في ذلك المزيد من المناطق الريفية في الدائرة لإلحاق الضرر بالحزب الأكثر شعبية في المدن وما إلى ذلك.

يمكن أن تحدث ظاهرة مشابهة تُعرف باسم مشكلة الوحدة المساحية القابلة للتعديل (MAUP) عند تحليل البيانات. كيف تحدد المناطق لتجميع بياناتك - على سبيل المثال معرفة بأن منطقة معينة يمكن أن تغير النتيجة.، لذا يتم استبعادها. يمكن أن يكون للمقياس المستخدم لتجميع البيانات تأثير كبير أيضًا. يمكن أن تختلف النتائج على نطاق واسع سواء باستخدام الرموز البريدية أو المقاطعات أو الولايات.

الخطأ السابع: التحيز للعينة Sampling Bias

 

وتعنى استخلاص النتائج من مجموعة من البيانات لا تمثل مجتمع البحث الذين تحاول فهمهم. مثل المشكلة التى تظهر في الاقتراع الانتخابي حيث لا يمثل الأشخاص المشاركون في الاستطلاع إجمالي السكان ، إما بسبب الاختيار الذاتي أو التحيز من قبل المحللين. تأكد ما إذا كان المشاركون في البحث ممثلين حقًا للمجتمع ولا يخضعون لبعض التحيز في أخذ العينات.

الخطأ الثامن: خطأ المقامر Gambler's Fallacy

 

الاعتقاد الخاطئ بأنه نظرًا لحدوث شيء ما بشكل متكرر أكثر من المعتاد ، فمن غير المرجح أن يحدث الآن في المستقبل والعكس صحيح. عندما تجد نفسك معرض هذه المغالطة ، ذكر نفسك أنه لا توجد قوة تصحيح في الكون تعمل على "موازنة الأشياء"!

الخطأ التاسع: الانحدار نحو المتوسط Regression Toward the Mean

 

عندما يحدث شيء ما ويكون جيدًا أو سيئًا بشكل غير عادي ، فإنه بمرور الوقت سوف يٌعتاد عليه ويصبح شيء متوسط. في أي مكان تلعب فيه هذه الفرصة العشوائية دورًا في النتيجة ، فمن المحتمل أن ترى تراجعًا نحو المتوسط. على سبيل المثال ، غالبًا ما يكون النجاح في العمل مزيجًا من المهارة والحظ. هذا يعني أنه من المرجح أن أفضل الشركات أداءً اليوم سوف تكون أقرب إلى المتوسط في غضون 10 سنوات قادمة، ليس من خلال عدم الكفاءة ولكن لأنهم اليوم يستفيدون على الأرجح من سلسلة من الحظ السعيد.

الخطأ العاشر: تأثير هاوثورن Hawthorne Effect

 

ويُعرف أيضًا باسم تأثير المراقب. وهو عندما يؤثر فعل المراقبة على سلوك هذا الشخص. في عشرينيات القرن الماضي في مصنع هوثورن في إلينوي ، افترضت إحدى تجارب العلوم الاجتماعية أن العمال سيصبحون أكثر إنتاجية بعد التغييرات المختلفة في بيئتهم مثل ساعات العمل ومستويات الإضاءة وأوقات الراحة. ومع ذلك ، اتضح أن الدافع الفعلي لإنتاجية العمال هو اهتمام الشخص المسئول بهم. عند استخدام مواضيع البحث الإنسانية ، من المهم تحليل البيانات الناتجة مع مراعاة تأثير هوثورن.

الخطأ الحادي عشر: مفارقة سيمبسون Simpson's Paradox

 

هى ظاهرة يظهر فيها الاتجاه في مجموعات مختلفة من البيانات ولكنه يختفي أو ينعكس عند دمج المجموعات. ي السبعينيات ، اتُهمت جامعة بيركلي بالتمييز على أساس الجنس لأن احتمالية قبول المتقدمات من الإناث أقل من الذكور. ومع ذلك ، عند محاولة تحديد مصدر المشكلة ، وجدوا أنه بالنسبة للمواضيع الفردية ، كانت معدلات القبول بشكل عام أفضل للنساء من الرجال. كان سبب المفارقة هو الاختلاف في الموضوعات التي يتقدم لها الرجال والنساء. كانت نسبة أكبر من المتقدمين الإناث يتقدمون إلى موضوعات تنافسية للغاية حيث كانت معدلات القبول أقل بكثير لكلا الجنسين.

الخطأ الثاني عشر: مغالطة ماكنمارا McNamara Fallacy

 

وتعنى أن الاعتماد فقط على المقاييس في المواقف المعقدة يمكن أن يتسبب في الإغفال عن الصورة الأكبر. سمي على اسم روبرت ماكنمارا ، وزير الدفاع الأمريكي (1961-1968) ، الذي اعتقد أن الحقيقة لا يمكن العثور عليها إلا في البيانات والدقة الإحصائية. تشير المغالطة إلى منهج يقوم على اعتبار أن جسد العدو مقياسًا للنجاح في حرب فيتنام. وذلك يعني أنه تم تجاهل الأفكار الأخرى ذات الصلة مثل المزاج المتغير للجمهور الأمريكي ومشاعر الشعب الفيتنامي إلى حد كبير. عند تحليل الظواهر المعقدة ، غالبًا ما

نضطر إلى استخدام مقياس ما كبديل للنجاح. ومع ذلك ، فإن التحسين الدوغمائي لهذا الرقم وتجاهل جميع المعلومات الأخرى هو أمر محفوف بالمخاطر.

التعليقات


الأقسام

أحدث المقالات

الأكثر مشاهدة

الوســوم

خدمات المركز

نبذة عنا

تؤمن شركة دراسة بأن التطوير هو أساس نجاح أي عمل؛ ولذلك استمرت شركة دراسة في التوسع من خلال افتتاح فروع أو عقد اتفاقيات تمثيل تجاري لتقديم خدماتها في غالبية الجامعات العربية؛ والعديد من الجامعات الأجنبية؛ وهو ما يجسد رغبتنا لنكون في المرتبة الأولى عالمياً.

اتصل بنا

فرع:  الرياض  00966555026526‬‬ - 555026526‬‬

فرع:  جدة  00966560972772 - 560972772

فرع:  كندا  +1 (438) 701-4408 - 7014408

شارك:

عضو فى

دفع آمن من خلال

Visa Mastercard Myfatoorah Mada