تحيز الاختيار

تحيز في التحليل الإحصائي نتيجة لعدم عشوائية اختيار العينة

تحيز الاختيار هو اختيار الأفراد أو الجماعات أو البيانات لتحليلها بطريقة لا تحقق التوزيع العشوائي الصحيح، وبهذه الطريقة ضمان أن العينة التي تم الحصول عليها لا تمثل السكان المزمع تحليلهم.[1] يشار إليها أحياناً باسم تأثير الاختيار. عبارة تحيز الاختيار غالبا ما تشير إلى تشويه التحليل الإحصائي، الناتج عن طريقة جمع العينات. إذا لم يؤخذ تحيز الاختيار بعين الاعتبار، عندها تصبح بعض استنتاجات الدراسة غير دقيقة. أحد أمثلة تحيز الاختيار هو انحياز استعياني، ويرتبط أيضاً أرتباطاً وثيقاً بالانحياز التأكيدي.

التحيز والتباين يساهمان في الخطأ الكلي

أنواع

عدل

هناك العديد من الأنواع لانحياز الاختيار، نذكر منها:

الانحياز الاستعياني

عدل

الانحياز الاستعياني هو خطأ منهجيّ يحدث نتيجة لعدم اختيار عيّنات الدراسة بشكلٍ عشوائي،[2] وهو ما يجعل من تمثيل بعض الأفراد في الدراسة أقلّ من تمثيل البعض الآخر، وينتج عن ذلك الحصول على عيّنة منحازة تعرّف على أنّها عيّنة إحصائيّة لمجموعة بشريّة ما (أو حتّى لمجموعات غير بشريّة) نصيب الأفراد بالتمثيل فيها غير متساوٍ أو غير موضوعيّ.[3] غالباً ما يتمّ تصنيف هذا النوع من الانحياز على أنّه نوع من انحياز الاختيار،[4] وأحياناً يسمّى بالانحياز في اختيار العيّنة،[5][6][7] but some classify it as a separate type of bias.[8] ويصنّفه البعض على أنّه نوع منفصلٍ من الانحياز.

إنّ ما يميّز الانحياز الاستعياني (وإن لم يكن مقبولاً على أنّه نوع منفصل من التحيّز بشكلٍ عام) أنّه يقوّض الصلاحيّة الخارجيّة للاختبار (بمعنى أنّه يقلّل من إمكانيّة تعميم النتائج على بقيّة المجتمعات) بينما يتطرّق تحيّز الاختيار بشكلٍ أساسيّ إلى الصلاحيّة الداخليّة للاختلافات والتشابهات الموجودة في العيّنة المدروسة. ومن هذا المنطلق فإنّ الأخطاء التي تحصل أثناء عمليّة تجميع العيّنات أو مجموعات الدراسة هي التي تتسبّب في الانحياز الاستعياني، وبالمقابل فإنّ حصول تحيّز الاختيار يعتمد على الأخطاء التي تحدث أثناء أي عمليّة تالية لعمليّة تجميع العينّات.

تتضمّن الأمثلة التي توضّح الانحياز الاستعياني أوّلاً انحياز الاختيار الذاتيّ، بمعنى إجراء الدّراسات المسبقة على الخاضعين للتجربة، ثانياً عدم أخذ بعض العيّنات أو الاختبارات التي لم يكتب لها النجاح بالحسبان، وثالثاً انحياز الانتقال الذي يحدث عند استبعاد العيّنات التي انتقلت مؤخّراً إلى داخل دائرة الدراسة أو إلى خارجها.

الفاصل الزمني

عدل

الانتهاء المبكّر من التجربة في الوقت الذي تدعم فيه النتائج النتيجة المرغوبة.

قد يتمّ إنهاء التجربة مبكّراً عند قيمة متطرّفة (لأسباب أخلاقيّة في الغالب)، ولكن من المرجّح أن يتمّ الوصول إلى القيمة المتطرّفة بواسطة المتغير ذي التباين الإحصائيّ الأكبر، حتى لو كان لكل المتغيّرات متوسّط واحد.

تعرّض

عدل

انحياز التأثّر يحصل انحياز التأثّر السريري عندما يهيّئ أحد الأمراض لمرض آخر، بمعنى أنّ يؤدّي علاج المرض الأوّل خطأً إلى المرض الثاني، عى سبيل المثال: تعطي أعراض ما بعد سنّ اليأس فرصةً أكبر لتطوّر سرطان بطانة الرحم، ولذلك فإنّه من الممكن أن يتحمّل الأستروجين الذي يُفرز في مرحلة ما بعد سنّ اليأس الملامةَ على التسبّب في حدوث سرطان بطانة الرحم.[9] انحياز أوّلي، ويحدث عندما يكون علاج الأعراض الأوّليّة للمرض أو لأيّ نتيجة له سبباً في حدوث النتيجة. هو انحياز محتمل الحدوث عندما يبدأ العلاج بعد فترة زمنيّة من ظهور أولى أعراض المرض قبل التشخيص الفعليّ له.[9] يمكن التقليل من احتماليّة حدوث هذا الانحياز عن طريق التأخّر، أي إقصاء حالات التعرّض التي تحصل في مرحلة معيّنة قبل تشخيص المرض.[10] انحياز الإشارة، وهو خليط محتمل الحدوث بين السبب والنتيجة، يحدث عندما يعتمد التعرّض على الإشارة، على سبيل المثال يتمّ إعطاء علاج للأشخاص المعرّضين بشكلٍ كبير لخطر الإصابة بالمرض، وهو ما يحتمل أن يتسبّب في زيادة أعداد الأشخاص المعالجين من المرض[11] مقارنة بأعداد المصابين به. وهو ما قد يتسبّب بظاهرة خاطئة تتجلّى بأن يتسبّب العلاج بظهور المرض.

بيانات

عدل

تجزئة (تقسيم) البيانات مع معرفة محتويات الأقسام، ومن ثم تحليلها باختبارات مصمّمة للأقسام المختارة بطريقة عشوائيّة.

تعديل تحيليات ما بعد الحدث للبيانات المستخلصة بالاعتماد على أسبابٍ اعتباطيّة أو ذاتيّة بما في ذلك: الالتقاطيّة: اختيار مجموعات فرعيّة محدّدة من البيانات بهدف دعم الاستنتاج (على سبيل المثال ذكر مجموعة من الأمثلة عن تحطّم الطائرة كدليلٍ على أنّ رحلات شركة طيران بعينها غير آمنة، وتجاهل المثال المقابل ذو فرصة الحصول الأكبر الذي يتمثّل بالرّحلات الجوّية العديدة التي تكتمل بأمان. انظر عقلية بحسب الظروف). رفض البيانات السيّئة بناءً على: 1 أسباب اعتباطيّة، بدلاً من الاعتماد على معايير مذكورة مسبقاً ومتّفق عليها عموماً أو 2 التخلّص من القيم المتطرّفة اعتماداً على أسسٍ فشلت في أن تراعي بيانات مهمّة يمكن استخلاصها من ملاحظات شاذّة.

المصادر

عدل
  1. ^ Dictionary of Cancer Terms → selection bias. Retrieved on September 23, 2009.
  2. ^ Medical Dictionary - 'Sampling Bias' Retrieved on September 23, 2009 نسخة محفوظة 10 مارس 2016 على موقع واي باك مشين.
  3. ^ TheFreeDictionary → biased sample. Retrieved on 2009-09-23. Site in turn cites: Mosby's Medical Dictionary, 8th edition. نسخة محفوظة 17 يونيو 2019 على موقع واي باك مشين.
  4. ^ Dictionary of Cancer Terms → Selection Bias. Retrieved on September 23, 2009. نسخة محفوظة 9 يونيو 2009 على موقع واي باك مشين.
  5. ^ Ards، Sheila؛ Chung، Chanjin؛ Myers، Samuel L. (1998). "The effects of sample selection bias on racial differences in child abuse reporting". Child Abuse & Neglect. ج. 22 ع. 2: 103–115. DOI:10.1016/S0145-2134(97)00131-2. PMID:9504213.
  6. ^ Cortes، Corinna؛ Mohri، Mehryar؛ Riley، Michael؛ Rostamizadeh، Afshin (2008). Sample Selection Bias Correction Theory (PDF). Lecture Notes in Computer Science. ج. 5254. ص. 38–53. arXiv:0805.2775. CiteSeerX:10.1.1.144.4478. DOI:10.1007/978-3-540-87987-9_8. ISBN:978-3-540-87986-2. مؤرشف من الأصل (PDF) في 2018-09-27. {{استشهاد بكتاب}}: |صحيفة= تُجوهل (مساعدة)
  7. ^ Cortes، Corinna؛ Mohri، Mehryar (2014). "Domain adaptation and sample bias correction theory and algorithm for regression" (PDF). Theoretical Computer Science. ج. 519: 103–126. CiteSeerX:10.1.1.367.6899. DOI:10.1016/j.tcs.2013.09.027. مؤرشف من الأصل (PDF) في 2018-09-27.
  8. ^ Fadem، Barbara (2009). Behavioral Science. Lippincott Williams & Wilkins. ص. 262. ISBN:978-0-7817-8257-9. مؤرشف من الأصل في 2017-03-24.
  9. ^ ا ب Feinstein AR؛ Horwitz RI (نوفمبر 1978). "A critique of the statistical evidence associating estrogens with endometrial cancer". Cancer Res. ج. 38 ع. 11 Pt 2: 4001–5. PMID:698947.
  10. ^ Tamim H؛ Monfared AA؛ LeLorier J (مارس 2007). "Application of lag-time into exposure definitions to control for protopathic bias". Pharmacoepidemiol Drug Saf. ج. 16 ع. 3: 250–8. DOI:10.1002/pds.1360. PMID:17245804.
  11. ^ Matthew R. Weir (2005). Hypertension (Key Diseases) (Acp Key Diseases Series). Philadelphia, Pa: American College of Physicians. ص. 159. ISBN:978-1-930513-58-7.