الانحدار اللوجستي هو نموذج إحصائي يُستخدم أساسًا في مشكلات التصنيف، وليس التنبؤ بالقيم المستمرة. ويهدف هذا النموذج إلى تقدير احتمالية وقوع حدث معين بناءً على مجموعة من المتغيرات المستقلة، بحيث تكون نتيجة التنبؤ إحدى فئتين غالبًا (مثل: نعم/لا، 0/1، صحيح/خطأ).
ورغم احتوائه على كلمة “انحدار” في اسمه، فإن الانحدار اللوجستي يُعد في جوهره نموذج تصنيف، ويُستخدم على نطاق واسع في مجالات مثل الطب، والاقتصاد، وعلوم البيانات، والكشف عن الاحتيال.
الدالة اللوجستية (Sigmoid Function)
يعتمد الانحدار اللوجستي على ما يُعرف بـ الدالة اللوجستية (Sigmoid Function)، وهي دالة رياضية تقوم بتحويل أي قيمة عددية إلى قيمة محصورة بين 0 و1. وتمثّل هذه القيمة ناتج النموذج على شكل احتمال.
وبناءً على هذا الاحتمال، يتم تصنيف النتيجة إلى إحدى الفئتين وفق حد معيّن (غالبًا 0.5). فإذا تجاوز الاحتمال هذا الحد، تُصنَّف النتيجة ضمن الفئة الإيجابية، وإذا كان أقل منه، تُصنَّف ضمن الفئة السلبية.
المتغير التابع في الانحدار اللوجستي
يتميّز الانحدار اللوجستي بأن المتغير التابع فيه يكون:
- ثنائي القيمة 0 أو 1
- أو يمثّل فئتين واضحتين
ولا يُستخدم هذا النموذج للتنبؤ بقيم رقمية مستمرة، بل لتحديد الانتماء إلى فئة معينة أو تقدير احتمال هذا الانتماء.
أمثلة تطبيقية على الانحدار اللوجستي
يُستخدم الانحدار اللوجستي في العديد من التطبيقات العملية، من أبرزها:
- التنبؤ بقبول أو رفض طلب قرض.
- تحديد ما إذا كان البريد الإلكتروني مزعجًا أم لا.
- تشخيص وجود مرض من عدمه بناءً على بيانات طبية.
- الكشف عن العمليات الاحتيالية في المعاملات المالية.