خوارزميات التصنيف والتنبؤ وطريقة عملها وأنواعها

الملخص

مفهوم خوارزميات التصنيف والتنبؤ، أمثلة تطبيقية للاستخدامات المتنوعة، طريقة عمل خوارزميات التصنيف والتنبؤ، خوارزميات التصنيف المختلفة.

مفهوم خوارزميات التصنيف والتنبؤ

إن خوارزميات التصنيف والتنبؤ هي شكل من أشكال تحليل البيانات والتي تستخلص نماذج تصف بشكل دقيق فئات وتصنيفات البيانات المهمة.

مثلاً، يمكن بناء نموذج تصنيف من أجل تقييم طلبات القروض في نظام منح القروض بأحد البنوك، بحيث يقسم مجموعة الطلبات إلى فئتين، آمنة وغير آمنة (أي أن فيها مخاطرة على البنك).

ومثل هذا التحليل يمكن أن يساعد في فهم البيانات وضبط نظام منح القروض.

وتستخدم خوارزميات التصنيف والتنبؤ (بالإنجليزية: Classification and Prediction) في العديد من المجالات، حيث أن لها تطبيقات عديدة.

ومن أمثلة تطبيقاتها تلك المستخدمة في نظم كشف عمليات الاحتيال، والتسويق المستهدف لفئات معينة.

كذلك تُستخدم في التنبؤ بمستوى الأداء أو مدى الإقبال على شراء المنتجات، وميكنة الصناعات التحويلية، وتشخيص الأمراض.

أمثلة تطبيقية للاستخدامات المتنوعة

مثلاً، إذا افترضنا أن مدير قسم القروض في أحد البنوك أو مدير إدارة وتحليل المخاطر فيه يرغب في تحليل البيانات المتوفرة لدى البنك حتى يعرف أي من طلبات القروض يمكن أن يكون آمناً وأي منها يمكن أن يكون غير آمن أو فيه مخاطرة على البنك.

أو إذا افترضنا أن مدير إدارة التسويق في أحد محلات بيع الأجهزة الإلكترونية يرغب في تحليل بيانات المبيعات حتى يستطيع أن يخمن فيما إذا كان زبون بمواصفات وسمات معينة سوف يقوم بشراء جهاز كمبيوتر تم طرحه حديثاً في المحل.

أو لو افترضنا أن باحثاً في المجال الطبي يرغب في تحليل البيانات المتوفرة لديه والمتعلقة بنتائج اختبارات علاجية لمرض السرطان حتى يستطيع التنبؤ بأفضل علاج للمرض من ثلاثة أنواع من الأدوية التي يقوم باختبارها على المرضى.

ففي كل مثال من الأمثلة المذكورة يتم استخدام طرق التصنيف من أجل تحليل البيانات.

ويتم بناء نموذج التصنيف لتكون مهمته التنبؤ بالفئة أو السمات المحددة التي تصف الفئة التي يتم استكشافها، أو بتعبير أوضح الفئة التي ينتمي لها العنصر الذي يتم استكشافه، مثل (آمن أو خطر) في حالة طلبات القروض، و(نعم أو لا) في حالة التسويق المستهدف، والعلاج (أ أو ب أو ج) في حالة العلاج الطبي.

وفي كل الأمثلة المذكورة كانت النماذج التي تمثلها الفئات أو المسميات ذات قيم اسمية، ولا يهم فيها.

كما يمكن أن تكون القيم التي يتم التنبؤ بها رقمية.

كأن يرغب مدير المبيعات في التنبؤ بالمبلغ الذي يمكن أن ينفقه زبون معين أثناء رحلة للتسوق داخل المركز التجاري، وهو ما يُطلق عليه التنبؤ الرقمي، وهو المجال الذي يهتم به أسلوب تحليل الانحدار كأحد أساليب التحليل الإحصائي للبيانات.

في هذا الفصل، سوف يتم التطرق بالتفصيل للتصنيف الهادف للتنبؤ بالقيم الاسمية.

طريقة عمل خوارزميات التصنيف والتنبؤ

إن التحليل باستخدام خوارزميات التصنيف هو عبارة عن عملية مكونة من خطوتين.

تسمى الخطوة الأولى خطوة التعلم (بالإنجليزية: Learn Step)، حيث يتم فيها بناء نموذج التصنيف.

والخطوة الثانية هي خطوة التصنيف (بالإنجليزية: Classification Step)، حيث يتم فيها استخدام النموذج من أجل التنبؤ بالفئات أو السمات لبيانات محددة.

ويتم في خطوة التعلم تحليل البيانات باستخدام خوارزمية التصنيف ومن ثم استخلاص قواعد التصنيف (بالإنجليزية: Classification Rules).

والخطوة الثانية هي خطوة التصنيف ويتم فيها استخدام بيانات السجل المُستكشف من أجل تقدير مدى تحقق قاعدة أو قواعد التصنيف.

فإذا تحققت قاعدة التصنيف فإنه يمكن تطبيقها على السجل المستكشف.

وعادة ما تكون نتيجة التقدير محددة مسبقاً، مما يجعل خطوة التعلم واضحة ومحددة.

أما إذا كانت غير مقدّرة وبحاجة إلى تحديد فهذا يقودنا إلى الحاجة إلى التحليل العنقودي أو التجزئة العنقودية حتى يمكن تجزئة البيانات إلى مجموعتين محددتين بالسمات المطلوب التصنيف وفقاً لها.

ويمكن تقييم خوارزميات التصنيف باستخدام مقياس نسبة صحة القاعدة Accuracy، وهي نسبة عدد السجلات التي يتم اختبارها وتصنيفها بشكل صحيح باستخدام الخوارزمية.

أنواع خوارزميات التصنيف

توجد أربعة أنواع من خورازميات التصنيف:

  1. التصنيف باستخدام خوارزميات شجرة القرار
  2. التصنيف باستخدام خوارزميات الشبكات العصبية
  3. التصنيف باستخدام نظرية الاحتمالات
  4. التصنيف باستخدام خوارزمية الجار الأقرب

وسوف يتم شرحها بالتفصيل في أبواب مستقلة يمكن تصفحها ضمن محتويات كتاب تنقيب البيانات.

خوارزميات التصنيف والتنبؤ
خوارزميات التصنيف والتنبؤ
Don`t copy text!