الرئيسية » تنقيب البيانات » خوارزميات التصنيف والتنبؤ وطريقة عملها وأنواعها

خوارزميات التصنيف والتنبؤ وطريقة عملها وأنواعها

آخر تحديث: مارس 3, 2021

الملخص

مفهوم خوارزميات التصنيف والتنبؤ، أمثلة تطبيقية للاستخدامات المتنوعة، طريقة عمل خوارزميات التصنيف والتنبؤ، خوارزميات التصنيف المختلفة.

مفهوم خوارزميات التصنيف والتنبؤ

إن خوارزميات التصنيف والتنبؤ هي شكل من أشكال تحليل البيانات والتي تستخلص نماذج تصف بشكل دقيق فئات وتصنيفات البيانات المهمة.

مثلا، يمكن بناء نموذج تصنيف من أجل تقييم طلبات القروض في نظام منح القروض بأحد البنوك، بحيث يقسم مجموعة الطلبات إلى فئتين، آمنة وغير آمنة (أي أن فيها مخاطرة على البنك).

ومثل هذا التحليل يمكن أن يساعد في فهم البيانات وضبط نظام منح القروض.

وتستخدم خوارزميات التصنيف والتنبؤ (بالإنجليزية: Classification and Prediction) في العديد من المجالات، حيث أن لها تطبيقات عديدة.

ومن أمثلة تطبيقاتها تلك المستخدمة في نظم كشف عمليات الاحتيال، والتسويق المستهدف لفئات معينة.

كذلك تُستخدم في التنبؤ بمستوى الأداء أو مدى الإقبال على شراء المنتجات، وميكنة الصناعات التحويلية، وتشخيص الأمراض.

أمثلة تطبيقية للاستخدامات المتنوعة

مثلا، إذا افترضنا أن مدير قسم القروض في أحد البنوك أو مدير إدارة وتحليل المخاطر فيه يرغب في تحليل البيانات المتوفرة لدى البنك حتى يعرف أي من طلبات القروض يمكن أن يكون آمنًا وأي منها يمكن أن يكون غير آمن أو فيه مخاطرة على البنك.

أو إذا افترضنا أن مدير إدارة التسويق في أحد محلات بيع الأجهزة الإلكترونية يرغب في تحليل بيانات المبيعات حتى يستطيع أن يخمن فيما إذا كان زبون بمواصفات وسمات معينة سوف يقوم بشراء جهاز كمبيوتر تم طرحه حديثًا في المحل.

أو لو افترضنا أن باحثًا في المجال الطبي يرغب في تحليل البيانات المتوفرة لديه والمتعلقة بنتائج اختبارات علاجية لمرض السرطان حتى يستطيع التنبؤ بأفضل علاج للمرض من ثلاثة أنواع من الأدوية التي يقوم باختبارها على المرضى.

ففي كل مثال من الأمثلة المذكورة يتم استخدام طرق وخوارزميات التصنيف من أجل تحليل البيانات.

ويتم بناء نموذج التصنيف لتكون مهمته التنبؤ بالفئة أو السمات المحددة التي تصف الفئة التي يتم استكشافها، أو بتعبير أوضح الفئة التي ينتمي لها العنصر الذي يتم استكشافه، مثل (آمن أو خطر) في حالة طلبات القروض، و(نعم أو لا) في حالة التسويق المستهدف، والعلاج (أ أو ب أو ج) في حالة العلاج الطبي.

وفي كل الأمثلة المذكورة كانت النماذج التي تمثلها الفئات أو المسميات ذات قيم اسمية، ولا يهم فيها.

كما يمكن أن تكون القيم التي يتم التنبؤ بها رقمية.

كأن يرغب مدير المبيعات في التنبؤ بالمبلغ الذي يمكن أن ينفقه زبون معين أثناء رحلة للتسوق داخل المركز التجاري، وهو ما يُطلق عليه التنبؤ الرقمي، وهو المجال الذي يهتم به أسلوب تحليل الانحدار كأحد أساليب التحليل الإحصائي للبيانات.

في هذا الفصل، سوف يتم التطرق بالتفصيل للتصنيف الهادف للتنبؤ بالقيم الاسمية.

طريقة عمل خوارزميات التصنيف والتنبؤ

إن التحليل باستخدام خوارزميات التصنيف هو عبارة عن عملية مكونة من خطوتين.

تسمى الخطوة الأولى خطوة التعلم (بالإنجليزية: Learn Step)، حيث يتم فيها بناء نموذج التصنيف.

والخطوة الثانية هي خطوة التصنيف (بالإنجليزية: Classification Step)، حيث يتم فيها استخدام النموذج من أجل التنبؤ بالفئات أو السمات لبيانات محددة.

ويتم في خطوة التعلم تحليل البيانات باستخدام خوارزمية التصنيف ومن ثم استخلاص قواعد التصنيف (بالإنجليزية: Classification Rules).

والخطوة الثانية هي خطوة التصنيف ويتم فيها استخدام بيانات السجل المُستكشف من أجل تقدير مدى تحقق قاعدة أو قواعد التصنيف.

فإذا تحققت قاعدة التصنيف فإنه يمكن تطبيقها على السجل المستكشف.

وعادة ما تكون نتيجة التقدير محددة مسبقًا، مما يجعل خطوة التعلم واضحة ومحددة.

أما إذا كانت غير مقدّرة وبحاجة إلى تحديد فهذا يقودنا إلى الحاجة إلى التحليل العنقودي أو التجزئة العنقودية حتى يمكن تجزئة البيانات إلى مجموعتين محددتين بالسمات المطلوب التصنيف وفقًا لها.

ويمكن تقييم خوارزميات التصنيف باستخدام مقياس نسبة صحة القاعدة Accuracy، وهي نسبة عدد السجلات التي يتم اختبارها وتصنيفها بشكل صحيح باستخدام الخوارزمية.

أنواع خوارزميات التصنيف

توجد أربعة أنواع من خورازميات التصنيف، وهي كما يلي:

  1. التصنيف باستخدام خوارزميات شجرة القرار
  2. التصنيف باستخدام خوارزميات الشبكات العصبية
  3. والتصنيف باستخدام نظرية الاحتمالات
  4. والتصنيف باستخدام خوارزمية الجار الأقرب

وسوف يتم شرحها بالتفصيل في فصول مستقلة يمكن تصفحها ضمن محتويات كتاب تنقيب البيانات، من خلال الضغط على الرابط الخاص بأي منها.

أسئلة واختبارات

يمكن تحميل تطبيق اختبارات متعددة التخصصات، وهو تطبيق مجاني من إصدار مركز البحوث والدراسات متعدد التخصصات. ويحتوي التطبيق على العديد من الاختبارات والأسئلة المتخصصة في مجال الرياضيات وعلوم الكمبيوتر، ويهدف إلى توفير آلية للتدريب على الامتحانات والاختبارات الإلكترونية لطلاب المدارس والجامعات. ويجمع التطبيق بين التعليم والترفيه ويوفر آلية للمنافسة بطريقة تساهم في تعميم الفائدة بين المتنافسين.

رابط تحميل التطبيق على متجر جوجل بلاي: تطبيق اختبارات متعددة التخصصات

المصدر

  • كتاب التحليل المتقدم وتنقيب البيانات، د. م. مصطفى عبيد، دار الفكر العربي، القاهرة، الطبعة الأولى، 2017.
خوارزميات التصنيف والتنبؤ وطريقة عملها وأنواعها