الرئيسية » تنقيب البيانات » أنواع البيانات وتقسيماتها وخصائصها

أنواع البيانات وتقسيماتها وخصائصها

آخر تحديث: مارس 3, 2021

ملخص المحتوى

شرح مفهوم السمة أو المتغير وشرح وتوضيح أنواع البيانات وخصائص وسمات البيانات وتقسيمها من حيث السمات المميزة في مجالات علوم الكمبيوتر وتنقيب البيانات. شرح البيانات الاسمية والمنطقية والرتبية، والبيانات الكمية الرقمية بنوعيها الفتري والنسبي، والبيانات المنفصلة والمتصلة. تبسيط مفهوم الأنواع المختلفة للبيانات والمتغيرات والفرق بينها والحاجة لهذه التقسيمات واستخداماتها المختلفة.

السمة أو المتغير

السمة أو المتغير (بالإنجليزية: Attribute, Variable) هي حقل من حقول البيانات التي تُمثّل خاصية أو ميزة لكائن البيانات.

واسم “سمة” أو ميزة أو متغير غالبًا ما تُستخدم بشكل متنوع في المجالات المتعددة من مجالات التعامل مع البيانات.

ففي مجال الذكاء الاصطناعي جرت العادة على استخدام التعبير “ميزة”.

أما في مجال الإحصاء والبحث العلمي فجرت العادة على استخدام تعبير “المتغيرات”.

أما في مجال قواعد البيانات ومستودعات البيانات مجال تنقيب البيانات فجرت العادة على استخدام مصطلح “سمة” (بالإنجليزية: Attribute).

والسمة تصف كائن محدد في قاعدة البيانات.

مثلا، في جدول بيانات الزبائن في أحد المحلات يمكن أن نطلق تعبير السمة على الحقول التالية:

  • الاسم
  • العنوان
  • الدخل
  • … إلخ

وكل سجل من سجلات هذا الجدول سوف يمتلك مجموعة من السمات (المتغيرات) المميزة له.

تقسيمات أنواع البيانات

توجد عدة أنواع مختلفة من السمات (المتغيرات) وتختلف هذه الأنواع عن بعضها البعض بحسب طريقة قياسها، فمنها السمات النوعية وتتفرع منها السمات الاسمية والمنطقية والرتبية ومنها السمات الكمية أو الرقمية وتتفرع منها بيانات القياس الفتري والنسبي.

فيما يلي وصفًا لكل تقسيمات أنواع البيانات وخصائصها بالتفصيل:

البيانات النوعية

البيانات النوعية (بالإنجليزية: Qualitative Data) هي البيانات التي تصف ميزات كائن البيانات بدون تحديد كمياتها أو أحجامها.

وهناك ثلاثة أنواع فرعية من البيانات النوعية وهي:

  1. البيانات من النوع الاسمي
  2. والبيانات من النوع المنطقي
  3. والبيانات من النوع الرتبي

وفيما يلي شرحًا مفصلا لكل منها:

1. البيانات الاسمية

البيانات الاسمية (بالإنجليزية: Nominal Data) أو أنواع البيانات ذات السمة الاسمية (بالإنجليزية: Nominal Attribute) تعني أنها ترتبط بالأسماء وقيمها هي قيم اسمية أو رموز.

ومن أمثلتها أسماء الأشياء أو الأشخاص.

كما أن البيانات الاسمية لا تخضع للترتيب، ويمكن أن تُمثّل فئات أو تصنيفات معينة.

مثلا: في قاعدة بيانات مبيعات أحد الشركات يمكن أن تأخذ بعض الحقول سمات مثل (الحالة الاجتماعية) والتي تكون القيم المحتملة لها هي:

  • أعزب
  • متزوج
  • أرمل
  • مطلق
  • … إلخ

وكذلك (المهنة)، والتي يمكن أن تكون القيم المحتملة لها هي:

  • مدرس
  • طبيب
  • مزارع
  • … إلخ

وهكذا فإن هذه القيم جميعها هي قيم اسمية، لذا فإنه يُطلق على هذه السمات (الحالة الاجتماعية، المهنة، …) أنها سمات اسمية.

وبالرغم من ذلك إلا أنه في بعض الأحيان قد تكون السمة اسمية وتحتوي القيم فيها على أرقام، ولكن يتم التعامل معها كقيم اسمية. ومن أمثلة ذلك حقل (رقم الهاتف) أو (الرمز البريدي)، فالأرقام في هذه الحالات هي قيم اسمية وذلك لأنه لا يمكن جمعها أو طرحها أو مقارنتها حسابيًا مع بعضها البعض.

2. أنواع البيانات المنطقية

البيانات المنطقية (بالإنجليزية: Boolean Data) أو أنواع البيانات ذات السمة المنطقية هي بيانات اسمية أيضًا، ولكن قيمها محصورة في قيمتين أو حالتين فقط، ويمكن التعبير عنها رقميًا باستخدام النظام الثنائي للأعداد بالقيمتين (صفر، 1)، حيث تعبّر القيمة (صفر) عن غياب السمة أو عدم تحققها، والقيمة (1) عن تحققها. وهي تناظر القيم (نعم، لا) المنطقية. فمثلا في قاعد بيانات مرضى أحد أطباء الصدرية إذا كان هناك سمة (متغير) بعنوان “مدخن” التي تصف حالة المريض وما إذا كان مدخنًا أم لا، فإن القيمة (1) تعني أن المريض مدخن، والقيمة (0) تعني أنه غير مدخن. كما يمكن استخدام القيم (نعم، لا) بدلا من (1، صفر).

3. البيانات الرتبية

البيانات الرتبية (بالإنجليزية: Ordinal Data) أو أنواع البيانات ذات السمة الرتبية هي البيانات التي يمكن أن تأخذ قيمًا لها ترتيب معين فيما بينها ويكون هذا الترتيب ذات معنى. ولكن دون الاهتمام أو حتى بدون الحاجة لمعرفة الفرق الفعلي بين القيم المتتالية في هذا الترتيب.

فمثلا، في أحد مطاعم الوجبات السريعة يمكن أن يتم استخدام عدة خيارات لحجم المشروب الغازي الذي يتم اختياره مع وجبة الطعام، بحيث تأخذ القيم التالية: (صغير، متوسط، كبير)، وهذه القيم تكون في ترتيب واضح يبين تسلسل الحجم من الأصغر إلى الأكبر بالرغم من أننا لا نعلم الفرق بينها بشكل محدد. كذلك في استبانة تقييم الزبائن للمنتجات قد نجد أحد المتغيرات أو السمات التي تحدد رأي الزبون في منتج معين فتأخذ أحد القيم التالية: (سيء جدًا، سيء، جيد، جيد جدًا).

إن جميع البيانات من النوع الاسمي والمنطقي والرتبي هي بيانات نوعية (بالإنجليزية: Qualitative Data)، أي أنها تصف ميزات كائن البيانات بدون تحديد كمياتها أو أحجامها. أما البيانات التي تحدد هذه القيم بطريقة كمية فإنه يطلق عليها بيانات كمية (بالإنجليزية: Quantitative Data) أو ما يمكن تسميته بشكل أكثر تحديدًا بيانات رقمية (بالإنجليزية: Numeric Data).

أنواع البيانات الكمية أو الرقمية

البيانات الكمية أو الرقمية (بالإنجليزية: Quantitative Data – Numeric Data) أو سمات البيانات الكمية أو الرقمية هي من أنواع البيانات ذات القيم القابلة للقياس، ويمكن التعبير عنها بأعداد صحيحة أو حقيقية.

كما أنها يمكن أن تكون على شكل:

  1. قياس الفترة
  2. قياس النسبة

1. بيانات القياس الفتري

بيانات قياس الفترة (بالإنجليزية: Interval-Scaled) يتم فيها تقسيم القيم إلى فترات متساوية، وقيم هذه الفترات لها ترتيب يُعتد به. ويمكن أن تكون هذه القيم موجبة أو سالبة أو حتى صفر، كما يمكن مقارنتها مع بعضها البعض وحساب الفرق فيما بينها.

مثلا، وحدات القياس المستخدمة في قياس درجات الحرارة، يتم قياسها باستخدام التدريج المئوي في أيام مختلفة من الأسبوع، حيث يمكن الحصول على قياس محدد كل يوم، ويمكن ترتيب هذه القيم تنازليًا أو تصاعديًا لمعرفة الأيام الأكثر حرارة أو الأكثر بردًا، كما يمكن حساب الفرق في درجة الحرارة بين الأيام المختلفة، وكذلك في قياس التاريخ وغيرها من السمات الشبيهة. ولكن في هذا النوع من البيانات يتم التعامل مع القيم على أنها فترات وليس قيم رقمية بحتة.

ولتوضيح هذا الأمر مثلا فإنه لا يمكن القول بأن درجة الحرارة (30) درجة مئوية هي ضعف درجة الحرارة (15) درجة مئوية. كما أنه لا يمكن القول بأنه عندما تكون درجة الحرارة صفر أنه لا توجد قيمة لها أو أنها صفر حقيقي، وكذلك في حالة سمة التاريخ فإن السنة صفر ميلاية لا تعني أنها بداية العالم.

ومع ذلك فإنه يمكن حساب الفرق بين درجات الحرارة المختلفة كما يمكن حساب القيم الإحصائية المختلفة لها كالوسط والوسيط والموضحة بالتفصيل في موضوع التحليل الإحصائي للبيانات.

2. بيانات القياس النسبي

بيانات القياس النسبي (بالإنجليزية: Ratio-Scaled) هي أنواع البيانات ذات السمة الرقمية، وفيها تكون قيمة الصفر هي قيمة حقيقية، ويمكن مقارنتها معًا، كما يمكن ترتيبها وإجراء العمليات الحسابية عليها، وحساب القيم الإحصائية لها كالوسط والمنوال وغيرها. ومن أمثلة بيانات القياس المتري (سعر المنتج، العمر، الدخل،…)، فكل هذه البيانات ذات سمة رقمية من النوع النسبي ويمكن ترتيبها وإجراء العمليات الحسابية عليها ومقارنتها وحساب النسبة فيما بين كمياتها المختلفة. فإذا كان لدينا منتجين سعرهما على الترتيب (100) و (50) فإننا يمكن أن نقول أن سعر المنتج الأول هو ضعف سعر المنتج الثاني.

من جهة أخرى، فإنه يمكن تقسيم البيانات من منظور آخر كما يلي:

أنواع البيانات المنفصلة والبيانات المتصلة

أنواع البيانات ذات السمة المنفصلة يمكن أن تأخذ قيم متعددة ولكنها محدودة بعدد معين، ومن أمثلتها سمة المهنة.

فهناك عدد محدود من المهن، أي أنها تنتمي لفئة معدودة ومنتهية، كما أنها يمكن أن تكون قيم اسمية أو رقمية، مثلما يحدث عند استخدام النظام الثنائي في الحاسوب (0، 1)، أو حتى في حقل العمر الذي يتم تحديده بالسنوات ضمن مجموعة محددة من الأرقام مثلا (من 0 إلى 100).

أما إذا لم تكن السمة منفصلة فتكون متصلة، وهذا يعني أن القيم المحتملة لها هي قيم غير محدودة وغير معدودة، تمثل فئة الأعداد الحقيقية، ويمكن أن تكون قيم أعداد طبيعية ولكنها لا يمكن حصرها في مجموعة محددة ومنتهية من القيم.

أي أن قيمها تنتمي لمجموعة أعداد غير منتهية وغير محددة.

ومن أمثلتها حقول مثل (سعر المنتج).

لمزيد من الاطلاع حول هذه الموضوع من منظور البحث العلمي، فيما يلي مقترح موضوع للقراءة:

المتغيرات في البحث العلمي – أنواعها واستخداماتها

كناب البحث العلمي – مركز البحوث والدراسات متعدد التخصصات

المصدر

  • كتاب التحليل المتقدم وتنقيب البيانات، د.م. مصطفى عبيد، دار الفكر العربي، القاهرة، الطبعة الأولى، 2017.
  • موسوعة الرياضيات والإحصاء، مركز البحوث والدراسات متعدد التخصصات 2020.
أنواع البيانات وتقسيماتها وخصائصها
أنواع البيانات وتقسيماتها وخصائصها

أحدث إصدارات مركز البحوث والدراسات متعدد التخصصات، تطبيق اختبارات متعددة التخصصات