الاختبارات اللامعلمية

الاختبارات اللامعلمية

تقدم الاختبارات اللامعلمية Nonparametric Tests الحد الأدنى من الافتراضات حول التوزيع الأساسي للبيانات. يمكن تجميع الاختبارات المتوفرة في مربعات الحوار هذه في ثلاث فئات عريضة بناءً على كيفية تنظيم البيانات:

  • يحلل اختبار العينة الواحدة حقلاً واحدًا.
  • يقارن الاختبار للعينات المرتبطة حقلين أو أكثر لنفس مجموعة الحالات.
  • يقوم اختبار العينات المستقلة بتحليل حقل واحد تم تجميعه حسب فئات مجال آخر.

استخدام الاختبارات اللامعلمية لدراسة بيانات بطاقة الائتمان

تتبع دراسة افتراضية لاستخدام بطاقة الائتمان الإنفاق الشهري لكل موضوع على بطاقته الأساسية لمدة عامين، مع تقسيم الإنفاق حسب نوع المعاملة (البقالة Grocery، والتجزئة Retail، والترفيه Entertainment، والسفر Travel، وغيرها). يتوافق كل سجل في مجموعة البيانات مع شهر معين من الإنفاق ونوع المعاملة، وبالتالي تتطلب البيانات التي تم جمعها لكل موضوع سنتين × 12 شهرًا في السنة × 5 أنواع من المعاملات = 120 سجلًا. يتم جمع هذه المعلومات في ملف credit_card.sav. راجع موضوع “ملفات الأمثلة” للحصول على مزيد من المعلومات. هناك سؤالان ترغب في محاولة الإجابة عليهما من مجموعة البيانات هذه وهما ما إذا كان الإنفاق على مدار الـ 24 شهرًا يختلف باختلاف نوع البطاقة الأساسية وما إذا كان الإنفاق يختلف حسب نوع المعاملة. تتطلب هذه الأسئلة أنواعًا مختلفة من الاختبارات:

  1. تختلف البطاقة الأساسية المستخدمة من موضوع لآخر، وهي واحدة لجميع السجلات في موضوع معين. لاستخدام الاختبارات اللامعلمية لاختبار ما إذا كان الإنفاق يختلف باختلاف البطاقة الأساسية، يمكنك تجميع السجلات بحيث يكون هناك سجل واحد لكل موضوع يعرض إجمالي الإنفاق لكل 24 شهرًا عبر جميع أنواع المعاملات الخمسة. يمكنك بعد ذلك استخدام الاختبارات اللامعلمية للعينات المستقلة لاختبار ما إذا كان إجمالي الإنفاق يختلف باختلاف البطاقة الأساسية.
  2. يتم تسجيل كل نوع معاملة لكل موضوع، ويتم تكرارها في السجلات لموضوع معين. لاستخدام الاختبارات اللامعلمية لاختبار ما إذا كان الإنفاق يختلف حسب نوع المعاملة، يمكنك تجميع السجلات بحيث يكون هناك سجل لكل نوع معاملة لكل موضوع يعرض إجمالي الإنفاق لكل 24 شهرًا. يمكنك بعد ذلك إعادة هيكلة البيانات من الحالات إلى المتغيرات للحصول على إعداد البيانات المطلوب لاستخدام الاختبارات اللامعلمية ذات الصلة لاختبار ما إذا كان الإنفاق يختلف حسب نوع المعاملة.

تحضير البيانات لتحليل العينات المستقلة

لضمان اتساق أسماء مجموعات البيانات التي يجب الرجوع إليها أثناء الإرشادات التالية، امنح مجموعة البيانات اسمًا.

1. من القوائم اختر: ملف> إعادة تسمية مجموعة البيانات …

File > Rename Dataset…

2. اكتب originalData كاسم جديد لمجموعة البيانات name of the dataset.

3. انقر فوق موافق OK.

ستتمكن الآن من الرجوع بسهولة إلى مجموعة البيانات هذه لاحقًا.

4. لتجميع البيانات، اختر من القوائم: البيانات> تجميع …

Data > Aggregate…

يظهر مربع حوار تجميع البيانات Aggregate Data dialog box كما يلي:

مربع حوار تجميع البيانات - الاختبارات اللامعلمية
مربع حوار تجميع البيانات – الاختبارات اللامعلمية

5. حدد هوية العميل Customer ID [custid] كمتغير فاصل break variable.

6. حدد بطاقة الائتمان الأساسية Primary credit card [card]، وعدد العناصر Number of items [items]، والمبلغ الذي تم إنفاقه Amount spent [spent] كمتغيرات للتجميع variables to aggregate.

7. حدد card_mean في قائمة ملخصات المتغيرات Summaries of Variables وانقر فوق الوظيفة Function.

8. في مربع حوار الوظائف التجميعية Aggregate Functions، في مجموعة الإحصائيات الموجزة Summary Statistics، حدد أولاً First.

9. انقر فوق متابعة Continue.

تحديد الوظيفة

10. في مربع حوار تجميع البيانات Aggregate Data في قائمة ملخصات المتغيرات أو Summaries of Variables، حدد items_mean وspent_mean وانقر فوق الوظيفة Function.

11. حدد أولاً First في مجموعة الإحصائيات الموجزة Summary Statistics كوظيفة function.

سيتم تمرير معلومات القاموس الخاصة ببطاقة الائتمان الأساسية Primary credit card [card] إلى المتغير الجديد card_first. لاحظ أنه لا يوجد فرق بين اختيار الأول First أو الأخير Last أو الحد الأدنى Minimum أو الحد الأقصى Maximum لأن قيم البطاقة الأساسية Primary card [card] هي نفسها لكل عميل.

12. انقر فوق متابعة Continue.

13. في مربع حوار تجميع البيانات Aggregate Data، حدد items_mean وspent_mean في قائمة ملخصات المتغيرات Summaries of Variables وانقر فوق الوظيفة Function.

14. حدد المجموع Sum في مجموعة الإحصائيات الموجزة Summary Statistics كوظيفة function.

15. انقر فوق متابعة أو Continue.

16. في مجموعة الحفظ Save، حدد إنشاء مجموعة بيانات جديدة تحتوي فقط على المتغيرات المجمعة Create new dataset containing only the aggregated variables واكتب عينات مستقلة independentSamples كاسم مجموعة بيانات جديدة new dataset name.

17. انقر فوق موافق OK.

الآن، مجموعة البيانات المجمعة جاهزة تقريبًا للتحليل.

18. في طريقة عرض المتغيرات Variable View في نافذة محرر البيانات Data Editor لمجموعة البيانات المستقلة الجديدة independentSamples dataset، عيِّن دور العناصر items_sum وspent_sum إلى الهدف Target.

ستتيح لك هذه التحديدات تشغيل العينات المستقلة وعينة واحدة من الاختبارات اللامعلمية على “تلقائي” automatic.

إجراء تحليل الاختبارات اللامعلمية للعينات المستقلة

أنت الآن جاهز لاختبار ما إذا كان إجمالي الإنفاق يختلف باختلاف أنواع البطاقات الأساسية.

لإجراء تحليل الاختبارات اللامعلمية لعينات مستقلة:

1. اختر من القوائم: تحليل> الاختبارات اللامعلمية> عينات مستقلة …

Analyze > Nonparametric Tests > Independent Samples…

2. في علامة التبويب الأهداف Objectives، إذا لم تكن محددة بالفعل، فحدد مقارنة التوزيعات عبر المجموعات تلقائيًا Automatically compare distributions across groups.

3. انقر فوق تشغيل Run.

بشكل افتراضي، ستختبر اختبارات العينات المستقلة الحقول المتصلة continuous والترتيبية ordinal مع دور الهدف target باستخدام حقل فئوي واحد categorical مع دور الإدخال input.

ملخص اختبار الفرضية

الشكل التالي يبين ملخص اختبار الفرضية Hypothesis test summary:

ملخص اختبار الفرضية Hypothesis test summary - الاختبارات اللامعلمية
ملخص اختبار الفرضية Hypothesis test summary – الاختبارات اللامعلمية

بشكل افتراضي، يقوم الإجراء بإنشاء كائن نموذج في عارض المخرجات output Viewer. بدلاً من ذلك، يمكنك إنشاء مخططات charts وجداول محورية pivot tables عن طريق تحديد الجداول المحورية والمخططات في مجموعة عرض المخرجات Output Display في علامة التبويب المخرجات Output في مربع الحوار تحرير> خيارات (Edit> Options). يستخدم هذا المثال كائن النموذج. من خلال تنشيط (النقر المزدوج) هذا الكائن، يمكنك الحصول على عرض تفاعلي للنموذج.

العرض الرئيسي الافتراضي هو عرض ملخص اختبار الفرضية. يشير جدول الملخص إلى أن كلاً من عدد العناصر المشتراة والمبلغ الإجمالي الذي تم إنفاقه يختلف باختلاف أنواع البطاقات الأساسية.

عرض اختبار العينات المستقلة

الشكل التالي يبين عرض اختبار العينات المستقلة، اختبار Kruskal-Wallis لـ items_sum:

عرض اختبار العينات المستقلة، اختبار Kruskal-Wallis لـ items_sum
عرض اختبار العينات المستقلة، اختبار Kruskal-Wallis لـ items_sum

يُظهر العرض المساعد الافتراضي مزيدًا من التفاصيل عن اختبار Kruskal-Wallis لـ items_sum، بما في ذلك إحصائية الاختبار ودرجات الحرية degrees of freedom للاختبار. لاحظ أنه بينما يخبرك الاختبار أن العدد الإجمالي للعناصر ليس هو نفسه بحسب نوع بطاقة الائتمان الأساسية (لأن قيمة الدلالة لها أقل من 0.05)، فإنه لا يخبرك عن البطاقات المختلفة بالفعل.

يعرض العرض أيضًا مخططات مربعة boxplots منفصلة لكل بطاقة ائتمان أساسية. تشير Boxplots إلى أن عدد العناصر التي تم شراؤها بواسطة الأشخاص الذين يستخدمون بطاقات American Express و Visa و Mastercard باعتبارها بطاقاتهم الأساسية قد اشتروا عناصر أكثر من الأشخاص الذين لديهم بطاقات Discover أو “Other” كبطاقتهم الأساسية، ولكنك ستحتاج إلى النظر إلى عرض المقارنات الثنائية من أجل التأكد.

المقارنات الثنائية

1. حدد مقارنات ثنائية Pairwise Comparisons من القائمة المنسدلة للعرض المساعد.

يظهر شكل المقارنات الثنائية Pairwise comparisons كما يلي:

المقارنات الثنائية Pairwise comparisons - الاختبارات اللامعلمية
المقارنات الثنائية Pairwise comparisons – الاختبارات اللامعلمية

يُظهر عرض المقارنات الثنائية مخطط شبكة المسافة distance network chart وجدول المقارنات comparisons table.

  • مخطط شبكة المسافة distance network chart هو تمثيل رسومي لجدول المقارنات. تتوافق الخطوط الصفراء مع فروق ذات دلالة إحصائية؛ تتوافق الخطوط السوداء مع اختلافات غير مهمة. من هذا، يمكنك أن ترى بسرعة أن هناك اختلافات بين Discover و American Express و Visa و Mastercard، وبين “Other” و American Express.
  • يوضح جدول المقارنات comparisons table النتائج العددية لجميع المقارنات الثنائية. يتوافق كل صف مع مقارنة ثنائية منفصلة ويمنحك مزيدًا من التفاصيل حول كيفية تحديد الاختلافات المهمة. الأمر الأكثر إثارة للاهتمام هنا هو أن الاختلافات (القيم الموجودة في عمود إحصائيات الاختبار Test Statistic) بين “Other” و Visa و Mastercard تكاد تقارب الاختلافات بين Discover و Visa و Mastercard، لكن الاختلافات بين “Other” و Visa و Mastercard ليست كبيرة.

انظر الآن إلى المقارنات الثنائية للمبلغ المنفق.

2. حدد spent_sum * Primary credit card (Test 2) من قائمة الحقول Fields المنسدلة.

يظهر شكل المقارنات الثنائية Pairwise comparisons كما يلي:

المقارنات الثنائية Pairwise comparisons - الاختبارات اللامعلمية
المقارنات الثنائية Pairwise comparisons – الاختبارات اللامعلمية

تظهر المقارنات الثنائية للحقل spent_sum نتائج مماثلة، على الرغم من أن الاختلاف بين “Other” و Visa ذو دلالة إحصائية. يبدو أن الاختلافات غير المهمة في “Other” في هاتين الطريقتين ترجع إلى حقيقة أن الأخطاء المعيارية للمقارنات مع “Other” أعلى من المقارنات مع Discover، والتي قد تكون بدورها بسبب عدد صغير نسبيًا من الموضوعات التي تحمل بطاقة ائتمان أساسية من نوع “أخرى” Other.

معلومات الحقل الفئوي

حدد معلومات الحقل الفئوي Categorical Field Information من القائمة المنسدلة للعرض المساعد auxiliary view.

يظهر شكل معلومات الحقل الفئوي Categorical field information كما يلي:

معلومات الحقل الفئوي Categorical field information
معلومات الحقل الفئوي Categorical field information

تؤكد طريقة العرض معلومات الحقل الفئوي Categorical Field Information على وجود عدد قليل نسبيًا من السجلات حيث يكون “أنواع أخرى” أو “Other” هو بطاقة الائتمان الأساسية.

المصدر

error:
Scroll to Top