قراءة ملفات قاعدة البيانات في SPSS

يمكنك قراءة البيانات بأي تنسيق لقواعد البيانات ضمن برنامج تشغيل ملفات قاعدة البيانات في SPSS. في وضع التحليل المحلي، يجب تثبيت برامج التشغيل الضرورية على الحاسوب المحلي الخاص بك. في وضع التحليل الموزع (المتوفر مع خادم SPSS)، يجب تثبيت برامج التشغيل على الخادم البعيد. راجع موضوع وضع التحليل الموزع لمزيد من المعلومات.

ملاحظة: إذا كنت تقوم بتشغيل إصدار Windows 64 بت من SPSS، فلا يمكنك قراءة مصادر قاعدة بيانات Excel أو Access أو dBASE، على الرغم من أنها قد تظهر في قائمة مصادر قاعدة البيانات المتاحة. برامج تشغيل ODBC 32 بت لهذه المنتجات غير متوافقة.

فيما يلي سوف يتم شرح طرق كل من:

خطوات قراءة ملفات قاعدة البيانات في SPSS
اختيار مصدر البيانات
تحديد حقول البيانات
تكوين علاقة بين الجداول
حساب الحقول الجديدة
تحديد الحالات المسترجعة
تكوين استعلام معلمة
تحديد المتغيرات
النتائج

خطوات قراءة ملفات قاعدة البيانات في SPSS

1. اختر من القوائم:

ملف> استيراد البيانات> قاعدة البيانات> استعلام جديد …

File > Import Data > Database > New Query…

(أو اختر تحرير الاستعلام للعمل على استعلام محفوظ)

2. حدد مصدر البيانات.

3. إذا لزم الأمر (اعتمادًا على مصدر البيانات)، حدد ملف قاعدة البيانات و / أو أدخل اسم تسجيل الدخول وكلمة المرور والمعلومات الأخرى.

4. ثم حدد الجدول (الجداول) والحقول. بالنسبة لمصادر بيانات OLE DB (متوفرة فقط في أنظمة تشغيل Windows)، يمكنك تحديد جدول واحد فقط.

5. حدد أي علاقات بين الجداول الخاصة بك.

اختياريًا:

حدد أي معايير اختيار لبياناتك.
ثم أضف مطالبة لإدخال المستخدم لإنشاء استعلام معلمات.
احفظ الاستعلام الذي تم إنشاؤه قبل تشغيله.

يمكنك قراءة البيانات من أي تنسيق لقاعدة البيانات لديك برنامج تشغيل قاعدة بيانات. في وضع التحليل المحلي، يجب تثبيت برامج التشغيل الضرورية على الحاسوب المحلي الخاص بك. في وضع التحليل الموزع (المتوفر مع إصدار الخادم)، يجب تثبيت برامج التشغيل على الخادم البعيد.

لإضافة مصادر البيانات في وضع التحليل الموزع، راجع مسؤول النظام لديك.

تجمع الاتصال

إذا قمت بالوصول إلى نفس مصدر ملفات قاعدة البيانات في SPSS عدة مرات في نفس الجلسة أو الوظيفة، يمكنك تحسين الأداء من خلال تجميع الاتصالات.

1. في الخطوة الأخيرة من المعالج، الصق بناء جملة الأمر في نافذة بناء الجملة.

2. في نهاية سلسلة الاتصال المقتبسة، أضف Pooling = true.

اختيار مصدر البيانات

استخدم الشاشة الأولى من معالج ملفات قاعدة البيانات في SPSS لتحديد نوع مصدر البيانات المراد قراءته.

مصادر بيانات ODBC

إذا لم يكن لديك أي مصادر بيانات ODBC تم تكوينها، أو إذا كنت تريد إضافة مصدر بيانات جديد، فانقر فوق إضافة مصدر بيانات ODBC.

في أنظمة تشغيل Linux، لا يتوفر هذا الزر. يتم تحديد مصادر بيانات ODBC في odbc.ini، ويجب تعيين متغيرات بيئة ODBCINI إلى موقع هذا الملف. لمزيد من المعلومات، راجع الوثائق الخاصة ببرامج تشغيل قاعدة البيانات.
في وضع التحليل الموزع (المتوفر مع IBM® SPSS® Statistics Server)، لا يتوفر هذا الزر. لإضافة مصادر البيانات في وضع التحليل الموزع، راجع مسؤول النظام لديك.

يتكون مصدر بيانات ODBC من جزأين أساسيين من المعلومات: برنامج التشغيل الذي سيتم استخدامه للوصول إلى البيانات وموقع قاعدة البيانات التي تريد الوصول إليها. لتحديد مصادر البيانات، يجب أن يكون لديك برامج التشغيل المناسبة مثبتة. يتم تضمين برامج تشغيل لمجموعة متنوعة من تنسيقات قواعد البيانات مع وسائط التثبيت.

تحديد حقول البيانات

تتحكم خطوة تحديد البيانات في الجداول والحقول التي تتم قراءتها. تتم قراءة حقول (أعمدة) قاعدة البيانات كمتغيرات.

إذا كان الجدول يحتوي على أي حقل (حقول) محدد، فستظهر جميع حقوله في نوافذ معالج قاعدة البيانات التالية، ولكن سيتم استيراد الحقول المحددة في هذه الخطوة كمتغيرات فقط. يمكّنك هذا من إنشاء روابط الجدول وتحديد المعايير باستخدام الحقول التي لا تقوم باستيرادها.

عرض أسماء الحقول: لسرد الحقول في جدول، انقر فوق علامة الجمع (+) على يسار اسم الجدول. لإخفاء الحقول، انقر فوق علامة الطرح (-) الموجودة على يسار اسم الجدول.

لإضافة حقل: انقر نقرًا مزدوجًا فوق أي حقل في قائمة “الجداول المتوفرة”، أو اسحبه إلى قائمة “استرداد الحقول في هذا الترتيب”. يمكن إعادة ترتيب الحقول عن طريق سحبها وإفلاتها داخل قائمة الحقول.

لإزالة حقل: انقر نقرًا مزدوجًا فوق أي حقل في قائمة Retrieve Fields In This Order، أو اسحبه إلى قائمة الجداول المتوفرة.

لفرز أسماء الحقول: إذا تم تحديد خانة الاختيار هذه، فسيعرض معالج قاعدة البيانات الحقول المتاحة بترتيب أبجدي.

بشكل افتراضي، تعرض قائمة الجداول المتوفرة جداول قاعدة البيانات القياسية فقط. يمكنك التحكم في نوع العناصر المعروضة في القائمة:

الجداول. جداول قاعدة البيانات القياسية.
الرؤى. طرق العرض عبارة عن “جداول” افتراضية أو ديناميكية تحددها الاستعلامات. يمكن أن تتضمن هذه الصلات العديد من الجداول و / أو الحقول المشتقة من العمليات الحسابية بناءً على قيم الحقول الأخرى.
المرادفات. المرادف هو اسم مستعار لجدول أو طريقة عرض، وعادة ما يتم تحديده في طلب بحث.
جداول النظام. تحدد جداول النظام خصائص قاعدة البيانات. في بعض الحالات، قد يتم تصنيف جداول قاعدة البيانات القياسية كجداول نظام ولن يتم عرضها إلا إذا حددت هذا الخيار. غالبًا ما يقتصر الوصول إلى جداول النظام الحقيقية على مسؤولي قواعد البيانات.

ملاحظة: بالنسبة لمصادر بيانات OLE DB (متوفرة فقط في أنظمة تشغيل Windows)، يمكنك تحديد الحقول فقط من جدول واحد. صلات الجدول المتعددة غير معتمدة لمصادر بيانات OLE DB.

تكوين علاقة بين الجداول

تسمح لك خطوة تحديد العلاقات بتعريف العلاقات بين الجداول لمصادر بيانات ODBC. إذا تم تحديد الحقول من أكثر من جدول واحد، فيجب تحديد صلة واحدة على الأقل.

إنشاء العلاقات: لإنشاء علاقة، اسحب حقلاً من أي جدول إلى الحقل الذي تريد الانضمام إليه. سيرسم معالج قاعدة البيانات خط ربط بين الحقلين، للإشارة إلى علاقتهما. يجب أن تكون هذه الحقول من نفس نوع البيانات.

ربط تلقائي بجداول: يحاول ضم الجداول تلقائيًا بناءً على المفاتيح الأساسية / الخارجية أو مطابقة أسماء الحقول ونوع البيانات.

نوع الربط: إذا كان برنامج التشغيل الخاص بك يدعم الصلات الخارجية، فيمكنك تحديد الصلات الداخلية أو الصلات الخارجية اليسرى أو الصلات الخارجية اليمنى.

صلة داخلية: تتضمن الصلة الداخلية الصفوف فقط حيث تتساوى الحقول المرتبطة.
الصلات الخارجية: بالإضافة إلى المطابقة الفردية مع الصلات الداخلية، يمكنك أيضًا استخدام الصلات الخارجية لدمج الجداول بنظام المطابقة واحد إلى متعدد. على سبيل المثال، يمكنك مطابقة جدول لا يوجد فيه سوى عدد قليل من السجلات التي تمثل قيم البيانات والتسميات الوصفية المرتبطة بقيم في جدول يحتوي على مئات أو آلاف السجلات التي تمثل المستجيبين للاستطلاع. تتضمن الصلة الخارجية اليسرى كافة السجلات من الجدول الموجود على اليسار، ومن الجدول الموجود على اليمين، تتضمن فقط تلك السجلات التي تتساوى فيها الحقول المرتبطة. في الصلة الخارجية اليمنى، تستورد الصلة كافة السجلات من الجدول الموجود على اليمين، ومن الجدول الموجود على اليسار، كما أنها تستورد فقط تلك السجلات التي تتساوى فيها الحقول المرتبطة.

حساب الحقول الجديدة

إذا كنت في الوضع الموزع، ومتصلًا بخادم بعيد (متاح مع خادم IBM® SPSS® Statistics Server)، فيمكنك حساب الحقول الجديدة قبل قراءة البيانات في IBM SPSS Statistics.

يمكنك أيضًا حساب الحقول الجديدة بعد قراءة البيانات في إحصائيات IBM SPSS، ولكن حساب الحقول الجديدة في قاعدة البيانات يمكن أن يوفر الوقت لمصادر البيانات الكبيرة.

اسم حقل جديد: يجب أن يتوافق الاسم مع قواعد اسم متغير SPSS.

التعبير Expression: أدخل التعبير لحساب الحقل الجديد. يمكنك سحب أسماء الحقول الموجودة من قائمة الحقول والوظائف من قائمة الوظائف.

تحديد الحالات المسترجعة

تسمح لك خطوة الحد من الحالات المستردة بتحديد المعايير لتحديد مجموعات فرعية من الحالات (الصفوف). تتكون الحالات المحددة بشكل عام من ملء شبكة المعايير بالمعايير. تتكون المعايير من تعبيرين وبعض العلاقة بينهما. تعيد التعبيرات قيمة صواب أو خطأ أو مفقود لكل حالة.

إذا كانت النتيجة صحيحة، يتم تحديد الحالة.
إذا كانت النتيجة خاطئة أو مفقودة، فلن يتم تحديد الحالة.
تستخدم معظم المعايير واحدًا أو أكثر من العوامل العلائقية الستة (<،>، <=،>=، =، <>).
يمكن أن تتضمن التعبيرات أسماء الحقول، والثوابت، والمعاملات الحسابية، والدوال الرقمية وغيرها، والمتغيرات المنطقية. يمكنك استخدام الحقول التي لا تخطط لاستيرادها كمتغيرات.

لبناء معاييرك، تحتاج إلى تعبيرين على الأقل وعلاقة لربط التعبيرات.

1. لإنشاء تعبير، اختر إحدى الطرق التالية:

في خلية تعبير، اكتب أسماء الحقول أو الثوابت أو عوامل التشغيل الحسابية أو الدالات الرقمية وغيرها أو المتغيرات المنطقية.
انقر نقرًا مزدوجًا فوق الحقل في قائمة الحقول.
ثم اسحب الحقل من قائمة الحقول إلى خلية تعبير.
اختر حقلاً من القائمة المنسدلة في أي خلية تعبير نشطة.

2. لاختيار عامل التشغيل العلائقي (مثل = أو>)، ضع المؤشر في خلية العلاقة واكتب عامل التشغيل أو اختره من القائمة المنسدلة.

إذا كان SQL يحتوي على جمل WHERE مع تعبيرات لتحديد الحالة، فيجب تحديد التواريخ والأوقات في التعبيرات بطريقة خاصة (بما في ذلك الأقواس المتعرجة الموضحة في الأمثلة):

يجب تحديد القيم الحرفية للتاريخ باستخدام النموذج العام {d ‘yyyy-mm-dd’}.
ويجب تحديد القيم الحرفية للوقت باستخدام الصيغة العامة {t ‘hh: mm: ss’}.
يجب تحديد التاريخ / الوقت (الطوابع الزمنية) باستخدام الصيغة العامة {ts ‘yyyy-mm-dd hh: mm: ss’}.
ويجب وضع القيمة الكاملة للتاريخ و / أو الوقت في علامات اقتباس فردية. يجب التعبير عن السنوات في شكل مكون من أربعة أرقام، ويجب أن تحتوي التواريخ والأوقات على رقمين لكل جزء من القيمة. على سبيل المثال، 1 يناير 2005، 1:05 صباحًا سيتم التعبير عنها على النحو التالي:

{ts ‘2005-01-01 01:05:00’}

الدوال Functions

يتم توفير مجموعة مختارة من دالات SQL المضمنة الحسابية والمنطقية والسلسلة والتاريخ والوقت. يمكنك سحب دالة من القائمة إلى التعبير، أو يمكنك إدخال أي دالة SQL صالحة. راجع وثائق قاعدة البيانات الخاصة بك للحصول على وظائف SQL الصالحة.

استخدم أسلوب أخذ العينات العشوائية Use Random Sampling

يحدد هذا الخيار عينة عشوائية من الحالات من مصدر البيانات. بالنسبة لمصادر البيانات الكبيرة، قد ترغب في قصر عدد الحالات على عينة تمثيلية صغيرة، مما قد يؤدي إلى تقليل الوقت المستغرق لتشغيل الإجراءات بشكل ملحوظ. أخذ العينات العشوائية الأصلية، إذا كان متاحًا لمصدر البيانات، يكون أسرع من أخذ العينات العشوائية من إحصائيات IBM® SPSS®، لأن أخذ العينات العشوائية من IBM SPSS Statistics لا يزال يتعين عليه قراءة مصدر البيانات بالكامل لاستخراج عينة عشوائية.

بالتقريب Approximately: يولد عينة عشوائية تقارب النسبة المئوية المحددة للحالات. نظرًا لأن هذا الروتين يتخذ قرارًا عشوائيًا كاذبًا لكل حالة، فإن النسبة المئوية للحالات المختارة يمكن أن تقارب النسبة المئوية المحددة فقط. كلما زاد عدد الحالات الموجودة في ملف البيانات، كلما اقتربت النسبة المئوية للحالات المختارة من النسبة المئوية المحددة.
بالضبط Exactly: يختار عينة عشوائية لعدد محدد من الحالات من العدد الإجمالي المحدد للحالات. إذا تجاوز العدد الإجمالي للحالات المحددة العدد الإجمالي للحالات في ملف البيانات، فستحتوي العينة على حالات أقل نسبيًا من العدد المطلوب.

ملاحظة: إذا كنت تستخدم عينات عشوائية، فلن يكون التجميع متاحًا (متاحًا في الوضع الموزع مع خادم IBM SPSS Statistics Server).

موجه للحصول على قيمة

يمكنك تضمين مطالبة في الاستعلام الخاص بك لإنشاء استعلام معلمات. عندما يقوم المستخدمون بتشغيل الاستعلام، سيُطلب منهم إدخال المعلومات (بناءً على ما هو محدد هنا). قد ترغب في القيام بذلك إذا كنت بحاجة إلى مشاهدة طرق عرض مختلفة لنفس البيانات. على سبيل المثال، قد ترغب في تشغيل نفس الاستعلام للاطلاع على أرقام المبيعات لأرباع مالية مختلفة.

3. ضع المؤشر في أي خلية تعبير، وانقر فوق المطالبة بالقيمة Prompt For Value لإنشاء موجه.

تكوين استعلام معلمة

استخدم خطوة الموجه Prompt للقيمة لإنشاء مربع حوار يطلب معلومات من المستخدمين في كل مرة يقوم أحد الأشخاص بتشغيل استعلامك. هذه الميزة مفيدة إذا كنت تريد الاستعلام عن مصدر البيانات نفسه باستخدام معايير مختلفة.

لإنشاء موجه، أدخل سلسلة مطالبة وقيمة افتراضية. يتم عرض سلسلة المطالبة في كل مرة يقوم فيها المستخدم بتشغيل الاستعلام الخاص بك. يجب أن تحدد السلسلة نوع المعلومات المطلوب إدخالها. إذا كان المستخدم لا يختار من قائمة، يجب أن تعطي السلسلة تلميحات حول كيفية تنسيق الإدخال. مثال على ذلك: أدخل A Quarter (Q1، Q2، Q3، …).

السماح للمستخدم بتحديد قيمة من القائمة: إذا تم تحديد خانة الاختيار هذه، يمكنك تقييد المستخدم بالقيم التي تضعها هنا. تأكد من أن القيم الخاصة بك مفصولة بالعوائد.

نوع البيانات: اختر نوع البيانات هنا (رقم أو سلسلة أو تاريخ).

يجب إدخال قيم التاريخ والوقت بطريقة خاصة:

يجب أن تستخدم قيم التاريخ الصيغة العامة yyyy-mm-dd.
ويجب أن تستخدم قيم الوقت الصيغة العامة: hh: mm: ss.
ويجب أن تستخدم قيم التاريخ / الوقت (الطوابع الزمنية) الصيغة العامة yyyy-mm-dd hh: mm: ss.

تجميع البيانات

إذا كنت في الوضع الموزع، ومتصلًا بخادم بعيد (متاح مع IBM® SPSS® Statistics Server)، فيمكنك تجميع البيانات قبل قراءتها في IBM SPSS Statistics.

يمكنك أيضًا تجميع البيانات بعد قراءتها في IBM SPSS Statistics، ولكن التجميع المسبق قد يوفر الوقت لمصادر البيانات الكبيرة.

لإنشاء بيانات مجمعة، حدد متغيرًا واحدًا أو أكثر من المتغيرات التي تحدد كيفية تجميع الحالات.
حدد واحدًا أو أكثر من المتغيرات المجمعة.
ثم حدد دالة تجميعية لكل متغير إجمالي.
اختياريًا، قم بإنشاء متغير يحتوي على عدد الحالات في كل مجموعة فاصل.

ملاحظة: إذا كنت تستخدم عينات عشوائية من SPSS، فلن يكون التجميع متاحًا.

تحديد المتغيرات

أسماء وتسميات المتغير Variable names and labels: يتم استخدام اسم حقل (عمود) قاعدة البيانات الكامل كتسمية متغير. ما لم تقم بتعديل اسم المتغير، يقوم معالج قاعدة البيانات بتعيين أسماء متغيرات لكل عمود من قاعدة البيانات بإحدى طريقتين:

إذا كان اسم حقل قاعدة البيانات يشكل اسمًا صالحًا ومتغيرًا فريدًا، فسيتم استخدام الاسم كاسم متغير.
إذا كان اسم حقل قاعدة البيانات لا يشكل اسمًا صالحًا ومتغيرًا فريدًا، فسيتم إنشاء اسم فريد جديد تلقائيًا. للحصول على معلومات حول قواعد تسمية المتغيرات، راجع أسماء المتغيرات.

انقر فوق أي خلية لتحرير اسم المتغير.

تحويل السلاسل إلى قيم رقمية: حدد مربع Recode to Numeric لمتغير سلسلة إذا كنت تريد تحويله تلقائيًا إلى متغير رقمي. يتم تحويل قيم السلسلة إلى قيم أعداد صحيحة متتالية بناءً على الترتيب الأبجدي للقيم الأصلية. يتم الاحتفاظ بالقيم الأصلية كعناوين قيم للمتغيرات الجديدة.

العرض لحقول السلسلة عرض المتغير: يتحكم هذا الخيار في عرض قيم سلسلة “عرض المتغير” variable-width. بشكل افتراضي، يكون العرض 255 بايت، وستتم قراءة أول 255 بايت فقط (عادةً 255 حرفًا في اللغات أحادية البايت). يمكن أن يصل العرض إلى 32767 بايت. على الرغم من أنك ربما لا ترغب في اقتطاع قيم السلسلة، إلا أنك لا تريد أيضًا تحديد قيمة كبيرة غير ضرورية، مما يؤدي إلى عدم كفاءة المعالجة.

تقليل عرض السلسلة استنادًا إلى القيم المرصودة: قم بتعيين عرض كل متغير سلسلة تلقائيًا إلى أطول قيمة يتم ملاحظتها.

فرز الحالات

إذا كنت في الوضع الموزع، ومتصلا بخادم بعيد (متاح مع SPSS Server)، فيمكنك فرز البيانات قبل قراءتها في SPSS.

يمكنك أيضًا فرز البيانات بعد قراءتها في SPSS، ولكن الفرز المسبق قد يوفر الوقت لمصادر البيانات الكبيرة.

النتائج

تعرض خطوة النتائج جملة SQL Select لاستعلامك.

يمكنك تحرير عبارة SQL Select قبل تشغيل الاستعلام، ولكن إذا قمت بالنقر فوق الزر “السابق” لإجراء تغييرات في الخطوات السابقة، فستفقد التغييرات التي تم إجراؤها على عبارة Select.
لحفظ الاستعلام لاستخدامه في المستقبل، استخدم قسم حفظ الاستعلام في ملف.
للصق بنية GET DATA الكاملة في نافذة بناء الجملة، حدد لصقها في محرر بناء الجملة لمزيد من التعديل. لن يؤدي نسخ ولصق عبارة التحديد من نافذة النتائج إلى لصق صيغة الأمر اللازمة.

ملاحظة: يحتوي بناء الجملة الذي تم لصقه على مسافة فارغة قبل علامة اقتباس الإغلاق على كل سطر من SQL يتم إنشاؤه بواسطة المعالج. هذه الفراغات ليست زائدة عن الحاجة. عند معالجة الأمر، يتم دمج جميع أسطر عبارة SQL معًا بطريقة حرفية للغاية. بدون المسافة، لن تكون هناك مسافة بين الحرف الأخير في سطر واحد والحرف الأول في السطر التالي.

معلومات ملف البيانات

يحتوي ملف البيانات على أكثر بكثير من البيانات الأولية. يحتوي أيضًا على أي معلومات تعريف متغير، بما في ذلك:

أسماء المتغير Variable names
تنسيقات المتغير Variable formats
المتغير الوصفي وتسميات القيمة Descriptive variable and value labels

يتم تخزين هذه المعلومات في جزء القاموس من ملف البيانات. يوفر محرر البيانات طريقة واحدة لعرض معلومات تعريف المتغير. يمكنك أيضًا عرض معلومات القاموس الكاملة لمجموعة البيانات النشطة أو أي ملف بيانات آخر.

لعرض معلومات ملف البيانات

1. من القوائم في نافذة محرر البيانات، اختر:

ملف> عرض معلومات ملف البيانات

File > Display Data File Information

2. بالنسبة لملف البيانات المفتوحة حاليًا، اختر ملف العمل.

3. لملفات البيانات الأخرى، اختر ملف خارجي، ثم حدد ملف البيانات. يتم عرض معلومات ملف البيانات في العارض أو Viewer.

المصدر

المرجع الأساسي لبرنامج التحليل الإحصائي SPSS – قراءة ملفات قاعدة البيانات في SPSS، ترجمة وإعداد: د. م. مصطفى عبيد، مركز البحوث والدراسات متعدد التخصصات.
الموقع الرسمي لشركة آي بي إم IBM SPSS software.