كتاب تنقيب البيانات

كتاب تنقيب البيانات

المحتويات

 

تنقيب البيانات المعقدة Complex Data Types

ما هو تنقيب البيانات المعقدة تُستخدم الخوارزميات وتقنيات تحليل و تنقيب البيانات المعقدة في مجالات عديدة تزداد اتساعاً يومياً وتزداد معها التحديات في مواجهة أنواع البيانات المتعددة والأكثر تعقيداً، كما تتنوع اتجاهات بحوث التنقيب وفقاً لتنوع وتعدد تلك المجالات، ويزداد استخدامها في هذا العصر في مجال الذكاء الاصطناعي الذي يهدف إلى تسهيل الحياة اليومية للبشر …

تنقيب البيانات المعقدة Complex Data Types قراءة المزيد »

كفاءة خوارزميات التصنيف وتقييمها ومعايير اختيارها

ملخص المحتوى شرح طرق تقييم كفاءة خوارزميات التصنيف ومعايير اختيار خوارزمية التصنيف المناسبة بحسب الاحتياج مع التوضيح بالأمثلة التطبيقية، قياس نسبة صحة خوارزميات التصنيف، شرح مشكلة اختلال التوازن في خوارزميات التصنيف، قياس الحساسية والنوعية، قياس الدقة والمثالية، قياس السرعة والمتانة وقابلية التوسع وقابلية التفسير لخوارزميات التصنيف. مفهوم تقييم كفاءة خوارزميات التصنيف بعد بناء أحد الخوارزميات …

كفاءة خوارزميات التصنيف وتقييمها ومعايير اختيارها قراءة المزيد »

التحليل الإحصائي للبيانات – مقدمة في الإحصاء الوصفي

مفهوم التحليل الإحصائي للبيانات من أجل إنجاح مرحلة تحضير البيانات للتنقيب ومن ثم إنجاح عمليات تنقيب البيانات نفسها وسائر إجراءات البحث العلمي بكافة أشكاله، فإنه من الضروري أن يكون لدينا صورة وصفية عامة للبيانات التي يتم التخطيط للتنقيب فيها، ويتم ذلك من خلال التحليل الإحصائي الوصفي لهذه البيانات (بالإنجليزية: Statistical Data Analysis). ويمكن الحصول على الصورة …

التحليل الإحصائي للبيانات – مقدمة في الإحصاء الوصفي قراءة المزيد »

التصنيف باستخدام خوارزمية الجار الأقرب

ملخص المحتوى شرح وتبسيط أسلوب التصنيف باستخدام خوارزمية الجار الأقرب والطرق المختلفة لتطبيقها واستخداماتها في المجالات المتعددة. وشرح مفهوم الثقة في نتائج الاستكشاف الذي يتم التوصل إليه باستخدام الخوارزمية. خوارزمية الجار الأقرب تُعتبر خوارزمية الجار الأقرب (بالإنجليزية: Nearest Neighbor Algorithm) من تقنيات التنقيب في البيانات، وهي من خوارزميات التصنيف والتنبؤ التي تهدف للتنبؤ عن طريق …

التصنيف باستخدام خوارزمية الجار الأقرب قراءة المزيد »

التصنيف باستخدام نظرية الاحتمالات

ملخص المحتوى شرح وتسيط نظرية الاحتمالات أو النظرية الافتراضية واستخدامها في خوارزميات التصنيف في تنقيب البيانات مع توضيح الخطوات العملية بالأمثلة التطبيقية المبسطة المستخدمة في التصنيف باستخدام نظرية الاحتمالات. المقصود بـ التصنيف باستخدام نظرية الاحتمالات التصنيف باستخدام نظرية الاحتمالات أو النظرية الافتراضية، هي طريقة تصنيف إحصائية وتعتمد فكرتها على بناء الاحتمالات، وذلك من خلال التنبوء …

التصنيف باستخدام نظرية الاحتمالات قراءة المزيد »

تنقيب واستكشاف الأنماط النادرة و الأنماط السلبية

مفهوم الأنماط النادرة والأنماط السلبية إن جميع قواعد التبعية والارتباط والأنماط المتكررة التي يتم استكشافها هي تلك التي ترتفع فيها معدلات التكرار في قواعد البيانات، ومع ذلك فقد يكون من الشيق أيضاً أن يتم استكشاف الأنماط قليلة التكرار بدلاً من الأنماط كثيرة التكرار، أو استكشاف الأنماط التي تعكس علاقة ارتباط عكسية بين المتغيرات المختلفة، وهذه …

تنقيب واستكشاف الأنماط النادرة و الأنماط السلبية قراءة المزيد »

التصوير المرئي للبيانات Data Visualization

ملخص المحتوى التصوير المرئي للبيانات وأساليبه المختلفة التصوير البكسلي للبيانات تصوير البيانات باستخدام تقنية الإسقاط الهندسي مصفوفة القطع المبعثرة تصوير البيانات باستخدام تقنية الأيقونات تصوير البيانات باستخدام تقنية التصوير الهرمي تصوير البيانات والعلاقات المعقدة تصوير البيانات وعلاقات الارتباط التصوير البكسلي للبيانات التصوير البكسلي للبيانات (بالإنجليزية: Pixel-Oriented Visualization) هي طريقة سهلة للتعبير المرئي عن البيانات أو …

التصوير المرئي للبيانات Data Visualization قراءة المزيد »

مستودعات البيانات – تعريفها ومميزاتها وأهميتها وبنيتها

ملخص المحتوى مقدمة عن مستودعات البيانات وتعريف مستودع البيانات، الاختلافات بين أنظمة قواعد البيانات التشغيلية ومستودعات البيانات، والحاجة إلى استخدام مستودعات البيانات لتحليل البيانات، بدلاً من إجراء التحليل مباشرة على قواعد البيانات التقليدية. عرض بنية مستودع البيانات، ثلاثة نماذج لمستودعات البيانات – نموذج المؤسسة، ومركز البيانات، والمستودع الافتراضي. الأدوات المساعدة الخلفية لتخزين البيانات، مثل الاستخراج …

مستودعات البيانات – تعريفها ومميزاتها وأهميتها وبنيتها قراءة المزيد »

قياس تشابه واختلاف البيانات

مفهوم تشابه واختلاف البيانات في معظم تقنيات تحليل وتنقيب البيانات، مثل خوارزمية التحليل العنقودي وخوارزمية الجار الأقرب، تظهر الحاجة إلى قياس تشابه واختلاف البيانات من أجل تقييم مدى التشابه والاختلاف فيما بين البيانات. مثلاً قد يحتاج أحد المراكز التجارية إلى تجزئة زبائنه إلى مجموعات ذات خصائص مميزة، كأن يقوم بتجميع الزبائن المتشابهين في الدخل أو …

قياس تشابه واختلاف البيانات قراءة المزيد »

أدوات تنقيب البيانات – برنامج Orange

ما هو برنامج Orange أحد أدوات تنقيب البيانات برنامج Orange من الأدوات المتخصصة في تنقيب البيانات وهو يعتبر بيئة برمجية شاملة مفتوحة المصدر توفر أدوات وتقنيات التنقيب في قواعد البيانات وتعلم الآلة. وقد تم تطوير البرنامج في مختبر المعلوماتية الحيوية بكلية علوم الكمبيوتر والمعلومات، جامعة ليوبليانا، سلوفينيا. برنامج Orange هو برنامج مجاني، يمكنك إعادة توزيعه …

أدوات تنقيب البيانات – برنامج Orange قراءة المزيد »

Don`t copy text!