موضوعات مختارة في علوم البيانات PDF

Summary

هذا النص هو ملخص لموضوعات مختارة في علم البيانات، يشمل تعريفًا بالمجال، وعناصر تكوينه، وأهميته، ودورة حياته. يهدف لإعطاء نظرة عامة عن علم البيانات وأهميته.

Full Transcript

‫موضوعات مختارة يف علوم البيانات‬ ‫الفصل األول‬ ‫علم البيانات‬ ‫(تمهيد)‬ ‫الوحدة التعليمية األوىل‬ ‫‪2‬‬ ‫موضوعات الوحدة التعليمية‬ ‫ علم البيانات‪.‬‬ ‫ لماذا علم البيانات؟‬ ‫ا...

‫موضوعات مختارة يف علوم البيانات‬ ‫الفصل األول‬ ‫علم البيانات‬ ‫(تمهيد)‬ ‫الوحدة التعليمية األوىل‬ ‫‪2‬‬ ‫موضوعات الوحدة التعليمية‬ ‫ علم البيانات‪.‬‬ ‫ لماذا علم البيانات؟‬ ‫التقن وعلم البيانات‪.‬‬ ‫ي‬ ‫ التطور‬ ‫ دورة حياة علم البيانات‪.‬‬ ‫‪3‬‬ ‫نواتج التعلم‬ ‫ً‬ ‫عزيزي الطالب بنهاية هذه الوحدة ستكون قادرا عىل أن‪:‬‬ ‫ُ‬ ‫تعرف علم البيانات‪.‬‬ ‫▪‬ ‫تمي عنارص تكوين علم البيانات‪.‬‬ ‫▪‬ ‫تذكر أهمية علم البيانات‪.‬‬ ‫▪‬ ‫تحدد أسباب الحاجة لظهور تخصص علم البيانات‪.‬‬ ‫▪‬ ‫تستعرض دورة حياة علم البيانات‪.‬‬ ‫▪‬ ‫تربط تسلسل العالقة بي مراحل دورة حياة علم البيانات‪.‬‬ ‫▪‬ ‫‪4‬‬ ‫علم البيانات‬ ‫تم تعريف علم البيانات بطرق مختلفة ومنها‪:‬‬ ‫هو مج ــال متع ــدد التخصص ــات‪ ،‬يرك ــز عل ــى اس ــتخراج الــرؤى والتوقعــات م ــن البيان ــات‪ ،‬وتمكيــن مراجعــة‬ ‫◼‬ ‫البيان ــات المهيكل ــة وغي ــر المهيكل ــة‪ ،‬واستكش ــافها ع ــن طري ــق عملي ــات وأدوات وأس ــاليب متنوع ــة‪.‬‬ ‫االصطناع – علم البيانات‬ ‫ي‬ ‫الهيئة السعودية للبيانات والذكاء‬ ‫واليمجة المتخصصة‪ ،‬والقدرة التحليلية المتقدمة‪ ،‬والذكاء‬ ‫هو مجال يجمع بي الرياضيات واإلحصاء‪ ،‬ر‬ ‫◼‬ ‫ً‬ ‫بخية يف المجال المستهدف وذلك الستخراج الرؤى من بيانات هذا المجال‪.‬‬ ‫ر‬ ‫ا‬ ‫ز‬ ‫االصطناع وتعلم اآللة معز‬ ‫ي‬ ‫‪IBM‬‬ ‫‪5‬‬ ‫عنارص تكوين علم البيانات‬ ‫الخبرة‬ ‫في المجال المستهدف‬ ‫التقصي‬ ‫معالجة‬ ‫االحصائي‬ ‫البيانات‬ ‫علم‬ ‫البيانات‬ ‫الرياضيات‬ ‫علوم الحاسب‬ ‫تعلم اآللة‬ ‫المصدر‪Palmer, Shelly. Data Science for the C-Suite. New York: Digital Living Press, 2015. :‬‬ ‫(مترجم)‬ ‫‪6‬‬ ‫لماذا علم البيانات؟‬ ‫برز علم البيانات لألسباب اآلتية‪:‬‬ ‫البيانات الضخمة (‪.)Big Data‬‬ ‫◼‬ ‫تعدد مصادر البيانات‪.‬‬ ‫◼‬ ‫ً‬ ‫االصطناع يف التعرف عىل البيانات آليا‪.‬‬ ‫ي‬ ‫تطور أدوات الذكاء‬ ‫◼‬ ‫وجود أطر نظرية وتحليلية وخوارزميات وأساليب تتعامل مع كافة أنواع البيانات بغض النظر عن المجال‬ ‫◼‬ ‫المستهدف‪.‬‬ ‫ توظيف هذه األطر والخوارزميات واألساليب‪.‬‬ ‫ بروز وظائف يف مجال البيانات كمحلل البيانات وعالم البيانات وغيها‪.‬‬ ‫ احتياج سوق العمل لعلماء بيانات متخصصي ويمتلكون المهارة والمعرفة بأدوات وأساليب علم‬ ‫البيانات‪.‬‬ ‫‪7‬‬ ‫دورة حياة علم البيانات‬ ‫تحديد‬ ‫وتعريف‬ ‫المشكلة‬ ‫عمليات‬ ‫جمع‬ ‫التشغيل‬ ‫وتجهيز‬ ‫والمتابعة‬ ‫البيانات‬ ‫تحليل‬ ‫النمذجة‬ ‫واكتشاف‬ ‫والتقييم‬ ‫البيانات‬ ‫‪8‬‬ ‫تحديد وتعريف المشكلة‬ ‫إيجاد المشكلة‪:‬‬ ‫تواجه المنظمات صعوبات وتحديات تعيق تحقيق بعض أهدافها‪.‬‬ ‫◼‬ ‫كذلك‪ ،‬يظهر فرص تطويرية إليجاد حلول منية عىل البيانات‪.‬‬ ‫◼‬ ‫المبن عىل البيانات‪.‬‬ ‫ي‬ ‫تعريف لها كمرحلة أولية يف الحل‬ ‫ي‬ ‫أهمية تحديد المشكلة ووضع إطار‬ ‫◼‬ ‫من يجد المشكلة؟‬ ‫عالم البيانات‪.‬‬ ‫◼‬ ‫أصحاب المصلحة‪.‬‬ ‫◼‬ ‫البحث والتطوير‪.‬‬ ‫◼‬ ‫‪9‬‬ ‫جمع وتجهي البيانات‬ ‫جمع البيانات‪:‬‬ ‫جمع البيانات مفتوحة المصدر أو المتاحة للعموم‪.‬‬ ‫◼‬ ‫جمع البيانات بشكل مباش‪.‬‬ ‫◼‬ ‫ قواعد البيانات‪.‬‬ ‫ بيانات أنظمة ر‬ ‫إنينت األشياء والحوسبة السحابية‪.‬‬ ‫االجتماع‪.‬‬ ‫ي‬ ‫ مصادر الويب ووسائل البث والتواصل‬ ‫تجهي البيانات‪:‬‬ ‫ر‬ ‫الن تم تجميعها لتظهر بصورة موحدة يسهل التعامل معها‪.‬‬ ‫العمل عىل سياق وتنظيم البيانات ي‬ ‫◼‬ ‫تخزينها يف مستودعات البيانات‪.‬‬ ‫◼‬ ‫التأكد من عدم وجود خلل أو ضياع أو عدم تناسق للبيانات‪.‬‬ ‫◼‬ ‫‪10‬‬ ‫تحليل واكتشاف البيانات‬ ‫االستكشاف (‪)Exploratory Data Analysis - EDA‬‬ ‫ي‬ ‫تحليل البيانات‬ ‫تسهم هذه العملية ف التعرف عىل البيانات واكتشاف ر‬ ‫اآلت‪:‬‬ ‫ي‬ ‫ي‬ ‫◼‬ ‫ر‬ ‫ إعطاء انطباع عن البيانات ي‬ ‫الن تتعامل معها‪.‬‬ ‫ التعرف عىل البيانات المتطرفة والشاذة والغي منطقية‪.‬‬ ‫ إثبات الفرضيات أو رفضها‪.‬‬ ‫ التأكد من عدم وجود انحياز يف الفرضيات أو التحليالت المعمول بها‪.‬‬ ‫‪11‬‬ ‫النمذجة والتقييم‬ ‫النمذجة‪:‬‬ ‫ه الركن األساس ف علوم البيانات‪ ،‬ويكون ر‬ ‫اليكي فيه عىل فهم العالقة بي أنماط وعنارص البيانات‪.‬‬ ‫◼‬ ‫ي‬ ‫ي‬ ‫يف هذه المرحلة‪ ،‬يقوم عالم البيانات بتصميم وتمرين الخوارزميات والنماذج لتحليل ومعرفة نمط البيانات‬ ‫◼‬ ‫الن تجيب عىل المشكلة أساس البحث‪.‬‬ ‫ر‬ ‫بهدف إيجاد الحلول ي‬ ‫التقييم‪:‬‬ ‫عي معايي تقييم شاملة‪.‬‬ ‫التأكد من جودة النمذجة المعمول بها وذلك بتمريرها ر‬ ‫◼‬ ‫ً‬ ‫تتنوع معايي التقييم اعتمادا عىل نوع النموذج‪.‬‬ ‫◼‬ ‫التقييم يهدف إىل صالحية النموذج بشكل عام أو ما يسىم عمومية النموذج (‪ )Generalization‬وعىل‬ ‫◼‬ ‫نطاق أوسع من البيانات‪.‬‬ ‫‪12‬‬ ‫عمليات التشغيل والمتابعة‬ ‫االحصات‪.‬‬ ‫ي‬ ‫تنته دورة حياة علوم البيانات عند الحصول عىل نتيجة النموذج التنبؤي أو‬ ‫ي‬ ‫ال‬ ‫◼‬ ‫يتم وضع هذه العمليات بعناية يف سلسلة من عمليات التشغيل وذلك بتصدير النموذج ليتم التعرف عىل‬ ‫◼‬ ‫عنارص بيانات جديدة والتنبؤ بها أو التعرف عليها‪.‬‬ ‫األوىل وتحسي دقته يف التعرف عىل األنماط‪.‬‬ ‫ي‬ ‫كذلك‪ ،‬يتم استخدام البيانات الجديدة لتحسي النموذج‬ ‫◼‬ ‫أثناء هذه المرحلة المستمرة‪ ،‬يتم متابعة النموذج بغرض‪:‬‬ ‫◼‬ ‫ مراقبة أداء النموذج الذي تم بناءه‪.‬‬ ‫ اكتشاف أي تشتت يف البيانات الجديدة المدخلة وقياس تأثيها عىل أداء النموذج‪.‬‬ ‫ تحديث وترقية النموذج‪.‬‬ ‫ التأكد من توفر معايي الخصوصية والحماية عىل البيانات والنماذج المستخدمة‪.‬‬ ‫‪13‬‬ ‫تقييم ذاتر‬ ‫ي‬ ‫‪ -1‬للتعرف عىل األنماط يف البيانات بطريقة آلية‪ ،‬نستخدم‪..........‬‬ ‫ب‪ -‬تعلم اآللة‪.‬‬ ‫أ‪ -‬تجهي البيانات‪.‬‬ ‫اآلىل‪.‬‬ ‫د‪ -‬تقييم النموذج ي‬ ‫ج‪ -‬جمع البيانات‪.‬‬ ‫‪ -2‬تتمثل الخطوة األوىل يف دورة حياة علم البيانات يف‪.............:‬‬ ‫ب‪ -‬تحليل البيانات‪.‬‬ ‫أ‪ -‬عمليات التشغيل‪.‬‬ ‫د‪ -‬تحديد المشكلة وتعريفها‪.‬‬ ‫ج‪ -‬جمع البيانات وتجهيها‪.‬‬ ‫‪ -3‬الهدف من تقييم النموذج ي‬ ‫اآلىل هو التأكد من‪............‬‬ ‫ب‪ -‬اكتمال النموذج‪.‬‬ ‫أ‪ -‬جاهزية البيانات‪.‬‬ ‫د‪ -‬عرض النتائج‪.‬‬ ‫ج‪ -‬عمومية النموذج‪.‬‬ ‫‪14‬‬ ‫الفصل األول‬ ‫علم البيانات‬ ‫(تمهيد)‬ ‫الوحدة التعليمية الثانية‬ ‫‪2‬‬ ‫موضوعات الوحدة التعليمية‬ ‫ مراجعة عنارص تكوين علم البيانات‪.‬‬ ‫االصطناع‪.‬‬ ‫ي‬ ‫ علوم الحاسب والذكاء‬ ‫ الرياضيات واإلحصاء‪.‬‬ ‫الخبة يف مجال األعمال المستهدف‪.‬‬ ‫ر‬ ‫ ‬ ‫ سمات عالم البيانات‪.‬‬ ‫‪3‬‬ ‫نواتج التعلم‬ ‫ً‬ ‫عزيزي الطالب بنهاية هذه الوحدة ستكون قادرا عىل أن‪:‬‬ ‫تعدد العنارص المكونة لعلم البيانات‪.‬‬ ‫▪‬ ‫ً‬ ‫االصطناع يف ظهور وتطور علم‬ ‫ي‬ ‫التقن خصوصا يف علوم الحاسب والذكاء‬‫ي‬ ‫تكتشف دور التطور‬ ‫▪‬ ‫البيانات‪.‬‬ ‫تتعرف عىل األدوات األساسية والمكونات الرئيسة لممارسة علم البيانات‪.‬‬ ‫▪‬ ‫الن يتحىل بها عالم البيانات‪.‬‬ ‫تصنف المهارات الصلبة والناعمة ي‬ ‫▪‬ ‫‪4‬‬ ‫عنارص تكوين علم البيانات (مراجعة)‬ ‫الخبرة‬ ‫في المجال المستهدف‬ ‫التقصي‬ ‫معالجة‬ ‫االحصائي‬ ‫البيانات‬ ‫علم‬ ‫البيانات‬ ‫الرياضيات‬ ‫علوم الحاسب‬ ‫تعلم اآللة‬ ‫المصدر‪Palmer, Shelly. Data Science for the C-Suite. New York: Digital Living Press, 2015. :‬‬ ‫(مترجم)‬ ‫‪5‬‬ ‫تابع‪ :‬عنارص تكوين علم البيانات‬ ‫بما أن علم البيانات هو تقاطع لعدة علوم ومعارف‬ ‫ومهارات‪ ،‬فإن عالم البيانات سيمتلك يف مراحل تعلمه‬ ‫الخبرة‬ ‫وتدريبه وعمله عىل أرض الواقع أدوات عدة تتوزع عىل‪:‬‬ ‫في المجال المستهدف‬ ‫اتقان مهارات حاسوبية وبرمجية وحل مشكالت باستخدام‬ ‫◼‬ ‫التقصي‬ ‫معالجة‬ ‫االحصائي‬ ‫البيانات‬ ‫االصطناع‪.‬‬ ‫ي‬ ‫أدوات تقنية وأدوات الذكاء‬ ‫علم‬ ‫البيانات‬ ‫معرفة وتطبيق األساليب الرياضية واالحصائية وتوظيفها‬ ‫◼‬ ‫الرياضيات‬ ‫علوم الحاسب‬ ‫للتحليل واالستنتاج من البيانات‪.‬‬ ‫تعلم اآللة‬ ‫المعرفة الشاملة والعميقة لمجال األعمال المستهدف وفهم‬ ‫◼‬ ‫الن تواجه مجال‬ ‫بيانات المجال وجذور المشاكل أو الفرص ي‬ ‫األعمال المستهدف‪.‬‬ ‫‪6‬‬ ‫االصطناع‬ ‫ي‬ ‫علوم الحاسب والذكاء‬ ‫االصطناع وتطبيقاته يف‬ ‫ي‬ ‫ساهم تطور الحوسبة والذكاء‬ ‫نمو علم البيانات وتوسع انتشاره يف مجاالت األعمال‬ ‫الخبرة‬ ‫المختلفة‪ ،‬وذلك ل‪:‬‬ ‫في المجال المستهدف‬ ‫تعدد الموارد الحاسوبية وتطور أداؤها مما يسهم يف‬ ‫◼‬ ‫التقصي‬ ‫معالجة‬ ‫االحصائي‬ ‫البيانات‬ ‫االصطناع‪.‬‬ ‫ي‬ ‫معالجة البيانات وبناء نماذج الذكاء‬ ‫علم‬ ‫البيانات‬ ‫ الحوسبة الشخصية‪.‬‬ ‫الرياضيات‬ ‫علوم الحاسب‬ ‫ الحوسبة المتنقلة والرشيقة‪.‬‬ ‫تعلم اآللة‬ ‫ الحوسبة المتوازية وفائقة األداء‪.‬‬ ‫ الحوسبة السحابية‪.‬‬ ‫ الحوسبة الطرفية‪.‬‬ ‫‪7‬‬ ‫االصطناع‬ ‫ي‬ ‫تابع‪ :‬علوم الحاسب والذكاء‬ ‫االصطناع وتطبيقاته يف‬ ‫ي‬ ‫ساهم تطور الحوسبة والذكاء‬ ‫نمو علم البيانات وتوسع انتشاره يف مجاالت األعمال‬ ‫الخبرة‬ ‫المختلفة‪ ،‬وذلك ل‪:‬‬ ‫في المجال المستهدف‬ ‫االصطناع‪.‬‬ ‫ي‬ ‫تطور وتوسع تطبيقات الذكاء‬ ‫◼‬ ‫التقصي‬ ‫معالجة‬ ‫االحصائي‬ ‫البيانات‬ ‫ تعلم اآللة‪.‬‬ ‫علم‬ ‫البيانات‬ ‫ التعلم العميق‪.‬‬ ‫الرياضيات‬ ‫علوم الحاسب‬ ‫االصطناع التوليدي‪.‬‬ ‫ الذكاء‬ ‫تعلم اآللة‬ ‫ي‬ ‫‪8‬‬ ‫الرياضيات واالحصاء‬ ‫تتجذر العمليات الرياضية واالحصائية لقرون عديدة‬ ‫ً‬ ‫وأصبحت أساسا للعلوم بشن أنواعها ال سيما علوم‬ ‫الخبرة‬ ‫الحاسب وعلم البيانات‪.‬‬ ‫في المجال المستهدف‬ ‫االصطناع‪.‬‬ ‫ي‬ ‫الخوارزميات ونماذج الذكاء‬ ‫◼‬ ‫التقصي‬ ‫معالجة‬ ‫االحصائي‬ ‫البيانات‬ ‫ خوارزميات تعلم اآللة‪.‬‬ ‫علم‬ ‫البيانات‬ ‫اآلل والعمليات‬ ‫ خوارزميات تسلسل أعمال التعلم‬ ‫ي‬ ‫الرياضيات‬ ‫علوم الحاسب‬ ‫االحصائية المستخدمة لبناء وتقييم نماذج الذكاء‬ ‫تعلم اآللة‬ ‫االصطناع‪.‬‬ ‫ي‬ ‫‪9‬‬ ‫تابع‪ :‬الرياضيات واالحصاء‬ ‫تتجذر العمليات الرياضية واالحصائية لقرون عديدة‬ ‫ً‬ ‫وأصبحت أساسا للعلوم بشن أنواعها ال سيما علوم‬ ‫الخبرة‬ ‫الحاسب وعلم البيانات‪.‬‬ ‫في المجال المستهدف‬ ‫العمليات والنماذج االحصائية‪.‬‬ ‫◼‬ ‫التقصي‬ ‫معالجة‬ ‫االحصائي‬ ‫البيانات‬ ‫مبن عىل البيانات‪.‬‬ ‫احصائ ي‬ ‫ي‬ ‫تقص‬ ‫ي‬ ‫ ‬ ‫علم‬ ‫البيانات‬ ‫ تدقيق واختبار الفرضيات عىل البيانات المعطاة‪.‬‬ ‫الرياضيات‬ ‫علوم الحاسب‬ ‫البيائ‪.‬‬ ‫ فهم واستعراض التوزي ع‬ ‫تعلم اآللة‬ ‫ي‬ ‫‪10‬‬ ‫الخبة يف المجال المستهدف‬ ‫ر‬ ‫يركز علم البيانات عىل حل مشكالت أو تحقيق فرص أو‬ ‫تنظيم وتسيب عمليات أعمال المجال المستهدف‪.‬‬ ‫الخبرة‬ ‫بيانات مجال األعمال المستهدف‪.‬‬ ‫◼‬ ‫في المجال المستهدف‬ ‫ وجود كم هائل من البيانات يف مجاالت األعمال‬ ‫التقصي‬ ‫معالجة‬ ‫االحصائي‬ ‫البيانات‬ ‫المختلفة‪.‬‬ ‫علم‬ ‫البيانات‬ ‫ البيانات ال ي‬ ‫تأئ بصورة منظمة أو مجهزة يف معظم‬ ‫الرياضيات‬ ‫علوم الحاسب‬ ‫األحيان‪.‬‬ ‫تعلم اآللة‬ ‫ هذه البيانات ذات قيمة عالية وترشد أصحاب‬ ‫المصلحة لحلول مبتكرة‪.‬‬ ‫‪11‬‬ ‫الخبة يف المجال المستهدف‬ ‫تابع‪ :‬ر‬ ‫يركز علم البيانات عىل حل مشكالت أو تحقيق فرص أو‬ ‫تنظيم وتسيب عمليات أعمال المجال المستهدف‪.‬‬ ‫الخبرة‬ ‫حلول غب ظاهرة وغب بديهية‪.‬‬ ‫◼‬ ‫في المجال المستهدف‬ ‫ تظهر أنماط يف بيانات المجال المستهدف وذلك‬ ‫التقصي‬ ‫معالجة‬ ‫االحصائي‬ ‫البيانات‬ ‫المبن عىل البيانات‪.‬‬ ‫ي‬ ‫اإلحصائ‬ ‫ي‬ ‫بالتقص‬ ‫ي‬ ‫علم‬ ‫البيانات‬ ‫ يتم بناء واختبار فرضيات تخص مهام محددة يف‬ ‫الرياضيات‬ ‫علوم الحاسب‬ ‫المجال المستهدف‪.‬هذه الفرضيات قد تمثل أو تظهر‬ ‫تعلم اآللة‬ ‫حلول أعمال مبتكرة‪.‬‬ ‫ بطبيعة البيانات فإن هذه الحلول ال تظهر بشكل‬ ‫ويأئ دور علم البيانات الكتشاف أنماط‬ ‫ر‬ ‫مباش‪،‬‬ ‫ي‬ ‫البيانات والحلول الممكنة‪.‬‬ ‫‪12‬‬ ‫سمات عالم البيانات‬ ‫ً‬ ‫ا‬ ‫والن نذكرها أدناه مثال ال حرصا‪:‬‬ ‫مهارات عديدة وهامة قد يمتلكها عالم البيانات‪ ،‬ي‬ ‫الكم من أهم األدوات‬ ‫ي‬ ‫تعتب الرياضيات واالحصاء والتحليل‬ ‫ر‬ ‫المهارات الكمية (‪:)Quantitative skills‬‬ ‫◼‬ ‫النظرية والتطبيقية لعالم البيانات‪.‬‬ ‫المهارات التقنية‪ :‬اإلدراك الكامل للحلول التقنية ومواكبة تطورها‪.‬‬ ‫◼‬ ‫والن بها يقوم بطرح التساؤالت الهامة‬ ‫ي‬ ‫والتحليىل‪ :‬من أهم المهارات الناعمة لعالم البيانات‬ ‫ي‬ ‫التفكب النقدي‬ ‫◼‬ ‫والموجهة‪ ،‬وبناء رؤى وتصورات مبدئية ينتج عنها حلول مبنية عىل البيانات‪.‬‬ ‫االبتكار واإلبداع‪ :‬تعظيم االستفادة من األدوات المتاحة ودمج األساليب وعمل حلول ابتكارية‪.‬‬ ‫◼‬ ‫ً‬ ‫التواصل الفعال‪ :‬يكون ذلك مع فرق العمل المختلفة‪.‬ويكون حتميا عند التواصل مع أصحاب المصلحة‬ ‫◼‬ ‫لفهم المشكلة المراد حلها وطرح الحلول والتساؤالت‪.‬‬ ‫‪13‬‬ ‫ذائ‬ ‫تقييم ي‬ ‫‪ -1‬من األساليب اإلحصائية المستخدمة يف علم البيانات‪:‬‬ ‫ب‪ -‬التعلم العميق‪.‬‬ ‫أ‪ -‬تعلم اآللة‪.‬‬ ‫البمجة الحاسوبية‪.‬‬ ‫د‪ -‬ر‬ ‫البيائ‪.‬‬ ‫ي‬ ‫ج‪ -‬التوزي ع‬ ‫أكب قدر من أهداف ودوافع أصحاب‬ ‫الن تساعد عالم البيانات الستخالص ر‬ ‫‪ -2‬من أهم السمات ي‬ ‫المصلحة‪:‬‬ ‫ب‪ -‬االبتكار‪.‬‬ ‫أ‪ -‬التفكب النقدي‪.‬‬ ‫د‪ -‬التواصل الفعال‪.‬‬ ‫ج‪ -‬المهارات الكمية‪.‬‬ ‫والن تساعد عمليات التخزين والوصول للبيانات عن بعد‪:‬‬ ‫‪ -3‬من أهم المصادر الحاسوبية الحديثة ي‬ ‫ب‪ -‬الحوسبة السحابية‪.‬‬ ‫أ‪ -‬الحوسبة الشخصية‪.‬‬ ‫د‪ -‬الحوسبة المتوازية‪.‬‬ ‫ج‪ -‬الحوسبة المتنقلة‪.‬‬ ‫‪14‬‬ ‫الفصل األول‬ ‫تمهيد لعلم البيانات‬ ‫(الوحدة التعليمية الثالثة)‬ ‫‪2‬‬ ‫موضوعات الوحدة التعليمية‬ ‫ مفهوم البيانات‪.‬‬ ‫ مصادر وأنواع البيانات‪.‬‬ ‫ تصنيف البيانات‪.‬‬ ‫ استكشاف البيانات‪.‬‬ ‫ مجاالت استخدام علم البيانات‪.‬‬ ‫‪3‬‬ ‫نواتج التعلم‬ ‫ً‬ ‫عزيزي الطالب بنهاية هذه الوحدة ستكون قادرا عىل أن‪:‬‬ ‫ُ‬ ‫تعرف مفهوم البيانات‪.‬‬ ‫▪‬ ‫تذكر مصادر وأنواع البيانات‪.‬‬ ‫▪‬ ‫تحدد الية تصنيف البيانات‪.‬‬ ‫▪‬ ‫تستعرض طرق استكشاف البيانات‪.‬‬ ‫▪‬ ‫توضح مجاالت استخدام علم البيانات‪.‬‬ ‫▪‬ ‫‪4‬‬ ‫مفهوم البيانات‬ ‫البيانات‬ ‫الت يتم تمثيلها بتنسيق معي‪ ،‬مثل الجدول أو جدول‬ ‫مجموعة من القيم أو المالحظات أو الحقائق ي‬ ‫◼‬ ‫البيانات أو قاعدة بيانات‬ ‫تأت البيانات يف أشكال عديدة‪ ،‬مثل البيانات العددية والفئوية والنمطية والنصية‪.‬‬ ‫يمكن أن ي‬ ‫◼‬ ‫ً‬ ‫كما يمكن أن تكون منظمة أو غي منظمة‪ ،‬اعتمادا عىل كيفية تمثيلها وتخزينها‪.‬‬ ‫◼‬ ‫المعلومات‬ ‫علم والتعليم‬ ‫ال‬ ‫البحث‬ ‫لدعم‬ ‫وإتاحته‬ ‫وتنظيمه‬ ‫وجمعه‬ ‫إنشاؤه‬ ‫يتم‬ ‫مورد‬ ‫أنها‬ ‫عىل‬ ‫لها‬ ‫نظر‬ ‫اما المعلومات ُ‬ ‫في‬ ‫◼‬ ‫ي‬ ‫واألنشطة األخرى‪.‬‬ ‫يمكن أن تتخذ المعلومات أشكال عدة‪ ،‬مثل الكتب والمجالت والمقاالت والموارد الرقمية وغيها من‬ ‫◼‬ ‫المواد‪.‬‬ ‫‪5‬‬ ‫تابع‪ :‬مفهوم البيانات‬ ‫المعرفة‬ ‫ُ‬ ‫ً‬ ‫ً‬ ‫عاىل‬ ‫ي‬ ‫فهم‬ ‫أنها‬ ‫ىل‬ ‫ع‬ ‫المعرفة‬ ‫إىل‬ ‫نظر‬‫ي‬ ‫ما‬ ‫ا‬‫فغالب‬ ‫‪.‬‬‫المعلومات‬ ‫بفكرة‬ ‫ا‬‫وثيق‬ ‫يرتبط مفهوم المعرفة ارتباطا‬ ‫◼‬ ‫مبت عىل أساس المعلومات‪.‬‬ ‫المستوى أو إتقان لموضوع أو منطق معي‪ ،‬ي‬ ‫ُ‬ ‫ينظر إىل المعرفة ايضا‪ ،‬عىل أنها أصل هام التخاذ القرارات وتحقيق األهداف الشخصية والتنظيمية‪.‬‬ ‫◼‬ ‫المعرفة‬ ‫المعلومات‬ ‫البيانات‬ ‫‪6‬‬ ‫مصادر البيانات‬ ‫مصادر البيانات ]‪:[Data Sources‬‬ ‫المعامالت‪ :‬يمكن إنشاء البيانات من خالل المعامالت االدارية والمالية‪ ،‬مثل رشاء بطاقات االئتمان أو‬ ‫‪.1‬‬ ‫المعامالت المرصفية‪.‬‬ ‫االجتماع‪ ،‬مثل ‪Facebook‬‬ ‫ي‬ ‫االجتماع‪ :‬يمكن جمع البيانات من منصات وسائل التواصل‬ ‫ي‬ ‫وسائل التواصل‬ ‫‪.2‬‬ ‫و‪twitter.‬‬ ‫عي اإلنينت‪.‬‬ ‫مواقع الويب واألنظمة األساسية ر‬ ‫‪.3‬‬ ‫أجهزة االستشعار وأجهزة إنينت اآلشياء )‪ :(IoT‬مثل األجهزة القابلة لالرتداء واألجهزة الميلية الذكية‪،‬‬ ‫‪.4‬‬ ‫لتتبع المعلومات الشخصية والظروف البيئية‪.‬‬ ‫مجموعات البيانات الحكومية والعامة‪.‬‬ ‫‪.5‬‬ ‫موفرو البيانات من الطرف الثالث‪ :‬يمكن رشاء البيانات من مزودي البيانات الخارجيي مثل رشكات األبحاث‬ ‫‪.6‬‬ ‫أو وسطاء البيانات أو مزودي المعلومات المالية أو الديموغرافية‪.‬‬ ‫‪7‬‬ ‫أنواع البيانات‬ ‫هناك عدة أنواع مختلفة من البيانات‪ ،‬بما يف ذلك‪:‬‬ ‫البيانات المهيكلة‪ :‬البيانات المنظمة بتنسيق معي‪ ،‬مثل الصفوف واآلعمدة يف جدول بيانات أو الحقول يف‬ ‫‪.1‬‬ ‫قاعدة بيانات‪.‬‬ ‫الت ليس لها تنسيق معي‪ ،‬مثل النص من منشورات وسائل التواصل‬ ‫البيانات غي المهيكلة‪ :‬البيانات ي‬ ‫‪.2‬‬ ‫االجتماع‪.‬‬ ‫ي‬ ‫الت لها مستوى معي من التنظيم‪ ،‬ولكن ليس بقدر البيانات المنظمة‪.‬‬ ‫البيانات شبه المنظمة‪ :‬البيانات ي‬ ‫‪.3‬‬ ‫تتضمن اآلمثلة ملفات ‪ XML‬و ‪.JSON‬‬ ‫الت يمكن قياسها كميا واستخدامها يف العمليات الحسابية‪.‬‬ ‫البيانات العددية‪ :‬البيانات ي‬ ‫‪.4‬‬ ‫الت يمكن تقسيمها إىل فئات‪.‬‬ ‫البيانات الفئوية‪ :‬البيانات ي‬ ‫‪.5‬‬ ‫الت يمكن أن تحتوي عىل قيمتي فقط عىل سبيل المثال صح أو خطأ‪ 1 ،‬أو ‪0‬‬ ‫البيانات الثنائية‪ :‬البيانات ي‬ ‫‪.6‬‬ ‫الت يتم جمعها خالل فية زمنية‪ ،‬مثل أسعار األسهم ودرجة الحرارة‪.‬‬ ‫بيانات السالسل الزمنية‪ :‬البيانات ي‬ ‫‪.7‬‬ ‫‪8‬‬ ‫تصنيف البيانات‬ ‫تصنيف البيانات ]‪ :[Data Classification‬هو عملية تنظيم البيانات ف فئات او أصناف ً‬ ‫بناء عىل خصائص‬ ‫◼‬ ‫ي‬ ‫أو سمات معينة‪.‬‬ ‫هناك عدة طرق مختلفة لتصنيف البيانات‪ ،‬بما يف ذلك‪:‬‬ ‫◼‬ ‫تصنيف البيانات الرقمية‪ :‬يعتمد عىل القيم العددية‪ ،‬مثل العمر والوزن ودرجة الحرارة‪.‬‬ ‫‪.1‬‬ ‫اف‪.‬‬ ‫تصنيف البيانات الفئوية‪ :‬يعتمد عىل القيم الفئوية‪ ،‬مثل الجنس أو نوع المنتج أو الموقع الجغر ي‬ ‫‪.2‬‬ ‫هرم‪ ،‬حيث يتم تنظيم البيانات يف هيكل يشبه الشجرة‪،‬‬ ‫ي‬ ‫الهرم‪ :‬يعتمد عىل هيكل‬ ‫ي‬ ‫تصنيف البيانات‬ ‫‪.3‬‬ ‫مع مستويات متعددة من الفئات‪.‬‬ ‫تصنيف البيانات النصية‪ :‬يعتمد عىل البيانات النصية‪ ،‬مثل منشورات الوسائط االجتماعية أو‬ ‫‪.4‬‬ ‫مراجعات العمالء‪.‬‬ ‫تصنيف البيانات الصورية‪ :‬يعتمد عىل بيانات الصورة‪ ،‬مثل الصور الفوتوغرافية أو مقاطع الفيديو‪.‬‬ ‫‪.5‬‬ ‫‪9‬‬ ‫استكشاف البيانات‬ ‫الت يتم فيها استخدام تصورات وإحصاءات‬ ‫ه المرحلة ي‬ ‫يعد استكشاف البيانات ]‪ [Data Exploration‬ي‬ ‫◼‬ ‫موجزة لفهم البنية األساسية وخصائص البيانات‪.‬‬ ‫الت يمكن استخدامها الستكشاف البيانات‪ ،‬بما يف ذلك‪:‬‬ ‫هناك العديد من األساليب المختلفة ي‬ ‫◼‬ ‫المرت ‪Visualization -‬‬ ‫ي‬ ‫التمثيل‬ ‫‪.1‬‬ ‫إحصاءات موجزة ‪Summarization -‬‬ ‫‪.2‬‬ ‫جداول التكرار‬ ‫‪.3‬‬ ‫االرتباط واالنحدار ‪Correlation and Regression -‬‬ ‫‪.4‬‬ ‫‪10‬‬ ‫مجاالت استخدام علم البيانات‬ ‫ذكاء األعمال‬ ‫◼ يمكن استخدام علم البيانات لتحليل بيانات‬ ‫العمالء وبيانات المبيعات وغيها من البيانات‬ ‫المتعلقة بالعمال الكتساب رؤى حول سلوك‬ ‫العمالء والتنبؤ باالتجاهات المستقبلية وإبالغ‬ ‫قرارات العمل‪.‬‬ ‫كشف االحتيال‬ ‫◼ يمكن استخدام علم البيانات لتحديد اآلنماط‬ ‫الت قد تشي إىل‬ ‫والشذوذ يف المعامالت المالية ي‬ ‫االحتيال‪.‬‬ ‫‪11‬‬ ‫تابع‪ :‬مجاالت استخدام علم البيانات‬ ‫الرعاية الصحية‬ ‫◼ يمكن استخدام علم البيانات لتحليل السجالت‬ ‫الطبية والبيانات األخرى المتعلقة بالصحة لتحسي‬ ‫نتائج المرض‪ ،‬وتحديد المخاطر الصحية‬ ‫المحتملة‪ ،‬وإعالم سياسة الصحة العامة‪.‬‬ ‫االجتماع‬ ‫ي‬ ‫وسائل التواصل‬ ‫◼ يمكن استخدام علم البيانات لتحليل بيانات وسائل‬ ‫االجتماع لفهم الرأي العام وتحديد‬ ‫ي‬ ‫التواصل‬ ‫عي اإلنينت‪.‬‬ ‫االتجاهات وتتبع انتشار المعلومات ر‬ ‫‪12‬‬ ‫تابع‪ :‬مجاالت استخدام علم البيانات‬ ‫معالجة اللغة الطبيعية‬ ‫يمكن استخدام علم البيانات لمعالجة وفهم وعمل‬ ‫◼‬ ‫ر‬ ‫البشية‪ ،‬بما يف ذلك روبوتات‬ ‫ً‬ ‫بناء عىل اللغة‬ ‫تنبؤات‬ ‫المحادثة والتعرف عىل الكالم وتلخيص النصوص‬ ‫الكبية‪.‬‬ ‫رؤية الحاسوب‬ ‫يمكن استخدام علم البيانات لتحليل الصور ومقاطع‬ ‫◼‬ ‫الفيديو ولتطوير السيارات ذاتية القيادة والتطبيقات‬ ‫المرئية اآلخرى‪.‬‬ ‫‪13‬‬ ‫ذات‬ ‫تقييم ي‬ ‫الت لها مستوى معي من التنظيم‪ ،‬ولكن ليس بقدر البيانات المنظمة وتتضمن األمثلة‬ ‫‪ -1‬البيانات ي‬ ‫ملفات ‪ XML‬و ‪.JSON‬‬ ‫ب‪ -‬البيانات شبه المنظمة‪.‬‬ ‫أ‪ -‬البيانات المنظمة‪.‬‬ ‫د‪ -‬البيانات غي المهيكلة‪.‬‬ ‫ج‪ -‬البيانات غي المنظمة‪.‬‬ ‫الت يمكن استخدامها الستكشاف البيانات‪:‬‬ ‫‪ -2‬أي أسلوب من األساليب التالية ليس من األساليب ي‬ ‫ب‪ -‬إحصاءات موجزة‬ ‫أ‪ -‬االستطالع‬ ‫المرت‬ ‫ي‬ ‫د‪ -‬التمثيل‬ ‫ج‪ -‬االرتباط واالنحدار‬ ‫‪ -3‬من مجاالت استخدام علم البيانات لتحليل الصور ومقاطع الفيديو‪:‬‬ ‫ب‪ -‬رؤية الحاسوب‪.‬‬ ‫أ‪ -‬كشف االحتيال‪.‬‬ ‫د‪ -‬ذكاء االعمال‪.‬‬ ‫ج‪ -‬معالجة اللغة الطبيعية‪.‬‬ ‫‪14‬‬ ( ) 2 3 :... 4 : : Tables Comma-separated Values (.csv) MS Excel : (DB) non-SQL SQL : Files (.png) (.docx.txt ) : (NIFTI Files).. :. 5 Structured Relational Unstructured Non-relational 6 :. :. 7 JSON (Key- "Beans" { : [ "Total" : { 11, "Total" : 10, "Red" : 3, "Red" : 3, "Blue" : "Blue" : 4, 5, "Yellow" : 3 "Yellow" : }, 3 { } "Total" : 12, ] "Red" : 2, "Blue" : 6, "Yellow" : 4 },... 8 9 : : ( ) : ( ) : ( ) 10. : :(DB). :. :. : 11. : (Structured Query Language, SQL).(Table). ) ) ) Employee ID Project ID Name Finish Date Years of Experience Status Supervised By 12 (NoSQL). ( ).SQL (Object-relational- ORM) Project ID: Emp ID: 015 Project 10012 Employee Project ID: Project 021 Employee Project Project ID: Emp ID: 023 10016 13....NoSQL : ( ) ( ) 14. graph ) (Tables).(databases NoSQL. NoSQL :..(Graph Databases) SQL. 15............. SQL -1. -. -. -. -.( -value) -............. -2.SQL -.Tables -.Non-relational -.JSON -............. NoSQL -3. -. -. -. - 16 ‫ض‬ ‫اﻟﺜﺎي‬ ‫ي‬ ‫اﻟﻔﺼﻞ‬ ‫اﻟﻤﻔﺎﻫ ﻢ اﻷﺳﺎﺳ ﺔ ﻟﻌﻠﻢ اﻟﺒ ﺎﻧﺎت‬ ‫)اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻟﺜﺎﻧ ﺔ(‬ ‫‪2‬‬ ‫ﻣﻮﺿﻮﻋﺎت اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ‬ ‫ﻣﺨﻄﻄﺎت اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ﺣﻠﻮل ﺗﺠﺎر ﺔ وﻣﻔﺘﻮﺣﺔ اﻟﻤﺼﺪر ﻟﻘﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫‪3‬‬ ‫ﻧﻮاﺗﺞ اﻟﺘﻌﻠﻢ‬ ‫ ‬ ‫ﻋ ﺰي اﻟﻄﺎﻟﺐ ﺑﻨﻬﺎ ﺔ ﻫﺬە اﻟﻮﺣﺪة ﺳﺘﻜﻮن ﻗﺎدرا ﻋ أن‪:‬‬ ‫يض‬ ‫واﻟﻤ ات اﻟﺘﺨ ن ﺔ واﻻﺳﺘﻌﻼﻣ ﺔ‪.‬‬ ‫ﺗﻘﺮر أي ﻣﺨﻄﻂ ﺑ ﺎﻧﺎت ﺑﻨﺎء ﻋ ﻧﻤﻂ اﻟﺒ ﺎﻧﺎت‬ ‫ﺗﺘﻌﺮف ﻋ اﻟﺘﻘﻨ ﺎت واﻟﺤﻠﻮل اﻟﻤﺴﺘﺨﺪﻣﺔ ﺳﻮاء كﺎﻧﺖ ﺗﺠﺎر ﺔ أو ﻣﻔﺘﻮﺣﺔ اﻟﻤﺼﺪر ﻟﺘﺨ ﻦ‬ ‫ت‬ ‫واﺳ ﺟﺎع اﻟﺒ ﺎﻧﺎت واﻟﺘﻌﺎﻣﻞ ﻣﻊ ﻋﻨﺎ ﻫﺎ‪.‬‬ ‫‪4‬‬ ‫ﻣﺨﻄﻄﺎت اﻟﺒ ﺎﻧﺎت‬ ‫ﻏﺎﻟبﺎ ﻣﺎ ﺗﺘﻜﻮن ﻗﺎﻋﺪة ﺑ ﺎﻧﺎت ‪ -‬اﻟﻤﻨﻈﻤﺔ واﻟﻌﻼﻗ ﺔ ‪ -‬ﻣﻦ ‬ ‫أ ﻣﻦ ﺟﺪول واﺣﺪ ) ت‬ ‫ﺣى ﻣﺌﺎت اﻟﺠﺪاول(‪.‬‬ ‫ ‬ ‫ ﻤﻜﻦ ﺗﻮﺻ ﻞ ﺟﻤﻴﻊ ﺟﺪاول ﻗﺎﻋﺪة اﻟﺒ ﺎﻧﺎت ﺑبﻌﻀﻬﺎ اﻟبﻌﺾ‪ ،‬ت‬ ‫ﺣى ﻟﻮ اﺳﺘﻐﺮق اﻷﻣﺮ ﻋﺪة ﺻﻼت ﻟﻠﻘ ﺎم‬ ‫بﺬﻟﻚ‪.‬‬ ‫ُْ‬ ‫ض‬ ‫ﻟﺠﻌﻞ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت ‬ ‫أ ﻧﻈﺎﻓﺔ وأﺳﻬﻞ ي اﻻﺳﺘﺨﺪام‪ ،‬ﻏﺎﻟبﺎ ﻣﺎ ﺗتﺒﻊ بﻌﺾ اﻷﻧﻤﺎط اﻟﺸﺎﺋﻌﺔ ﻋﻨﺪ ﺗﻨﻈ ﻢ‬ ‫اﻟﺠﺪاول واﻟﺘﻔﺎﻋﻞ ﻣﻊ بﻌﻀﻬﺎ اﻟبﻌﺾ ﺴ ﻫﺬە اﻷﻧﻤﺎط ﻣﺨﻄﻄﺎت اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ﻫﻨﺎك اﻟﻌﺪ ﺪ ﻣﻦ اﻟﻤﺨﻄﻄﺎت اﻟﺸﺎﺋﻌﺔ اﻟﻤﺨﺘﻠﻔﺔ‪ ،‬اﻟﻤﺨﻄﻄﺎت اﻷﺳﺎﺳ ﺔ‪:‬‬ ‫ﻣﺨﻄﻂ اﻟﻨﺠﻤﺔ )‪(Star Schema‬‬ ‫ﻣﺨﻄﻂ ﻧﺪﻓﺔ اﻟﺜﻠﺞ )‪(Snowflake Schema‬‬ ‫ﻣﺨﻄﻂ ﻛﻮﻛبﺔ )‪(Fact Constellation Schema‬‬ ‫‪5‬‬ ‫ﻣﺨﻄﻂ اﻟﻨﺠﻤﺔ )‪(Star Schema‬‬ ‫اﻹ ﺠﺎﺑ ﺎت‪:‬‬ ‫ ﺴ ﻂ )ﻳﻮﺟﺪ ﻋﺪد أﻗﻞ ﻣﻦ اﻟﺠﺪاول ﺸكﻞ ﻋﺎم(‪.‬‬ ‫ﻣﻄﻠﻮب ﻋﺪد أﻗﻞ ﻣﻦ اﻟﺼﻼت‪.‬‬ ‫ض‬ ‫أﺳﻬﻞ ي ﻓﻬﻢ ﻛ ﻔ ﺔ ارﺗبﺎط اﻟﺠﺪاول ﺑبﻌﻀﻬﺎ‬ ‫اﻟبﻌﺾ‪.‬‬ ‫اﻟﺴﻠﺒ ﺎت‪:‬‬ ‫اﻟ ﺜ ﻣﻦ اﻟﺒ ﺎﻧﺎت(‪.‬‬ ‫ي‬ ‫اﻟﻌﺎ )ﻳﺘﻢ ﺗﻜﺮار‬ ‫ي‬ ‫اﻟﺘﻜﺮار‬ ‫ﻏ ﺗﻄﺒ ﻌ ﺔ )‪ (renormalized‬ﺴبﺐ اﻟﺘﻜﺮار‬ ‫ي‬ ‫اﻟﻌﺎ واﻟﺬي بﺪورە ﻌﺮض ﻋﻨﺎ اﻟﺒ ﺎﻧﺎت‬ ‫ي‬ ‫ﻟﺨﻄﻮرة ﻋﺪم اﻟﺘﻮاﻓﻖ واﻻ ﺴﺎق‪.‬‬ ‫‪6‬‬ ‫ﻣﺨﻄﻂ ﻧﺪﻓﺔ اﻟﺜﻠﺞ )‪(Snowflake Schema‬‬ ‫اﻹ ﺠﺎﺑ ﺎت‪:‬‬ ‫اﻧﺨﻔﺎض اﻟﺘﻜﺮار )ﻳﺘﻢ ﺗﻜﺮار ﻋﺪد ﻗﻠ ﻞ ﺟﺪا ﻣﻦ‬ ‫اﻟﻤﻘﺎﻳ ﺲ‪ ،‬إن وﺟﺪت(‬ ‫ﺗﻄﺒﻴﻊ )‪(normalization‬‬ ‫اﻟﺴﻠﺒ ﺎت‪:‬‬ ‫ ‬ ‫أ ﺗﻌﻘ ﺪا )ﻓﻬﻢ ﻛ ﻔ ﺔ ارﺗبﺎط اﻟﺠﺪاول‬ ‫ﺑبﻌﻀﻬﺎ اﻟبﻌﺾ ‬ ‫أ ﺻﻌ ﺔ(‬ ‫ﻫﻨﺎك ﺣﺎﺟﺔ إ ﻣ ﺪ ﻣﻦ اﻟﺼﻼت )ﻗﺪ ﻳﺘﻄﻠﺐ‬ ‫ي ض‬ ‫ﺟﺪوﻟن ﻋﺪة ﺻﻼت وﺳ ﻄﺔ(‬ ‫اﻻﻧﻀﻤﺎم إ ‬ ‫‪7‬‬ ‫اﻻﺧﺘ ﺎر ي ض‬ ‫ﺑن ﻣﺨﻄﻄﺎت اﻟﻨﺠﻮم وﻧﺪﻓﺔ اﻟﺜﻠﺞ‬ ‫ ﻌﺘﻤﺪ اﻻﺧﺘ ﺎر ي ض‬ ‫ﺑن ﻣﺨﻄﻂ اﻟﻨﺠﻤﺔ أو ﻧﺪﻓﺔ‬ ‫ش‬ ‫ﻟﻤ وع‬ ‫اﻟﺜﻠﺞ ﻋ اﻻﺣﺘ ﺎﺟﺎت اﻟﻤﺤﺪدة‬ ‫ﺗﻌ ﻣﺨﻄﻄﺎت اﻟﻨﺠﻮم‬ ‫ي‬ ‫ﺗﺤﻠ ﻞ اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫اﻷوﻟ ﺔ ﻟﻠبﺴﺎﻃﺔ وﺳﻬﻮﻟﺔ اﻻﺳﺘﺨﺪام‪ ،‬ﺑيﻨﻤﺎ‬ ‫ﺗﻌﻤﻞ ﻣﺨﻄﻄﺎت ﻧﺪﻓﺔ اﻟﺜﻠﺞ ﻋ ﺗﺤﺴ ي ض‬ ‫ن‬ ‫ﻛﻔﺎءة اﻟﺘﺨ ﻦ وﺳﻼﻣﺔ اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫‪8‬‬ (Fact Constellation Schema) ‫ﻣﺨﻄﻂ ﻛﻮﻛبﺔ‬ 9 ‫ﺗﺎﺑﻊ‪ :‬ﻣﺨﻄﻂ ﻛﻮﻛبﺔ )‪(Fact Constellation Schema‬‬ ‫ﺗﺘﻜﻮن ﻣﺨﻄﻄﺎت ﻛﻮﻛبﺔ ﻣﻦ‪:‬‬ ‫ﺳﻠﺴﻠﺔ ﻣﺨﻄﻂ اﻟﻨﺠﻮم ‪ /‬ﻧﺪﻓﺔ اﻟﺜﻠﺞ‪.‬‬ ‫ت‬ ‫اﻟى ﺴﺘﺨﺪم بﻌﺾ اﻷبﻌﺎد اﻟﺸﺎﺋﻌﺔ‪.‬‬ ‫اﻧﺪﻣﺎج اﻟﻌﺪ ﺪ ﻣﻦ ﻣﺨﻄﻄﺎت اﻟﻨﺠﻮم ‪ /‬ﻧﺪﻓﺔ اﻟﺜﻠﺞ ي‬ ‫ت‬ ‫اﻟﻤﺸ ﻛﺔ اﻟﻤﺤﺘﻤﻠﺔ‪.‬‬ ‫ﺗﺘﻜﻮن ﻣﻦ اﻟﻌﺪ ﺪ ﻣﻦ ﺟﺪاول اﻟﺤﻘﺎﺋﻖ )‪ (Fact Tables‬ﻣﻊ ﺟﺪاول اﻷبﻌﺎد‬ ‫‪10‬‬ ‫ﺣﻠﻮل ﺗﺠﺎر ﺔ وﻣﻔﺘﻮﺣﺔ اﻟﻤﺼﺪر ﻟﻘﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت‬ ‫‪11‬‬ ‫ﺗﻘﻴ ﻢ ذايت‬ ‫ي‬ ‫‪ -1‬ﻣﻦ ﺳﻠﺒ ﺎت ﻣﺨﻄﻂ ﻧﺪﻓﺔ اﻟﺜﻠﺞ‪.............‬‬ ‫ب‪ -‬اﻟﺘﻄﺒﻴﻊ‪.‬‬ ‫أ‪ -‬اﻧﺨﻔﺎض اﻟﺘﻜﺮار‪.‬‬ ‫د‪ -‬ﺣﺎﺟﺔ إ ﻋﺪد ﻗﻠ ﻞ ﻣﻦ اﻟﺼﻼت‪.‬‬ ‫ج‪ -‬‬ ‫أ ﺗﻌﻘ ﺪ‪.‬‬ ‫‪ -2‬ﻣﺨﻄﻂ ……………… ﻫﻮ أ ﺴﻂ ﻧ ع ﻣﻦ ﻣﺨﻄﻄﺎت ﻣﺴﺘﻮدع اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ب‪ -‬ﻧﺪﻓﺔ اﻟﺜﻠﺞ‪.‬‬ ‫أ‪ -‬اﻟﻨﺠﻤﺔ‪.‬‬ ‫د‪ -‬اﻟﻬﺮم‪.‬‬ ‫ج‪ -‬ﻛﻮﻛبﺔ‪.‬‬ ‫اﻟﺘﺎ ﻟ ﺲ أﺣﺪ اﻟﺤﻠﻮل اﻟﺘﺠﺎر ﺔ ﻣﻔﺘﻮﺣﺔ اﻟﻤﺼﺪر ﻟﻘﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت؟‬ ‫ي‬ ‫‪ -3‬أي ﻣﻦ‬ ‫ب‪.mongoDB -‬‬ ‫أ‪.ORACLE -‬‬ ‫د‪.dropbox -‬‬ ‫ج‪.Microsoft -‬‬ ‫‪12‬‬ ‫ض‬ ‫اﻟﺜﺎي‬ ‫ي‬ ‫اﻟﻔﺼﻞ‬ ‫اﻟﻤﻔﺎﻫ ﻢ اﻷﺳﺎﺳ ﺔ ﻟﻌﻠﻢ اﻟﺒ ﺎﻧﺎت‬ ‫)اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻟﺜﺎﻟﺜﺔ(‬ ‫‪2‬‬ ‫ﻣﻮﺿﻮﻋﺎت اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ‬ ‫أﻧﻮاع أوﻋ ﺔ اﻟﺒ ﺎﻧﺎت اﻟﻤﺘﺨﺼﺼﺔ‪.‬‬ ‫ﺗﺤﺪ ﺚ اﻟﺒ ﺎﻧﺎت اﻟﻤﺨﺰﻧﺔ‪.‬‬ ‫‪3‬‬ ‫ﻧﻮاﺗﺞ اﻟﺘﻌﻠﻢ‬ ‫ ‬ ‫ﻋ ﺰي اﻟﻄﺎﻟﺐ ﺑﻨﻬﺎ ﺔ ﻫﺬە اﻟﻮﺣﺪة ﺳﺘﻜﻮن ﻗﺎدرا ﻋ أن‪:‬‬ ‫ﺗﺬﻛﺮ أﻫﻢ أﻧﻮاع أوﻋ ﺔ اﻟﺒ ﺎﻧﺎت اﻟﻤﺘﺨﺼﺼﺔ‪.‬‬ ‫ ﻣﺴﺘﻮدﻋﺎت اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ض‬ ‫ﺗ يﺒن ﻣﺎ ي‬ ‫ش‬ ‫ ح أﺳﻮاق اﻟﺒ ﺎﻧﺎت وﺻﻔﺎﺗﻬﺎ‪.‬‬ ‫بﺤ ات اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ﺗﻮﺿﺢ ي‬ ‫ي ض‬ ‫ﺗﺒن ﻃﺮق ﺗﺤﺪ ﺚ اﻟﺒ ﺎﻧﺎت اﻟﻤﺨﺰﻧﺔ‪.‬‬ ‫‪4‬‬ ‫أﻧﻮاع أوﻋ ﺔ اﻟﺒ ﺎﻧﺎت اﻟﻤﺘﺨﺼﺼﺔ‬ ‫كﻞ ﻗﺎﻋﺪة ﺑ ﺎﻧﺎت ﻣﺘﺨﺼﺼﺔ ﻟﻬﺎ اﺳﻢ ﻣﺤﺪد‪ ،‬و ﺴﺘﺨﺪم ﻷﺷ ﺎء ﻣﺨﺘﻠﻔﺔ‪ ،‬وﻟﻬﺎ أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﺒ ﺎﻧﺎت‪،‬‬ ‫و ﺴﺘﺨﺪﻣﻬﺎ أﺷﺨﺎص ﻣﺨﺘﻠﻔﻮن‪.‬‬ ‫ﻣﻦ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت اﻟﻤﺘﺨﺼﺼﺔ‪:‬‬ ‫ﻣﺴﺘﻮدﻋﺎت اﻟﺒ ﺎﻧﺎت )‪(Data Warehouses‬‬ ‫أﺳﻮاق اﻟﺒ ﺎﻧﺎت )‪(Data Marts‬‬ ‫بﺤ ات اﻟﺒ ﺎﻧﺎت )‪(Data Lakes‬‬ ‫ي‬ ‫‪DATA SOURCES‬‬ ‫‪https://axysweb.com/data-lake-data-warehouse-data-mart-definition-objectif-et-fonctionnement/ :‬‬ ‫‪5‬‬ ‫ﻣﺴﺘﻮدﻋﺎت اﻟﺒ ﺎﻧﺎت )‪(Data Warehouses‬‬ ‫وﻏ ﻣﺘﻄﺎﻳﺮة‬ ‫وﻣﺘﻐ ة زﻣﻨ ﺎ ي‬ ‫ي‬ ‫»ﻣﺴﺘﻮدع اﻟﺒ ﺎﻧﺎت‪ :‬ﻋبﺎرة ﻋﻦ ﻣﺠﻤﻮﻋﺔ ﺑ ﺎﻧﺎت ﻣﻮﺟﻬﺔ ﻧﺤﻮ اﻟﻤﻮﺿ ع وﻣﺘكﺎﻣﻠﺔ‬ ‫ض‬ ‫ ﺴﺘﺨﺪم ﺸكﻞ أﺳﺎ ﺻﻨﻊ اﻟﻘﺮار اﻟﺘﻨﻈ ‪(WH Inmon, Building Data Warehouses, 1992) «.‬‬ ‫ي‬ ‫ي ي‬ ‫ﻏﺎﻟبﺎ ﻣﺎ ﺴﺘﺨﺪم ﻟﻠﺠﺪاول اﻟﻌﻼﺋﻘ ﺔ اﻟﻤﻨﻈﻤﺔ‪.‬‬ ‫ﻛﺒ ة ﻣﻦ ﺑ ﺎﻧﺎت اﻟﻤﻌﺎﻣﻼت اﻟﻤﻌﺎﻟﺠﺔ‪.‬‬ ‫ﻋﺎدة ﻣﺎ ﺗﺤﺘﻮي ﻋ كﻤ ﺎت ي‬ ‫ ‬ ‫أ ﺗﻌﻘ ﺪا و ﺴﺘﺨﺪﻣﻬﺎ ﻣﻬﻨﺪﺳﻮ اﻟﺒ ﺎﻧﺎت أو ﻣﺴﺆوﻟﻮ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ ‬ ‫أ ﻋﺮﺿﺔ ﻟﻤﺘﺎبﻌﺔ ﻣﺨﻄﻂ ﻧﺪﻓﺔ اﻟﺜﻠﺞ‪.‬‬ ‫‪6‬‬ ‫أﺳﻮاق اﻟﺒ ﺎﻧﺎت )‪(Data Marts‬‬ ‫ ﻣﺠﻤﻮﻋﺔ ﻓﺮﻋ ﺔ ﻣﺘﺨﺼﺼﺔ ﻣﻦ ﻣﺴﺘﻮدع اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫أﺳﻮاق اﻟﺒ ﺎﻧﺎت ي‬ ‫إﻧﻬﺎ أﺻﻐﺮ ﺣﺠﻤﺎ‪ ،‬وﺗﺤﺘﻮي ﻓﻘﻂ ﻋ ﻣﻌﻠﻮﻣﺎت ﻣﻌﺎﻟﺠﺔ ﺣﻮل ﻣﻮﺿ ع ي ض‬ ‫ﻣﻌن‪ ،‬وﻟﻬﺎ ﺑن ﺔ أ ﺴﻂ‪.‬‬ ‫ﻣﻮﻇ دﻋﻢ اﻟﻌﻤﻼء ﻟﻠﻮﺻﻮل إﻟﻴﻬﺎ‬ ‫ض‬ ‫أو‬ ‫ي ض‬ ‫ﻟﻠﻤﺤﻠﻠن‬ ‫ﺗﻌﺘ ﺧﺪﻣﺔ ذاﺗ ﺔ ﻷﻧﻬﺎ ﻣﺼﻤﻤﺔ ﻟﺘﻜﻮن ﺴ ﻄﺔ بﻤﺎ ض‬ ‫ ﻜ ‬ ‫ي‬ ‫ي‬ ‫ب‬ ‫بﺄﻧﻔﺴﻬﻢ‪.‬‬ ‫ﺗﻌ اﻷوﻟ ﺔ ﻟﺴﻬﻮﻟﺔ اﻻﺳﺘﺨﺪام‪ ،‬ﻓﺈﻧﻬﺎ ﻏﺎﻟبﺎ ﺗتﺒﻊ ﻣﺨﻄﻄﺎ ﻧﺠﻤ ﺎ‪.‬‬ ‫ي‬ ‫ﻧﻈﺮا ﻷن ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت ﻫﺬە‬ ‫‪7‬‬ ‫بﺤ ات اﻟﺒ ﺎﻧﺎت )‪(Data Lakes‬‬ ‫ي‬ ‫ﻏ اﻟﻤﻌﺎﻟﺠﺔ‪.‬‬ ‫ﻛﺒ ة ﻣﻦ اﻟﺒ ﺎﻧﺎت اﻟﺨﺎم ي‬ ‫بﺤ ات اﻟﺒ ﺎﻧﺎت كﻤ ﺎت ي‬ ‫ﺗﺨﺰن ي‬ ‫ﻏ ﻣﻨﻈﻤﺔ‪.‬‬ ‫ ﻤﻜﻦ أن ﺗﺤﺘﻮي ﻋ ﺑ ﺎﻧﺎت ﻣﻨﻈﻤﺔ أو ﺑ ﺎﻧﺎت ي‬ ‫ﻏﺎﻟبﺎ ﻣﺎ ﻳﺘﻢ ﺟﻤﻊ اﻟﺒ ﺎﻧﺎت ﻣﻦ ﻋﺪة ﻣﺼﺎدر ﻣﺨﺘﻠﻔﺔ‪.‬‬ ‫ ﻤﻜﻦ أن ﺗﺘﻀﻤﻦ ﺑ ﺎﻧﺎت أو أﻧﻮاع ﻣﻠﻔﺎت ﻣﺨﺘﻠﻔﺔ‪.‬‬ ‫بﺤ ات اﻟﺒ ﺎﻧﺎت وﻻ ﺗتﺒﻊ أي ﻣﺨﻄﻂ‬ ‫ﻧﻈﺮا ﻟﻄﺒ ﻌﺔ اﻟﻤﻌﻠﻮﻣﺎت اﻷوﻟ ﺔ‪ ،‬ﻏﺎﻟبﺎ ﻣﺎ ﺴﺘﺨﺪم ﻋﻠﻤﺎء اﻟﺒ ﺎﻧﺎت ي‬ ‫ﻣﺤﺪد‪.‬‬ ‫‪8‬‬ ‫ﺗﺤﺪ ﺚ اﻟﺒ ﺎﻧﺎت اﻟﻤﺨﺰﻧﺔ‬ ‫اﻟﻤﺘﻐ ة ﺑبﻂء‪ ،‬ﻏﺎﻟبﺎ ﻣﺎ ﺗﻈﻬﺮ ﺣﺎﻟﺘﺎن‪:‬‬ ‫ي‬ ‫بﺎﻟنﺴبﺔ ﻟﻸبﻌﺎد )‪(variables/attribues‬‬ ‫ﺗﺤﺪ ﺚ ﻗ ﻤﺔ ﺣﺎﻟ ﺔ‪.‬‬ ‫ت‬ ‫اﻟي ﻳﺘﻢ ﺴﺠ ﻠﻬﺎ‪.‬‬ ‫اﻟﻤﺘﻐ ات ي‬ ‫ي‬ ‫ﺗﻐﻴ ﻋﺪد‬ ‫ي‬ ‫‪9‬‬ ‫ﺗﺎﺑﻊ‪ :‬ﺗﺤﺪ ﺚ اﻟﺒ ﺎﻧﺎت اﻟﻤﺨﺰﻧﺔ‬ ‫ﺗﺤﺪ ﺚ ﺳﺠﻞ بﻘ ﻤﺔ ﻣﺤﺪﺛﺔ‪:‬‬ ‫اﻟ ﺘﺎبﺔ ﻓﻮق اﻟﻘ ﻢ اﻟﺘﺎر ﺨ ﺔ‪:‬‬ ‫ﻳب ﻣﺠﻤﻮﻋﺔ اﻟﺒ ﺎﻧﺎت اﻟﺨﺎﺻﺔ بﻚ أﺻﻐﺮ وأ ﺴﻂ‬ ‫إذا ﻗﻤﺖ ﻓﻘﻂ ﺑﺘﻐﻴ اﻟﻘ ﻤﺔ ض اﻟﺨﻠ ﺔ‪ ،‬ﻓﻬﺬا ت‬ ‫ي‬ ‫ي‬ ‫ي‬ ‫بﻜﺜ ‪.‬وﻣﻊ ذﻟﻚ‪ ،‬ﻧﻈﺮا ﻷﻧﻚ ﻓﻘﺪت اﻟﻘ ﻤﺔ اﻟﺨﺎﺻﺔ بﻚ‪ ،‬ﻟﻢ ﻌﺪ ﺑ ﻣكﺎﻧﻚ اﻟﻮﺻﻮل إ اﻟﺒ ﺎﻧﺎت‬ ‫ي‬ ‫اﻟﺘﺎر ﺨ ﺔ‪.‬‬ ‫اﻻﺣﺘﻔﺎظ بﺎﻟﻘ ﻢ اﻟﺘﺎر ﺨ ﺔ‪:‬‬ ‫ﺗﻄﻠﺐ إﺿﺎﻓﺔ أﻋﻤﺪة إﺿﺎﻓ ﺔ بﺤ ﺚ ﻤﻜﻨﻚ ﺗتﺒﻊ اﻟﻘ ﻤﺔ اﻟﺤﺎﻟ ﺔ‪ ،‬وﻛﺬﻟﻚ ﻋﻨﺪﻣﺎ كﺎﻧﺖ اﻟﻘ ﻢ‬ ‫اﻷﺧﺮى ﺸﻄﺔ ﻋﻦ ﻃ ﻖ إﺿﺎﻓﺔ اﻷﻋﻤﺪة‪ :‬اﻟﺴﺠﻞ اﻟنﺸﻂ واﻟبﺪا ﺔ اﻟنﺸﻄﺔ واﻟﻨﻬﺎ ﺔ اﻟنﺸﻄﺔ‪.‬‬ ‫‪Active Record‬‬ ‫‪Updated Active Record‬‬ ‫‪10‬‬ ‫ﺗﺎﺑﻊ‪ :‬ﺗﺤﺪ ﺚ اﻟﺒ ﺎﻧﺎت اﻟﻤﺨﺰﻧﺔ‬ ‫اﻟﻤﺘﻐ ات ت‬ ‫اﻟي ﻳﺘﻢ ﺴﺠ ﻠﻬﺎ ‪:‬‬ ‫ي‬ ‫ﺗﻐﻴ ﻋﺪد‬ ‫ي‬ ‫ي‬ ‫ي ض‬ ‫ﺳيﺘﻌن ﻋﻠ ﻚ ﺗﺤﺪ ﺪ ﻣﺎ إذا ﻛﻨﺖ ﺗ ﺪ‬ ‫ﻋﻨﺪ إﺿﺎﻓﺔ أﻋﻤﺪة أو إزاﻟﺘﻬﺎ ﻣﻦ ﺟﺪول أو ﻣﺠﻤﻮﻋﺔ ﺑ ﺎﻧﺎت‪،‬‬ ‫ﺣﺬف ﺟﻤﻴﻊ اﻟﺒ ﺎﻧﺎت اﻟﺘﺎر ﺨ ﺔ أم ﻻ‪.‬‬ ‫ﺳبﺐ ﻣﺤﺪد‪ :‬ﻗ ﻢ ﻓﺎرﻏﺔ‪ ،‬أو ﻣﺴﺎﻓﺎت )‪ (spaces‬ﻻ ﺗﻮﺟﺪ ﻓﻴﻬﺎ ﻗ ﻢ ﺣ ﺚ ﺠﺐ أن ﺗﻜﻮن ﻣﻮﺟﻮدة‪.‬‬ ‫ش ئ‬ ‫ي ض‬ ‫ض‬ ‫ﺳﺘن ﻗ ﻤﺎ ﻓﺎرﻏﺔ‪.‬‬ ‫اﻟﺤﺎﻟﺘن‪،‬‬ ‫ﻻ ﻳﻬﻢ ﻣﺎ إذا ﻛﻨﺖ ﺗﻀ ﻒ أﻋﻤﺪة أو ﺗ ﻠﻬﺎ ‪ -‬ي كﻠﺘﺎ‬ ‫‪11‬‬ ‫ﺗﻘﻴ ﻢ ذايت‬ ‫ي‬ ‫وﻏ ‬ ‫وﻣﺘﻐ ة زﻣﻨ ﺎ ي‬ ‫ي‬ ‫‪................ -1‬ﻋبﺎرة ﻋﻦ ﻣﺠﻤﻮﻋﺔ ﺑ ﺎﻧﺎت ﻣﻮﺟﻬﺔ ﻧﺤﻮ اﻟﻤﻮﺿ ع وﻣﺘكﺎﻣﻠﺔ‬ ‫ض‬ ‫اﻟﺘﻨﻈ ‪.‬‬ ‫ي‬ ‫ار‬ ‫ﺮ‬ ‫اﻟﻘ‬ ‫ﺻﻨﻊ‬ ‫ ‬ ‫أﺳﺎ ي‬ ‫ي‬ ‫ﻣﺘﻄﺎﻳﺮة ﺴﺘﺨﺪم ﺸكﻞ‬ ‫بﺤ ة اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ب‪ -‬ي‬ ‫أ‪ -‬ﻣﺴﺘﻮدع اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫د‪ -‬ﻧﻈﺎم اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ج‪ -‬أﺳﻮاق اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫‪ -2‬ﻣﻦ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت اﻟﻤﺨﺼﺼﺔ ت‬ ‫اﻟي ﺗﺤﺘﻮي بﺎﻟﻐﺎﻟﺐ ﻋ ﺑ ﺎﻧﺎت وﻣﻠﻔﺎت ﻣﺘﻨﻮﻋﺔ و ﺘﻢ ﻓﻴﻬﺎ ﺟﻤﻊ‬ ‫ي‬ ‫اﻟﺒ ﺎﻧﺎت ﻣﻦ ﻋﺪة ﻣﺼﺎدر ﻣﺨﺘﻠﻔﺔ‪.‬‬ ‫بﺤ ة اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ب‪ -‬ي‬ ‫أ‪ -‬ﻣﺴﺘﻮدع اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫د‪ -‬ﻧﻈﺎم اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ج‪ -‬أﺳﻮاق اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫ﺗﻌ اﻷوﻟ ﺔ ﻟﺴﻬﻮﻟﺔ اﻻﺳﺘﺨﺪام‪ ،‬ﻓﺈﻧﻬﺎ ﻏﺎﻟبﺎ ﺗتﺒﻊ ﻣﺨﻄﻂ ‪..............‬‬ ‫ي‬ ‫‪ -3‬ﻧﻈﺮا ﻷن أﺳﻮاق اﻟﺒ ﺎﻧﺎت‬ ‫ب‪ -‬اﻟﻨﺠﻤﺔ‪.‬‬ ‫أ‪ -‬ﻧﺪﻓﺔ اﻟﺜﻠﺞ‪.‬‬ ‫د‪ -‬اﻟﻬﺮم‪.‬‬ ‫ج‪ -‬اﻟ ﻮﻛبﺔ‪.‬‬ ‫‪12‬‬ ‫اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ‬ ‫اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ ‫)اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻷو (‬ ‫‪2‬‬ ‫ﻣﻮﺿﻮﻋﺎت اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ‬ ‫‪ ‬ﻣﻔﻬﻮم اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫‪ ‬ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫‪ ‬ﺗﺤﺪ ﺎت ﺗﻨﻈ ﻢ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫ﻣﻨﻈﻮﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫‪ ‬اﻷﻃﺮاف‬ ‫‪3‬‬ ‫ﻧﻮاﺗﺞ اﻟﺘﻌﻠﻢ‬ ‫أن‪:‬‬ ‫ﻋ ﺰي اﻟﻄﺎﻟﺐ ﺑﻨﻬﺎ ﺔ ﻫﺬە اﻟﻮﺣﺪة ﺳﺘﻜﻮن ﻗﺎدرا ﻋ‬ ‫ُ‬ ‫ﺗﻌﺮف ﻣﻔﻬﻮم اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫‪‬‬ ‫ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫ﺗﻤ ﺑ‬ ‫‪‬‬ ‫ﺗﺬﻛﺮ أﻫﻢ ﺗﺤﺪ ﺎت ﺗﻨﻈ ﻢ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫‪‬‬ ‫ﻣﻨﻈﻮﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫ﺗﺤﺪد أﻫﻢ اﻷﻃﺮاف اﻟﻤﻮﺟﻮدﻳﻦ‬ ‫‪‬‬ ‫‪4‬‬ ‫ﻣﻔﻬﻮم اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ ‫ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒ ﺎﻧﺎت اﻟ ﺗﻜﻮن‬ ‫اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ ‫‪‬‬ ‫ﺿﺨﻤﺔ ﺟﺪا وﻣﻌﻘﺪة ﻟﺪرﺟﺔ أن اﻷدوات واﻟﺘﻘﻨ ﺎت‬ ‫اﻟﺘﻘﻠ ﺪ ﺔ ﻟﻤﻌﺎﻟﺠﺔ اﻟﺒ ﺎﻧﺎت وﺗﺤﻠ ﻠﻬﺎ ﻗﺪ ﻻ ﺗﻜﻮن ﺎﻓ ﺔ‬ ‫ﻟﻠﺘﻌﺎﻣﻞ ﻣﻌﻬﺎ‪.‬‬ ‫ُ‬ ‫ﺴﺘﺨﺪم ﻣﺼﻄﻠﺢ "اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ" ﻟﻺﺷﺎرة إ‬ ‫‪‬‬ ‫اﻟ ﻤ ﺎت اﻟ ﺒ ة واﻟﻤﺘﻨﻮﻋﺔ ﻣﻦ اﻟﺒ ﺎﻧﺎت اﻟ ﺗﺘﺪﻓﻖ‬ ‫ﻋﺎت ﻋﺎﻟ ﺔ واﻟ ﺗﺤﺘﺎج إ ﻣﻌﺎﻟﺠﺔ ﻓﻮر ﺔ‪.‬‬ ‫ﺗ ﻤﻦ اﻟﺘﺤﺪ ﺎت اﻟ ﺗﺮاﻓﻖ ﻫﺬا اﻟﻨ ع ﻣﻦ اﻟﺒ ﺎﻧﺎت‬ ‫‪‬‬ ‫ﺗﻮﻓ ﻫﺎ وﻣﻌﺎﻟﺠﺘﻬﺎ وﺗﺨ ﻨﻬﺎ وﺗﺤﻠ ﻠﻬﺎ واﻟ ﺤﺚ ﻓﻴﻬﺎ‬ ‫وﻣﺸﺎرﻛﺘﻬﺎ وﻧﻘﻠﻬﺎ وﺗﺼ ﺮﻫﺎ ﺎﻻﺿﺎﻓﺔ ا اﻟﻤﺤﺎﻓﻈﺔ ﻋ‬ ‫اﻟﺨﺼﻮﺻ ﺎت اﻟ ﺗﺮاﻓﻘﻬﺎ‪.‬‬ ‫‪https://www.arabicmagazine.net/Images/Articles/2018811111949801.jpg‬‬ ‫‪5‬‬ ‫ﺧﺼﺎﺋﺺ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ https://image.slidesharecdn.com/cduulgymsoiyznljkxjw-signature-c40f32b45a67da0182f1bf54c9c02be86d54572e45fbf14c4b729ae4430cdcbd-poli-201001084350/75/-13-2048.jpg 6 ‫ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ ‫ذﻟﻚ‪:‬‬ ‫ﻫﻨﺎك اﻟﻌﺪ ﺪ ﻣﻦ اﻟﻤﺼﺎدر اﻟ ﺗ ﺘﺞ ﻋﻨﻬﺎ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪ ،‬ﻤﺎ‬ ‫وﺳﺎﺋﻞ اﻟﺘﻮاﺻﻞ اﻻﺟﺘﻤﺎ ‪ :‬ﻣﺜﻞ ‪ Facebook‬و ‪ Twitter‬و ‪.Instagram‬‬ ‫‪‬‬ ‫أﺟﻬﺰة إﻧ ﻧﺖ اﻷﺷ ﺎء )‪ :(IoT‬ﻣﺜﻞ اﻷﺟﻬﺰة اﻟﻤ ﻟ ﺔ اﻟﺬﻛ ﺔ واﻷﺟﻬﺰة اﻟﻘﺎ ﻠﺔ ﻟﻼرﺗﺪاء‪.‬‬ ‫‪‬‬ ‫ﺗﻢ إ ﺸﺎؤﻫﺎ ﺑﻮاﺳﻄﺔ اﻟﺨﻮادم وﻣﻮاﻗﻊ اﻟ ﺐ واﻟﺘﻄﺒ ﻘﺎت ﻣﻌﻠﻮﻣﺎت ﻗ ﻤﺔ ﺣﻮل ﺳﻠﻮك‬ ‫ﻣﻠﻔﺎت اﻟﺴﺠﻞ‪ :‬اﻟ‬ ‫اﻟﻤﺴﺘﺨﺪم وأداء اﻟﻨﻈﺎم‪.‬‬ ‫وﻧ ﺔ‪ :‬ﻣﺜﻞ ‪ Amazon‬و ‪.eBay‬‬ ‫اﻟﺘﺠﺎرة اﻹﻟ‬ ‫‪‬‬ ‫أﺟﻬﺰة اﻟﺠﻮال‪ :‬ﺗﻘﻮم اﻷﺟﻬﺰة اﻟﻤﺤﻤﻮﻟﺔ ﻣﺜﻞ اﻟﻬﻮاﺗﻒ اﻟﺬﻛ ﺔ واﻷﺟﻬﺰة اﻟﻠﻮﺣ ﺔ ﺑ ﺸﺎء ﺑ ﺎﻧﺎت ﺣﻮل اﻟﻤﻮﻗﻊ‬ ‫‪‬‬ ‫واﻻﺳﺘﺨﺪام وﺳﺠﻞ اﻟﺘﺼﻔﺢ‪.‬‬ ‫‪7‬‬ ‫ﺗﺎﺑﻊ‪ :‬ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ ‫ﻓ ﺔ‪ :‬ﺗﻘﻮم اﻟﻤﺆﺳﺴﺎت اﻟﻤﺎﻟ ﺔ واﻟﺒﻨﻮك ﺑ ﺸﺎء ﻤ ﺎت ﻛﺒ ة ﻣﻦ اﻟﺒ ﺎﻧﺎت ﺣﻮل اﻟﻤﻌﺎﻣﻼت‬ ‫اﻟﻤﺎﻟ ﺔ واﻟﻤ‬ ‫‪‬‬ ‫وﺳﻠﻮك اﻟﻌﻤﻼء واﺗﺠﺎﻫﺎت اﻟﺴﻮق‪.‬‬ ‫ﺔ )‪ (CDRs‬وأﻧﻈﻤﺔ‬ ‫وﻧ ﺔ )‪ (EHRs‬وﻣﺴﺘﻮدﻋﺎت اﻟﺒ ﺎﻧﺎت اﻟ‬ ‫اﻟﺮﻋﺎ ﺔ اﻟﺼﺤ ﺔ‪ :‬اﻟﺴﺠﻼت اﻟﺼﺤ ﺔ اﻹﻟ‬ ‫‪‬‬ ‫اﻟﺒ ﺎﻧﺎت اﻟﻄﺒ ﺔ اﻷﺧﺮى ﺗﻮﻟﺪ ﻤ ﺎت ﻛﺒ ة ﻣﻦ اﻟﺒ ﺎﻧﺎت ﺣﻮل ﺻﺤﺔ اﻟﻤ ﺾ واﻟﻌﻼج واﻟﻨﺘﺎﺋﺞ‪.‬‬ ‫اﻟﺘﻌﺎﻣﻼت اﻟﺤﻜﻮﻣ ﺔ‪ :‬ﺗﻘﻮم اﻟﺠﻬﺎت اﻟﺤﻜﻮﻣ ﺔ ﺑ ﻧﺘﺎج ﻤ ﺎت ﻛﺒ ة ﻣﻦ اﻟﺒ ﺎﻧﺎت ﺣﻮل اﻟ ﻛﻴ ﺔ اﻟﺴ ﺎﻧ ﺔ‪،‬‬ ‫‪‬‬ ‫واﻟﻤﺆ ات اﻻﻗﺘﺼﺎد ﺔ‪ ،‬واﻟﺒ ﺎﻧﺎت اﻟﺒ ﺌ ﺔ‪.‬‬ ‫ُ‬ ‫واﻟﺘﺠﺎرب ﻤ ﺔ ﻛﺒ ة ﻣﻦ‬ ‫اﻟﻤﺴﻮﺣﺎت واﻟ ﺤﺚ اﻟﻌﻠ‬ ‫اﻻﺳﺘﻄﻼﻋﺎت واﻟ ﺤﻮث واﻟﺒ ﺎﻧﺎت اﻟﻌﻠﻤ ﺔ‪ :‬ﺗ‬ ‫‪‬‬ ‫ﻤﻜﻦ أن ﺗﻜﻮن ﻣﻔ ﺪة ﻟﻠﺘﺤﻠ ﻞ واﻟﺮؤى‪.‬‬ ‫اﻟﺒ ﺎﻧﺎت اﻟ‬ ‫ﻫﺬە ﻣﺠﺮد أﻣﺜﻠﺔ ﻗﻠ ﻠﺔ‪ ،‬وﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ﺗﺘﻄﻮر ﺎﺳﺘﻤﺮار ﻣﻊ ﺗﻐ اﻟﺘﻜﻨﻮﻟﻮﺟ ﺎ واﻟﻤﺠﺘﻤﻊ‪.‬‬ ‫‪8‬‬ ‫ﺗﺤﺪ ﺎت ﺗﻨﻈ ﻢ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ ‫ﻫﻨﺎك اﻟﻌﺪ ﺪ ﻣﻦ اﻟﻤﺸ ﻼت واﻟﺘﺤﺪ ﺎت اﻟ ﻗﺪ ﺗﻮاﺟﻬﻬﺎ اﻟﻤﺆﺳﺴﺎت ﻋﻨﺪ اﻟﺘﻌﺎﻣﻞ ﻣﻊ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪ ،‬ﻤﺎ‬ ‫‪‬‬ ‫ذﻟﻚ‪:‬‬ ‫‪9‬‬ ‫ﻣﻨﻈﻮﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ ‫اﻷﻃﺮاف‬ ‫ﺗﺘﻌﺎﻣﻞ ﻣﻊ ﻫﺬە اﻟﺨﺪﻣﺔ وﺗﺤﺪ ﺪ واﺟ ﺎت وﺣﻘﻮق ﻞ‬ ‫ﻟ ﻳﺘﻢ ﺗﻨﻈ ﻢ أي ﺧﺪﻣﺔ ﺠﺐ ﺗﺤﺪ ﺪ اﻷﻃﺮاف اﻟ‬ ‫‪‬‬ ‫ﻃﺮف‪.‬‬ ‫ﻣﺎ ﺑ ﻨﻬﺎ‪ ،‬ﻫﺬە اﻟﻤﻨﻈﻮﻣﺔ ُﻣ ﻮﻧﺔ ﻣﻦ‪:‬‬ ‫ﺗﺘﻜﻮن ﻣﻨﻈﻮﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ﻣﻦ ﻋﺪة ﺟﻬﺎت ﺗﺘﻔﺎﻋﻞ‬ ‫‪‬‬ ‫‪ ‬ﻣﻮﻓﺮ‪/‬ﻣﺰود اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫‪ُ ‬ﻣﻘﺪم ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫‪ ‬ﻋﻤ ﻞ ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‪.‬‬ ‫‪10‬‬ ‫ﻣﻮﻓﺮ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ ‫ُﻣﻘﺪم اﻟﺨﺪﻣﺔ‪ ،‬و ﺸﻤﻞ أ ﺸﻄﺔ‬ ‫اﻟﺒ ﺎﻧﺎت ﻣﻦ ﻣﺼﺎدر ُﻣﺨﺘﻠﻔﺔ إ‬ ‫ﺗﻮﻓ‬ ‫ﻌﻤﻞ ﻣﻮﻓﺮ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ﻋ‬ ‫‪‬‬ ‫‪:‬‬ ‫ﺳ ﻞ اﻟﻤﺜﺎل ﻣﺎ‬ ‫ﻣﻮﻓﺮة اﻟﺒ ﺎﻧﺎت ﻋ‬ ‫‪ ‬إ ﺸﺎء اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫‪ ‬إ ﺸﺎء اﻟﻤﻌﻠﻮﻣﺎت اﻟﻮﺻﻔ ﺔ )‪ (Meta data‬اﻟ ﺗﺼﻒ ﻣﺼﺪر اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫اﻹﻧ ﻧﺖ‪.‬‬ ‫‪ ‬إ ﺠﺎد ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت اﻟﻤﻔﺘﻮﺣﺔ )‪ (open data‬ﻋ‬ ‫‪ ‬ﺗﻮﻓ ﺑ ﺎن اﻟﺨﺪﻣﺎت )‪ (Service catalogue‬إ ُﻣﻘﺪم اﻟﺨﺪﻣﺔ ﻋﻦ اﻟﺒ ﺎﻧﺎت اﻟﻘﺎ ﻠﺔ ﻟﻺﺳﺘﺨﺪام‪.‬‬ ‫‪11‬‬ ‫ُﻣﻘﺪم ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ ‫اﻟﺒ ﺔ اﻟﺘﺤﺘ ﺔ اﻟﻼزﻣﺔ ﻟﻬﺎ و ﺸﻤﻞ أ ﺸﻄﺔ ُﻣﻘﺪم‬ ‫ﻘﻮم ُﻣﻘﺪم اﻟﺨﺪﻣﺔ ﺑﺘﺤﻠ ﻞ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ وﺗﻮﻓ‬ ‫‪‬‬ ‫‪:‬‬ ‫ﺳ ﻞ اﻟﻤﺜﺎل ﻣﺎ‬ ‫اﻟﺨﺪﻣﺔ ﻋ‬ ‫ﻣﻦ ﻣﻮﻓﺮ اﻟﺒ ﺎﻧﺎت أو اﻟ ﺤﺚ‬ ‫ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت وﺟﻤﻊ اﻟﺒ ﺎﻧﺎت ﻋﻦ ﻃ ﻖ اﻟﻄﻠﺐ اﻟﻤ ﺎ‬ ‫‪ ‬اﻟ ﺤﺚ‬ ‫اﻹﻧ ﻧﺖ )‪.(Data Crawling‬‬ ‫‪ ‬ﺗﺨ ﻦ اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫‪ ‬دﻣﺞ اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫‪ ‬ﺗﻮﻓ أدوات ﻟﺘﺤﻠ ﻞ اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫‪ ‬دﻋﻢ إدارة اﻟﺒ ﺎﻧﺎت ﻣﺜﻞ ﺧﺼﻮﺻ ﺔ اﻟﺒ ﺎﻧﺎت وأﻣﻦ اﻟﺒ ﺎﻧﺎت وﻣﻠ ﺔ اﻟﺒ ﺎﻧﺎت‪.‬‬ ‫‪12‬‬ ‫ﻋﻤ ﻞ ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ‬ ‫ُ‬ ‫ﻘﺪﻣﻬﺎ‬ ‫ﻫﻮ اﻟﻤﺴﺘﺨﺪم اﻟﻨﻬﺎ ﻟﻤﻨﻈﻮﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ أو ﻫﻮ ﻧﻈﺎم ﺴﺘﺨﺪم اﻟﻨﺘﺎﺋﺞ أو اﻟﺨﺪﻣﺎت اﻟ‬ ‫‪‬‬ ‫ُ‬ ‫ُﻣﻘﺪم ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ و ﻤﺎ ﻤﻜﻦ ﻟﻠﻌﻤ ﻞ أن ﻳ ﺘﺞ ﺧﺪﻣﺎت ﺟﺪ ﺪة أو

Use Quizgecko on...
Browser
Browser