Data Science Presentation PDF

Summary

This presentation provides an introduction to data science, including definitions of data, information, and knowledge. It also discusses the different applications and uses of data science and big data.

Full Transcript

‫د‪.‬اسعد السعدني‬ ‫‪1‬‬ ‫أهداف التعلم‬ ‫بنهاية هذا الفصل سيكون الطالب قادرا على أن‪:‬‬ ‫فهما ملصطلح علم البيانات ومفهومه‪.‬‬ ‫‪.1‬يكتسب الطالب ً‬ ‫‪.2‬يميزبين املصطلحات‪ :‬البيانات‪ ،‬املعلومات‪ ،‬واملعرفة‪.‬‬...

‫د‪.‬اسعد السعدني‬ ‫‪1‬‬ ‫أهداف التعلم‬ ‫بنهاية هذا الفصل سيكون الطالب قادرا على أن‪:‬‬ ‫فهما ملصطلح علم البيانات ومفهومه‪.‬‬ ‫‪.1‬يكتسب الطالب ً‬ ‫‪.2‬يميزبين املصطلحات‪ :‬البيانات‪ ،‬املعلومات‪ ،‬واملعرفة‪.‬‬ ‫‪.3‬يفرق بين علم البيانات وذكاء األعمال‪.‬‬ ‫‪.4‬يوضح التقارب بين علم البيانات والذكاء االصطناعي‪.‬‬ ‫‪.5‬يعرف مراحل دورة حياة علم البيانات‪.‬‬ ‫صنف تقنياته‪.‬‬ ‫ُ‬ ‫يعرف مصطلح البيانات الضخمة‪ ،‬يحدد خصائصه‪ ،‬وي ِّ‬ ‫‪ِّ.6‬‬ ‫حدد مبادئ حوكمة البيانات‪.‬‬ ‫‪.7‬يعرف مفهوم إدارة البيانات ُ‬ ‫وي‬ ‫ِّ‬ ‫‪.8‬يناقش املهارات واألدوات الضرورية ملمارسة علم البيانات‪.‬‬ ‫حدد مختلف املهن املرتبطة بمجال علم البيانات‪.‬‬ ‫ُ‬ ‫‪.9‬ي ِّ‬ ‫‪.01‬يعرف أهمية البيانات في تشكيل املجتمعات الرقمية وتطويرها‬ ‫‪2‬‬ ‫مقدمة يف علم البياانت‬ ‫‪Data Science‬‬ ‫تكمن أهمية علم البيانات (‪ )Data Science‬في أن البيانات أصبحت جزءا أساسيا في جميع‬ ‫مطلبا ر ً‬ ‫ئيسا من قبل الشركات لكي تتوسع أعمالها وتتطور‪.‬حيث تمكن‬ ‫ً‬ ‫الصناعات‪ ،‬فلقد أصبحت البيانات‬ ‫الشركات من اتخاذ القرارات املناسبة وذلك من خالل تحليل كميات كبيرة من البيانات الستخراج رؤى‬ ‫وتوصيات قيمة إلدارة تلك الشركات‪.‬‬ ‫علم البيانات هو مجال الدراسة الذي يتعامل مع كميات هائلة من البيانات باستخدام األدوات والتقنيات‬ ‫الحديثة إليجاد أنماط غير بديهية داخل تلك البيانات‪ ،‬وللوصول الى معلومات مهمة يمكن أن تساهم في‬ ‫اتخاذ القرارات املتعلقة بكافة األعمال‪.‬‬ ‫‪3‬‬ ‫مجاالت تطبيق علم البيانات‬ ‫التطبيقات التجارية والصناعية‬ ‫‪‬‬ ‫الرعاية الصحية‪ ،‬واملعلوماتية الحيوية‪ ،‬والعلوم الطبيعية‬ ‫‪‬‬ ‫االقتصاد الرقمي‪ ،‬وتحليل وسائل التواصل االجتماعي والشبكات االجتماعية‬ ‫‪‬‬ ‫املنازل الذكية‪ ،‬واملدن الذكية واملواصالت الذكية‬ ‫‪‬‬ ‫التعليم والتعلم اإللكتروني‬ ‫‪‬‬ ‫الطاقة‪ ،‬واالستدامة‪ ،‬واملناخ‬ ‫‪‬‬ ‫‪4‬‬ ‫البيانات واملعلومات ‪Data and Information‬‬ ‫تحيط بك البيانات بصورة يومية في كل مكان‪ ،‬فتتلقى املعلومات من التلفازومن الصحف والكتب وشبكة اإلنترنت‪،‬‬ ‫ولكن هل فكرت في أن هناك فرقا بين البيانات واملعلومات؟ تعد البيانات تمثيال للحقائق أو األفكار بصورة شكلية‪،‬‬ ‫بحيث يمكن إيصالها أو معالجتها من خالل طريقة أو عملية ما‪.‬‬ ‫‪ ‬البيانات‪ :‬تمثيل الحقائق أو األفكاربتنسيق مناسب للتخزين أو املعالجة أو النقل‪.‬‬ ‫‪ ‬املعلومات‪ :‬مجموعة من البيانات التي خضعت للمعالجة وأصبحت منظمة ذات معنى وتقدم في سياق محدد‬ ‫ُ‬ ‫ومفيد وتمكن عمليات صنع القرار‪.‬‬ ‫البيانات األولية واملعلومات ‪:Raw Data and Information‬‬ ‫ً‬ ‫تطلق تسمية البيانات األولية على البيانات التي تم جمعها حديثا من مصادر مختلفة‪ ،‬ولكن لم يتم معالجتها أو‬ ‫تحليلها بعد بأي شكل من األشكال‪ ،‬وعادة ما ترمز كلمة البيانات (‪ )Data‬إلى البيانات األولية‪ ،‬ولكن بمجرد‬ ‫تحليلها فإنها تتحول إلى معلومات‪.‬‬ ‫‪5‬‬ 6 ‫املعرفة ‪Knowledge‬‬ ‫تعتبر املعرفة تمثيال لفهمك للعالم‪ ،‬وهي بشكل أساس ي مجموعة من املعلومات يتم استخدامها لتقديم فائدة أو‬ ‫تحقيق غرض معين‪.‬يمكنك القول إن فهم الشخص لبعض املعلومات حول ش يء ما يوفر لديه معرفة به‪ ،‬فتصبح‬ ‫املعلومات معرفة عند تطبيق عمليات التفكير‪ ،‬أو التقييم‪ ،‬أو التخطيط‪ ،‬أو التنظيم‪.‬‬ ‫‪7‬‬ 8 ‫علم البيانات وذكاء األعمال ‪Business & Science Data‬‬ ‫‪Intelligence‬‬ ‫توجد البيانات في كل مكان من حولك‪ ،‬ويتم استخدامها ومعالجتها وتحليلها في جميع مجاالت الحياة‪.‬‬ ‫‪‬‬ ‫ُ‬ ‫تتطور نوعية البيانات واستخداماتها باستمرار‪ ،‬وتستخدم بشكل خاص في العديد من التطبيقات املهمة مثل‬ ‫‪‬‬ ‫ذكاء األعمال (‪ ،)Business Intelligence‬ولهذا ُيعتبر ذكاء األعمال عملية قائمة على التقنية‬ ‫لتحليل البيانات وتوفير معلومات مهمة تساعد املدراء التنفيذين وغيرهم من املسؤولين وصناع القرار على‬ ‫اتخاذ قرارات دقيقة خاصة باألعمال‪.‬‬ ‫على الرغم من أن كال من علم البيانات وذكاء األعمال يتضمن العمل على البيانات‪ ،‬إال أنهما يختلفان عن‬ ‫‪‬‬ ‫بعضهما‪.‬‬ ‫ً‬ ‫ُيعد علم البيانات أكثر تعقيدا مقارنة بذكاء األعمال‪ ،‬حيث يقتصر نطاق ذكاء األعمال على مجال األعمال‪ ،‬ويتم‬ ‫‪‬‬ ‫فيه تحليل البيانات السابقة من خالل تطوير لوحات املعلومات وعرض مستخلصات (رؤى) األعمال‪ ،‬وكذلك‬ ‫ترتيب وتنظيم وتحليل البيانات وذلك الستخراج املعلومات التي من شأنها مساعدة الشركات على النمو‬ ‫وتحقيق أهدافها بناء على فهم االتجاهات الحالية لألعمال‪.‬‬ ‫يعتمد علم البيانات على استخدام البيانات املتوفرة للقيام بتنبؤات مستقبلية وعرض توقعات نمو األعمال‬ ‫‪‬‬ ‫التجارية‪ ،‬وذلك بتوظيف مجموعة واسعة مما يسمى بالنماذج التنبؤية والخوارزميات اإلحصائية املعقدة‪.‬‬ ‫‪9‬‬ ‫ذكاء االعمال ‪ :Business Intelligence‬هو نظام مبني على البيانات ويشمل جمع وتخزين وتحليل وتمثيل البيانات لدعم‬ ‫عمليات اتخاذ القرارات‪.‬‬ ‫يتمثل الدور األساس ي ألدوات ذكاء األعمال في تحليل معلومات املؤسسات والشركات واملساهمة في إعداد استراتيجيات األعمال‪ ،‬أما‬ ‫أدوات عالم البيانات فتشمل أدوات معالجة البيانات وأدوات البيانات الضخمة وكذلك نماذج خوارزمية معقدة لتحليل البيانات‬ ‫واستخالص التوصيات‪.‬‬ ‫‪10‬‬ ‫علم البيانات والذكاء االصطناعي ‪Data Science and‬‬ ‫‪Artificial Intelligence‬‬ ‫ً‬ ‫كما تعرفت سابقا على مفهوم علم البيانات‪ ،‬فإن مجال الذكاء االصطناعي ‪ُ Artificial Intelligence‬يعد‬ ‫ً‬ ‫مجال آخريتعامل مع كم كبيرمن البيانات‪.‬‬ ‫يمكن استخدام كل تقنية من هاتين التقنيتين بصوره منفصلة عن األخرى للوصول لحلول لتحديات مختلفة‪ ،‬كذلك‬ ‫يمكن لكل منهما إكمال بعضهما والتقارب ً‬ ‫معا‪.‬‬ ‫‪:Artificial Intelligence‬أحد مجاالت علوم الحاسب ويهدف لبناء أنظمة قادرة على‬ ‫ً‬ ‫الذكاء االصطناعي‬ ‫ً‬ ‫ً‬ ‫أداء املهام التي تتطلب عادة ذكاء بشريا مثل القدرة على التعلم واالستدالل‪ ،‬وحل املشكالت ومعالجة اللغة الطبيعية‬ ‫واإلدراك‪.‬‬ ‫باستخدام أدوات حسابية للقيام بما يسمى بالتحليل الوصفي‬‫ً‬ ‫يختص علم البيانات بمعالجة البيانات التاريخية‬ ‫للبيانات ‪ Descriptive Analysis‬والذي يقدم وصفا للمو اقف املحددة‪ ،‬وكذلك للتنبؤ بالنتائج من خالل‬ ‫التحليل التنبؤي ‪ ،Predictive Analysis‬ولتقديم الحلول والتوصيات للمشكالت من خالل التحليل التوجيهي‬ ‫ً‬ ‫استخداما هي األدوات اإلحصائية واإلدارية التي يمكن بواسطتها‬ ‫‪.Prescriptive Analysis‬من أكثر األدوات‬ ‫تحليل البيانات املؤرخة‪.‬‬ ‫‪11‬‬ ‫يستخدم الذكاء االصطناعي مجموعة متنوعة من التقنيات ملحاكاة الطريقة التي يفكر بها البشر والتي‬ ‫‪‬‬ ‫ً‬ ‫فبدل من التركيز على إجراء الحسابات الرياضية‪ ،‬يتم التركيز‬ ‫يقومون بناء عليها باتخاذ القرارات وتحليلها‪،‬‬ ‫عند استخدام أدوات الذكاء االصطناعي على عناصر املعرفة والذكاء كعناصر حاسمة لحل املشكالت‪.‬‬ ‫ويهتم الذكاء االصطناعي كذلك بالحوسبة املعرفية‪.‬‬ ‫ّ‬ ‫مشروعات علم البيانات املعقدة ً‬ ‫و‬ ‫غالبا ما تتضمن استخدام تقنيات تعلم اآللة ‪ -‬أحد فر ع الذكاء‬ ‫‪‬‬ ‫االصطناعي ‪ -‬لتسهيل تحليل البيانات التنبؤية والتوجيهي‪.‬‬ ‫ّ‬ ‫يستخدم الجيل القادم من أدوات علم البيانات ومنصات ذكاء األعمال تعلم اآللة للقيام ببعض اإلجراءات‬ ‫‪‬‬ ‫التعرف على األنماط في البيانات الكتشاف األنماط املخفية وتقديم التصورات والرؤى املهمة التخاذ‬ ‫ّ‬ ‫مثل‬ ‫القرارات‬ ‫جدا في الحصول على‬ ‫عند الجمع بين علم البيانات والذكاء االصطناعي‪ ،‬يمكن الحصول على طريقة فعالة ً‬ ‫‪‬‬ ‫نتائج دقيقة بشكل ملحوظ تساهم في اتخاذ قرارات أفضل وأسرع‪.‬‬ ‫‪12‬‬ ‫دورة حياة علم البيانات ‪Data Science Life Cycle‬‬ ‫يقوم علماء البيانات واملتخصصين في العمل‬ ‫على مشروعات علم البيانات بتوظيف خبراتهم‬ ‫من خالل خطوات محددة لتنفيذ كل مشروع‬ ‫جديد بكفاءة‪ُ.‬يطلق على هذه العملية اسم‬ ‫دورة حياة علم البيانات وتتضمن خمس‬ ‫مراحل تتميز كل مرحلة من املراحل املختلفة‬ ‫لهذه الدورة بخصائص معينة‪.‬‬ ‫‪13‬‬ ‫‪.1‬تعريف املشكلة وصياغتها ‪Problem Definition and‬‬ ‫‪Formulation‬‬ ‫فهم أهداف ومتطلبات العمل أو‬ ‫املشكلة العلمية وتحويل هذه‬ ‫املعرفة الى مسألة يمكن حلها‬ ‫بتحليل البيانات‪.‬‬ ‫‪ ‬من أجل تصميم و إيجاد حل‬ ‫ملشكلة بواسطة علم البيانات‪،‬‬ ‫فإنك تحتاج أوال إلى فهم ماهية‬ ‫املشكلة نفسها‪.‬‬ ‫‪ُ ‬يعد التحليل الشامل للمشكلة‬ ‫وبيئتها واملتغيرات التي تؤثر عليها‬ ‫أمرا ضرورًيا لتطوير الحلول‬ ‫ً‬ ‫الالزمة لحل تلك املشكلة‬ ‫‪14‬‬ ‫‪ -2‬جمع البيانات‪Data Collection‬‬ ‫ عملية جمع القراءات أو الحقائق وتنسيقها‪ ،‬وتشمل‬ ‫الحصول عليها وتسميتها وتحسينها‪.‬‬ ‫ بعد أن يتم تحديد األهداف‪ ،‬يجب توفير مجموعة‬ ‫البيانات نفسها‪ ،‬ورغم انه قد يتم إدخال البيانات‬ ‫ً‬ ‫ً‬ ‫يدويا أحيانا‪ ،‬فمن املهم التنقيب وجمع البيانات‪،‬‬ ‫حيث يتعين في هذه املرحلة جمع بيانات كافية‬ ‫ملواصلة معالجتها‪.‬‬ ‫ يمكن أن تأتي البيانات نفسها من مجموعة متنوعة‬ ‫ً‬ ‫من املصادر‪ ،‬فمثال تقوم أجهزة االستشعار البيئية‬ ‫وتطبيقات الهاتف املحمول ومنصات الويب بتوليد‬ ‫البيانات بصورة مستمرة ليتم تخزينها تلق ً‬ ‫ائيا في‬ ‫قواعد البيانات‪.‬‬ ‫‪15‬‬ ‫‪ -3‬تجهيزالبيانات وتنظيفها ‪Data Preparation and Cleaning‬‬ ‫عملية متعددة املراحل ملراجعة البيانات وتصحيحها للتأكد من أنها في صيغة موحدة‪ ،‬ويتضمن ذلك‬ ‫‪‬‬ ‫معالجة القيم املفقودة والبيانات املشوشة‪ ،‬وحل التناقضات والتكرارات‪.‬‬ ‫ُ‬ ‫تعد عملية "تنظيف" البيانات ومعالجتها أحد أهم املراحل في دورة حياة علم البيانات‪.‬‬ ‫‪‬‬ ‫يجب على عالم البيانات تصحيح وتجهيز البيانات التي تم جمعها في مرحلة التنقيب للتأكد من مناسبتها‬ ‫‪‬‬ ‫ملرحلة التحليل الالحقة‪ ،‬وعند دمج البيانات من مصادر متعددة تزيد احتمالية تكرار البيانات أو تداخلها‪،‬‬ ‫األمرالذي يتطلب عملية تصحيح وتصويب لتلك البيانات‪.‬‬ ‫كذلك هو الحال إذا ُوجدت بيانات تالفة أو منسقة بشكل غير صحيح أو مكررة أو خاطئة أو حتى غير‬ ‫‪‬‬ ‫مكتملة‪.‬‬ ‫تكمن أهمية تصحيح تلك البيانات في أن الرؤى أو االستنتاجات املستمدة في مرحلة التحليل من تلك‬ ‫‪‬‬ ‫البيانات ستكون خاطئة وسيصعب للغاية استنتاج ما إذا كانت املشكلة ناشئة من أخطاء في خطوات‬ ‫التحليل أو أن البيانات نفسها لم يتم تصحيحها‪ ،‬ولهذا السبب فإن عملية تنظيف البيانات والتحقق من‬ ‫ً‬ ‫ً‬ ‫ُ‬ ‫صحتها ً‬ ‫جيدا قبل تحليلها تعد أمرا مهما للغاية للعملية بأكملها‪.‬‬ ‫‪16‬‬ ‫‪ -4‬التحليل االستكشافي للبيانات‪Exploratory Data Analysis‬‬ ‫‪ ‬هو نهج لتحليل مجموعات البيانات وتلخيص خصائصها الرئيسية‪ ،‬ويتم عادة باستخدام األساليب‬ ‫املرئية‪.‬‬ ‫‪ ‬بعد أن جمعت البيانات وقمت بتصحيحها‪ ،‬يمكنك تحليل مجموعة البيانات واستنباط اإلجابات‬ ‫املطلوبة ألسئلتك‪ ،‬ويتم إجراء تحليل البيانات باستخدام أدوات تحليل البيانات او األكواد واملكتبات‬ ‫ً‬ ‫البرمجية املتخصصة‪ ،‬وقد يكون التحليل بسيطا وذلك بدراسة متغير واحد أو أكثر‪ ،‬وقد يتسع ليشمل‬ ‫تعقيدا تتضمن عمليات إحصائية متقدمة‪.‬‬‫ً‬ ‫عمليات أكثر‬ ‫‪ُ ‬يعد تعلم اآللة من أكثر الطرق شيوعا في الوقت الحالي لتحليل مجموعة البيانات‪ ،‬ويجب ِّاتباع خطوات‬ ‫محددة لتحليل البيانات باستخدام تعلم اآللة‪ ،‬ففي البداية يجب تحديد نموذج تعلم اآللة بإيجاد قيم‬ ‫املدخالت واملخرجات يليها بناء خوارزمية التحليل نفسها‪.‬‬ ‫‪ ‬تعتبر هذه العملية معقدة‪ ،‬ولهذا فإن هناك متخصصين للقيام بها مثل علماء البيانات ومهندس ي تعلم‬ ‫اآللة‪.‬بعد االنتهاء من الخوارزمية‪ ،‬يتم بناء النموذج واختباره‪ ،‬وعند اكتمال هاتين املرحلتين يمكنك‬ ‫استخدام البيانات الناتجة منه للوصول لإلجابات املرجوه الحصول عليها من عمليات التحليل‪.‬‬ ‫‪17‬‬ ‫‪ -5‬التمثيل الرسومي للبيانات ‪Data Visualization‬‬ ‫‪ ‬يسلط التمثيل الرسومي للمعلومات الضوء على أنماط و اتجاهات البيانات‪ ،‬ويساعد القارئ‬ ‫على تطويررؤى وتوصيات ً‬ ‫بناء على تلك البيانات‪.‬‬ ‫‪ ‬يتم تقديم البيانات التي يتم تحليلها عادة بصوره جداول بيانات‪ ،‬مما يتيح ملحللي البيانات ذوي‬ ‫الخبرة استخدامها‪ ،‬ويقدم التمثيل املرئي لتحليل البيانات إمكانية استخالص رؤى وتوصيات‬ ‫ذات جودة أفضل‪ ،‬بينما توفر الرسوم البيانية واملخططات وحتى الخرائط‪ ،‬وكذلك التقارير‬ ‫املنسقة طريقة فعالة لرؤية وفهم أنماط البيانات و اتجاهاتها أي ما توحي به تلك البيانات‪.‬‬ ‫أمرا ضرورًيا التخاذ قرارات ُمستندة إلى البيانات عند التعامل مع كميات‬ ‫‪ُ ‬يعد تمثيل النتائج ً‬ ‫هائلة من املعلومات‪.‬‬ ‫‪18‬‬ ‫املجاالت واملهارات األساسية للدراسة في علم البيانات‬ ‫‪ ‬علم البيانات هو مصطلح واسع يتطلب الكفاءة في مختلف املجاالت إلتقانها‪.‬‬ ‫‪ ‬بعض املجاالت والجوانب الرئيسية الالزمة إلتقان علم البيانات‪:‬‬ ‫❖تعلم اآللة‬ ‫بالنسبة لعالم البيانات‪ ،‬يعد تعلم اآللة مهارة أساسية‪.‬تتمثل الفكرة األساسية للتعلم اآللي في السماح‬ ‫لآلالت بالتعلم بشكل مستقل باستخدام كتلة البيانات التي يتم تغذيتها بالجهاز كمدخالت‪.‬مع تقدم‬ ‫التكنولوجيا‪ ،‬يتم تدريب اآلالت على التصرف مثل البشرفي القدرة على اتخاذ القرار‪.‬‬ ‫❖التعلم العميق‬ ‫ً‬ ‫ً‬ ‫غالبا ما يستخدم التعلم العميق في علم البيانات‪.‬ألنها تعمل بشكل أفضل بكثير من طرق التعلم اآللي‬ ‫ً‬ ‫تلقائيا من بنية البيانات‪.‬‬ ‫التقليدية‪.‬حيث يستخرج التعلم العميق امليزات‬ ‫‪19‬‬ ‫❖الرياضيات‬ ‫لتحسين مهارات التعلم اآللي‪ ،‬يجب أن يكون لدى عالم البيانات معرفة عميقة بالرياضيات‪.‬موضوعان‬ ‫مهمان في الرياضيات من حيث التطبيق في علم البيانات هما الجبر والحساب‪.‬فإن الحسابات مطلوبة في‬ ‫مجاالت مختلفة من التعلم اآللي‪ ،‬مثل تقنيات التحسين‪.‬‬ ‫❖االحصاء واالحتمالية‬ ‫ً‬ ‫العالم هو عالم احتمالي‪ ،‬لذلك نحن نعمل مع البيانات االحتمالية؛ هذا يعني أنه وفقا ملجموعة محددة‬ ‫جزءا من الوقت فقط‪.‬الستخدام علم البيانات بشكل‬ ‫من املتطلبات األساسية‪ ،‬ستظهر لك البيانات ً‬ ‫صحيح‪ ،‬يجب أن تكون على دراية باالحتماالت واإلحصاءات‪.‬اإلحصاء واالحتماالت من املتطلبات‬ ‫األساسية في علم البيانات واملعرفة الجيدة في هذا املجال ضرورية‪.‬‬ ‫❖الخوارزميات‬ ‫نظرا ألن جميع أنظمة التعلم اآللي تعتمد على الخوارزميات‪ ،‬فمن الضروري ً‬ ‫جدا أن يكون لدى عالم‬ ‫‪ً ‬‬ ‫البيانات فهم أساس ي للخوارزميات وكيفية تصميمها‪.‬‬ ‫‪20‬‬ ‫❖معالجة اللغة الطبيعية‬ ‫ً‬ ‫ً‬ ‫ً‬ ‫في مجال علم البيانات‪ ،‬تعد معالجة اللغة الطبيعية مكونا مهما للغاية مع تطبيقات واسعة في مختلف‬ ‫قطاعات الصناعة والشركات‪.‬من السهل على البشر فهم اللغة‪ ،‬ومع ذلك‪ ،‬فإن اآلالت غير قادرة على‬ ‫التعرف عليها بشكل كاف‪.‬معالجة اللغة الطبيعية هي فرع من فروع الذكاء االصطناعي يركز على سد‬ ‫الفجوة بين التواصل بين اإلنسان واآللة لتمكين اآللة من التفسيروالفهم‪.‬‬ ‫❖العرض املرئي للبيانات‬ ‫يعد تصوير البيانات أحد أهم فروع علم البيانات‪.‬ببساطة‪ ،‬يتضمن الرسم التوضيحي عرض البيانات في‬ ‫شكل رسوم بيانية ومخططات بيانية‪.‬‬ ‫❖لغة البرمجة‬ ‫يجب أن يتمتع عالم البيانات‪ ،‬باإلضافة إلى مهارات الكمبيوتر األساسية مثل مهارات البرمجة حتى يتمكن‬ ‫من استخدامها للعمل مع البيانات والتمثيل املرئي واستخدام التعلم اآللي ومهارات التعلم العميق في‬ ‫تنفيذ املشروع‪.‬‬ ‫‪21‬‬ ‫تطبيقات علم البيانات‬ ‫اآلن بعد أن عرفت أهمية علم البيانات واملتطلبات األساسية واملهارات الالزمة له‪ ،‬من املهم أن تعرف كيف‬ ‫يمكن استخدام علم البيانات في العالم الحقيقي‪ ،‬وسنرى كيف غير علم البيانات العالم اليوم‪.‬لذلك‪ ،‬إليك‬ ‫قائمة بتطبيقات علوم البيانات ملعرفة املزيد عن تطبيقاتها‪:‬‬ ‫ املواصالت‬ ‫أهم تقدم أو تطويرحققه علم البيانات في مجال النقل هو إدخال السيارات ذاتية القيادة‪.‬‬ ‫‪ ‬لقد أسس علم البيانات موطئ قدم قوي في صناعة النقل من خالل التحليل املكثف ألنماط استهالك‬ ‫الوقود‪.‬‬ ‫‪ ‬املر اقبة النشطة للمركبة وسلوك السائق‪.‬‬ ‫ً‬ ‫‪ ‬توفيربيئات قيادة أكثرأمانا للسائقين‪.‬‬ ‫‪ ‬تحسين أداء السيارة‪ ،‬وإضافة االستقاللية إلى السيارات‪.‬‬ ‫ً‬ ‫باستخدام التعلم املعزز واالستقاللية‪ ،‬يمكن لشركات صناعة السيارات بناء سيارات أكثر ذ ً‬ ‫كاء وطرقا‬ ‫منطقية أفضل‪.‬‬ ‫‪22‬‬ ‫ كشف املخاطرواالحتيال‬ ‫تم استخدام علم البيانات ألول مرة في التمويل واملصارف‪.‬كانت العديد من املؤسسات املالية مثقلة بالديون في‬ ‫نهاية كل عام‪.‬لذلك‪ ،‬تم اعتبار اساليب علم البيانات كحل‪.‬لتحليل احتمالية املخاطر‪ ،‬تعلموا فصل البيانات ً‬ ‫بناء‬ ‫على مواصفات العميل والتكاليف السابقة واملتغيرات الضرورية األخرى‪.‬وبالتالي‪ ،‬يمكنهم القيام بالتسويق‬ ‫بناء على إيرادات كل عميل كل عام‪.‬‬‫املستهدف ً‬ ‫ علم الوراثة والجينات الوراثية‬ ‫يساعد علم البيانات علماء األحياء على تحليل استجابة الجينات لألدوية املختلفة‪.‬والغرض منه هو فهم ودراسة‬ ‫تأثير الحمض النووي على صحة الشخص‪ ،‬والذي يسعى إلى إيجاد روابط بيولوجية بين األمراض والجينات‬ ‫واالستجابات لألدوية‪.‬‬ ‫ تطويراالدوية‬ ‫يتطلب اكتشاف دواء جديد سنوات من البحث واالختبار للوصول إلى مرحلة اإلنتاج وفي النهاية يتم ترخيصه‬ ‫للمتاجر الطبية واملستشفيات للمرض ى‪.‬يمكن استخدام خوارزميات التعلم اآللي وعلوم البيانات لتبسيط العملية‬ ‫وتقليل الوقت الالزم للفحص األولي ملركبات األدوية املستخدمة في إنتاج األدوية‪.‬يمكن أن تتنبأ الخوارزميات‬ ‫أيضا بكيفية استجابة الجسم ملركبات دو ائية معينة باستخدام نماذج ومحاكاة إحصائية‬ ‫وعلوم البيانات ً‬ ‫ورياضية مختلفة‪.‬هذا أسرع بكثير من االختبا ات املختبرية التقليدية‪.‬يمكن للنماذج ً‬ ‫أيضا توقع النتائج املستقبلية‬ ‫ر‬ ‫بشكل أكثردقة‪.‬‬ ‫‪23‬‬ ‫التعامل مع البياانت‬ ‫ما املقصود بالبيانات الضخمة؟ ?‪What is Big Data‬‬ ‫نظرا لخصائص‬ ‫مجموعة بيانات كبيرة تتطلب تقنيات قابلة للتوسع لتخزينها ومعالجتها وإدارتها وتحليلها وذلك ً‬ ‫حجمها‪ ،‬وتنوعها وسرعتها وتباينها وبالطبع قيمتها‪.‬‬ ‫يشير مصطلح البيانات الضخمة إلى البيانات الكبيرة ً‬ ‫جدا أو املعقدة التي ال يمكن معالجتها بالطرق التقليدية‪،‬‬ ‫ً‬ ‫كبيرا جدا لتتم معالجتها باستخدام أنظمة الحوسبة التقليدية‪ ،‬فإن تخزين‬ ‫ونظرا ألن كم هذه البيانات ُيعد ً‬ ‫ً‬ ‫كبيرا‪ ،‬وكذلك قد تتطلب السرعة الهائلة لعملية جمع البيانات متطلبات‬ ‫مجموعاتها ومعالجتها يعتبر ً‬ ‫تحديا ً‬ ‫تخزين عالية للغاية‪.‬‬ ‫‪24‬‬ ‫البيانات هي أساس علم البيانات؛ البيانات هي املكونات الرئيسية التي تستند إليها جميع التحليالت‪.‬في مجال‬ ‫علم البيانات‪ ،‬يمكن تقسيم هذه البيانات إلى مجموعتين‪ :‬البيانات التقليدية والبيانات الضخمة‪.‬‬ ‫تشير البيانات التقليدية إلى البيانات املخزنة في قواعد البيانات التي يمكن للمحللين إدارتها على جهاز‬ ‫الحاسوب‪.‬هذه البيانات في شكل جدول يحتوي على قيم عددية أو نصية‪.‬بالطبع‪ ،‬مصطلح "تقليدي"‬ ‫هو ما نستخدمه في أغلب األحيان للتمييزبشكل أفضل بين البيانات الضخمة و أنواع البيانات األخرى‪.‬‬ ‫البيانات الضخمة‪ ،‬من ناحية أخرى‪ ،‬هي بيانات أكبر من البيانات التقليدية وعادة ما يتم توزيعها عبر‬ ‫شبكة واسعة من أجهزة الحاسوب‪.‬‬ ‫‪ ‬تعريف البيانات الضخمة‪ :‬تشير البيانات الضخمة إلى مجموعة بيانات هيكلية معقدة وغير منظمة‬ ‫وذات حجم كبير يتم إنشاؤها بسرعة من مجموعة متنوعة من املصادر‪ ،‬مما يساعد في اتخاذ‬ ‫القرار‪.‬‬ ‫‪25‬‬ ‫تشير البيانات الضخمة إلى مجموعة كبيرة من البيانات غير املتجانسة التي يتم الحصول عليها من‬ ‫ً‬ ‫أنواعا مختلفة من البيانات على النحو التالي‪:‬‬ ‫مجموعة متنوعة من املصادروتتضمن‬ ‫‪ ‬البيانات غير املهيكلة‪ :‬الشبكات االجتماعية‪ ،‬ورسائل البريد اإللكتروني‪ ،‬واملدونات‪ ،‬والتغريدات‪،‬‬ ‫والصورالرقمية‪ ،‬وبيانات الجوال‪ ،‬وصفحات الويب‪ ،‬إلخ‪.‬‬ ‫‪ ‬شبه املنظمة‪ :‬ملفات ‪ ،XML‬ملفات نصية‪ ،‬إلخ‪.‬‬ ‫‪ ‬البيانات املهيكلة‪ :‬قواعد البيانات والتنسيقات املهيكلة األخرى‪.‬‬ ‫البيانات الضخمة هي في األساس تطبيق خاص لعلم البيانات حيث تكون مجموعة البيانات كبيرة ً‬ ‫جدا‬ ‫وتحتاج إلى التغلب على التحديات املنطقية ملواجهتها‪.‬‬ ‫علم البيانات هو نهج علمي يطبق األفكارالخوارزمية والحاسوبية ملعالجة هذه البيانات الضخمة‪.‬‬ ‫‪26‬‬ ‫خصائص البيانات الضخمة‬ ‫‪Characteristics of Big Data‬‬ ‫هناك خمسة معايير أساسية تساعدنا في‬ ‫تصنيف أي بيانات تحت مصطلح "البيانات‬ ‫الضخمة" وهي‪ :‬التنوع‪ ،‬والقيمة‪ ،‬والحجم‪،‬‬ ‫واملوثوقية‪ ،‬والسرعة‪.‬وتعتبر البيانات‬ ‫"ضخمة" عندما تأتي بأحجام كبيرة‪ ،‬وبمعدل‬ ‫ً‬ ‫سريع جدا‪ ،‬وبتنوع كبير‪ ،‬وبدقة عالية‪،‬‬ ‫وفائدة‪.‬ويجب أن تستوفي البيانات جميع هذه‬ ‫املعايير لكي يتم اعتبارها "بيانات ضخمة"‪.‬‬ ‫‪27‬‬ ‫‪ ‬التنوع ‪Variety‬‬ ‫يسير التنوع إلى العديد من أنواع البيانات املتو افرة ويتم هيكلة البيانات التقليدية املختلفة‬ ‫وتكييفها بدقة في قواعد البيانات العالئقية‪ ،‬ولكن مع ظهور البيانات الضخمة‪ ،‬أصبحت‬ ‫البيانات تتو افر في أنواع جديدة غير منظمة‪.‬تتطلب أنواع البيانات غير املنظمة وشبه املنظمة)‬ ‫مثل النصوص والصوت والفيديو (معالجة اضافية مسبقة الستخالص املعاني ودعم معلومات‬ ‫البيانات الوصفية املتعلقة بتلك البيانات‪ ،‬وبدون هذه البيانات الوصفية يكون من املستحيل‬ ‫معرفة ما يتم تخزينه وكيف يمكن معالجته‪.‬‬ ‫‪ ‬القيمة‪Value‬‬ ‫إن جمع الكثير من البيانات ال يعني أن تلك البيانات هي ذات قيمة‪ ،‬فقيمة البيانات تتمثل في‬ ‫امكانية الحصول على التوصيات والوصول إلى بعص األفكارمن خاللها ‪.‬‬ ‫يشير مصطلح القيمة الى مدى فائدة البيانات في اتخاذ القرارات‪ ،‬وبالطبع فإن إجراء التحليالت‬ ‫املناسبة هو وسيلة استخراج قيمة البيانات الضخمة‪.‬‬ ‫‪28‬‬ ‫‪ ‬الحجم‪Volume‬‬ ‫مهما في البيانات‬ ‫نظرا ألنه يجب معالجة كميات كبيرة من البيانات غير املنظمة‪ ،‬فإن كم البيانات يعد ً‬ ‫جانبا ً‬ ‫✓ ً‬ ‫الضخمة‪.‬‬ ‫✓ يمكن أن تكون قيمة بعض هذه البيانات غير معروفة قبل القيام بتحليلها‪ ،‬مثل بيانات تصفح‬ ‫املستخدمين ألحد مو اقع الويب أو أحد تطبيقات الهاتف الذكي‪ ،‬أو تلك البيانات التي يتم الحصول عليها‬ ‫من أجهزة إنترنت األشياء املدعمة بأجهزة االستشعار‪.‬‬ ‫✓ قد يصل حجم هذه البيانات إلى العشرات‪ ،‬بل املئات من التيرابايت من البيانات‪.‬‬ ‫‪ ‬املوثوقية‪Veracity‬‬ ‫✓ ترتبط صحة البيانات بمدى دقة مجموعة البيانات أو موثوقيتها‪.‬‬ ‫✓ ال ترتبط املوثوقية بجودة البيانات نفسها فحسب‪ ،‬بل أيضا بمدى مصداقية مصدر البيانات ونوعها‬ ‫وكيفية معالجتها‪.‬‬ ‫‪ ‬السرعة‪Velocity‬‬ ‫✓ يشير مصطلح السرعة إلى معدل التقاط البيانات وتخزينها‪.‬‬ ‫✓ تنتج البيانات من معظم األجهزة الذكية املتصلة باإلنترنت أجهزة إنترنت األشياء واألجهزة املحمولة في الوقت الحقيقي أو‬ ‫‪29‬‬ ‫قريبا من الوقت الحقيقي‪ ،‬مما يتطلب الجمع الفوري لتلك البيانات وكذلك نقلها وتخزينها‪.‬‬ ‫ً‬ ‫الفرق بين علم البيانات والبيانات الضخمة‬ ‫االختالفات بين علم البيانات والبيانات الضخمة‪:‬‬ ‫‪ ‬تحتاج املؤسسات إلى البيانات الضخمة لتحسين أدائها وزيادة نمو أعمالها وتقديم منتجات أفضل‬ ‫لعمالئها‪.‬بينما يوفر علم البيانات أساليب وآليات لفهم واستغالل إمكانات البيانات الضخمة في‬ ‫الوقت املناسب‪.‬‬ ‫‪ ‬من الواضح أن علم البيانات يستخدم مناهج نظرية وعملية الستكشاف معلومات البيانات الضخمة‪،‬‬ ‫ً‬ ‫ً ًً‬ ‫والتي تلعب دورا مهما في استغالل إمكانات البيانات الضخمة‪.‬يمكن اعتبار البيانات الضخمة على أنها‬ ‫مجموعة من البيانات غيرالصالحة‪ ،‬إال إذا تم تحليلها باالستدالل االستنباطي واالستقرائي‪.‬‬ ‫‪ ‬يرتبط تحليل البيانات الضخمة بالتنقيب في البيانات‪.‬لكن علم البيانات يستخدم خوارزميات التعلم‬ ‫اآللي لتصميم وتطويرالنماذج اإلحصائية لتوليد املعرفة بكميات كبيرة من البيانات الضخمة‪.‬‬ ‫‪30‬‬ ‫تقنيات إدارة البيانات الضخمة‬ ‫‪Technologies that Enable the Management of Big Data‬‬ ‫تستخدم الشركات أنظمة الحاسب وقواعد البيانات لالحتفاظ بالسجالت املختلفة مثل ًاملعامالت املتعلقة‬ ‫‪‬‬ ‫بمعالجة الطلبات واملدفوعات وتتبع العمالء وإدارة التكلفة في الشركات تحتاج الشركات أيضا إلى نظام إلعداد‬ ‫التقارير لتوفير املعلومات التي تساعدها على العمل بكفاءة واملساعدة املدراء التنفيذيين على اتخاذ القرارات‬ ‫املدروسة التي تضمن أداء أفضل لألعمال‪.‬‬ ‫يحتاج مديرو املتجر اإللكتروني إلى تحسين تجربة الشراء والتأكد من أن زوار املوقع الذين يتصفحون املنتجات‬ ‫‪‬‬ ‫سيصبحون زبائن للمتجر وذلك من خالل شراء املنتجات وكذلك العمل على عودة الزبائن للشراء مرات أخرى‬ ‫في املستقبل من خالل املوقع‪.‬‬ ‫ينتج عن هذه التفاصيل الدقيقة التي يتم جمعها كم هائل من البيانات التي يجب تحليلها لتقديم رؤية واضحة‬ ‫‪‬‬ ‫وقيمة للقائمين على أعمال الشركة‪.‬يتم استخدام نتائج تحليل تلك املعلومات إلحداث تغييرات في مخطط‬ ‫موقع الويب أو املتجر‪ ،‬ولتعديل أسعار املنتجات سواء بالزيادة أو بالخصم‪ ،‬ولتنظيم الحمالت التسويقية‬ ‫للمنتجات على وسائل التواصل االجتماعي للتأثيرعلى سلوكيات الشراء لدى الزبائن‪.‬‬ ‫يتطلب القيام بهذا األمر من الشركات توفير تقنيات وأدوات جديدة إلدارة وتحليل البيانات الضخمة الستخراج‬ ‫‪‬‬ ‫قيمة األعمال‪ ،‬ويجب جمع البيانات املطلوبة من املصادر الداخلية كدو ائر املبيعات والتصنيع واملحاسبة‪،‬‬ ‫وكذلك من املصادر الخارجية كالبيانات اإلحصائية عن النمو السكاني وطبيعة الزبائن وأعمارهم‪ ،‬وكذلك‬ ‫البيانات املتعلقة بالشركات املنافسة مثال‪ ،‬وذلك الستخراج معلومات موجزة وموثوقة حول الوضع الحالي‬ ‫واملستقبلي للشركة والتأثيرات املحتملة ملتغيرات السوق‪.‬‬ ‫‪31‬‬ ‫تقنيات إدارة البيانات الضخمة‬ ‫مستودعات البيانات ‪Data Warehouse‬‬ ‫✓ قد تعتبرمستودعات البيانات األداة األقدم لتحليل بيانات الشركات‪.‬‬ ‫✓ يسيرمستودع البيانات إلى قاعدة البيانات التي تخزن البيانات الحالية والتاريخية التي نتجت عن‬ ‫العديد من أنظمة املعامالت التشغيلية األساسية مثل أنظمة املبيعات‪ ،‬ودعم العمالء‪ ،‬والتصنيع‪،‬‬ ‫والتي تجعل البيانات متاحة لصانعي القرارفي الشركة‬ ‫✓ ويتم دمج هذه البيانات مع البيانات من املصادرالخارجية لتحويل البيانات غيراملكتملة إلى بيانات‬ ‫منظمة قبل تخزينها في مستودع البيانات‪.‬‬ ‫✓ يوفرنظام مستودع البيانات أيضا مجموعة من األدوات للتحليل واالستعالم وكذلك أدوات إعداد‬ ‫التقاريرالرسومية‪.‬‬ ‫‪32‬‬ ‫تقنيات إدارة البيانات الضخمة‬ ‫‪ ‬الحوسبة في الذاكرة‪In-Memory Computing‬‬ ‫هي طريقة لتسهيل عملية تحليل البيانات الضخمة العتمادها بصورة أساسية على ذاكرة الحاسب‬ ‫الرئيسة ‪ RAM‬لتخزين البيانات‪.‬يصل املستخدمون إلى البيانات املخزنة في الذاكرة األساسية للنظام‬ ‫وبالتالي يتم تجاوز معوقات استرداد وقراءة البيانات املوجودة في قاعدة البيانات التقليدية املستندة إلى‬ ‫التخزين على األقراص مما يعني تقليل وقت االستعالم بشكل كبير‪.‬تتميز الخوادم السحابية بشكل خاص‬ ‫بوجود سعة كبيرة من ذاكرة الوصول العشوائي‪ ،‬مما يسهل استخدامها في عمليات الحوسبة في الذاكرة‪.‬‬ ‫‪ ‬بحيرة البيانات‪Data Lake‬‬ ‫ً‬ ‫بحيرة البيانات هي مستودع بيانات عادة ما يكون سحابيا ُيستخدم لتخزين كميات هائلة من البيانات‬ ‫األولية وغير املعالجة‪.‬في هذه الطريقة يتم استخدام عنوان ‪ URL‬ثابت لدعم كل من البيانات املنظمة)‬ ‫مثل قواعد البيانات (والبيانات غيراملنظمة) مثل رسائل البريد اإللكتروني واملستندات( ‪.‬‬ ‫‪33‬‬ ‫‪ ‬التنقيب في البيانات الضخمة ‪Mining Big Data‬‬ ‫✓ عملية اكتشاف األنماط في كمية كبيرة من البيانات واستخراج املعلومات املفيدة في توقع السلوك املستقبلي‪.‬‬ ‫✓ يتم جمع البيانات الضخمة باستمرار بواسطة أجهزة االستشعار والتطبيقات العامة والتطبيقات‬ ‫الشخصية‪.‬‬ ‫✓ إن عملية جمع البيانات ليست سوى الخطوة األولى في العملية املشارإليها باسم اكتشاف املعرفة‪.‬‬ ‫✓ عملية اكتشاف األنماط في كمية كبيرة يشير إلى العملية الشاملة للوصول إلى املعرفة املفيدة من البيانات‪,‬‬ ‫فالتنقيب عن البيانات هو تطبيق لخوارزميات في توقع السلوك املستقبلي‪.‬‬ ‫✓ تحديد العالقات املختلفة داخل هذه البيانات‪.‬‬ ‫✓ تعتبر الخطوات األخرى في عملية اكتشاف املعرفة مثل تنظيف البيانات‪ ،‬وتكامل البيانات‪ ،‬وتحويل صيغة‬ ‫البيانات‪ ،‬والتفسيرالصحيح لنتائج التنقيب ضرورية لضمان اشتقاق املعرفة املفيدة من البيانات‪.‬‬ ‫‪34‬‬ 35 36 ‫‪ ‬البيانات الضخمة والتخزين السحابي ‪Big Data and Cloud Storage‬‬ ‫✓ هناك خياران معتمدان لتخزين البيانات الضخمة التخزين السحابي والتخزين الداخلي‪.‬‬ ‫✓ ولقد كان تطوير تطبيقات البيانات الضخمة في املاض ي يعتمد أساسا على حفظ البيانات في وسائط‬ ‫التخزين داخليا (على الخوادم داخل الشركات واملؤسسات)‪ ،‬مما تطلب توفر مستودعات بيانات‬ ‫محلية عالية التكلفة‪ ،‬وكذلك تثبيت برامج معقدة إلدارة تلك املستودعات‪.‬‬ ‫✓ ساهمت التطورات الحديثة في علوم الحوسبة والبيانات في استبدال تلك الطريقة بالتخزين السحابي‪،‬‬ ‫والذي يعد بمثابة الحل األمثل لتخزين البيانات الضخمة‪ ،‬وذلك ملا يلي‪:‬‬ ‫ تو افر النطاق العريض عالي السرعة على نطاق واسع يسهل حركة البيانات من مكان إلى آخر‪.‬ومع وجود‬ ‫بيانات منتجة محليا لم تعد هناك حاجة لتخزين البيانات داخليا‪ ،‬بل أصبح باإلمكان نقلها إلى التخزين‬ ‫السحابي لتحليلها‪.‬‬ ‫ أصبحت غالبية التطبيقات تعتمد على التخزين السحابي‪ ،‬مما يعني أن عملية إنتاج املزيد من البيانات‬ ‫ً‬ ‫سحابيا تزداد باستمرار‪ ،‬ولقد ساهم ذلك في قيام أعداد متزايدة من رواد األعمال بعمل تحليالت‬ ‫وتخزينها‬ ‫جديدة للبيانات الضخمة ملساعدة الشركات على تحليل البيانات السحابية في كثير من املجاالت مثل‬ ‫معامالت التجارة اإللكترونية وبيانات أداء تطبيقات الويب‪.‬‬ ‫‪37‬‬ 38 ‫سياسة الشركات وحوكمة البيانات ‪Data Governance and Policies‬‬ ‫✓ تحدد الضوابط والهياكل التنظيمية للشركات واملؤسسات املسؤوليات وطرق اتخاذ القرارات املتعلقة‬ ‫بإدارة البيانات‪ ،‬والتي تتضمن تطويرالسياسات واإلجراءات الداخلية التي تتحكم بإدارة البيانات‬ ‫✓ تساعد إدارة البيانات املؤسسات الخاصة أو املؤسسات الحكومية وغير الربحية في التعامل مع‬ ‫عمليات إدارة البيانات بجودة عالية خالل جميع مراحل دورة حياة البيانات‪ ،‬وتؤدي هذه السياسات‬ ‫واإلجراءات الفعالة إلى تحسين األعمال والنتائج‪ ،‬حيث تقوم الشركات واملؤسسات بجمع كميات هائلة‬ ‫من البيانات الداخلية والخارجية‪ ،‬وتعتبر إدارة البيانات ضرورية الستخدام تلك البيانات بفعالية‬ ‫وإدارة املخاطروخفض التكاليف املختلفة‪.‬‬ ‫واجبا على املؤسسات أن تمتثل للتشريعات الجديدة الخاصة بخصوصية البيانات وحمايتها مثل‬ ‫✓ أصبح ً‬ ‫الالئحة العامة لحماية البيانات في االتحاد األوروبي (‪ )GDPR‬وقانون خصوصية املستهلك في‬ ‫كاليفورنيا (‪ ،)CCPA‬وذلك ألن حوكمة البيانات بصورة سيئة تجر املؤسسات إلى صعوبات وتجعلها‬ ‫تحت طائلة مواجهة العقوبات‪.‬‬ ‫تضمن حوكمة البيانات أن البيانات ) آمنة ‪ -‬موثوقة ‪ -‬موثقة – مدارة – مدققة (‬ ‫‪39‬‬ ‫معاييرحوكمة البيانات ‪Data Governance Standards‬‬ ‫قامت منظمة املعاييرالدولية ‪ 150‬بتطويرمعيار‪ ISO/IEC 38505‬لتطبيق مبادئ حوكمة تقنية‬ ‫املعلومات على متطلبات إدارة البيانات‪.‬‬ ‫‪ ‬املبادئ الستة لحوكمة البيانات‬ ‫املسئولية‪ :‬تحدد لألفراد‪.‬‬ ‫‪.1‬‬ ‫االستراتيجية‪ :‬تتو افق مع مهمة ورؤية املؤسسة‪.‬‬ ‫‪.2‬‬ ‫الحيازة‪ :‬تتو افق مع املتطلبات التنظيمية‬ ‫‪.3‬‬ ‫التو افق‪ :‬ضمان االمتثال للتشريعات والسياسات الداخلية وأخالقيات العمل‪.‬‬ ‫‪.4‬‬ ‫األداء‪ :‬تلبية متطلبات املؤسسة‪.‬‬ ‫‪.5‬‬ ‫السلوك اإلنساني‪ :‬تشجيع الناس على املشاركة‪.‬‬ ‫‪.6‬‬ ‫‪40‬‬ ‫‪ ‬حوكمة البيانات وإدارتها ‪Data Governance versus Data Management‬‬ ‫✓ من األهمية اإلدراك أن حوكمة البيانات هي أحد مكونات إدارة البيانات الشاملة‪.‬‬ ‫✓ إن وضع القواعد اإلرشادية لحوكمة البيانات دون التنفيذ الفعلي لها يعتبر مضيعة للوقت والجهد دون‬ ‫معنى أو قيمة حقيقية‪ ،‬فحوكمة البيانات تحدد جميع الضوابط والسياسات والعمليات‪ ،‬والتي تنفذ‬ ‫بواسطة إدارة البيانات‪ ،‬والتي مهمتها هي جمع البيانات واستخدامها في صنع القرار من خالل اتباع‬ ‫أساسيات الحوكمة والتي تتمثل بالضوابط والسياسات والعمليات املتعلقة بالبيانات‪.‬‬ ‫✓ تشبه حوكمة البيانات عملية تطويرالتصميم لبناء منزل جديد‪ ،‬أما إدارة البيانات فهي عملية البناء‬ ‫نفسها‪.‬‬ ‫‪ ‬إدارة البيانات‪ :‬إدارة البيانات هي إنشاء وتنفيذ البنى والسياسات واإلجراءات التي تدير احتياجات دورة‬ ‫حياة البيانات الكاملة للمؤسسة‪.‬‬ ‫تحديات حوكمة البيانات ‪Data Governance Challenges‬‬ ‫ ‬ ‫تعد التحديات املرتبطة بالبيانات السحابية والبيانات الضخمة من األمورالشائعة التي تواجهها املؤسسات بخصوص حوكمة البيانات‪،‬‬ ‫فالخدمات السحابية و أنظمة البيانات الضخمة تستدعي متطلبات حوكمة جديدة‪.‬لقد كان تركيزبرامج حوكمة البيانات حتى وقت قريب‬ ‫على البيانات املخزنة في مركزالبيانات‪ ،‬أما اآلن فأصبح من الضروري التعامل مع الكثيرمن البيانات املنظمة وغيراملنظمة وشبه املنظمة‬ ‫التي قد تظهرمعا في بيئات البيانات الضخمة‪ ،‬باإلضافة إلى تهديدات الخصوصية املرتبطة بأنظمة البيانات السحابية‪.‬‬ ‫‪41‬‬ ‫من املسؤول عن حوكمة البيانات؟ ?‪Who is Responsible‬‬ ‫تضم عملية حوكمة البيانات مجموعة متنوعة من األشخاص في معظم املؤسسات‪:‬‬ ‫✓ املستخدمين النهائيين املطلعين على البيانات ذات العالقة في أنظمة املؤسسة‪.‬‬ ‫✓ مدراء األعمال‬ ‫✓ املتخصصين في إدارة البيانات‬ ‫✓ موظفي تقنية املعلومات‪ ،‬ويتحمل املسئولية الرئيسة عن الحوكمة عادة رئيس قسم املعلومات أو‬ ‫كبيرمسؤولي البيانات ومديرإدارة البيانات‬ ‫ُيعد رئيس قسم املعلومات أحد كبار املسؤولين التنفيذيين عن برنامج حوكمة البيانات وتشمل‬ ‫مسؤولياته الحصول على املو افقة والتمويل والتوظيف في البرنامج‪ ،‬وكذلك تقديم املبادرات‪ ،‬وتقييم‬ ‫تطورالبرنامج‪ ،‬والترويج له بفاعلية‪.‬‬ ‫ً‬ ‫فاعتمادا على حجم املؤسسة‪ ،‬يتم تعيين مدير عام إلدارة البيانات ولقيادة وتنسيق مبادرة الحوكمة‪ ،‬حيث‬ ‫يتولى عقد االجتماعات‪ ،‬وتنفيذ الدورات التدريبية‪ ،‬وتتبع مؤشرات األداء الرئيسة‪ ،‬وإدارة االتصاالت‬ ‫الداخلية للمبادرة‪.‬ويعمل مدير إدارة البيانات مع مالكي البيانات واملسؤولين الذين يضمنون تطبيق‬ ‫ضوابط وقواعد حوكمة البيانات و اتباع املستخدمين النهائيين لها‪.‬‬ ‫‪42‬‬

Use Quizgecko on...
Browser
Browser