موضوعات مختارة : علوم البيانات PDF
Document Details
Uploaded by Deleted User
Palmer, Shelly
Tags
Summary
هذه وثيقة تتناول أساسيات علم البيانات، مع التركيز على موضوعات مختارة. تتضمن المقدمة دراسة لمفاهيم علم البيانات، وأهميته في حل المشكلات من خلال البيانات الضخمة، مع ذكر أدوات الذكاء الاصطناعي.
Full Transcript
ﻋﻠﻮم اﻟﺒ ﺎﻧﺎت ﻣﻮﺿﻮﻋﺎت ﻣﺨﺘﺎرة اﻟﻔﺼﻞ اﻷول ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت )ﺗﻤﻬ ﺪ( اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻷو 2 ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت...
ﻋﻠﻮم اﻟﺒ ﺎﻧﺎت ﻣﻮﺿﻮﻋﺎت ﻣﺨﺘﺎرة اﻟﻔﺼﻞ اﻷول ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت )ﺗﻤﻬ ﺪ( اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻷو 2 ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﺗﻢ ﺗﻌ ﻒ ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻄﺮق ﻣﺨﺘﻠﻔﺔ وﻣﻨﻬﺎ: ﻫﻮ ﻣﺠ ــﺎل ﻣﺘﻌ ــﺪد اﻟﺘﺨﺼﺼ ــﺎت ،ﻳﺮﻛ ــﺰ ﻋﻠ ــﻰ اﺳ ــﺘﺨﺮاج اﻟــﺮؤى واﻟﺘﻮﻗﻌــﺎت ﻣ ــﻦ اﻟﺒ ﺎﻧ ــﺎت ،وﺗﻤﻜ ــﻦ ﻣﺮاﺟﻌــﺔ ◼ اﻟﺒ ﺎﻧ ــﺎت اﻟﻤﻬ ﻠ ــﺔ وﻏ ــﺮ اﻟﻤﻬ ﻠ ــﺔ ،واﺳﺘﻜﺸ ــﺎﻓﻬﺎ ﻋ ــﻦ ﻃ ــﻖ ﻋﻤﻠ ــﺎت وأدوات وأﺳ ــﺎﻟ ﺐ ﻣﺘﻨﻮﻋ ــﺔ. ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت اﻟﻬﻴﺌﺔ اﻟﺴﻌﻮد ﺔ ﻟﻠﺒ ﺎﻧﺎت واﻟﺬ ﺎء اﻻﺻﻄﻨﺎ اﻟ ﺎﺿ ﺎت واﻹﺣﺼﺎء ،واﻟ ﻣﺠﺔ اﻟﻤﺘﺨﺼﺼﺔ ،واﻟﻘﺪرة اﻟﺘﺤﻠ ﻠ ﺔ اﻟﻤﺘﻘﺪﻣﺔ ،واﻟﺬ ﺎء ﻫﻮ ﻣﺠﺎل ﺠﻤﻊ ﺑ ◼ اﻟﻤﺠﺎل اﻟﻤﺴﺘﻬﺪف وذﻟﻚ ﻻﺳﺘﺨﺮاج اﻟﺮؤى ﻣﻦ ﺑ ﺎﻧﺎت ﻫﺬا اﻟﻤﺠﺎل. وﺗﻌﻠﻢ اﻵﻟﺔ ﻣﻌﺰزا ﺨ ة اﻻﺻﻄﻨﺎ IBM 5 ﺗﻜ ﻦ ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻋﻨﺎ اﻟﺧﺑرة ﻓﻲ اﻟﻣﺟﺎل اﻟﻣﺳﺗﮭدف اﻟﺗﻘﺻﻲ ﻣﻌﺎﻟﺟﺔ اﻻﺣﺻﺎﺋﻲ اﻟﺑﯾﺎﻧﺎت ﻋﻠم اﻟﺑﯾﺎﻧﺎت اﻟرﯾﺎﺿﯾﺎت ﻋﻠوم اﻟﺣﺎﺳب ﺗﻌﻠم اﻵﻟﺔ اﻟﻣﺻدرPalmer, Shelly. Data Science for the C-Suite. New York: Digital Living Press, 2015. : )ﻣﺗرﺟم( 6 ﻟﻤﺎذا ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت؟ ﺑﺮز ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻟﻸﺳ ﺎب اﻵﺗ ﺔ: اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ).(Big Data ◼ ﺗﻌﺪد ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت. ◼ اﻟﺒ ﺎﻧﺎت آﻟ ﺎ. اﻟﺘﻌﺮف ﻋ ﺗﻄﻮر أدوات اﻟﺬ ﺎء اﻻﺻﻄﻨﺎ ◼ وﺟﻮد أﻃﺮ ﻧﻈ ﺔ وﺗﺤﻠ ﻠ ﺔ وﺧﻮارزﻣ ﺎت وأﺳﺎﻟ ﺐ ﺗﺘﻌﺎﻣﻞ ﻣﻊ ﺎﻓﺔ أﻧﻮاع اﻟﺒ ﺎﻧﺎت ﻐﺾ اﻟﻨﻈﺮ ﻋﻦ اﻟﻤﺠﺎل ◼ اﻟﻤﺴﺘﻬﺪف. ﺗﻮﻇ ﻒ ﻫﺬە اﻷﻃﺮ واﻟﺨﻮارزﻣ ﺎت واﻷﺳﺎﻟ ﺐ. ﻣﺠﺎل اﻟﺒ ﺎﻧﺎت ﻤﺤﻠﻞ اﻟﺒ ﺎﻧﺎت وﻋﺎﻟﻢ اﻟﺒ ﺎﻧﺎت وﻏ ﻫﺎ. ﺑﺮوز وﻇﺎﺋﻒ و ﻤﺘﻠ ﻮن اﻟﻤﻬﺎرة واﻟﻤﻌﺮﻓﺔ ﺄدوات وأﺳﺎﻟ ﺐ ﻋﻠﻢ اﺣﺘ ﺎج ﺳﻮق اﻟﻌﻤﻞ ﻟﻌﻠﻤﺎء ﺑ ﺎﻧﺎت ﻣﺘﺨﺼﺼ اﻟﺒ ﺎﻧﺎت. 7 دورة ﺣ ﺎة ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﺗﺣدﯾد وﺗﻌرﯾف اﻟﻣﺷﻛﻠﺔ ﻋﻣﻠﯾﺎت ﺟﻣﻊ اﻟﺗﺷﻐﯾل وﺗﺟﮭﯾز واﻟﻣﺗﺎﺑﻌﺔ اﻟﺑﯾﺎﻧﺎت ﺗﺣﻠﯾل اﻟﻧﻣذﺟﺔ واﻛﺗﺷﺎف واﻟﺗﻘﯾﯾم اﻟﺑﯾﺎﻧﺎت 8 ﺗﺤﺪ ﺪ وﺗﻌ ﻒ اﻟﻤﺸ ﻠﺔ إ ﺠﺎد اﻟﻤﺸ ﻠﺔ: ﺗﻮاﺟﻪ اﻟﻤﻨﻈﻤﺎت ﺻﻌ ﺎت وﺗﺤﺪ ﺎت ﺗﻌﻴﻖ ﺗﺤﻘﻴﻖ ﻌﺾ أﻫﺪاﻓﻬﺎ. ◼ اﻟﺒ ﺎﻧﺎت. ﺔ ﻹ ﺠﺎد ﺣﻠﻮل ﻣﻨ ﺔ ﻋ ﻛﺬﻟﻚ ،ﻈﻬﺮ ﻓﺮص ﺗﻄ ◼ اﻟﺒ ﺎﻧﺎت. اﻟﺤﻞ اﻟﻤﺒ ﻋ ﻟﻬﺎ ﻤﺮﺣﻠﺔ أوﻟ ﺔ أﻫﻤ ﺔ ﺗﺤﺪ ﺪ اﻟﻤﺸ ﻠﺔ ووﺿﻊ إﻃﺎر ﺗﻌ ◼ ﻣﻦ ﺠﺪ اﻟﻤﺸ ﻠﺔ؟ ﻋﺎﻟﻢ اﻟﺒ ﺎﻧﺎت. ◼ أﺻﺤﺎب اﻟﻤﺼﻠﺤﺔ. ◼ اﻟ ﺤﺚ واﻟﺘﻄ ﺮ. ◼ 9 ﺟﻤﻊ وﺗﺠﻬ اﻟﺒ ﺎﻧﺎت ﺟﻤﻊ اﻟﺒ ﺎﻧﺎت: ﺟﻤﻊ اﻟﺒ ﺎﻧﺎت ﻣﻔﺘﻮﺣﺔ اﻟﻤﺼﺪر أو اﻟﻤﺘﺎﺣﺔ ﻟﻠﻌﻤﻮم. ◼ . ﺟﻤﻊ اﻟﺒ ﺎﻧﺎت ﺸ ﻞ ﻣ ﺎ ◼ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت. ﺑ ﺎﻧﺎت أﻧﻈﻤﺔ إﻧ ﻧﺖ اﻷﺷ ﺎء واﻟﺤﻮﺳ ﺔ اﻟﺴﺤﺎﺑ ﺔ. ﻣﺼﺎدر اﻟ ﺐ ووﺳﺎﺋﻞ اﻟ ﺚ واﻟﺘﻮاﺻﻞ اﻻﺟﺘﻤﺎ . ﺗﺠﻬ اﻟﺒ ﺎﻧﺎت: ﺳ ﺎق وﺗﻨﻈ ﻢ اﻟﺒ ﺎﻧﺎت اﻟ ﺗﻢ ﺗﺠﻤ ﻌﻬﺎ ﻟﺘﻈﻬﺮ ﺼﻮرة ﻣﻮﺣﺪة ﺴﻬﻞ اﻟﺘﻌﺎﻣﻞ ﻣﻌﻬﺎ. اﻟﻌﻤﻞ ﻋ ◼ ﻣﺴﺘﻮدﻋﺎت اﻟﺒ ﺎﻧﺎت. ﺗﺨ ﻨﻬﺎ ◼ اﻟﺘﺄ ﺪ ﻣﻦ ﻋﺪم وﺟﻮد ﺧﻠﻞ أو ﺿ ﺎع أو ﻋﺪم ﺗﻨﺎﺳﻖ ﻟﻠﺒ ﺎﻧﺎت. ◼ 10 ﺗﺤﻠ ﻞ وا ﺸﺎف اﻟﺒ ﺎﻧﺎت ﺗﺤﻠ ﻞ اﻟﺒ ﺎﻧﺎت اﻻﺳﺘﻜﺸﺎ )(Exploratory Data Analysis - EDA اﻟﺒ ﺎﻧﺎت وا ﺸﺎف اﻵ : اﻟﺘﻌﺮف ﻋ ﺴﻬﻢ ﻫﺬە اﻟﻌﻤﻠ ﺔ ◼ إﻋﻄﺎء اﻧﻄ ﺎع ﻋﻦ اﻟﺒ ﺎﻧﺎت اﻟ ﺗﺘﻌﺎﻣﻞ ﻣﻌﻬﺎ. اﻟﺒ ﺎﻧﺎت اﻟﻤﺘﻄﺮﻓﺔ واﻟﺸﺎذة واﻟﻐ ﻣﻨﻄﻘ ﺔ. اﻟﺘﻌﺮف ﻋ إﺛ ﺎت اﻟﻔﺮﺿ ﺎت أو رﻓﻀﻬﺎ. اﻟﻔﺮﺿ ﺎت أو اﻟﺘﺤﻠ ﻼت اﻟﻤﻌﻤﻮل ﺑﻬﺎ. اﻟﺘﺄ ﺪ ﻣﻦ ﻋﺪم وﺟﻮد اﻧﺤ ﺎز 11 اﻟﻨﻤﺬﺟﺔ واﻟﺘﻘﻴ ﻢ اﻟﻨﻤﺬﺟﺔ: اﻟﺒ ﺎﻧﺎت. أﻧﻤﺎط وﻋﻨﺎ ﻓﻬﻢ اﻟﻌﻼﻗﺔ ﺑ ﻋﻠﻮم اﻟﺒ ﺎﻧﺎت ،و ﻜﻮن اﻟ ﻛ ﻓ ﻪ ﻋ اﻟﺮﻛﻦ اﻷﺳﺎس ◼ ﻫﺬە اﻟﻤﺮﺣﻠﺔ ،ﻘﻮم ﻋﺎﻟﻢ اﻟﺒ ﺎﻧﺎت ﺑﺘﺼﻤ ﻢ وﺗﻤ ﻦ اﻟﺨﻮارزﻣ ﺎت واﻟﻨﻤﺎذج ﻟﺘﺤﻠ ﻞ وﻣﻌﺮﻓﺔ ﻧﻤﻂ اﻟﺒ ﺎﻧﺎت ◼ اﻟﻤﺸ ﻠﺔ أﺳﺎس اﻟ ﺤﺚ. ﺑﻬﺪف إ ﺠﺎد اﻟﺤﻠﻮل اﻟ ﺗﺠ ﺐ ﻋ اﻟﺘﻘﻴ ﻢ: اﻟﺘﺄ ﺪ ﻣﻦ ﺟﻮدة اﻟﻨﻤﺬﺟﺔ اﻟﻤﻌﻤﻮل ﺑﻬﺎ وذﻟﻚ ﺑﺘﻤ ﺮﻫﺎ ﻋ ﻣﻌﺎﻳ ﺗﻘﻴ ﻢ ﺷﺎﻣﻠﺔ. ◼ ﻧ ع اﻟﻨﻤﻮذج. ﺗ ﻨ ع ﻣﻌﺎﻳ اﻟﺘﻘﻴ ﻢ اﻋﺘﻤﺎدا ﻋ ◼ ﻋﻤﻮﻣ ﺔ اﻟﻨﻤﻮذج ) (Generalizationوﻋ اﻟﺘﻘﻴ ﻢ ﻳﻬﺪف إ ﺻﻼﺣ ﺔ اﻟﻨﻤﻮذج ﺸ ﻞ ﻋﺎم أو ﻣﺎ ﺴ ◼ ﻧﻄﺎق أوﺳﻊ ﻣﻦ اﻟﺒ ﺎﻧﺎت. 12 ﻋﻤﻠ ﺎت اﻟ ﺸﻐ ﻞ واﻟﻤﺘﺎ ﻌﺔ ﻧ ﺠﺔ اﻟﻨﻤﻮذج اﻟﺘ ﺒﺆي أو اﻻﺣﺼﺎ . دورة ﺣ ﺎة ﻋﻠﻮم اﻟﺒ ﺎﻧﺎت ﻋﻨﺪ اﻟﺤﺼﻮل ﻋ ﻻﺗ ﺘ ◼ ﺳﻠﺴﻠﺔ ﻣﻦ ﻋﻤﻠ ﺎت اﻟ ﺸﻐ ﻞ وذﻟﻚ ﺑﺘﺼﺪﻳﺮ اﻟﻨﻤﻮذج ﻟﻴﺘﻢ اﻟﺘﻌﺮف ﻋ ﻳﺘﻢ وﺿﻊ ﻫﺬە اﻟﻌﻤﻠ ﺎت ﻌﻨﺎ ﺔ ◼ ﺑ ﺎﻧﺎت ﺟﺪ ﺪة واﻟﺘ ﺒﺆ ﺑﻬﺎ أو اﻟﺘﻌﺮف ﻋﻠﻴﻬﺎ. ﻋﻨﺎ اﻷﻧﻤﺎط. اﻟﺘﻌﺮف ﻋ دﻗﺘﻪ اﻟﻨﻤﻮذج اﻷو وﺗﺤﺴ ﻛﺬﻟﻚ ،ﻳﺘﻢ اﺳﺘﺨﺪام اﻟﺒ ﺎﻧﺎت اﻟﺠﺪ ﺪة ﻟﺘﺤﺴ ◼ أﺛﻨﺎء ﻫﺬە اﻟﻤﺮﺣﻠﺔ اﻟﻤﺴﺘﻤﺮة ،ﻳﺘﻢ ﻣﺘﺎ ﻌﺔ اﻟﻨﻤﻮذج ﻐﺮض: ◼ ﻣﺮاﻗ ﺔ أداء اﻟﻨﻤﻮذج اﻟﺬي ﺗﻢ ﺑﻨﺎءە. أداء اﻟﻨﻤﻮذج. اﻟﺒ ﺎﻧﺎت اﻟﺠﺪ ﺪة اﻟﻤﺪﺧﻠﺔ وﻗ ﺎس ﺗﺄﺛ ﻫﺎ ﻋ ا ﺸﺎف أي ﺸ ﺖ ﺗﺤﺪ ﺚ وﺗﺮﻗ ﺔ اﻟﻨﻤﻮذج. اﻟﺒ ﺎﻧﺎت واﻟﻨﻤﺎذج اﻟﻤﺴﺘﺨﺪﻣﺔ. اﻟﺘﺄ ﺪ ﻣﻦ ﺗﻮﻓﺮ ﻣﻌﺎﻳ اﻟﺨﺼﻮﺻ ﺔ واﻟﺤﻤﺎ ﺔ ﻋ 13 اﻟﻔﺼﻞ اﻷول ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت )ﺗﻤﻬ ﺪ( اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻟﺜﺎﻧ ﺔ 2 ﺗﻜ ﻦ ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت )ﻣﺮاﺟﻌﺔ( ﻋﻨﺎ اﻟﺧﺑرة ﻓﻲ اﻟﻣﺟﺎل اﻟﻣﺳﺗﮭدف اﻟﺗﻘﺻﻲ ﻣﻌﺎﻟﺟﺔ اﻻﺣﺻﺎﺋﻲ اﻟﺑﯾﺎﻧﺎت ﻋﻠم اﻟﺑﯾﺎﻧﺎت اﻟرﯾﺎﺿﯾﺎت ﻋﻠوم اﻟﺣﺎﺳب ﺗﻌﻠم اﻵﻟﺔ اﻟﻣﺻدرPalmer, Shelly. Data Science for the C-Suite. New York: Digital Living Press, 2015. : )ﻣﺗرﺟم( 5 ﺗﻜ ﻦ ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﺗﺎﺑﻊ :ﻋﻨﺎ ﻤﺎ أن ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻫﻮ ﺗﻘﺎﻃﻊ ﻟﻌﺪة ﻋﻠﻮم وﻣﻌﺎرف ﻣﺮاﺣﻞ ﺗﻌﻠﻤﻪ وﻣﻬﺎرات ،ﻓﺈن ﻋﺎﻟﻢ اﻟﺒ ﺎﻧﺎت ﺳ ﻤﺘﻠﻚ اﻟﺧﺑرة وﺗﺪر ﻪ وﻋﻤﻠﻪ ﻋ أرض اﻟﻮاﻗﻊ أدوات ﻋﺪة ﺗﺘﻮزع ﻋ : ﻓﻲ اﻟﻣﺟﺎل اﻟﻣﺳﺗﮭدف ﺔ و ﺮﻣﺠ ﺔ وﺣﻞ ﻣﺸ ﻼت ﺎﺳﺘﺨﺪام اﺗﻘﺎن ﻣﻬﺎرات ﺣﺎﺳ ◼ اﻟﺗﻘﺻﻲ ﻣﻌﺎﻟﺟﺔ اﻻﺣﺻﺎﺋﻲ اﻟﺑﯾﺎﻧﺎت أدوات ﺗﻘﻨ ﺔ وأدوات اﻟﺬ ﺎء اﻻﺻﻄﻨﺎ . ﻋﻠم اﻟﺑﯾﺎﻧﺎت ﻣﻌﺮﻓﺔ وﺗﻄﺒﻴﻖ اﻷﺳﺎﻟ ﺐ اﻟ ﺎﺿ ﺔ واﻻﺣﺼﺎﺋ ﺔ وﺗﻮﻇ ﻔﻬﺎ ◼ اﻟرﯾﺎﺿﯾﺎت ﻋﻠوم اﻟﺣﺎﺳب ﻟﻠﺘﺤﻠ ﻞ واﻻﺳ ﻨﺘﺎج ﻣﻦ اﻟﺒ ﺎﻧﺎت. ﺗﻌﻠم اﻵﻟﺔ اﻟﻤﻌﺮﻓﺔ اﻟﺸﺎﻣﻠﺔ واﻟﻌﻤ ﻘﺔ ﻟﻤﺠﺎل اﻷﻋﻤﺎل اﻟﻤﺴﺘﻬﺪف وﻓﻬﻢ ◼ ﺗﻮاﺟﻪ ﻣﺠﺎل ﺑ ﺎﻧﺎت اﻟﻤﺠﺎل وﺟﺬور اﻟﻤﺸﺎ ﻞ أو اﻟﻔﺮص اﻟ اﻷﻋﻤﺎل اﻟﻤﺴﺘﻬﺪف. 6 ﻋﻠﻮم اﻟﺤﺎﺳﺐ واﻟﺬ ﺎء اﻻﺻﻄﻨﺎ وﺗﻄﺒ ﻘﺎﺗﻪ ﺳﺎﻫﻢ ﺗﻄﻮر اﻟﺤﻮﺳ ﺔ واﻟﺬ ﺎء اﻻﺻﻄﻨﺎ ﻣﺠﺎﻻت اﻷﻋﻤﺎل ﻧﻤﻮ ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت وﺗﻮﺳﻊ اﻧ ﺸﺎرە اﻟﺧﺑرة اﻟﻤﺨﺘﻠﻔﺔ ،وذﻟﻚ ل: ﻓﻲ اﻟﻣﺟﺎل اﻟﻣﺳﺗﮭدف ﺔ وﺗﻄﻮر أداؤﻫﺎ ﻣﻤﺎ ﺴﻬﻢ ﺗﻌﺪد اﻟﻤﻮارد اﻟﺤﺎﺳ ◼ اﻟﺗﻘﺻﻲ ﻣﻌﺎﻟﺟﺔ اﻻﺣﺻﺎﺋﻲ اﻟﺑﯾﺎﻧﺎت ﻣﻌﺎﻟﺠﺔ اﻟﺒ ﺎﻧﺎت و ﻨﺎء ﻧﻤﺎذج اﻟﺬ ﺎء اﻻﺻﻄﻨﺎ . ﻋﻠم اﻟﺑﯾﺎﻧﺎت اﻟﺤﻮﺳ ﺔ اﻟﺸﺨﺼ ﺔ. اﻟرﯾﺎﺿﯾﺎت ﻋﻠوم اﻟﺣﺎﺳب اﻟﺤﻮﺳ ﺔ اﻟﻤﺘﻨﻘﻠﺔ واﻟﺮﺷ ﻘﺔ. ﺗﻌﻠم اﻵﻟﺔ اﻟﺤﻮﺳ ﺔ اﻟﻤﺘﻮاز ﺔ وﻓﺎﺋﻘﺔ اﻷداء. اﻟﺤﻮﺳ ﺔ اﻟﺴﺤﺎﺑ ﺔ. اﻟﺤﻮﺳ ﺔ اﻟﻄﺮﻓ ﺔ. 7 ﺗﺎﺑﻊ :ﻋﻠﻮم اﻟﺤﺎﺳﺐ واﻟﺬ ﺎء اﻻﺻﻄﻨﺎ وﺗﻄﺒ ﻘﺎﺗﻪ ﺳﺎﻫﻢ ﺗﻄﻮر اﻟﺤﻮﺳ ﺔ واﻟﺬ ﺎء اﻻﺻﻄﻨﺎ ﻣﺠﺎﻻت اﻷﻋﻤﺎل ﻧﻤﻮ ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت وﺗﻮﺳﻊ اﻧ ﺸﺎرە اﻟﺧﺑرة اﻟﻤﺨﺘﻠﻔﺔ ،وذﻟﻚ ل: ﻓﻲ اﻟﻣﺟﺎل اﻟﻣﺳﺗﮭدف ﺗﻄﻮر وﺗﻮﺳﻊ ﺗﻄﺒ ﻘﺎت اﻟﺬ ﺎء اﻻﺻﻄﻨﺎ . ◼ اﻟﺗﻘﺻﻲ ﻣﻌﺎﻟﺟﺔ اﻻﺣﺻﺎﺋﻲ اﻟﺑﯾﺎﻧﺎت ﺗﻌﻠﻢ اﻵﻟﺔ. ﻋﻠم اﻟﺑﯾﺎﻧﺎت اﻟﺘﻌﻠﻢ اﻟﻌﻤﻴﻖ. اﻟرﯾﺎﺿﯾﺎت ﻋﻠوم اﻟﺣﺎﺳب اﻟﺘﻮﻟ ﺪي. اﻟﺬ ﺎء اﻻﺻﻄﻨﺎ ﺗﻌﻠم اﻵﻟﺔ 8 اﻟ ﺎﺿ ﺎت واﻻﺣﺼﺎء ﺗﺘﺠﺬر اﻟﻌﻤﻠ ﺎت اﻟ ﺎﺿ ﺔ واﻻﺣﺼﺎﺋ ﺔ ﻟﻘﺮون ﻋﺪ ﺪة أﻧﻮاﻋﻬﺎ ﻻ ﺳ ﻤﺎ ﻋﻠﻮم وأﺻ ﺤﺖ أﺳﺎﺳﺎ ﻟﻠﻌﻠﻮم ﺸ اﻟﺧﺑرة اﻟﺤﺎﺳﺐ وﻋﻠﻢ اﻟﺒ ﺎﻧﺎت. ﻓﻲ اﻟﻣﺟﺎل اﻟﻣﺳﺗﮭدف اﻟﺨﻮارزﻣ ﺎت وﻧﻤﺎذج اﻟﺬ ﺎء اﻻﺻﻄﻨﺎ . ◼ اﻟﺗﻘﺻﻲ ﻣﻌﺎﻟﺟﺔ اﻻﺣﺻﺎﺋﻲ اﻟﺑﯾﺎﻧﺎت ﺧﻮارزﻣ ﺎت ﺗﻌﻠﻢ اﻵﻟﺔ. ﻋﻠم اﻟﺑﯾﺎﻧﺎت واﻟﻌﻤﻠ ﺎت ﺧﻮارزﻣ ﺎت ﺴﻠﺴﻞ أﻋﻤﺎل اﻟﺘﻌﻠﻢ اﻵ اﻟرﯾﺎﺿﯾﺎت ﻋﻠوم اﻟﺣﺎﺳب اﻻﺣﺼﺎﺋ ﺔ اﻟﻤﺴﺘﺨﺪﻣﺔ ﻟﺒﻨﺎء وﺗﻘﻴ ﻢ ﻧﻤﺎذج اﻟﺬ ﺎء ﺗﻌﻠم اﻵﻟﺔ اﻻﺻﻄﻨﺎ . 9 ﺗﺎﺑﻊ :اﻟ ﺎﺿ ﺎت واﻻﺣﺼﺎء ﺗﺘﺠﺬر اﻟﻌﻤﻠ ﺎت اﻟ ﺎﺿ ﺔ واﻻﺣﺼﺎﺋ ﺔ ﻟﻘﺮون ﻋﺪ ﺪة أﻧﻮاﻋﻬﺎ ﻻ ﺳ ﻤﺎ ﻋﻠﻮم وأﺻ ﺤﺖ أﺳﺎﺳﺎ ﻟﻠﻌﻠﻮم ﺸ اﻟﺧﺑرة اﻟﺤﺎﺳﺐ وﻋﻠﻢ اﻟﺒ ﺎﻧﺎت. ﻓﻲ اﻟﻣﺟﺎل اﻟﻣﺳﺗﮭدف اﻟﻌﻤﻠ ﺎت واﻟﻨﻤﺎذج اﻻﺣﺼﺎﺋ ﺔ. ◼ اﻟﺗﻘﺻﻲ ﻣﻌﺎﻟﺟﺔ اﻻﺣﺻﺎﺋﻲ اﻟﺑﯾﺎﻧﺎت اﺣﺼﺎ ﻣﺒ ﻋ اﻟﺒ ﺎﻧﺎت. ﺗﻘ ﻋﻠم اﻟﺑﯾﺎﻧﺎت ﺗﺪﻗﻴﻖ واﺧﺘ ﺎر اﻟﻔﺮﺿ ﺎت ﻋ اﻟﺒ ﺎﻧﺎت اﻟﻤﻌﻄﺎة. اﻟرﯾﺎﺿﯾﺎت ﻋﻠوم اﻟﺣﺎﺳب ﻓﻬﻢ واﺳﺘﻌﺮاض اﻟﺘﻮز ـ ــﻊ اﻟﺒ ﺎ . ﺗﻌﻠم اﻵﻟﺔ 10 اﻟﻤﺠﺎل اﻟﻤﺴﺘﻬﺪف اﻟﺨ ة ﺣﻞ ﻣﺸ ﻼت أو ﺗﺤﻘﻴﻖ ﻓﺮص أو ﻳﺮﻛﺰ ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻋ ﺗﻨﻈ ﻢ و ﺴﻴ ﻋﻤﻠ ﺎت أﻋﻤﺎل اﻟﻤﺠﺎل اﻟﻤﺴﺘﻬﺪف. اﻟﺧﺑرة ﺑ ﺎﻧﺎت ﻣﺠﺎل اﻷﻋﻤﺎل اﻟﻤﺴﺘﻬﺪف. ◼ ﻓﻲ اﻟﻣﺟﺎل اﻟﻣﺳﺗﮭدف ﻣﺠﺎﻻت اﻷﻋﻤﺎل وﺟﻮد ﻢ ﻫﺎﺋﻞ ﻣﻦ اﻟﺒ ﺎﻧﺎت اﻟﺗﻘﺻﻲ ﻣﻌﺎﻟﺟﺔ اﻻﺣﺻﺎﺋﻲ اﻟﺑﯾﺎﻧﺎت اﻟﻤﺨﺘﻠﻔﺔ. ﻋﻠم اﻟﺑﯾﺎﻧﺎت ﻣﻌﻈﻢ ﺼﻮرة ﻣﻨﻈﻤﺔ أو ﻣﺠﻬﺰة اﻟﺒ ﺎﻧﺎت ﻻ ﺗﺄ اﻟرﯾﺎﺿﯾﺎت ﻋﻠوم اﻟﺣﺎﺳب اﻷﺣ ﺎن. ﺗﻌﻠم اﻵﻟﺔ ﻫﺬە اﻟﺒ ﺎﻧﺎت ذات ﻗ ﻤﺔ ﻋﺎﻟ ﺔ وﺗﺮﺷﺪ أﺻﺤﺎب اﻟﻤﺼﻠﺤﺔ ﻟﺤﻠﻮل ﻣﺒﺘﻜﺮة. 11 اﻟﻤﺠﺎل اﻟﻤﺴﺘﻬﺪف ﺗﺎﺑﻊ :اﻟﺨ ة ﺣﻞ ﻣﺸ ﻼت أو ﺗﺤﻘﻴﻖ ﻓﺮص أو ﻳﺮﻛﺰ ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻋ ﺗﻨﻈ ﻢ و ﺴﻴ ﻋﻤﻠ ﺎت أﻋﻤﺎل اﻟﻤﺠﺎل اﻟﻤﺴﺘﻬﺪف. اﻟﺧﺑرة ﺪﻳﻬ ﺔ. ﺣﻠﻮل ﻏ ﻇﺎﻫﺮة وﻏ ◼ ﻓﻲ اﻟﻣﺟﺎل اﻟﻣﺳﺗﮭدف ﺑ ﺎﻧﺎت اﻟﻤﺠﺎل اﻟﻤﺴﺘﻬﺪف وذﻟﻚ ﺗﻈﻬﺮ أﻧﻤﺎط اﻟﺗﻘﺻﻲ ﻣﻌﺎﻟﺟﺔ اﻻﺣﺻﺎﺋﻲ اﻟﺑﯾﺎﻧﺎت اﻹﺣﺼﺎ اﻟﻤﺒ ﻋ اﻟﺒ ﺎﻧﺎت. ﺎﻟﺘﻘ ﻋﻠم اﻟﺑﯾﺎﻧﺎت ﻳﺘﻢ ﺑﻨﺎء واﺧﺘ ﺎر ﻓﺮﺿ ﺎت ﺗﺨﺺ ﻣﻬﺎم ﻣﺤﺪدة اﻟرﯾﺎﺿﯾﺎت ﻋﻠوم اﻟﺣﺎﺳب اﻟﻤﺠﺎل اﻟﻤﺴﺘﻬﺪف.ﻫﺬە اﻟﻔﺮﺿ ﺎت ﻗﺪ ﺗﻤﺜﻞ أو ﺗﻈﻬﺮ ﺗﻌﻠم اﻵﻟﺔ ﺣﻠﻮل أﻋﻤﺎل ﻣﺒﺘﻜﺮة. ﻄﺒ ﻌﺔ اﻟﺒ ﺎﻧﺎت ﻓﺈن ﻫﺬە اﻟﺤﻠﻮل ﻻ ﺗﻈﻬﺮ ﺸ ﻞ دور ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻻ ﺸﺎف أﻧﻤﺎط ،وﺄ ﻣﺎ اﻟﺒ ﺎﻧﺎت واﻟﺤﻠﻮل اﻟﻤﻤﻜﻨﺔ. 12 ﺳﻤﺎت ﻋﺎﻟﻢ اﻟﺒ ﺎﻧﺎت ً ا: ﻣﻬﺎرات ﻋﺪ ﺪة وﻫﺎﻣﺔ ﻗﺪ ﻤﺘﻠ ﻬﺎ ﻋﺎﻟﻢ اﻟﺒ ﺎﻧﺎت ،واﻟ ﻧﺬﻛﺮﻫﺎ أدﻧﺎە ﻣﺜﺎ ﻻ ﺣ ﻣﻦ أﻫﻢ اﻷدوات اﻟ ﺎﺿ ﺎت واﻻﺣﺼﺎء واﻟﺘﺤﻠ ﻞ اﻟ اﻟﻤﻬﺎرات اﻟ ﻤ ﺔ ) :(Quantitative skillsﺗﻌﺘ ◼ اﻟﻨﻈ ﺔ واﻟﺘﻄﺒ ﻘ ﺔ ﻟﻌﺎﻟﻢ اﻟﺒ ﺎﻧﺎت. اﻟﻤﻬﺎرات اﻟﺘﻘﻨ ﺔ :اﻹدراك اﻟ ﺎﻣﻞ ﻟﻠﺤﻠﻮل اﻟﺘﻘﻨ ﺔ وﻣﻮا ﺔ ﺗﻄﻮرﻫﺎ. ◼ ﺑﻬﺎ ﻘﻮم ﻄ ح اﻟ ﺴﺎؤﻻت اﻟﻬﺎﻣﺔ :ﻣﻦ أﻫﻢ اﻟﻤﻬﺎرات اﻟﻨﺎﻋﻤﺔ ﻟﻌﺎﻟﻢ اﻟﺒ ﺎﻧﺎت واﻟ اﻟﺘﻔﻜ اﻟﻨﻘﺪي واﻟﺘﺤﻠ ◼ اﻟﺒ ﺎﻧﺎت. واﻟﻤﻮﺟﻬﺔ ،و ﻨﺎء رؤى وﺗﺼﻮرات ﻣ ﺪﺋ ﺔ ﻳ ﺘﺞ ﻋﻨﻬﺎ ﺣﻠﻮل ﻣﺒ ﺔ ﻋ اﻻﺑﺘ ﺎر واﻹ ﺪاع :ﺗﻌﻈ ﻢ اﻻﺳﺘﻔﺎدة ﻣﻦ اﻷدوات اﻟﻤﺘﺎﺣﺔ ودﻣﺞ اﻷﺳﺎﻟ ﺐ وﻋﻤﻞ ﺣﻠﻮل اﺑﺘ ﺎر ﺔ. ◼ اﻟﺘﻮاﺻﻞ اﻟﻔﻌﺎل :ﻜﻮن ذﻟﻚ ﻣﻊ ﻓﺮق اﻟﻌﻤﻞ اﻟﻤﺨﺘﻠﻔﺔ.و ﻜﻮن ﺣﺘﻤ ﺎ ﻋﻨﺪ اﻟﺘﻮاﺻﻞ ﻣﻊ أﺻﺤﺎب اﻟﻤﺼﻠﺤﺔ ◼ ﻟﻔﻬﻢ اﻟﻤﺸ ﻠﺔ اﻟﻤﺮاد ﺣﻠﻬﺎ وﻃ ح اﻟﺤﻠﻮل واﻟ ﺴﺎؤﻻت. 13 اﻟﻔﺼﻞ اﻷول ﺗﻤﻬ ﺪ ﻟﻌﻠﻢ اﻟﺒ ﺎﻧﺎت )اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻟﺜﺎﻟﺜﺔ( 2 ﻣﻔﻬﻮم اﻟﺒ ﺎﻧﺎت اﻟﺒ ﺎﻧﺎت ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻘ ﻢ أو اﻟﻤﻼﺣﻈﺎت أو اﻟﺤﻘﺎﺋﻖ اﻟ ﻳﺘﻢ ﺗﻤﺜ ﻠﻬﺎ ﺑﺘ ﺴﻴﻖ ﻣﻌ ،ﻣﺜﻞ اﻟﺠﺪول أو ﺟﺪول ◼ اﻟﺒ ﺎﻧﺎت أو ﻗﺎﻋﺪة ﺑ ﺎﻧﺎت أﺷ ﺎل ﻋﺪ ﺪة ،ﻣﺜﻞ اﻟﺒ ﺎﻧﺎت اﻟﻌﺪد ﺔ واﻟﻔﺌ ﺔ واﻟﻨﻤﻄ ﺔ واﻟﻨﺼ ﺔ. ﻤﻜﻦ أن ﺗﺄ اﻟﺒ ﺎﻧﺎت ◼ ﻤﺎ ﻤﻜﻦ أن ﺗﻜﻮن ﻣﻨﻈﻤﺔ أو ﻏ ﻣﻨﻈﻤﺔ ،اﻋﺘﻤﺎدا ﻋ ﻛ ﻔ ﺔ ﺗﻤﺜ ﻠﻬﺎ وﺗﺨ ﻨﻬﺎ. ◼ اﻟﻤﻌﻠﻮﻣﺎت واﻟﺘﻌﻠ ﻢ أﻧﻬﺎ ﻣﻮرد ﻳﺘﻢ إ ﺸﺎؤە وﺟﻤﻌﻪ وﺗﻨﻈ ﻤﻪ و ﺗﺎﺣﺘﻪ ﻟﺪﻋﻢ اﻟ ﺤﺚ اﻟﻌﻠ اﻣﺎ اﻟﻤﻌﻠﻮﻣﺎت ُ ﻓﻴﻨﻈﺮ ﻟﻬﺎ ﻋ ◼ واﻷ ﺸﻄﺔ اﻷﺧﺮى. ﻤﻜﻦ أن ﺗﺘﺨﺬ اﻟﻤﻌﻠﻮﻣﺎت أﺷ ﺎل ﻋﺪة ،ﻣﺜﻞ اﻟ ﺘﺐ واﻟﻤﺠﻼت واﻟﻤﻘﺎﻻت واﻟﻤﻮارد اﻟﺮﻗﻤ ﺔ وﻏ ﻫﺎ ﻣﻦ ◼ اﻟﻤﻮاد. 5 ﺗﺎﺑﻊ :ﻣﻔﻬﻮم اﻟﺒ ﺎﻧﺎت اﻟﻤﻌﺮﻓﺔ ُ أﻧﻬﺎ ﻓﻬﻢ ﻋﺎ ﻳﺮﺗ ﻂ ﻣﻔﻬﻮم اﻟﻤﻌﺮﻓﺔ ارﺗ ﺎﻃﺎ وﺛ ﻘﺎ ﻔﻜﺮة اﻟﻤﻌﻠﻮﻣﺎت.ﻓﻐﺎﻟ ﺎ ﻣﺎ ﻳﻨﻈﺮ إ اﻟﻤﻌﺮﻓﺔ ﻋ ◼ أﺳﺎس اﻟﻤﻌﻠﻮﻣﺎت. اﻟﻤﺴﺘﻮى أو إﺗﻘﺎن ﻟﻤﻮﺿ ع أو ﻣﻨﻄﻖ ﻣﻌ ،ﻣﺒ ﻋ ُ أﻧﻬﺎ أﺻﻞ ﻫﺎم ﻻﺗﺨﺎذ اﻟﻘﺮارات وﺗﺤﻘﻴﻖ اﻷﻫﺪاف اﻟﺸﺨﺼ ﺔ واﻟﺘﻨﻈ ﻤ ﺔ. ﻳﻨﻈﺮ إ اﻟﻤﻌﺮﻓﺔ ا ﻀﺎ ،ﻋ ◼ اﻟﻣﻌرﻓﺔ اﻟﻣﻌﻠوﻣﺎت اﻟﺑﯾﺎﻧﺎت 6 ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت ]:[Data Sources اء ﻄﺎﻗﺎت اﻻﺋﺘﻤﺎن أو اﻟﻤﻌﺎﻣﻼت :ﻤﻜﻦ إ ﺸﺎء اﻟﺒ ﺎﻧﺎت ﻣﻦ ﺧﻼل اﻟﻤﻌﺎﻣﻼت اﻻدار ﺔ واﻟﻤﺎﻟ ﺔ ،ﻣﺜﻞ .1 ﻓ ﺔ. اﻟﻤﻌﺎﻣﻼت اﻟﻤ وﺳﺎﺋﻞ اﻟﺘﻮاﺻﻞ اﻻﺟﺘﻤﺎ :ﻤﻜﻦ ﺟﻤﻊ اﻟﺒ ﺎﻧﺎت ﻣﻦ ﻣﻨﺼﺎت وﺳﺎﺋﻞ اﻟﺘﻮاﺻﻞ اﻻﺟﺘﻤﺎ ،ﻣﺜﻞ Facebook .2 وtwitter. ﻣﻮاﻗﻊ اﻟ ﺐ واﻷﻧﻈﻤﺔ اﻷﺳﺎﺳ ﺔ ﻋ اﻹﻧ ﻧﺖ. .3 أﺟﻬﺰة اﻻﺳ ﺸﻌﺎر وأﺟﻬﺰة إﻧ ﻧﺖ اﻵﺷ ﺎء ) :(IoTﻣﺜﻞ اﻷﺟﻬﺰة اﻟﻘﺎ ﻠﺔ ﻟﻼرﺗﺪاء واﻷﺟﻬﺰة اﻟﻤ ﻟ ﺔ اﻟﺬﻛ ﺔ، .4 ﻟﺘ ﺒﻊ اﻟﻤﻌﻠﻮﻣﺎت اﻟﺸﺨﺼ ﺔ واﻟﻈﺮوف اﻟﺒ ﺌ ﺔ. ﻣﺠﻤﻮﻋﺎت اﻟﺒ ﺎﻧﺎت اﻟﺤﻜﻮﻣ ﺔ واﻟﻌﺎﻣﺔ. .5 ﺎت اﻷ ﺤﺎث ﻣﺜﻞ اء اﻟﺒ ﺎﻧﺎت ﻣﻦ ﻣﺰودي اﻟﺒ ﺎﻧﺎت اﻟﺨﺎرﺟﻴ ﻣﻮﻓﺮو اﻟﺒ ﺎﻧﺎت ﻣﻦ اﻟﻄﺮف اﻟﺜﺎﻟﺚ :ﻤﻜﻦ .6 أو وﺳﻄﺎء اﻟﺒ ﺎﻧﺎت أو ﻣﺰودي اﻟﻤﻌﻠﻮﻣﺎت اﻟﻤﺎﻟ ﺔ أو اﻟﺪ ﻤﻮﻏﺮاﻓ ﺔ. 7 أﻧﻮاع اﻟﺒ ﺎﻧﺎت ذﻟﻚ: ﻫﻨﺎك ﻋﺪة أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﺒ ﺎﻧﺎت ،ﻤﺎ ﺟﺪول ﺑ ﺎﻧﺎت أو اﻟﺤﻘﻮل اﻟﺒ ﺎﻧﺎت اﻟﻤﻬ ﻠﺔ :اﻟﺒ ﺎﻧﺎت اﻟﻤﻨﻈﻤﺔ ﺑﺘ ﺴﻴﻖ ﻣﻌ ،ﻣﺜﻞ اﻟﺼﻔﻮف واﻵﻋﻤﺪة .1 ﻗﺎﻋﺪة ﺑ ﺎﻧﺎت. اﻟﺒ ﺎﻧﺎت ﻏ اﻟﻤﻬ ﻠﺔ :اﻟﺒ ﺎﻧﺎت اﻟ ﻟ ﺲ ﻟﻬﺎ ﺗ ﺴﻴﻖ ﻣﻌ ،ﻣﺜﻞ اﻟﻨﺺ ﻣﻦ ﻣ ﺸﻮرات وﺳﺎﺋﻞ اﻟﺘﻮاﺻﻞ .2 اﻻﺟﺘﻤﺎ . ﻣﻦ اﻟﺘﻨﻈ ﻢ ،وﻟ ﻦ ﻟ ﺲ ﻘﺪر اﻟﺒ ﺎﻧﺎت اﻟﻤﻨﻈﻤﺔ. اﻟﺒ ﺎﻧﺎت ﺷ ﻪ اﻟﻤﻨﻈﻤﺔ :اﻟﺒ ﺎﻧﺎت اﻟ ﻟﻬﺎ ﻣﺴﺘﻮى ﻣﻌ .3 ﺗﺘﻀﻤﻦ اﻵﻣﺜﻠﺔ ﻣﻠﻔﺎت XMLو .JSON اﻟﻌﻤﻠ ﺎت اﻟﺤﺴﺎﺑ ﺔ. ﻤﻜﻦ ﻗ ﺎﺳﻬﺎ ﻤ ﺎ واﺳﺘﺨﺪاﻣﻬﺎ اﻟﺒ ﺎﻧﺎت اﻟﻌﺪد ﺔ :اﻟﺒ ﺎﻧﺎت اﻟ .4 ﻤﻜﻦ ﺗﻘﺴ ﻤﻬﺎ إ ﻓﺌﺎت. اﻟﺒ ﺎﻧﺎت اﻟﻔﺌ ﺔ :اﻟﺒ ﺎﻧﺎت اﻟ .5 ﺳ ﻞ اﻟﻤﺜﺎل ﺻﺢ أو ﺧﻄﺄ 1 ،أو 0 ﻓﻘﻂ ﻋ ﻗ ﻤﺘ ﻤﻜﻦ أن ﺗﺤﺘﻮي ﻋ اﻟﺒ ﺎﻧﺎت اﻟﺜﻨﺎﺋ ﺔ :اﻟﺒ ﺎﻧﺎت اﻟ .6 ﺑ ﺎﻧﺎت اﻟﺴﻼﺳﻞ اﻟﺰﻣﻨ ﺔ :اﻟﺒ ﺎﻧﺎت اﻟ ﻳﺘﻢ ﺟﻤﻌﻬﺎ ﺧﻼل ﻓ ة زﻣﻨ ﺔ ،ﻣﺜﻞ أﺳﻌﺎر اﻷﺳﻬﻢ ودرﺟﺔ اﻟﺤﺮارة. .7 8 ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت ﺧﺼﺎﺋﺺ ﻓﺌﺎت او أﺻﻨﺎف ً ﺑﻨﺎء ﻋ ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت ] :[Data Classificationﻫﻮ ﻋﻤﻠ ﺔ ﺗﻨﻈ ﻢ اﻟﺒ ﺎﻧﺎت ◼ أو ﺳﻤﺎت ﻣﻌﻴﻨﺔ. ذﻟﻚ: ﻫﻨﺎك ﻋﺪة ﻃﺮق ﻣﺨﺘﻠﻔﺔ ﻟﺘﺼ ﻒ اﻟﺒ ﺎﻧﺎت ،ﻤﺎ ◼ اﻟﻘ ﻢ اﻟﻌﺪد ﺔ ،ﻣﺜﻞ اﻟﻌﻤﺮ واﻟﻮزن ودرﺟﺔ اﻟﺤﺮارة. ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت اﻟﺮﻗﻤ ﺔ :ﻌﺘﻤﺪ ﻋ .1 اﻟﻘ ﻢ اﻟﻔﺌ ﺔ ،ﻣﺜﻞ اﻟﺠ ﺲ أو ﻧ ع اﻟﻤﻨﺘﺞ أو اﻟﻤﻮﻗﻊ اﻟﺠﻐﺮا . ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت اﻟﻔﺌ ﺔ :ﻌﺘﻤﺪ ﻋ .2 ﻫ ﻞ ﺸ ﻪ اﻟﺸﺠﺮة، ﻫ ﻞ ﻫﺮ ،ﺣ ﺚ ﻳﺘﻢ ﺗﻨﻈ ﻢ اﻟﺒ ﺎﻧﺎت ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت اﻟﻬﺮ :ﻌﺘﻤﺪ ﻋ .3 ﻣﻊ ﻣﺴﺘ ﺎت ﻣﺘﻌﺪدة ﻣﻦ اﻟﻔﺌﺎت. اﻟﺒ ﺎﻧﺎت اﻟﻨﺼ ﺔ ،ﻣﺜﻞ ﻣ ﺸﻮرات اﻟﻮﺳﺎﺋﻂ اﻻﺟﺘﻤﺎﻋ ﺔ أو ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت اﻟﻨﺼ ﺔ :ﻌﺘﻤﺪ ﻋ .4 ﻣﺮاﺟﻌﺎت اﻟﻌﻤﻼء. ﺑ ﺎﻧﺎت اﻟﺼﻮرة ،ﻣﺜﻞ اﻟﺼﻮر اﻟﻔﻮﺗﻮﻏﺮاﻓ ﺔ أو ﻣﻘﺎﻃﻊ اﻟﻔ ﺪﻳﻮ. ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت اﻟﺼﻮر ﺔ :ﻌﺘﻤﺪ ﻋ .5 9 اﺳﺘﻜﺸﺎف اﻟﺒ ﺎﻧﺎت اﻟﻤﺮﺣﻠﺔ اﻟ ﻳﺘﻢ ﻓﻴﻬﺎ اﺳﺘﺨﺪام ﺗﺼﻮرات و ﺣﺼﺎءات ﻌﺪ اﺳﺘﻜﺸﺎف اﻟﺒ ﺎﻧﺎت ][Data Exploration ◼ ﻣﻮﺟﺰة ﻟﻔﻬﻢ اﻟﺒ ﺔ اﻷﺳﺎﺳ ﺔ وﺧﺼﺎﺋﺺ اﻟﺒ ﺎﻧﺎت. ذﻟﻚ: ﻤﻜﻦ اﺳﺘﺨﺪاﻣﻬﺎ ﻻﺳﺘﻜﺸﺎف اﻟﺒ ﺎﻧﺎت ،ﻤﺎ ﻫﻨﺎك اﻟﻌﺪ ﺪ ﻣﻦ اﻷﺳﺎﻟ ﺐ اﻟﻤﺨﺘﻠﻔﺔ اﻟ ◼ اﻟﺘﻤﺜ ﻞ اﻟﻤﺮ Visualization - .1 إﺣﺼﺎءات ﻣﻮﺟﺰة Summarization - .2 ﺟﺪاول اﻟﺘﻜﺮار .3 اﻻرﺗ ﺎط واﻻﻧﺤﺪار Correlation and Regression - .4 10 ﻣﺠﺎﻻت اﺳﺘﺨﺪام ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ذ ﺎء اﻷﻋﻤﺎل ﻤﻜﻦ اﺳﺘﺨﺪام ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻟﺘﺤﻠ ﻞ ﺑ ﺎﻧﺎت ◼ اﻟﻌﻤﻼء و ﺎﻧﺎت اﻟﻤﺒ ﻌﺎت وﻏ ﻫﺎ ﻣﻦ اﻟﺒ ﺎﻧﺎت اﻟﻤﺘﻌﻠﻘﺔ ﺎﻟﻌﻤﺎل ﻻ ﺴﺎب رؤى ﺣﻮل ﺳﻠﻮك اﻟﻌﻤﻼء واﻟﺘ ﺒﺆ ﺎﻻﺗﺠﺎﻫﺎت اﻟﻤﺴﺘﻘ ﻠ ﺔ و ﻼغ ﻗﺮارات اﻟﻌﻤﻞ. ﻛﺸﻒ اﻻﺣﺘ ﺎل ﻤﻜﻦ اﺳﺘﺨﺪام ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻟﺘﺤﺪ ﺪ اﻵﻧﻤﺎط ◼ اﻟﻤﻌﺎﻣﻼت اﻟﻤﺎﻟ ﺔ اﻟ ﻗﺪ ﺸ إ واﻟﺸﺬوذ اﻻﺣﺘ ﺎل. 11 ﺗﺎﺑﻊ :ﻣﺠﺎﻻت اﺳﺘﺨﺪام ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت اﻟﺮﻋﺎ ﺔ اﻟﺼﺤ ﺔ ﻤﻜﻦ اﺳﺘﺨﺪام ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻟﺘﺤﻠ ﻞ اﻟﺴﺠﻼت ◼ اﻟﻄﺒ ﺔ واﻟﺒ ﺎﻧﺎت اﻷﺧﺮى اﻟﻤﺘﻌﻠﻘﺔ ﺎﻟﺼﺤﺔ ﻟﺘﺤﺴ ﻧﺘﺎﺋﺞ اﻟﻤﺮ ،وﺗﺤﺪ ﺪ اﻟﻤﺨﺎﻃﺮ اﻟﺼﺤ ﺔ اﻟﻤﺤﺘﻤﻠﺔ ،و ﻋﻼم ﺳ ﺎﺳﺔ اﻟﺼﺤﺔ اﻟﻌﺎﻣﺔ. وﺳﺎﺋﻞ اﻟﺘﻮاﺻﻞ اﻻﺟﺘﻤﺎ ﻤﻜﻦ اﺳﺘﺨﺪام ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻟﺘﺤﻠ ﻞ ﺑ ﺎﻧﺎت وﺳﺎﺋﻞ ◼ ﻟﻔﻬﻢ اﻟﺮأي اﻟﻌﺎم وﺗﺤﺪ ﺪ اﻟﺘﻮاﺻﻞ اﻻﺟﺘﻤﺎ اﻻﺗﺠﺎﻫﺎت وﺗ ﺒﻊ اﻧ ﺸﺎر اﻟﻤﻌﻠﻮﻣﺎت ﻋ اﻹﻧ ﻧﺖ. 12 ﺗﺎﺑﻊ :ﻣﺠﺎﻻت اﺳﺘﺨﺪام ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻣﻌﺎﻟﺠﺔ اﻟﻠﻐﺔ اﻟﻄﺒ ﻌ ﺔ ﻤﻜﻦ اﺳﺘﺨﺪام ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻟﻤﻌﺎﻟﺠﺔ وﻓﻬﻢ وﻋﻤﻞ ◼ ذﻟﻚ رو ﻮﺗﺎت ﺔ ،ﻤﺎ ً ﺑﻨﺎء ﻋ اﻟﻠﻐﺔ اﻟ ﺗ ﺒﺆات اﻟ ﻼم وﺗﻠﺨ ﺺ اﻟﻨﺼﻮص اﻟﻤﺤﺎدﺛﺔ واﻟﺘﻌﺮف ﻋ اﻟ ﺒ ة. رؤ ﺔ اﻟﺤﺎﺳﻮب ﻤﻜﻦ اﺳﺘﺨﺪام ﻋﻠﻢ اﻟﺒ ﺎﻧﺎت ﻟﺘﺤﻠ ﻞ اﻟﺼﻮر وﻣﻘﺎﻃﻊ ◼ اﻟﻔ ﺪﻳﻮ وﻟﺘﻄ ﺮ اﻟﺴ ﺎرات ذاﺗ ﺔ اﻟﻘ ﺎدة واﻟﺘﻄﺒ ﻘﺎت اﻟﻤﺮﺋ ﺔ اﻵﺧﺮى. 13 ض اﻟﻔﺼﻞ اﻟﺜﺎ اﻟﻤﻔﺎﻫ ﻢ اﻷﺳﺎﺳ ﺔ ﻟﻌﻠﻢ اﻟﺒ ﺎﻧﺎت )اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻷو ( 2 ﺗﺮﻛ ﺐ اﻟﺒ ﺎﻧﺎت ض ﻋﺪة ﻋﻮاﻣﻞ ،ﻣﻨﻬﺎ: ﺔ ﺑﻨﺎءا ﻋ اﻟﺒ ﺌﺎت اﻟﺤﺎﺳ ﺗﺘﻌﺪد ﻃﺮق ﺗﺨ ﻦ اﻟﺒ ﺎﻧﺎت ً ﻃﺒ ﻌﺔ اﻟﺒ ﺎﻧﺎت وﺗﺮا ﻂ ﻣﻜﻮﻧﺎﺗﻬﺎ ،ﻣﺜ : n Øﺟﺪاول Tables üأﻣﺜﻠﺔ :ﺟﺪاول MS Excelأو )Comma-separated Values (.csv Øﻗﻮاﻋﺪ ﺑ ﺎﻧﺎت (DB) Databases üأﻣﺜﻠﺔ SQL :أو non-SQL ض Øﻣﻠﻔﺎت :Filesأﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ أوﻋ ﺔ اﻟﺒ ﺎﻧﺎت ﺼﻴﻎ واﻣﺘﺪادات وﺗﺮﻛ ﺐ ﺑ ﺎ ﻣﻨﻈﻢ وﻏ ﻣﻨﻈﻢ. üأﻣﺜﻠﺔ :اﻟﻨﺼ ﺔ ) .txtأو (.docxﻣﻠﻔﺎت اﻟﻮﺳﺎﺋﻂ ﺎﻟﺼﻮر ) (.pngأو ﻣﻠﻔﺎت ﺗﺼ ﺮ اﻟﻌﻘﻞ اﻟ ش ي )(NIFTI Files ﺣﺠﻢ اﻟﺒ ﺎﻧﺎت n Øﺑ ﺎﻧﺎت اﻋﺘ ﺎد ﺔ أو ﺑ ﺎﻧﺎت ﺿﺨﻤﺔ .Big Data Øﻧﻈﺎم ﺗﺨ ﻦ ﻣﺤ أو أﻧﻈﻤﺔ ﻣﻮزﻋﺔ أو ﺗﺨ ﻦ ﺳﺤﺎ . ﺔ ﻣﻦ ﺗﺨ ﻦ واﺳ ﺟﺎع ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻷوﻋ ﺔ اﻹﻟ وﻧ ﺔ واﻟﺬي ﺗﻤﻜﻦ اﻷﺟﻬﺰة اﻟﺤﺎﺳ أوﻋ ﺔ اﻟﺒ ﺎﻧﺎت: n وﺗﻨﻔ ﺬ اﻟﻌﻤﻠ ﺎت ﻋ اﻟﺒ ﺎﻧﺎت واﻟﻮﺻﻮل ﻟﻬﺎ إﻟ وﻧ ﺎ. 5 ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت ﻣﻦ ﺣ ﺚ اﻧﺘﻈﺎم ﻣﻦ ﺣ ﺚ ﻋﻼﻗﺔ اﻟﺒ ﺎﻧﺎت اﻟﺒ ﺎﻧﺎت ﻣﻬ كﻠﺔ ﻋﻼﺋﻘ ﺔ Structured Relational ﻏ ي ﻣﻬ كﻠﺔ ﻻ ﻋﻼﺋﻘ ﺔ Unstructured Non-relational 6 ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت ﻣﻦ ﺣ ﺚ اﻧﺘﻈﺎﻣﻬﺎ ض واﺣﺪة ﻣﻦ اﻟﻔﺌﺘ ض : ﺗﺄ أوﻋ ﺔ اﻟﺒ ﺎﻧﺎت ﺄﺷ ﺎل وأﺣﺠﺎم وﺗﺮا ﺐ ﻣﺘﻌﺪدة ،وﻟ ﻦ ﺟﻤ ﻌﻬﺎ ﺗﻨﺪرج n Øﺑ ﺎﻧﺎت ﻣﻬ ﻠﺔ :وﺗﻜﻮن اﻟﺒ ﺎﻧﺎت ﻟﻬﺎ ﺗﺮﻛ ﺐ وﻫ ﻞ ﻣﻨﺘﻈﻢ. ﻋﻜﺲ اﻟﺒ ﺎﻧﺎت اﻟﻤﻬ ﻠﺔ ،اﻟﺒ ﺎﻧﺎت اﻟﻐ ﻣﻬ ﻠﺔ ﺗﺄ ﺑ ﻛﻴ ﺔ ﻏ ﻣﻨﺘﻈﻤﺔ و ﻌﺘ Øﺑ ﺎﻧﺎت ﻏ ﻣﻬ ﻠﺔ :ﻋ ﺻﻌ ﺔ ﻟﺘﻌﻘ ﺪ ﺗﺮﻛﻴ ﺘﻬﺎ. اﻟﺘﻌﺎﻣﻞ ﻣﻌﻬﺎ أ 7 اﻟﺒ ﺎﻧﺎت اﻟﻤﻬ ﻠﺔ أﻣﺜﻠﺔ ﻋ أزواج اﻟﻤﻔﺘﺎح واﻟﻘ ﻤﺔ ) (Key-Value Pairsﻣﺜﻞ ﻣﻠﻔﺎت JSON ""Beans { [ : "Total" : { 11, "Total" : 10, "Red" : 3, "Red" : 3, "Blue" : "Blue" : 4, 5, "Yellow" : 3 "Yellow" : }, 3 { } "Total" : 12, ] "Red" : 2, "Blue" : 6, "Yellow" : 4 }, ... 8 اﻟﺒ ﺎﻧﺎت اﻟﻤﻬ ﻠﺔ ﺗﺎﺑﻊ :أﻣﺜﻠﺔ ﻋ ﺻﻔﻮف وأﻋﻤﺪة ﻣﺤﺪدة 9 اﻟﺒ ﺎﻧﺎت ﻏ اﻟﻤﻬ ﻠﺔ ﺷ ﻞ ﺗﻜﺘﻼت ﻣﻦ اﻟﺒ ﺎﻧﺎت ﺪون وﺟﻮد ﺗﻨﻈ ﻢ واﺿﺢ ،و ﻤﻜﻦ ﻋ اﻟﺒ ﺎﻧﺎت ﻏ اﻟﻤﻬ ﻠﺔ ﺗﺄ n ﺗﻘﺴ ﻤﻬﺎ إ ﻧﻮﻋ ض : nﻣﻠﻔﺎت )أو ﺣﺰم( ﺑ ﺎﻧﺎت ﻏ ﻣﻨﻈﻤﺔ ،وﻣﻦ أﻣﺜﻠﺘﻬﺎ: Øﻣﻠﻔﺎت ﻧﺼ ﺔ Øاﻟﻤﻠﻔﺎت اﻟﺼﻮﺗ ﺔ Øﻣﻠﻔﺎت اﻟﻔ ﺪﻳﻮ Øاﻟﺼﻮر Øﺑ ﺎﻧﺎت وﺳﺎﺋﻞ اﻟﺘﻮاﺻﻞ اﻻﺟﺘﻤﺎ ض Øاﻟ ﺪ اﻹﻟ و اﻟﺒ ﺎﻧﺎت اﻟ ﻳﺘﻢ ﺗﻮﻟ ﺪﻫﺎ ﻣﻦ ﻗ ﻞ اﻵﻟﺔ )اﻟﺤﺎﺳﻮب( ،ﻣﺜﻞ: ﺑ ﺎﻧﺎت آﻟ ﺔ :و n Øﻣﻠﻔﺎت اﻟﺴﺠﻞ )(Log Files 10 ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت ﻣﻦ ﺣ ﺚ ﻋﻼﻗﺘﻬﺎ ً ض ﻣﻔﻬﻮم ﻗﻮاﻋﺪ ﺔ.ﻧﺘﻌﺮف أو ﻋ اﻟﺒ ﺌﺎت اﻟﺤﺎﺳ ﺗﺘﻌﺪد ﻃﺮق ر ﻂ اﻟﺒ ﺎﻧﺎت ﺑ ﻌﻀﻬﺎ اﻟ ﻌﺾ ﻋﻨﺪ ﺗﺨ ﻨﻬﺎ اﻟﺒ ﺎﻧﺎت: ﺗﻘﻮم ﺑﺘﺨ ﻦ ﻣﺠﻤﻮﻋﺎت اﻟﺒ ﺎﻧﺎت واﺳ ﺟﺎع وﺗﻨﻔ ﺬ ﻣﺠﻤﻮﻋﺔ اﻟﻘﻮاﻋﺪ اﻟ ﻗﺎﻋﺪة اﻟﺒ ﺎﻧﺎت ):(DB n وﻧ ﺎ. اﻟﻌﻤﻠ ﺎت ﻋ اﻟﺒ ﺎﻧﺎت واﻟﻮﺻﻮل ﻟﻬﺎ إﻟ ﺗﺄ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت ﺄﺷ ﺎل وأﺣﺠﺎم وﺗﺮا ﺐ ﻣﺘﻌﺪدة ،و ﻤﻜﻦ ﺗﺼ ﻔﻬﺎ ﻣﻦ ﺣ ﺚ ﻋﻼﻗﺘﻬﺎ إ : n Øﻗﻮاﻋﺪ ﺑ ﺎﻧﺎت ﻋﻼﺋﻘ ﺔ :وﻓﻴﻬﺎ ،ﻳﺘﻢ ر ﻂ اﻟﺒ ﺎﻧﺎت ﻌﻼﻗﺎت ﻣﻔﺘﺎﺣ ﺔ أو وﺻﻼت ﻣﻨﻄﻘ ﺔ. Øﻗﻮاﻋﺪ ﺑ ﺎﻧﺎت ﻏ ﻋﻼﺋﻘ ﺔ :ﻳﺘﻢ ﺗﺨ ﻦ اﻟﺒ ﺎﻧﺎت ﻤﺠﻤﻮﻋﺎت وﻻ ﺗﻈﻬﺮ ﻫﻨﺎك را ﻄﺔ ﻋﻼﺋﻘ ﺔ. 11 ﻗﻮاﻋﺪ ﺑ ﺎﻧﺎت ﻋﻼﺋﻘ ﺔ ض ﻳﺘﻢ اﻹﺷﺎرة إ اﻟﻌﻼﻗﺎت ﺑ ض اﻟﺒ ﺎﻧﺎت ﺣﺎل وﺟﻮد ﻋﻼﻗﺔ أو وﺻﻼت ﻋﻼﺋﻘ ﺔ ﺗ ﻂ اﻟﺒ ﺎﻧﺎت ﻣﻊ ﻌﻀﻬﺎ اﻟ ﻌﺾ. ض إذا ﻧﻈﺮﻧﺎ إ اﻟﻠﻐﺎت اﻻﺳﺘﻌﻼﻣ ﺔ اﻟﻤﺴﺘﺨﺪﻣﺔ ﺸ ﻞ ﺷﺎﺋﻊ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت ،ﻓﺈن ﻃ ﻘﺔ اﻻﺳﺘﻌﻼم ﺗﻜﻮن ﻋﻦ ﻃ ﻖ: ﻟﻐﺔ اﻻﺳﺘﻌﻼم اﻟﻤﻬ ﻞ )(Structured Query Language, SQL n ض Øﺴﺘﺨﺪم ﻟﻼﺳﺘﻌﻼم ﻋﻦ أي ﻣﻜﻮن ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت واﻟ ﺗﻢ ﺗﺨﻄ ﻄﻬﺎ ﺑﻮﺟﻮد ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺠﺪاول ).(Table Øﻫﺬە اﻟﺠﺪاول ﺗ ﻄﻬﺎ ﻋﻼﻗﺎت ﻣﻔﺘﺎﺣ ﺔ ﺴﻬﻞ ﻋﻤﻠ ﺎت اﻻﺳﺘﻌﻼم. ) (primary keyواﻟﺜﺎﻧﻮي Øاﻟﻌﻼﻗﺎت ﺑ ض ﻋﻨﺎ اﻟﺒ ﺎﻧﺎت ﺗﻜﻮن ﻋﻦ ﻃ ﻖ اﻟﻤﻔﺎﺗﻴﺢ ﺎﻟﻤﻔﺘﺎح اﻟﺮﺋ ) (secondary keyواﻷﺟﻨ ).(foreign key Employee ID Project ID Name Finish Date Years of Experience Status Supervised By 12 ﺗﺎﺑﻊ :ﻗﻮاﻋﺪ ﺑ ﺎﻧﺎت ﻋﻼﺋﻘ ﺔ ﺪون ﻟﻐﺔ اﻻﺳﺘﻌﻼم اﻟﻤﻬ ﻞ )(NoSQL n Øﺴﺘﺨﺪم ﻟﻼﺳﺘﻌﻼم ﻋﻦ اﻟﺒ ﺎﻧﺎت اﻟﻤﺨﺰﻧﺔ ﻄ ﻘﺔ ﻏ ﻣﻬ ﻠﺔ. Øﻣﻦ أﻣﺜﻠﺘﻬﺎ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت اﻟﺸ ﻜ ﺔ )(Graph Databases ض Øﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت اﻟﺸ ﻜ ﺔ ،اﻟﻌﻼﻗﺎت ﺑ ض اﻟﺒ ﺎﻧﺎت ﻣﻮﺟﻮدة ﺸ ﻞ ﺿﺨﻢ وﻣﻌﻘﺪ ،ﻏ أن ﻫ ﻠﺘﻬﺎ ﻏ ض ﻣﻨﺘﻈﻤﺔ ﻤﺎ ﻫﻮ اﻟﺤﺎل اﻟﺒ ﺎﻧﺎت اﻟﻌﻼﺋﻘ ﺔ اﻻﻋﺘ ﺎد ﺔ واﻟﻤﺒ ﺔ ﻋ .SQL Øأﺳﺎﻟ ﺐ أﺧﺮى ﻟﻼﺳﺘﻌﻼم ﻋﻦ اﻟﻌﻼﻗﺎت ك )(Object-relational-mapping, ORM Project ID: Emp ID: 015 Project 10012 Employee Project ID: Project 021 Employee Project Project ID: Emp ID: 023 10016 13 ﻗﻮاﻋﺪ ﺑ ﺎﻧﺎت ﻏ ﻋﻼﺋﻘ ﺔ ﺳﻤﺔ ﻷﻧﻮاع ﻛﺜ ة ﻣﻦ اﻟﺒ ﺎﻧﺎت ،ﻓﺘﻜﻮن ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت اﻻﻋﺘ ﺎد ﺔ ﻋﺪم وﺟﻮد ﻋﻼﻗﺎت واﺿﺤﺔ ﺑ ض اﻟﺒ ﺎﻧﺎت ﻏ ﻣﻼﺋﻤﺔ ﻟﺘﺨ ﻦ ﻫﺬە اﻷﻧﻮاع اﻟﻌﺪ ﺪة ﻣﻦ اﻟﺒ ﺎﻧﺎت. ﺣﺴﺐ ﻃﺒ ﻌﺔ اﻟﺒ ﺎﻧﺎت ﺧﺼ ﺼﺎ ﻟﻨ ع ﻣﺤﺪد ﻣﻦ اﻟﺒ ﺎﻧﺎت وﻋ ﻋﻼﺋﻘ ﺔ ﺗﺒ ض ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت اﻟﻐ n اﻟﻤﺴﺘﻬﺪﻓﺔ. ض ﺗﻌ ﻣﺮوﻧﺔ وﻗﺎ ﻠ ﺔ ﻟﻠﺘﻮﺳﻊ ﺗﺨ ﻦ ﻫﺬا اﻟﻨ ع ﻣﻦ اﻟﺒ ﺎﻧﺎت. n ﻳﺘﻢ اﻻﺳﺘﻌﻼم ﻋﻨﻬﺎ ب .NoSQL n ﻣﻦ اﻷﻣﺜﻠﺔ ﻋﻠﻴﻬﺎ: n Øﻣﻠﻔﺎت ﻧﺼ ﺔ Øﻣﻠﻔﺎت اﻟﺒ ﺎﻧﺎت اﻟﻤﺘﺨﺼﺼﺔ )اﻟﻤﻮﺟ ﺔ ،اﻟﺼﻮر ،وﻏ ﻫﺎ( Øﻣﻠﻔﺎت اﻟﺴﺠﻞ )(Log Files 14 ﻣﺼﻔﻮﻓﺔ ﺗﺼ ﻒ اﻟﺒ ﺎﻧﺎت ﺑ ﺎﻧﺎت ﻏ ﻣﻬ ﻠﺔ. ﻞ اﻟﺒ ﺎﻧﺎت اﻟﻐ ﻋﻼﺋﻘ ﺔ n اﻟﺒ ﺎﻧﺎت اﻟﻌﻼﺋﻘ ﺔ ﻗﺪ ﺗﻜﻮن ﻣﻬ ﻠﺔ ﻣﺜﻞ n ﻣﻬ ﻠﺔ ﻣﺜﻞ ) graph ) (Tablesأو ﻏ .(databases ﻌﺾ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت ﻣﻦ ﻧ ع NoSQLﻗﺪ ﺗﻜﻮن n ﻣﻬ ﻠ ﺔ وﻋﻼﺋﻘ ﺔ. ﻫﻨﺎك أ ﻀﺎ ﻌﺾ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت ﻣﻦ ﻧ ع NoSQL n ﻣﻬ ﻠ ﺔ ﻣﻊ اﻣﺘﻼ ﻬﺎ ﻟﺨﺎﺻ ﺔ ﻗﺪ ﺗﻜﻮن ﻏ اﻟﺒ ﺎﻧﺎت اﻟﺸ ﻜ ﺔ اﻟﻌﻼﺋﻘ ﺔ.ﻣﺜﺎل :ﻗﻮاﻋﺪ ).(Graph Databases ﺑ ﺎﻧﺎت ﺟﻤﻴﻊ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت ﻣﻦ ﻧ ع SQL n ﻣﻬ ﻠﺔ وﻋﻼﺋﻘ ﺔ. 15 اﻟﻔﺼﻞ اﻟﺜﺎ اﻟﻤﻔﺎﻫ ﻢ اﻷﺳﺎﺳ ﺔ ﻟﻌﻠﻢ اﻟﺒ ﺎﻧﺎت )اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻟﺜﺎﻧ ﺔ( 2 ﻣﺨﻄﻄﺎت اﻟﺒ ﺎﻧﺎت ﻣﻦ ﺟﺪول واﺣﺪ )ﺣى ﻣﺌﺎت اﻟﺠﺪاول(. ﻏﺎﻟ ﺎ ﻣﺎ ﺗﺘﻜﻮن ﻗﺎﻋﺪة ﺑ ﺎﻧﺎت -اﻟﻤﻨﻈﻤﺔ واﻟﻌﻼﻗ ﺔ -ﻣﻦ أ n ﻤﻜﻦ ﺗﻮﺻ ﻞ ﺟﻤﻴﻊ ﺟﺪاول ﻗﺎﻋﺪة اﻟﺒ ﺎﻧﺎت ﺑ ﻌﻀﻬﺎ اﻟ ﻌﺾ ،ﺣى ﻟﻮ اﺳﺘﻐﺮق اﻷﻣﺮ ﻋﺪة ﺻﻼت ﻟﻠﻘ ﺎم n ﺬﻟﻚ. ُْ اﻻﺳﺘﺨﺪام ،ﻏﺎﻟ ﺎ ﻣﺎ ﺗ ﺒﻊ ﻌﺾ اﻷﻧﻤﺎط اﻟﺸﺎﺋﻌﺔ ﻋﻨﺪ ﺗﻨﻈ ﻢ ﻧﻈﺎﻓﺔ وأﺳﻬﻞ ﻟﺠﻌﻞ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت أ n ﻫﺬە اﻷﻧﻤﺎط ﻣﺨﻄﻄﺎت اﻟﺒ ﺎﻧﺎت. اﻟﺠﺪاول واﻟﺘﻔﺎﻋﻞ ﻣﻊ ﻌﻀﻬﺎ اﻟ ﻌﺾ ﺴ ﻫﻨﺎك اﻟﻌﺪ ﺪ ﻣﻦ اﻟﻤﺨﻄﻄﺎت اﻟﺸﺎﺋﻌﺔ اﻟﻤﺨﺘﻠﻔﺔ ،اﻟﻤﺨﻄﻄﺎت اﻷﺳﺎﺳ ﺔ: n ﻣﺨﻄﻂ اﻟﻨﺠﻤﺔ )(Star Schema Ø ﻣﺨﻄﻂ ﻧﺪﻓﺔ اﻟﺜﻠﺞ )(Snowflake Schema Ø ﻣﺨﻄﻂ ﻛﻮﻛ ﺔ )(Fact Constellation Schema Ø 5 ﻣﺨﻄﻂ اﻟﻨﺠﻤﺔ )(Star Schema اﻹ ﺠﺎﺑ ﺎت: ﺴ ﻂ )ﻳﻮﺟﺪ ﻋﺪد أﻗﻞ ﻣﻦ اﻟﺠﺪاول ﺸ ﻞ ﻋﺎم(. n ﻣﻄﻠﻮب ﻋﺪد أﻗﻞ ﻣﻦ اﻟﺼﻼت. n ﻓﻬﻢ ﻛ ﻔ ﺔ ارﺗ ﺎط اﻟﺠﺪاول ﺑ ﻌﻀﻬﺎ أﺳﻬﻞ n اﻟ ﻌﺾ. اﻟﺴﻠﺒ ﺎت: اﻟﺘﻜﺮار اﻟﻌﺎ )ﻳﺘﻢ ﺗﻜﺮار اﻟ ﺜ ﻣﻦ اﻟﺒ ﺎﻧﺎت(. n ﺗﻄﺒ ﻌ ﺔ ) (renormalizedﺴ ﺐ اﻟﺘﻜﺮار ﻏ n اﻟﺒ ﺎﻧﺎت ﻌﺮض ﻋﻨﺎ ﺪورە واﻟﺬي اﻟﻌﺎ ﻟﺨﻄﻮرة ﻋﺪم اﻟﺘﻮاﻓﻖ واﻻ ﺴﺎق. 6 ﻣﺨﻄﻂ ﻧﺪﻓﺔ اﻟﺜﻠﺞ )(Snowflake Schema اﻹ ﺠﺎﺑ ﺎت: اﻧﺨﻔﺎض اﻟﺘﻜﺮار )ﻳﺘﻢ ﺗﻜﺮار ﻋﺪد ﻗﻠ ﻞ ﺟﺪا ﻣﻦ n اﻟﻤﻘﺎﻳ ﺲ ،إن وﺟﺪت( ﺗﻄﺒﻴﻊ )(normalization n اﻟﺴﻠﺒ ﺎت: ﺗﻌﻘ ﺪا )ﻓﻬﻢ ﻛ ﻔ ﺔ ارﺗ ﺎط اﻟﺠﺪاول أ n ﺻﻌ ﺔ( ﺑ ﻌﻀﻬﺎ اﻟ ﻌﺾ أ ﻣ ﺪ ﻣﻦ اﻟﺼﻼت )ﻗﺪ ﻳﺘﻄﻠﺐ ﻫﻨﺎك ﺣﺎﺟﺔ إ n ﻋﺪة ﺻﻼت وﺳ ﻄﺔ( اﻻﻧﻀﻤﺎم إ ﺟﺪوﻟ 7 ﻣﺨﻄﻄﺎت اﻟﻨﺠﻮم وﻧﺪﻓﺔ اﻟﺜﻠﺞ اﻻﺧﺘ ﺎر ﺑ ﻌﺘﻤﺪ اﻻﺧﺘ ﺎر ﺑ ﻣﺨﻄﻂ اﻟﻨﺠﻤﺔ أو ﻧﺪﻓﺔ اﻟﺜﻠﺞ ﻋ اﻻﺣﺘ ﺎﺟﺎت اﻟﻤﺤﺪدة ﻟﻤ ش وع ﻣﺨﻄﻄﺎت اﻟﻨﺠﻮم ﺗﺤﻠ ﻞ اﻟﺒ ﺎﻧﺎت.ﺗﻌ اﻷوﻟ ﺔ ﻟﻠ ﺴﺎﻃﺔ وﺳﻬﻮﻟﺔ اﻻﺳﺘﺨﺪام ،ﺑ ﻨﻤﺎ ﺗﺤﺴ ﺗﻌﻤﻞ ﻣﺨﻄﻄﺎت ﻧﺪﻓﺔ اﻟﺜﻠﺞ ﻋ ﻛﻔﺎءة اﻟﺘﺨ ﻦ وﺳﻼﻣﺔ اﻟﺒ ﺎﻧﺎت. 8 ﻣﺨﻄﻂ ﻛﻮﻛ ﺔ )(Fact Constellation Schema 9 ﺗﺎﺑﻊ :ﻣﺨﻄﻂ ﻛﻮﻛ ﺔ )(Fact Constellation Schema ﺗﺘﻜﻮن ﻣﺨﻄﻄﺎت ﻛﻮﻛ ﺔ ﻣﻦ: ﺳﻠﺴﻠﺔ ﻣﺨﻄﻂ اﻟﻨﺠﻮم /ﻧﺪﻓﺔ اﻟﺜﻠﺞ. n اﻧﺪﻣﺎج اﻟﻌﺪ ﺪ ﻣﻦ ﻣﺨﻄﻄﺎت اﻟﻨﺠﻮم /ﻧﺪﻓﺔ اﻟﺜﻠﺞ اﻟى ﺴﺘﺨﺪم ﻌﺾ اﻷ ﻌﺎد اﻟﺸﺎﺋﻌﺔ. n ﺗﺘﻜﻮن ﻣﻦ اﻟﻌﺪ ﺪ ﻣﻦ ﺟﺪاول اﻟﺤﻘﺎﺋﻖ ) (Fact Tablesﻣﻊ ﺟﺪاول اﻷ ﻌﺎد اﻟﻤﺸ ﻛﺔ اﻟﻤﺤﺘﻤﻠﺔ. n 10 ﺣﻠﻮل ﺗﺠﺎر ﺔ وﻣﻔﺘﻮﺣﺔ اﻟﻤﺼﺪر ﻟﻘﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت 11 ض اﻟﻔﺼﻞ اﻟﺜﺎ اﻟﻤﻔﺎﻫ ﻢ اﻷﺳﺎﺳ ﺔ ﻟﻌﻠﻢ اﻟﺒ ﺎﻧﺎت )اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻟﺜﺎﻟﺜﺔ( 2 أﻧﻮاع أوﻋ ﺔ اﻟﺒ ﺎﻧﺎت اﻟﻤﺘﺨﺼﺼﺔ كﻞ ﻗﺎﻋﺪة ﺑ ﺎﻧﺎت ﻣﺘﺨﺼﺼﺔ ﻟﻬﺎ اﺳﻢ ﻣﺤﺪد ،و ﺴﺘﺨﺪم ﻷﺷ ﺎء ﻣﺨﺘﻠﻔﺔ ،وﻟﻬﺎ أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﺒ ﺎﻧﺎت، n و ﺴﺘﺨﺪﻣﻬﺎ أﺷﺨﺎص ﻣﺨﺘﻠﻔﻮن. ﻣﻦ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت اﻟﻤﺘﺨﺼﺼﺔ: n Øﻣﺴﺘﻮدﻋﺎت اﻟﺒ ﺎﻧﺎت )(Data Warehouses Øأﺳﻮاق اﻟﺒ ﺎﻧﺎت )(Data Marts Øﺤ ات اﻟﺒ ﺎﻧﺎت )(Data Lakes DATA SOURCES اﻟﻣﺻدرhttps://axysweb.com/data-lake-data-warehouse-data-mart-definition-objectif-et-fonctionnement/ : 5 ﻣﺴﺘﻮدﻋﺎت اﻟﺒ ﺎﻧﺎت )(Data Warehouses »ﻣﺴﺘﻮدع اﻟﺒ ﺎﻧﺎت :ﻋ ﺎرة ﻋﻦ ﻣﺠﻤﻮﻋﺔ ﺑ ﺎﻧﺎت ﻣﻮﺟﻬﺔ ﻧﺤﻮ اﻟﻤﻮﺿ ع وﻣﺘ ﺎﻣﻠﺔ وﻣﺘﻐ ة زﻣﻨ ﺎ وﻏ ﻣﺘﻄﺎﻳﺮة n ض (WH Inmon, Building Data Warehouses, 1992) «. ﺻﻨﻊ اﻟﻘﺮار اﻟﺘﻨﻈ ﺴﺘﺨﺪم ﺸ ﻞ أﺳﺎ ﻏﺎﻟ ﺎ ﻣﺎ ﺴﺘﺨﺪم ﻟﻠﺠﺪاول اﻟﻌﻼﺋﻘ ﺔ اﻟﻤﻨﻈﻤﺔ. n ﻋﺎدة ﻣﺎ ﺗﺤﺘﻮي ﻋ كﻤ ﺎت ﻛﺒ ة ﻣﻦ ﺑ ﺎﻧﺎت اﻟﻤﻌﺎﻣﻼت اﻟﻤﻌﺎﻟﺠﺔ. n ﺗﻌﻘ ﺪا و ﺴﺘﺨﺪﻣﻬﺎ ﻣﻬﻨﺪﺳﻮ اﻟﺒ ﺎﻧﺎت أو ﻣﺴﺆوﻟﻮ ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت. أ n ﻋﺮﺿﺔ ﻟﻤﺘﺎ ﻌﺔ ﻣﺨﻄﻂ ﻧﺪﻓﺔ اﻟﺜﻠﺞ. أ n 6 أﺳﻮاق اﻟﺒ ﺎﻧﺎت )(Data Marts ﻣﺠﻤﻮﻋﺔ ﻓﺮﻋ ﺔ ﻣﺘﺨﺼﺼﺔ ﻣﻦ ﻣﺴﺘﻮدع اﻟﺒ ﺎﻧﺎت. أﺳﻮاق اﻟﺒ ﺎﻧﺎت n إﻧﻬﺎ أﺻﻐﺮ ﺣﺠﻤﺎ ،وﺗﺤﺘﻮي ﻓﻘﻂ ﻋ ﻣﻌﻠﻮﻣﺎت ﻣﻌﺎﻟﺠﺔ ﺣﻮل ﻣﻮﺿ ع ﻣﻌ ض ،وﻟﻬﺎ ﺑ ﺔ أ ﺴﻂ. n ﺗﻌﺘ ﺧﺪﻣﺔ ذاﺗ ﺔ ﻷﻧﻬﺎ ﻣﺼﻤﻤﺔ ﻟﺘﻜﻮن ﺴ ﻄﺔ ﻤﺎ ﻜ ض ﻟﻠﻤﺤﻠﻠ ض أو ﻣﻮﻇ ض دﻋﻢ اﻟﻌﻤﻼء ﻟﻠﻮﺻﻮل إﻟﻴﻬﺎ n ﺄﻧﻔﺴﻬﻢ. اﻷوﻟ ﺔ ﻟﺴﻬﻮﻟﺔ اﻻﺳﺘﺨﺪام ،ﻓﺈﻧﻬﺎ ﻏﺎﻟ ﺎ ﺗ ﺒﻊ ﻣﺨﻄﻄﺎ ﻧﺠﻤ ﺎ. ﻧﻈﺮا ﻷن ﻗﻮاﻋﺪ اﻟﺒ ﺎﻧﺎت ﻫﺬە ﺗﻌ n 7 ﺤ ات اﻟﺒ ﺎﻧﺎت )(Data Lakes ﺗﺨﺰن ﺤ ات اﻟﺒ ﺎﻧﺎت كﻤ ﺎت ﻛﺒ ة ﻣﻦ اﻟﺒ ﺎﻧﺎت اﻟﺨﺎم ﻏ اﻟﻤﻌﺎﻟﺠﺔ. n ﺑ ﺎﻧﺎت ﻣﻨﻈﻤﺔ أو ﺑ ﺎﻧﺎت ﻏ ﻣﻨﻈﻤﺔ. ﻤﻜﻦ أن ﺗﺤﺘﻮي ﻋ n ﻏﺎﻟ ﺎ ﻣﺎ ﻳﺘﻢ ﺟﻤﻊ اﻟﺒ ﺎﻧﺎت ﻣﻦ ﻋﺪة ﻣﺼﺎدر ﻣﺨﺘﻠﻔﺔ. n ﻤﻜﻦ أن ﺗﺘﻀﻤﻦ ﺑ ﺎﻧﺎت أو أﻧﻮاع ﻣﻠﻔﺎت ﻣﺨﺘﻠﻔﺔ. n ﻧﻈﺮا ﻟﻄﺒ ﻌﺔ اﻟﻤﻌﻠﻮﻣﺎت اﻷوﻟ ﺔ ،ﻏﺎﻟ ﺎ ﻣﺎ ﺴﺘﺨﺪم ﻋﻠﻤﺎء اﻟﺒ ﺎﻧﺎت ﺤ ات اﻟﺒ ﺎﻧﺎت وﻻ ﺗ ﺒﻊ أي ﻣﺨﻄﻂ n ﻣﺤﺪد. 8 ﺗﺤﺪ ﺚ اﻟﺒ ﺎﻧﺎت اﻟﻤﺨﺰﻧﺔ ﺎﻟ ﺴ ﺔ ﻟﻸ ﻌﺎد ) (variables/attribuesاﻟﻤﺘﻐ ة ﺑ ﻂء ،ﻏﺎﻟ ﺎ ﻣﺎ ﺗﻈﻬﺮ ﺣﺎﻟﺘﺎن: n Øﺗﺤﺪ ﺚ ﻗ ﻤﺔ ﺣﺎﻟ ﺔ. Øﺗﻐﻴ ﻋﺪد اﻟﻤﺘﻐ ات اﻟ ﻳﺘﻢ ﺴﺠ ﻠﻬﺎ. 9 ﺗﺎﺑﻊ :ﺗﺤﺪ ﺚ اﻟﺒ ﺎﻧﺎت اﻟﻤﺨﺰﻧﺔ ﺗﺤﺪ ﺚ ﺳﺠﻞ ﻘ ﻤﺔ ﻣﺤﺪﺛﺔ: n Øاﻟ ﺘﺎ ﺔ ﻓﻮق اﻟﻘ ﻢ اﻟﺘﺎر ﺨ ﺔ: ض إذا ﻗﻤﺖ ﻓﻘﻂ ﺑﺘﻐﻴ اﻟﻘ ﻤﺔ اﻟﺨﻠ ﺔ ،ﻓﻬﺬا ﻳ ﻣﺠﻤﻮﻋﺔ اﻟﺒ ﺎﻧﺎت اﻟﺨﺎﺻﺔ ﻚ أﺻﻐﺮ وأ ﺴﻂ n ﻜﺜ .وﻣﻊ ذﻟﻚ ،ﻧﻈﺮا ﻷﻧﻚ ﻓﻘﺪت اﻟﻘ ﻤﺔ اﻟﺨﺎﺻﺔ ﻚ ،ﻟﻢ ﻌﺪ ﺑ ﻣ ﺎﻧﻚ اﻟﻮﺻﻮل إ اﻟﺒ ﺎﻧﺎت اﻟﺘﺎر ﺨ ﺔ. Øاﻻﺣﺘﻔﺎظ ﺎﻟﻘ ﻢ اﻟﺘﺎر ﺨ ﺔ: ﺗﻄﻠﺐ إﺿﺎﻓﺔ أﻋﻤﺪة إﺿﺎﻓ ﺔ ﺤ ﺚ ﻤﻜﻨﻚ ﺗ ﺒﻊ اﻟﻘ ﻤﺔ اﻟﺤﺎﻟ ﺔ ،وﻛﺬﻟﻚ ﻋﻨﺪﻣﺎكﺎﻧﺖ اﻟﻘ ﻢ n اﻷﺧﺮى ﺸﻄﺔ ﻋﻦ ﻃ ﻖ إﺿﺎﻓﺔ اﻷﻋﻤﺪة :اﻟﺴﺠﻞ اﻟ ﺸﻂ واﻟ ﺪا ﺔ اﻟ ﺸﻄﺔ واﻟﻨﻬﺎ ﺔ اﻟ ﺸﻄﺔ. Active Record Updated Active Record 10 ﺗﺎﺑﻊ :ﺗﺤﺪ ﺚ اﻟﺒ ﺎﻧﺎت اﻟﻤﺨﺰﻧﺔ ﻳﺘﻢ ﺴﺠ ﻠﻬﺎ : ﺗﻐﻴ ﻋﺪد اﻟﻤﺘﻐ ات اﻟ n Øﻋﻨﺪ إﺿﺎﻓﺔ أﻋﻤﺪة أو إزاﻟﺘﻬﺎ ﻣﻦ ﺟﺪول أو ﻣﺠﻤﻮﻋﺔ ﺑ ﺎﻧﺎت ،ﺳ ﺘﻌ ض ﻋﻠ ﻚ ﺗﺤﺪ ﺪ ﻣﺎ إذاﻛﻨﺖ ﺗ ﺪ ﺣﺬف ﺟﻤﻴﻊ اﻟﺒ ﺎﻧﺎت اﻟﺘﺎر ﺨ ﺔ أم ﻻ. Øﺳ ﺐ ﻣﺤﺪد :ﻗ ﻢ ﻓﺎرﻏﺔ ،أو ﻣﺴﺎﻓﺎت ) (spacesﻻ ﺗﻮﺟﺪ ﻓﻴﻬﺎ ﻗ ﻢ ﺣ ﺚ ﺠﺐ أن ﺗﻜﻮن ﻣﻮﺟﻮدة. ض Øﻻ ﻳﻬﻢ ﻣﺎ إذاﻛﻨﺖ ﺗﻀ ﻒ أﻋﻤﺪة أو ﺗ ﻠﻬﺎ -كﻠﺘﺎ اﻟﺤﺎﻟﺘ ض ،ﺳﺘ ش ئ ﻗ ﻤﺎ ﻓﺎرﻏﺔ. 11 اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ )اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻷو ( 2 ﻣﻔﻬﻮم اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒ ﺎﻧﺎت اﻟ ﺗﻜﻮن اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ◼ ﺿﺨﻤﺔ ﺟﺪا وﻣﻌﻘﺪة ﻟﺪرﺟﺔ أن اﻷدوات واﻟﺘﻘﻨ ﺎت اﻟﺘﻘﻠ ﺪ ﺔ ﻟﻤﻌﺎﻟﺠﺔ اﻟﺒ ﺎﻧﺎت وﺗﺤﻠ ﻠﻬﺎ ﻗﺪ ﻻ ﺗﻜﻮن ﺎﻓ ﺔ ﻟﻠﺘﻌﺎﻣﻞ ﻣﻌﻬﺎ. ُ ﺴﺘﺨﺪم ﻣﺼﻄﻠﺢ "اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ" ﻟﻺﺷﺎرة إ ◼ اﻟ ﻤ ﺎت اﻟ ﺒ ة واﻟﻤﺘﻨﻮﻋﺔ ﻣﻦ اﻟﺒ ﺎﻧﺎت اﻟ ﺗﺘﺪﻓﻖ ﻋﺎت ﻋﺎﻟ ﺔ واﻟ ﺗﺤﺘﺎج إ ﻣﻌﺎﻟﺠﺔ ﻓﻮر ﺔ. ﺗ ﻤﻦ اﻟﺘﺤﺪ ﺎت اﻟ ﺗﺮاﻓﻖ ﻫﺬا اﻟﻨ ع ﻣﻦ اﻟﺒ ﺎﻧﺎت ◼ ﺗﻮﻓ ﻫﺎ وﻣﻌﺎﻟﺠﺘﻬﺎ وﺗﺨ ﻨﻬﺎ وﺗﺤﻠ ﻠﻬﺎ واﻟ ﺤﺚ ﻓﻴﻬﺎ وﻣﺸﺎرﻛﺘﻬﺎ وﻧﻘﻠﻬﺎ وﺗﺼ ﺮﻫﺎ ﺎﻻﺿﺎﻓﺔ ا اﻟﻤﺤﺎﻓﻈﺔ ﻋ اﻟﺨﺼﻮﺻ ﺎت اﻟ ﺗﺮاﻓﻘﻬﺎ. https://www.arabicmagazine.net/Images/Articles/2018811111949801.jpg 5 ﺧﺼﺎﺋﺺ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ https://image.slidesharecdn.com/cduulgymsoiyznljkxjw-signature-c40f32b45a67da0182f1bf54c9c02be86d54572e45fbf14c4b729ae4430cdcbd-poli-201001084350/75/-13-2048.jpg 6 ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ذﻟﻚ: ﻫﻨﺎك اﻟﻌﺪ ﺪ ﻣﻦ اﻟﻤﺼﺎدر اﻟ ﺗ ﺘﺞ ﻋﻨﻬﺎ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ،ﻤﺎ وﺳﺎﺋﻞ اﻟﺘﻮاﺻﻞ اﻻﺟﺘﻤﺎ :ﻣﺜﻞ Facebookو Twitterو .Instagram ◼ أﺟﻬﺰة إﻧ ﻧﺖ اﻷﺷ ﺎء ) :(IoTﻣﺜﻞ اﻷﺟﻬﺰة اﻟﻤ ﻟ ﺔ اﻟﺬﻛ ﺔ واﻷﺟﻬﺰة اﻟﻘﺎ ﻠﺔ ﻟﻼرﺗﺪاء. ◼ ﺗﻢ إ ﺸﺎؤﻫﺎ ﺑﻮاﺳﻄﺔ اﻟﺨﻮادم وﻣﻮاﻗﻊ اﻟ ﺐ واﻟﺘﻄﺒ ﻘﺎت ﻣﻌﻠﻮﻣﺎت ﻗ ﻤﺔ ﺣﻮل ﺳﻠﻮك ﻣﻠﻔﺎت اﻟﺴﺠﻞ :اﻟ اﻟﻤﺴﺘﺨﺪم وأداء اﻟﻨﻈﺎم. وﻧ ﺔ :ﻣﺜﻞ Amazonو .eBay اﻟﺘﺠﺎرة اﻹﻟ ◼ أﺟﻬﺰة اﻟﺠﻮال :ﺗﻘﻮم اﻷﺟﻬﺰة اﻟﻤﺤﻤﻮﻟﺔ ﻣﺜﻞ اﻟﻬﻮاﺗﻒ اﻟﺬﻛ ﺔ واﻷﺟﻬﺰة اﻟﻠﻮﺣ ﺔ ﺑ ﺸﺎء ﺑ ﺎﻧﺎت ﺣﻮل اﻟﻤﻮﻗﻊ ◼ واﻻﺳﺘﺨﺪام وﺳﺠﻞ اﻟﺘﺼﻔﺢ. 7 ﺗﺎﺑﻊ :ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ﻓ ﺔ :ﺗﻘﻮم اﻟﻤﺆﺳﺴﺎت اﻟﻤﺎﻟ ﺔ واﻟﺒﻨﻮك ﺑ ﺸﺎء ﻤ ﺎت ﻛﺒ ة ﻣﻦ اﻟﺒ ﺎﻧﺎت ﺣﻮل اﻟﻤﻌﺎﻣﻼت اﻟﻤﺎﻟ ﺔ واﻟﻤ ◼ وﺳﻠﻮك اﻟﻌﻤﻼء واﺗﺠﺎﻫﺎت اﻟﺴﻮق. ﺔ ) (CDRsوأﻧﻈﻤﺔ وﻧ ﺔ ) (EHRsوﻣﺴﺘﻮدﻋﺎت اﻟﺒ ﺎﻧﺎت اﻟ اﻟﺮﻋﺎ ﺔ اﻟﺼﺤ ﺔ :اﻟﺴﺠﻼت اﻟﺼﺤ ﺔ اﻹﻟ ◼ اﻟﺒ ﺎﻧﺎت اﻟﻄﺒ ﺔ اﻷﺧﺮى ﺗﻮﻟﺪ ﻤ ﺎت ﻛﺒ ة ﻣﻦ اﻟﺒ ﺎﻧﺎت ﺣﻮل ﺻﺤﺔ اﻟﻤ ﺾ واﻟﻌﻼج واﻟﻨﺘﺎﺋﺞ. اﻟﺘﻌﺎﻣﻼت اﻟﺤﻜﻮﻣ ﺔ :ﺗﻘﻮم اﻟﺠﻬﺎت اﻟﺤﻜﻮﻣ ﺔ ﺑ ﻧﺘﺎج ﻤ ﺎت ﻛﺒ ة ﻣﻦ اﻟﺒ ﺎﻧﺎت ﺣﻮل اﻟ ﻛﻴ ﺔ اﻟﺴ ﺎﻧ ﺔ، ◼ واﻟﻤﺆ ات اﻻﻗﺘﺼﺎد ﺔ ،واﻟﺒ ﺎﻧﺎت اﻟﺒ ﺌ ﺔ. ُ واﻟﺘﺠﺎرب ﻤ ﺔ ﻛﺒ ة ﻣﻦ اﻟﻤﺴﻮﺣﺎت واﻟ ﺤﺚ اﻟﻌﻠ اﻻﺳﺘﻄﻼﻋﺎت واﻟ ﺤﻮث واﻟﺒ ﺎﻧﺎت اﻟﻌﻠﻤ ﺔ :ﺗ ◼ ﻤﻜﻦ أن ﺗﻜﻮن ﻣﻔ ﺪة ﻟﻠﺘﺤﻠ ﻞ واﻟﺮؤى. اﻟﺒ ﺎﻧﺎت اﻟ ﻫﺬە ﻣﺠﺮد أﻣﺜﻠﺔ ﻗﻠ ﻠﺔ ،وﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ﺗﺘﻄﻮر ﺎﺳﺘﻤﺮار ﻣﻊ ﺗﻐ اﻟﺘﻜﻨﻮﻟﻮﺟ ﺎ واﻟﻤﺠﺘﻤﻊ. 8 ﺗﺤﺪ ﺎت ﺗﻨﻈ ﻢ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ﻫﻨﺎك اﻟﻌﺪ ﺪ ﻣﻦ اﻟﻤﺸ ﻼت واﻟﺘﺤﺪ ﺎت اﻟ ﻗﺪ ﺗﻮاﺟﻬﻬﺎ اﻟﻤﺆﺳﺴﺎت ﻋﻨﺪ اﻟﺘﻌﺎﻣﻞ ﻣﻊ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ،ﻤﺎ ▪ ذﻟﻚ: 9 ﻣﻨﻈﻮﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ اﻷﻃﺮاف ﺗﺘﻌﺎﻣﻞ ﻣﻊ ﻫﺬە اﻟﺨﺪﻣﺔ وﺗﺤﺪ ﺪ واﺟ ﺎت وﺣﻘﻮق ﻞ ﻟ ﻳﺘﻢ ﺗﻨﻈ ﻢ أي ﺧﺪﻣﺔ ﺠﺐ ﺗﺤﺪ ﺪ اﻷﻃﺮاف اﻟ ◼ ﻃﺮف. ﻣﺎ ﺑ ﻨﻬﺎ ،ﻫﺬە اﻟﻤﻨﻈﻮﻣﺔ ُﻣ ﻮﻧﺔ ﻣﻦ: ﺗﺘﻜﻮن ﻣﻨﻈﻮﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ﻣﻦ ﻋﺪة ﺟﻬﺎت ﺗﺘﻔﺎﻋﻞ ◼ ﻣﻮﻓﺮ/ﻣﺰود اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ. ُﻣﻘﺪم ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ. ﻋﻤ ﻞ ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ. 10 ﻣﻮﻓﺮ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ُﻣﻘﺪم اﻟﺨﺪﻣﺔ ،و ﺸﻤﻞ أ ﺸﻄﺔ اﻟﺒ ﺎﻧﺎت ﻣﻦ ﻣﺼﺎدر ُﻣﺨﺘﻠﻔﺔ إ ﺗﻮﻓ ﻌﻤﻞ ﻣﻮﻓﺮ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ﻋ ◼ : ﺳ ﻞ اﻟﻤﺜﺎل ﻣﺎ ﻣﻮﻓﺮة اﻟﺒ ﺎﻧﺎت ﻋ إ ﺸﺎء اﻟﺒ ﺎﻧﺎت. إ ﺸﺎء اﻟﻤﻌﻠﻮﻣﺎت اﻟﻮﺻﻔ ﺔ ) (Meta dataاﻟ ﺗﺼﻒ ﻣﺼﺪر اﻟﺒ ﺎﻧﺎت. إ ﺠﺎد ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت اﻟﻤﻔﺘﻮﺣﺔ ) (open dataﻋ اﻹﻧ ﻧﺖ. ﺗﻮﻓ ﺑ ﺎن اﻟﺨﺪﻣﺎت ) (Service catalogueإ ُﻣﻘﺪم اﻟﺨﺪﻣﺔ ﻋﻦ اﻟﺒ ﺎﻧﺎت اﻟﻘﺎ ﻠﺔ ﻟﻺﺳﺘﺨﺪام. 11 ُﻣﻘﺪم ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ اﻟﺒ ﺔ اﻟﺘﺤﺘ ﺔ اﻟﻼزﻣﺔ ﻟﻬﺎ و ﺸﻤﻞ أ ﺸﻄﺔ ُﻣﻘﺪم ﻘﻮم ُﻣﻘﺪم اﻟﺨﺪﻣﺔ ﺑﺘﺤﻠ ﻞ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ وﺗﻮﻓ ◼ : اﻟﺨﺪﻣﺔ ﻋ ﺳ ﻞ اﻟﻤﺜﺎل ﻣﺎ ﻣﻦ ﻣﻮﻓﺮ اﻟﺒ ﺎﻧﺎت أو اﻟ ﺤﺚ ﻣﺼﺎدر اﻟﺒ ﺎﻧﺎت وﺟﻤﻊ اﻟﺒ ﺎﻧﺎت ﻋﻦ ﻃ ﻖ اﻟﻄﻠﺐ اﻟﻤ ﺎ اﻟ ﺤﺚ اﻹﻧ ﻧﺖ ).(Data Crawling ﺗﺨ ﻦ اﻟﺒ ﺎﻧﺎت. دﻣﺞ اﻟﺒ ﺎﻧﺎت. ﺗﻮﻓ أدوات ﻟﺘﺤﻠ ﻞ اﻟﺒ ﺎﻧﺎت. دﻋﻢ إدارة اﻟﺒ ﺎﻧﺎت ﻣﺜﻞ ﺧﺼﻮﺻ ﺔ اﻟﺒ ﺎﻧﺎت وأﻣﻦ اﻟﺒ ﺎﻧﺎت وﻣﻠ ﺔ اﻟﺒ ﺎﻧﺎت. 12 ﻋﻤ ﻞ ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ُ ﻘﺪﻣﻬﺎ ﻫﻮ اﻟﻤﺴﺘﺨﺪم اﻟﻨﻬﺎ ﻟﻤﻨﻈﻮﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ أو ﻫﻮ ﻧﻈﺎم ﺴﺘﺨﺪم اﻟﻨﺘﺎﺋﺞ أو اﻟﺨﺪﻣﺎت اﻟ ◼ ُ ُﻣﻘﺪم ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ و ﻤﺎ ﻤﻜﻦ ﻟﻠﻌﻤ ﻞ أن ﻳ ﺘﺞ ﺧﺪﻣﺎت ﺟﺪ ﺪة أو ﻣﻌﺮﻓﺔ وذﻟﻚ إﻋﺘﻤﺎدا ﻋ ﻧﺘﺎﺋﺞ ﺗﺤﻠ ﻞ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ. : و ﺸﻤﻞ أ ﺸﻄﺔ اﻟﻌﻤ ﻞ ﻋ ﺳ ﻞ اﻟﻤﺜﺎل ﻣﺎ ◼ ﻃﻠﺐ ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ ﻣﻦ ﻣﺰود اﻟﺨﺪﻣﺔ. إﺳﺘﺨﺪام ُﻣﺨﺮﺟﺎت ﺧﺪﻣﺔ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ. 13 اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ اﻟﺒ ﺎﻧﺎت اﻟﻀﺨﻤﺔ )اﻟﻮﺣﺪة اﻟﺘﻌﻠ ﻤ ﺔ اﻟﺜﺎﻧ ﺔ( 2 إﻃﺎر اﻟﻌﻤﻞ Hadoop Hadoopھو إطﺎر ﻋﻣل ﻣﻔﺗوح اﻟﻣﺻدر ﻣﻌد ﻷﻏراض ﺗﻧﻔﯾذ ﻋﻣﻠﯾﺎت اﻟﺗﺧزﯾن اﻟﻣوزع وﻣﻌﺎﻟﺟﺔ ﻣﺟﻣوﻋﺎت ◼ اﻟﺑﯾﺎﻧﺎت اﻟﺿﺧﻣﺔ. ﺗم ﺗطوﯾره ﺑواﺳطﺔ Apache Software Foundationوھو ﻣﻛﺗوب ﺑﻠﻐﺔ اﻟﺟﺎﻓﺎ .Java ◼ ﯾﺗﻛون Hadoopﻣن أرﺑﻊ وﺣدات رﺋﯾﺳﯾﺔ: ◼ ّ .1ﻧﻈﺎم اﻟﻤﻠﻔﺎت اﻟﻤﻮزﻋﺔ ﻟـ :Hadoop (HDFS) - ▪ ﻧظﺎم ﻣﻠﻔﺎت ﻣوزع ﯾﻌﻣل ﻋﻠﻰ أﺟﮭزة ﻗﯾﺎﺳﯾﺔ أو ذات إﻣﻛﺎﻧﺎت ﻣﻧﺧﻔﺿﺔ. ▪ ﯾوﻓر HDFSﺳرﻋﺔ ﻧﻘل ﺑﯾﺎﻧﺎت أﻓﺿل ﻣن أﻧظﻣﺔ اﻟﻣﻠﻔﺎت اﻟﺗﻘﻠﯾدﯾﺔ ،ﺑﺎﻹﺿﺎﻓﺔ إﻟ