מדעי הנתונים וביג‪-‬דאטה - מדע חדש בהתהוות PDF

Document Details

SalutaryPlot7646

Uploaded by SalutaryPlot7646

2018

ליאור רוקח ורמי שקד

Tags

big data data science technology artificial intelligence

Summary

מאמר זה עוסק בהתפתחות המהירה של מדעי הנתונים וביג-דאטה. הוא מסביר כיצד מהפכה דיגיטלית יוצרת כמויות עצומות של נתונים, וטכנולוגיות חדשות לעיבוד וניתוח נתונים כאלה. המאמר מציג מגמות שונות ומשמעותיות בתחום, כולל ניתוח נתונים, למידה חישובית, ומדעי הנתונים.

Full Transcript

‫בחזית המדע‬ ‫מדעי הנתונים וביג‪-‬דאטה ‪ -‬מדע חדש בהתהוות‬ ‫‪1‬‬ ‫ליאור רוקח ורמי שקד‬ ‫המהפכה הדיגיטלית שבה אנו חיים מאפשרת לנו לייצר ולאגור כמויות עצומות של נתונים‪.‬בעשור האחרון התפתח‬...

‫בחזית המדע‬ ‫מדעי הנתונים וביג‪-‬דאטה ‪ -‬מדע חדש בהתהוות‬ ‫‪1‬‬ ‫ליאור רוקח ורמי שקד‬ ‫המהפכה הדיגיטלית שבה אנו חיים מאפשרת לנו לייצר ולאגור כמויות עצומות של נתונים‪.‬בעשור האחרון התפתח‬ ‫המושג של ביג‪-‬דאטה (‪ )Big Data‬או נְ תּונֵ י ָע ֵתק בעברית תקנית‪.‬במקור המושג ביג‪-‬דאטה מתייחס בעיקרו למאגרי‬ ‫נתונים עצומים כל כך עד ששיטות מסורתיות לעיבוד נתונים אינן מתאימות עוד‪.‬אולם לאחרונה רבים נוטים להשתמש‬ ‫במושג ביג‪-‬דאטה כשם כולל לשימוש בטכניקות מתקדמות לעיבוד וניתוח נתונים ללא קשר לגודל הנתונים‪.‬‬ ‫להגיע לשמש ובחזרה כ‪ 10-‬פעמים‪.‬הצפי שעד שנת ‪ 2020‬תגיע‬ ‫רקע‬ ‫כמות הנתונים ל‪ 146-‬ג’יגה לאדם ביום‪ ,‬דהיינו גידול של פי ‪50‬‬ ‫לאחרונה עלתה חברת קיימברידג’ אנליטיקה לכותרות כאשר‬ ‫בתוך עשור‪.‬הנתונים אף הפכו לנכסים משמעותיים של חברות‬ ‫התברר כי חברה זו סייעה בתשלום למטה הבחירות של טראמפ‬ ‫בינלאומיות‪.‬הכוח העיקרי של חברות כגון גוגל או פייסבוק גלום‬ ‫לנתח כמות גדולה של נתונים פרטיים שנאספו ברשת החברתית‬ ‫בנתונים שהם אוספים אודותינו ובניתוח חכם של הנתונים באופן‬ ‫של פייסבוק‪.‬במסגרת זו ביצעה החברה הערכת מבנה אישיות‬ ‫שעונה על צרכיהן העסקיים‪.‬חברות שונות מנפיקות כרטיסי‬ ‫ואופי המוני שלא באמצעות שאלון פסיכולוגי אלא באמצעות ניתוח‬ ‫אשראי עם אפשרות להחזר כספי (‪ (cash back‬רק כדי לקבל גישה‬ ‫העקבות הדיגיטליים שמשאירים המשתמשים ברשת החברתית‪.‬‬ ‫להרגלי הצריכה שלנו‪.‬אף על פי כן ההערכה המקובלת היא שרק‬ ‫שיטה זו פותחה על ידי חוקרי אקדמיה (‪)Kosinski et al., 2013‬‬ ‫כחצי אחוז מכלל הנתונים שנאספים מנותחים בסופו של דבר‪.‬‬ ‫ואפשרה למטה של טראמפ לשלוח לכל הבוחרים הפוטנציאליים‬ ‫מידע תעמולתי המותאם לאישיות שלהם‪.‬אירוע זה הוא דוגמה‬ ‫שלוש מגמות אפשרו את הגידול העצום בכמות הנתונים‪.‬‬ ‫מעשית ליכולות שעידן הביג‪-‬דאטה מביא‪.‬‬ ‫תחילה היו אלה מערכות המידע השייכות לארגונים (כגון בנקים‬ ‫וחברות תקשורת) שאפשרו איסוף נתונים מתמשך‪.‬בהמשך‪,‬‬ ‫המהפכה הדיגיטלית שבה אנו חיים מאפשרת לנו לייצר ולאגור‬ ‫עם הופעת האינטרנט והרשתות החברתיות‪ ,‬התעצמה מגמה זו‬ ‫כמויות עצומות של נתונים‪.‬ההערכה המקובלת היא שכמות‬ ‫כאשר המשתמשים החלו לתרום נתונים בעצמם‪.‬כמות הנתונים‬ ‫הנתונים שנוצרה בעולם בשנתיים האחרונות גדולה משמעותית‬ ‫שכלל האנושות מייצרת כתוצאה משימוש באינטרנט וברשתות‬ ‫מכמות הנתונים שנוצרה לפני כן משחר ההיסטוריה ועד שנת‬ ‫החברתית מגיעה למספרים עצומים‪.‬בכל דקה שחולפת נשלחות‬ ‫‪.2015‬בשנת ‪ 2012‬העריכה חברת הייעוץ ‪ (2012) IDC‬שבשנת‬ ‫למעלה מ‪ 16-‬מיליון הודעות ‪ WhatsApp‬ומבוצעים למעלה מ‪3.5-‬‬ ‫‪ 2010‬השאיר אחריו כל אדם עקבות דיגיטליים של כ‪ 3-‬ג’יגה‬ ‫מיליון חיפושים חדשים בגוגל‪.‬בכל דקה כחצי מיליון ציוצים‬ ‫ַּב ִית (באנגלית‪ )byte :‬של נתונים בכל יום‪ ,‬משמע כשלושה‬ ‫חדשים מתפרסמים ברשת ה‪ ,Twitter-‬ואנו מעלים כרבע מיליון‬ ‫מיליארדי מספרים ואותיות בכל יום‪.‬רק לצורך המחשה ‪ -‬אם‬ ‫תמונות חדשות לפייסבוק‪.‬בכל דקה המשתמשים ברחבי העולם‬ ‫נדפיס את הנתונים הללו על גבי נייר ונסדר אותם בערימה‪ ,‬נוכל‬ ‫‪ 1‬פרופ’ ליאור רוקח‪ ,‬ראש המחלקה להנדסת מערכות תוכנה ומידע‪ ,‬אוניברסיטת בן גוריון בנגב‪ ,‬מייסד המעבדה לביג‪-‬דאטה‬ ‫סא”ל (במיל’) רמי שקד‪ ,‬מרצה וחוקר טכנולוגיות למידה‪ ,‬לשעבר מפקד בית הספר למקצועות המחשב של צה"ל‬ ‫‪7‬‬ ‫>קריאתביניים ‪ 4‬גליון ‪ 4 30‬יולי ‪2018‬‬ ‫חדשים למאגר‪.‬‬ ‫מעלים כ‪ 700-‬שעות וידאו חדשות בעוד שיתר המשתמשים צופים‬ ‫‪.‬גגיוון (‪ -)Variety‬מתייחס למגוון הנתונים הנשמרים במאגר‪.‬‬ ‫בכ‪ 5-‬מיליון סרטונים‪.‬‬ ‫כיום ניתן לאסוף באותו המאגר מגוון רחב של נתונים הכולל‪:‬‬ ‫המגמה השלישית שמשפיעה רבות על גידול בכמות הנתונים‬ ‫נתונים מספריים‪ ,‬טקסטואליים‪ ,‬תמונה‪ ,‬שמע‪ ,‬וידאו‪ ,‬חישה וכו’‬ ‫היא האינטרנט של הדברים (‪.)IoT = Internet of Things‬מדובר‬ ‫פרט לשלושת הממדים העיקריים‪ ,‬יש שמוסיפים שבעה ממדי ‪V‬‬ ‫בנתונים שנוצרים אוטומטית על ידי המכונה וללא התערבות‬ ‫נוספים עד להשלמת ‪ 10‬ממדים‪ ,‬בפרט‪( Variability :‬חוסר עקביות‬ ‫ישירה של המשתמשים האנושיים‪.‬כבר היום כל טלפון נייד מייצר‬ ‫של בסיס הנתונים)‪( Veracity ,‬אי‪-‬אמינות)‪( Volatility ,‬אי‪-‬זמינות)‪,‬‬ ‫כמות עצומה של נתונים באמצעות החיישנים שנמצאים בתוכו‪.‬‬ ‫‪( Validity‬נכונות)‪( Vulnerability ,‬פגיעות)‪( Value ,‬ערך)‪Visualization ,‬‬ ‫במחקר שביצענו לאחרונה הסכימו חמישים נבדקים להתקין‬ ‫(ויזואליזציה)‪.‬‬ ‫תוכנה על גבי הטלפון הנייד שלהם כדי שזו תדגום חלק קטן‬ ‫מהנתונים שמיוצרים על ידי החיישנים‪.‬לאחר כשנה של דגימה‬ ‫השלבים העיקרים בפיתוח מערכות מבוססי נתוני עתק הם אלה‬ ‫התקבל בסיס נתונים הכולל ‪ 10‬מיליארדי רשומות (‪Mirsky et al.‬‬ ‫(‪:)Maimon & Rokach, 2010‬‬ ‫‪.)2017‬הרכבים האוטונומיים הצפויים לכבוש את כבישי ארצנו‬ ‫‪.‬אאיסוף הנתונים הגולמיים – בשלב זה הנתונים הגולמיים‬ ‫בעשור הבא כוללים מספר גדול עוד יותר של חיישנים העוקבים‬ ‫נאספים ומאוחסנים בתוך בסיסי הנתונים‪.‬לרוב שלב זה‬ ‫בצורה רציפה אחר הסביבה‪.‬נתונים אלו נאספים על ידי חיישני‬ ‫נעשה ממילא כחלק מהתפעול השוטף של מערכת המידע‬ ‫רכב המשותפים למספר כלי רכב‪ ,‬וזאת כדי למנוע היווצרות של‬ ‫ולפני שמחליטים על השימושים העתידיים שייעשו בנתונים‪.‬‬ ‫גודש תנועה או כדי להתריע בפני סכנות בכביש‪.‬‬ ‫במרבית הארגונים נוקטים בגישה של “אסוף כפי יכולתך”‬ ‫ההתפתחות האדירה הזו המלווה אותנו בשנים האחרונות בכל‬ ‫ושומרים את כל הנתונים‪.‬‬ ‫תחומי החברה‪ ,‬תעשייה‪ ,‬כלכלה‪ ,‬שירות‪ ,‬בידור‪ ,‬חינוך ורפואה‬ ‫‪.‬בהגדרת מטרות המערכת – בשלב זה מחליטים מה המטרה‬ ‫יוצרת לארגונים ממשלתיים‪ ,‬ציבוריים ופרטיים אתגרים לא‬ ‫העיקרית של מערכת הביג‪-‬דאטה ואילו מטרות מצפים‬ ‫פשוטים‪ ,‬כאשר הם באים לנתח‪ ,‬להבין ולעשות שימוש בנתונים‬ ‫להשיג‪.‬‬ ‫הנאגרים במערכות אלה כדי לשפר את יעילותם ורווחיותם‪.‬‬ ‫‪.‬געיבוד מקדים – בשלב זה מכינים את הנתונים לצורך ניתוחם‪.‬‬ ‫מורכבות הנתונים וכמויות הנתונים הנאספים מדי יום בארגונים‬ ‫העיבוד המקדים כולל מספר רב של שלבי משנה כגון‪:‬‬ ‫אלו גורמים לקושי‪ ,‬ומאידך תורמים באיכותם להצלחתו של‬ ‫‪1.1‬טיוב הנתונים – בשלב זה בודקים את איכות הנתונים‬ ‫הארגון‪.‬‬ ‫ומבצעים תיקון לנתונים משובשים כגון‪ :‬ערכים מחוץ‬ ‫לטווח האפשרי (למשל‪ ,‬גיל שלילי של לקוח) או צירופים‬ ‫ביג‪-‬דאטה‬ ‫לא הגיוניים (לקוח בן ‪ 12‬שיש לו שלושה ילדים)‪.‬‬ ‫על רקע זה התפתח בעשור האחרון המושג של ביג‪-‬דאטה (‪Big‬‬ ‫‪2.2‬זיהוי והגדרה של מאפיינים בעלי משמעות שניתן לחלצם‬ ‫‪ )Data‬או נְ תּונֵ י ָע ֵתק בעברית תקנית‪.‬במקור המושג ביג דאטה‬ ‫מתוך הנתונים הגולמיים ואשר עשויים לסייע בניתוח‬ ‫מתייחס בעיקרו למאגרי נתונים עצומים כל כך עד ששיטות‬ ‫מושכל של הנתונים‪.‬בשלב זה מקובל להיעזר בידע של‬ ‫מסורתיות לעיבוד נתונים אינן מתאימות עוד‪.‬אולם לאחרונה רבים‬ ‫מומחי התוכן במערכת‪.‬‬ ‫נוטים להשתמש במושג ביג‪-‬דאטה כשם כולל לשימוש בטכניקות‬ ‫‪3.3‬חילוץ מאפיינים – בשלב זה מיישמים את המאפיינים‬ ‫מתקדמות לעיבוד וניתוח נתונים ללא קשר לגודל הנתונים‪.‬אפשר‬ ‫שהוגדרו בשלב הקודם וממירים את הנתונים הגולמיים‬ ‫לאפיין כל פתרון בסביבת ‪ Big Data‬על בסיס מספר ממדים שונים‪.‬‬ ‫למבנה החדש‪.‬‬ ‫מדעני הנתונים נוהגים לאפיין זאת כך‪:‬‬ ‫‪4.4‬בחירת הנתונים שישמשו לניתוח ‪ -‬בשלב זה אנו‬ ‫‪.‬אנפח (‪ – )Volume‬מתייחס לכמות הנתונים שנאגרת בבסיס‬ ‫בוחרים את הרשומות שתשתתפנה בבניית המדגם ואת‬ ‫הנתונים‪.‬‬ ‫המאפיינים שישמשו לייצוגם‪ ,‬וזאת כדי להקל על השלב‬ ‫‪.‬במהירות (‪ -)Velocity‬מתייחס לקצב שבו מתווספים נתונים‬ ‫>קריאתביניים גליון ‪ 31‬יולי ‪2018‬‬ ‫‪8‬‬ ‫לבעליו‪.‬ככל שכמויות הנתונים הנאספים וכוח המחשוב גדלים‬ ‫הבא ולהבטיח את טיב המודל שיתקבל‪.‬‬ ‫(שני דברים הקורים כבר שנים ברציפות ובקצב מואץ)‪ ,‬כך יכולת‬ ‫‪.‬הניתוח הנתונים – בשלב זה נעזרים בשיטות ואלגוריתמים‬ ‫המערכות לפתור בעיות ולענות על הצרכים משתפרת בצורה‬ ‫לאפיון הנתונים באופן שיאפשר חיזוי או הערכה של נתונים‬ ‫משמעותית‪.‬בענפים מסוימים ניתן להכריז על מהפכות למחצה‬ ‫חדשים בשלבים הבאים‪.‬לרוב התוצר של שלב זה הוא מודל‬ ‫בפיתוח מערכות ובהפקת ידע ותובנות חדשות עקב הכנסת‬ ‫או מודלים המשרתים את המטרות שהוגדרו‪.‬‬ ‫כלים הלומדים בעזרת שימוש בנתונים‪.‬למשל‪ ,‬שיפור המעשה‬ ‫‪.‬ובחינת טיב המודל – בשלב זה מוודאים כי המודל שהתקבל‬ ‫החינוכי‪ ,‬יכולת החיפוש במאגרי נתונים עצומים‪ ,‬יכולת ניהוג כלי‬ ‫אכן תקף‪.‬אחת השיטות המקובלות היא לבחון את תקפות‬ ‫רכב אוטונומיים‪ ,‬ביולוגיה חישובית‪ ,‬עיבוד שפה טבעית‪ ,‬רובוטיקה‪,‬‬ ‫המודל על גבי נתונים שלא שימשו בשלבים הקודמים‬ ‫ראיית ושמיעת מכונה‪ ,‬תחבורה וערים חכמות‪ ,‬רפואה אישית‪,‬‬ ‫וזאת כדי להימנע מתופעות לא רצויות כגון התאמת יתר‬ ‫סייבר ועוד‪.‬‬ ‫(‪.)Overfitting‬התאמת יתר מתרחשת כאשר המודל מורכב‬ ‫יתר על המידה‪.‬תופעה זו גורמת למודל ללמוד רעשים‬ ‫ניתוח הנתונים הנאספים על אדם מסוים עשוי לעיתים לגלות‬ ‫סטטיסטיים בנתונים כאילו הם מייצגים תופעות אמיתיות ובכך‬ ‫דברים אודותיו לפני שהוא בעצמו מודע להם‪.‬הדוגמה הידועה‬ ‫לאבד את היכולת להכליל‪.‬‬ ‫ביותר בתחום היא המקרה שהתרחש בארצות הברית‪.‬רשת‬ ‫‪.‬זיישום המודל – בשלב זה משתמשים במודל באופן שוטף‬ ‫הקמעונות ‪ Target‬החליטה לנתח את נתוני הרכישות של‬ ‫ורציף‪.‬‬ ‫לקוחותיה (‪.)Duhiggfeb, 2012‬הם הציבו מטרה לאתר משפחות‬ ‫צעירות עוד בשלבים הראשונים של ההיריון כדי להציע להן‬ ‫התהליך בכללותו הנו תהליך איטרטיבי ובהתאם להיזון החוזר‬ ‫מוצרים מתאימים‪.‬לשם כך הם ניתחו את הרגלי הצריכה של‬ ‫המתקבל מיישום המודל‪ ,‬אפשר לחזור לכל אחד מהשלבים‬ ‫הנשים ברשת‪ ,‬זמן רב לפני שהן החלו לרכוש מוצרי תינוקות‪.‬‬ ‫הקודמים ולשפר את המודל‪.‬‬ ‫ניתוח זה גילה כי הרגלי הצריכה משתנים לעיתים עוד לפני‬ ‫שהנשים עצמן גילו שהן בהיריון‪.‬על בסיס יכולת החיזוי הזו החלה‬ ‫מדעי הנתונים‬ ‫חברת ‪ Target‬לשלוח קופונים מתאימים לנשים שהמודל מעריך‬ ‫השלב העיקרי ובעל היכולת הטובה ביותר להשיג ערך מוסף‬ ‫שהן כרגע בהיריון‪.‬הדבר אף גרם לתקרית לא נעימה שבה לקוח‬ ‫הוא שלב ניתוח הנתונים‪.‬פיתוח טכניקות ניתוח נתונים רבות‬ ‫כועס נכנס לאחד מסניפי הרשת ודרש לדבר עם מנהל‪“ :‬הבת‬ ‫ושונות במהלך השנים הוביל לתחום חדש המכונה כיום מדע‬ ‫שלי קיבלה את זה בדואר!”‪ ,‬אמר‪“.‬היא עדיין בתיכון‪ ,‬ואתם‬ ‫נתונים (‪.)Data Science‬תחום זה עוסק בניתוח נתונים לשם הפקת‬ ‫שולחים לה קופונים לבגדי תינוקות ועריסות? האם אתם מנסים‬ ‫מידע וידע‪ ,‬קבלת החלטות ומיכון של מערכות מתוך מקורות‬ ‫לעודד אותה להיכנס להריון?”‪.‬מנהל הסניף התנצל והבטיח‬ ‫פנימיים וחיצוניים לארגון במטרה לתמוך ולשפר את ההחלטות‬ ‫להסיר את הבת מרשימת התפוצה לקופונים‪.‬מספר ימים לאחר‬ ‫הארגון‪.‬העובד שאחראי על ניתוח הנתונים בארגון‪ ,‬מכונה מדען‬ ‫מכן התקשר האב שוב לסניף ובקול נבוך אמר כי “מסתבר שהיו‬ ‫הנתונים (‪ ,)Data Scientist‬והוא בדרך כלל משלב יכולות מקצועיות‬ ‫כמה פעילויות בבית שלי שלא הייתי מודע להן לגמרי‪.‬בתי אמורה‬ ‫משלושה תחומים עיקריים‪ :‬פיתוח תוכנה‪ ,‬מתמטיקה והבנה‬ ‫ללדת באוגוסט‪.‬אני חייב לך התנצלות‪”.‬‬ ‫עסקית‪.‬‬ ‫מדע הנתונים הפך עם השנים לגורם מכריע בסביבה התחרותית‬ ‫מדעי הנתונים (‪ )Data Science‬עושים שימוש בשיטות שמגיעות‬ ‫ומשמש את כל הרבדים בארגון‪ ,‬החל בהחלטות תפעוליות וכלה‬ ‫מדיסציפלינות אקדמיות שונות ובעיקר מדיסציפלינות אלה‪:‬‬ ‫בשיפור התכנון האסטרטגי‪.‬בארגונים מודרניים מבינים היום‬ ‫‪.‬אמתמטיקה בכלל‪ ,‬סטטיסטיקה וחקר ביצועים בפרט‪.‬‬ ‫שהנתונים הרבים הנאגרים במערכות המידע של הארגון (למשל‪,‬‬ ‫‪.‬במדעי המחשב בכלל ובינה מלאכותית ולמידה חישובית בפרט‪.‬‬ ‫מידע על לקוחות‪ ,‬על תהליכים ועל עסקאות) הם אחד מנכסיו‬ ‫העיקריים של הארגון‪ ,‬ושניתוח מושכל שלהם מייצר יתרון גדול‬ ‫‪9‬‬ ‫>קריאתביניים גליון ‪ 31‬יולי ‪2018‬‬ ‫יישומי הראייה הממוחשבת‪.‬בשנים האחרונות חלו התפתחויות‬ ‫הקשר בין ביג דאטה לבינה מלאכותית‬ ‫משמעותיות ביכולת המחשב להבין שפת דיבור כמו גם היכולת‬ ‫במילים פשוטות‪ ,‬בינה מלאכותית (‪ )Artificial Intelligence‬היא‬ ‫לנתח טקסטים כתובים‪.‬‬ ‫דיסציפלינה שנועדה לחקות ולדמות מגוון יכולות אנושיות‬ ‫באמצעות מחשב ובכך להפכו למחשב “חכם”‪.‬למידה חישובית‬ ‫‪x1‬‬ ‫(‪ )Machine Learning‬היא תת‪-‬תחום בבינה מלאכותית שנועדה‬ ‫‪y1‬‬ ‫לאפשר למערכות ויישומי מחשב ללמוד ולהשתפר בהשגת‬ ‫‪x2‬‬ ‫‪y2‬‬ ‫מטרותיהן מתוך נתונים שנאספו ואשר מייצגים את התנסויות‬ ‫‪x3‬‬ ‫העבר‪.‬למידה חישובית אחראית במידה רבה לפריצות הדרך‬ ‫‪y3‬‬ ‫‪x4‬‬ ‫שאנו חווים בשנים האחרונות בתחום הטכנולוגי‪.‬‬ ‫אולי השימוש הפופולרי הראשון בלמידה חישובית הוא מנוע‬ ‫איור ‪ :1‬המחשה של רשת עצבית‬ ‫החיפוש של גוגל‪.‬היכולת שלנו להזין שאילתת חיפוש או סתם‬ ‫שאלה ולקבל תשובות רלוונטיות‪ ,‬נובעת מהעובדה שמנוע‬ ‫למידה עמוקה מבוססת בעיקרה על מודל של רשת עצבית‬ ‫החיפוש של גוגל למד מה התשובה הרלוונטית מתוך טריליוני‬ ‫מלאכותית (איור ‪ )ANN-Artificial Neural Network( )1‬שקיבלה את‬ ‫חיפושים שבוצעו על ידי משתמשים אחרים‪.‬כך גוגל מסוגלת אף‬ ‫ההשראה שלה מהתהליכים המתקיימים במוחם של בעלי החיים‬ ‫להשלים את מילות החיפוש עוד לפני שהספקנו להקליד אותן‪.‬‬ ‫מתקדמים (‪.(Bengio et al., 2015‬למותר לציין כי המודל הראשון‬ ‫כל חיפוש שאנו מבצעים בגוגל מאפשר למערכת שלהם להמשיך‬ ‫של רשת עצבית מלאכותית פורסם עוד בשנות ה‪ 40-‬של המאה‬ ‫ללמוד ולהשתפר‪.‬מאחורי השירות הפשוט לכאורה עומדות חוות‬ ‫הקודמת‪ ,‬אך השימוש במודל הפך למעשי רק בשנות האלפיים‬ ‫שרתים הכוללות מיליוני מחשבים עם כוח עיבוד חזק במיוחד‪.‬‬ ‫בגלל מספר התפתחויות שחברו להן יחדיו‪:‬‬ ‫בשנים האחרונות חלו התפתחויות משמעותיות בתחום הלמידה‬ ‫‪.‬אהתפתחויות בחומרת המחשב – השיפור בביצועים של‬ ‫החישובית עם הפיכת השיטה של למידה עמוקה (‪)Deep learning‬‬ ‫המעבדים ובפרט של המעבדים הגרפיים (שבמקור שימשו‬ ‫למעשית‪.‬למידה עמוקה אפשרה להשיג פריצות דרך המאפשרות‬ ‫בעיקר בתחום משחקי המחשב) כמו גם הגידול בנפח‬ ‫למחשב לחקות יכולות אנושיות‪.‬למשל‪ ,‬לפי האתגר ‪,ImageNet‬‬ ‫זיכרונות המחשב מאפשרים לאמן רשת עצבית גדולה בזמן‬ ‫החל משנת ‪ 2015‬יכולת המחשב לזהות עצמים בתמונה עולה‬ ‫סביר‪.‬‬ ‫על זו של אדם ממוצע (‪.)He et al., 2015‬אחת היכולות השכליות‬ ‫‪.‬בהתפתחויות באלגוריתמים לאימון רשת עצבית אשר‬ ‫הראשונות והחשובות ביותר שרוכשים תינוקות בשנתם הראשונה‬ ‫מאפשרות לאמן רשתות עמוקות של קשרים בצורה נכונה‬ ‫היא זיהוי פנים של אנשים שונים‪.‬אך גם בזה המחשב עולה לאין‬ ‫יותר‪.‬‬ ‫שיעור על בני אדם‪.‬שערו בנפשכם את יכולתכם להבחין בין שני‬ ‫‪.‬גאך התרומה המשמעותית ביותר של הבינה המלאכותית היא‬ ‫אנשים ממוצא סיני או שני אחים תאומים‪.‬המחשב עולה על האדם‬ ‫ללא ספק ה‪ – Big Data-‬דהיינו‪ ,‬זמינות של כמות גדולה של‬ ‫בפעולה זו‪ ,‬בין היתר כיוון שהוא הוזן בכמות עצומה של דוגמאות‪,‬‬ ‫נתונים לאימון‪.‬התפתחות ה‪ Big Data-‬היא הכרחית מכיוון‬ ‫כמות רבה מזו שאנו בני התמותה נחשפים אליה במהלך חיינו‪.‬‬ ‫שבחלק מאתגרי הבינה המלאכותית נדרשת כמות עצומה‬ ‫בתחום הראייה הממוחשבת המחשב מצליח גם במשימות‬ ‫של נתונים כדי לאמן את המכונה‪.‬זאת בניגוד לבני אדם שדי‬ ‫מורכבות יותר כגון פענוח אוטומטי של תצלומי ממוגרפיה‬ ‫להם במספר מצומצם של דוגמאות כדי ללמוד מושג חדש‬ ‫באיכות דומה‪ ,‬ולעיתים באיכות שאף עולה על זו של רופא רדיולוג‬ ‫(‪.)Lehrach et al., 2017‬למשל‪ ,‬כדי ללמד פעוטות להבחין‬ ‫מומחה‪.‬גם במקרה זה התקבלה היכולת העל‪-‬אנושית מתוך‬ ‫בין כיסא לשולחן‪ ,‬די בדוגמאות ספורות‪.‬אולם את המכונה‬ ‫למידה חישובית של מאגרים הכוללים מיליוני תצלומי ממוגרפיה‬ ‫יש להזין בכמות גדולה של דוגמאות כדי שתוכל להבחין‬ ‫מתויגים עם אבחנות קודמות‪.‬ההצלחות אינן רק נחלתם של‬ ‫>קריאתביניים גליון ‪ 31‬יולי ‪2018‬‬ ‫‪10‬‬ ‫מורכב‪ ,‬כיוון שהתלמידים השונים נבדלים זה מזה במגוון רב של‬ ‫בין כיסא בעל ארבע רגליים לבין שולחן בעל ארבע רגליים‬ ‫פרמטרים‪ :‬מגדר‪ ,‬תרבות‪ ,‬הרגלים‪ ,‬השפעת החברה והבית‪ ,‬גיל‪,‬‬ ‫או כדי שתוכל להבין שגם שולחן מרובע וגם שולחן עגול‬ ‫מצב סוציו‪-‬אקונומי‪ ,‬תכונות אישיות ועוד‪.‬‬ ‫הם שולחנות‪.‬בעידן ה‪ Big Data-‬איסוף הכמות הדרושה של‬ ‫דוגמאות ואחסונן בבסיס נתונים הפך למשימה ישימה‪ ,‬וכך‬ ‫כחלק מהצורך לתת מענה לשינוי זה התפתח תחום חדש יחסית‬ ‫ניתן להעמיד בפני המכונה כמות גדולה של נתונים שלא‬ ‫המכונה כריית מידע בחינוך או ‪.EDM- Educational Data Mining‬‬ ‫הייתה ברשותנו בעבר‪.‬‬ ‫תחום זה מוגדר ע”י חוקרי חינוך רבים כאחד התחומים פורצי‬ ‫הדרך בתחום החינוך המתקדם (אבני ואברום‪.)2015 ,‬בבסיס‬ ‫קיימים מודלים שונים של רשתות עצביות‪.‬המשותף לכולם‬ ‫הרעיון עומדת ההנחה שניתן ללמוד מתוך כריית נתונים איכותית‬ ‫הוא קיומם של צומתי עיבוד המייצגים את הנוירונים הביולוגיים‬ ‫ומתמשכת ברשת החינוכית ובמערכות הלמידה הדיגיטאליות‬ ‫שקשורים זה לזה‪.‬רשת עצבית מלאכותית מאופיינת על ידי‬ ‫( ‪ )LMS‬על התנהגות הלומדים וסגנונות הלמידה השונים‪ ,‬על‬ ‫מספר הנוירונים‪ ,‬מבנה הרשת‪ ,‬מספר השכבות‪ ,‬אופן החיבור‬ ‫אינטראקציות בין הלומדים ועל האינטראקציה בין הלומדים לבין‬ ‫בין הנוירונים ברשת וכדומה‪.‬תהליך הלמידה נועד לקבוע את‬ ‫המערכת‪.‬כל זאת מתוך הביג‪-‬דאטה הנאגר במערכות הללו‪.‬‬ ‫עוצמת (משקל) הקישור של כל קשר ברשת העצבית‪.‬הלמידה‬ ‫ּמנָה” (משלי‬ ‫ל‪-‬פּי ַד ְרּכֹו גַם כִ ּי‪-‬יַזְ ִקּין לאֹ ‪-‬יָסּור ִמ ֶ ּ‬ ‫“חֲ נְֹך לַ נַעַ ר עַ ִ‬ ‫מתבצעת על‪-‬ידי “תגמול” “וענישה” של קשרים שונים ועל ידי‬ ‫כ”ב פסוק ו’)‪.‬‬ ‫חשיפת רשת הנוירונים לדוגמאות רבות‪“.‬תגמול” ו”ענישה” של‬ ‫הקשרים מתבצע על ידי שינוי המשקל של אותו הקשר‪ ,‬כך שכל‬ ‫למידה הסתגלותית (אדפטיבית) ולמידה מותאמת אישית‬ ‫קשר ש”מתוגמל” – יגדל משקלו‪ ,‬וכל קשר ש”נענש” – ירד משקלו‪.‬‬ ‫(פרסונאלית)‬ ‫לרוב רשתות עצביות מורכבות ועמוקות יותר יכולות ללמוד‬ ‫בכיתה אופיינית ניתן למצוא תלמידים בעלי צרכים וסגנונות‬ ‫משימות מורכבות יותר‪.‬‬ ‫לימוד שונים‪ ,‬והאחריות הכמעט בלתי אפשרית להתאמת‬ ‫החומר הלימודי לכולם מונחת על כתפיהם של המורים‪.‬למידה‬ ‫ביג‪-‬דאטה בחינוך‬ ‫הסתגלותית (הידועה גם בווריאציה מעט שונה כלמידה פרסונלית‬ ‫פורמט בית הספר אשר עוצב בימי המהפכה התעשייתית לפני‬ ‫או מותאמת) מבוססת על התאמה אישית של התוכן‪ ,‬תפיסת‬ ‫כ‪ 150-‬שנה מתבסס על עקרונות ההומניזם‪ ,‬השוויון והטכנולוגיה‬ ‫ההוראה‪ ,‬אמצעי הלימוד ושיטות הלימוד לכל הלומדים‪ ,‬והיא‬ ‫הדלה דאז‪.‬עיקרון השוויון והצורך בכוח עבודה משכיל ומיומן‬ ‫מבצעת התאמה זו לאורך כל שלבי הלימוד על בסיס מידע‬ ‫הוביל לפתרון המהיר והקל שלפיו כולם לומדים את אותו הדבר‪,‬‬ ‫שנאסף לאורך התהליך‪.‬תחום זה מיושם ע”י שיטות של כריית‬ ‫כך שהמורים מכוונים את הוראתם לתלמידים הממוצעים באותה‬ ‫מידע‪ ,‬למידת מכונה וסטטיסטיקה‪.‬מטרת התחום היא לשפר את‬ ‫דרך ובאותו זמן )זלקוביץ וגולדשטיין‪.)2011 ,‬עיקרון השוויון נשמר‬ ‫השיטות לחקר הנתונים הללו על מנת לגלות תובנות חדשות על‬ ‫ברובו גם היום‪ ,‬אך כיום הטכנולוגיה המתקדמת מאפשרת לנו‬ ‫האופן שבו תלמידים לומדים‪ ,‬וכך להתאים את תהליך הלמידה‬ ‫להתייחס גם לייחודיות של כל התלמידים וכל המורים‪ ,‬אם נחפוץ‬ ‫באופן מתמשך (בן‪-‬צדוק ‪ ;2011‬שמש‪.)2017 ,‬‬ ‫בכך‪.‬‬ ‫המחויבות של מערכת החינוך להכין את הבוגרים למציאות‬ ‫השיטה שבה המורים בבתי הספר נוהגים לשפר את הלמידה‪,‬‬ ‫המשתנה נושאת עמה הבטחה לחולל שינויים מהותיים‪.‬גישות‬ ‫מתבססת בעיקרה על ציונים‪ ,‬מדדים ומחוונים שלאורם הם‬ ‫חינוכיות חדשות‪ ,‬אשר שוללות את גישת ההוראה הזהה לכל‬ ‫תופסים את המתרחש בכיתה‪.‬גישה זו היא גישה “תגובתית”‪,‬‬ ‫התלמידים‪ ,‬חרטו על דגלן את הרעיון שלפיו במרכז הלמידה יש‬ ‫מאוחרת מדיי ותוצאתית למצב הנתון‪.‬לעומת זאת ‪ EDM‬דוגל‬ ‫להציב את ייחודיות הלומדים‪ ,‬ובשל כך בית הספר חייב להתאים‬ ‫במעבר מפסיביות לאקטיביות במעשה החינוכי‪.‬היכולת לאפשר‬ ‫עצמו לצרכים‪ ,‬ליכולות ולרקע הקודם של כל תלמיד ותלמיד‬ ‫לנו להיות פרואקטיביים יותר‪ ,‬לצפות בעוד מועד את מה שעומד‬ ‫(‪.)Gardner, 1983‬מימוש השינוי הנדרש והתאמתו לתלמידים הוא‬ ‫‪11‬‬ ‫>קריאתביניים גליון ‪ 31‬יולי ‪2018‬‬ ‫‪ְ 5.5‬ס ֶק ְיילָ ִּבילִ ּיֹות (‪ scalability‬או סילּומיּות) ושכפול הפתרונות‬ ‫לקרות ולהתאים את המעשה החינוכי למציאות המתהווה‪.‬‬ ‫המותאמים למערכות חינוך נוספות‪.‬‬ ‫מערכות ה‪ EDM-‬מאפשרות לממש בקלות יחסית את העקרונות‬ ‫‪6.6‬אג’יליות ( ‪ Agility‬או גמישות) – תוכנית הלמידה גמישה‬ ‫המרכזיים העומדים בבסיס הלמידה האדפטיבית והפרסונאלית‪,‬‬ ‫ומשתנה ומסוגלת להתאים את עצמה באופן תדיר‬ ‫והמפורטים כאן‪:‬‬ ‫להתפתחות ולשינוי שהתלמידים עוברים‪.‬‬ ‫‪1.1‬שקיפות הנתונים לכלל המעורבים במעשה החינוכי‬ ‫ניתן לעשות שימוש בתהליכי ‪ EDM‬גם למטרות חינוכיות נוספות‪.‬‬ ‫(תלמידים‪ ,‬מורים‪ ,‬הורים‪ ,‬מנהלים)‪.‬‬ ‫להלן מספר דוגמאות‪:‬‬ ‫‪2.2‬אבחון מדויק ושוטף של מיקומם של התלמידים במסלול‬ ‫(הלָ ”ה) מדויקים יותר בדגש‬ ‫> >תהליכי הוראה‪-‬למידה‪-‬הערכה ִ‬ ‫הלמידה וזיהוי תבניתי של אפיוני הלמידה המתאימים‬ ‫על מתן משוב למורות ולמורים בזמן אמת‪.‬המשוב מבוסס‬ ‫להם ביותר‪.‬האבחון יכול להתייחס לקצב הלימוד‪ ,‬העניין‬ ‫על איסוף נתונים ועיבודם בצורה מהירה (לדוגמה‪ ,‬זיהוי‬ ‫שהלומדים מגלים‪ ,‬חולשות‪ ,‬קשב‪ ,‬השפעת מאפייני הקבוצה‬ ‫התנהגויות חריגות של תלמידים)‪.‬בצורה זו ההתמקדות היא‬ ‫וגודלה וכו’‪’.‬‬ ‫בתהליך הלמידה ולא רק בהישג הסופי‪.‬התמקדות זו נוהגת‬ ‫‪3.3‬התאמת תוכנית למידה אישית לתלמידים על בסיס האבחון‬ ‫ביתר “צדק” כלפי הלומדים ומבטאת התייחסות מקיפה יותר‬ ‫כדי שהמערכת תאפשר למורים להתאים את תוכנית הלמידה‬ ‫למאמציהם המתמשכים וליחסם למקצוע‪.‬‬ ‫באופן אישי לכל התלמידים באופן שוטף ומתמשך‪.‬‬ ‫> >חיזוי נשירת סטודנטים באמצעות ניתוח הנתונים הרבים‬ ‫‪4.4‬משוב “איכותי” מבוסס‪-‬נתונים תדיר ומיָדי לתלמידים ולמורים‬ ‫שמגיעים ממערכות ניהול למידה (‪.)LMS‬המערכות הללו‬ ‫המעיד על התקדמותם של התלמידים בתוכנית הלמידה‬ ‫אוספות מידע על התנהגות הסטודנטים במערכת‪ ,‬לדוגמה‪:‬‬ ‫האישית שעוצבה עבורם‪ ,‬וכך ניתן בכל פעם מחדש להתאים‬ ‫להם את מסלול הלמידה‪.‬‬ ‫למידה ליניארית מבוססת הוראה‬ ‫השתתפות‬ ‫השתתפות‬ ‫בשיעור‬ ‫השתתפות‬ ‫בשיעור‬ ‫פרונטלי‬ ‫טכניקת‬ ‫שבר‬ ‫בשיעור‬ ‫פרונטלי‬ ‫השתתפות‬ ‫מעבר משבר‬ ‫עשרוני‬ ‫בשיעור‬ ‫פרונטלי‬ ‫שיטת‬ ‫פשוט לשבר‬ ‫השיטה פרונטלי‬ ‫הספירה‬ ‫עשרוני‬ ‫שברים‬ ‫העשרונית‬ ‫פשוטים‬ ‫השיטה‬ ‫שיטת‬ ‫העשרונית‬ ‫הספירה‬ ‫סותית בקבוצה‬ ‫התנ‬ ‫ידה‬ ‫השתתפות בשיעור‬ ‫שבר‬ ‫שברים‬ ‫למ‬ ‫פרונטלי‬ ‫עשרוני‬ ‫פשוטים‬ ‫לימוד‬ ‫חוברת‬ ‫קריאת‬ ‫טכניקת‬ ‫ר טון‬ ‫מעבר משבר‬ ‫ה בס‬ ‫פשוט לשבר‬ ‫צ פי‬ ‫עשרוני‬ ‫למידה הסתגלותית ללמידת שבר עשרוני‬ ‫איור ‪ :2‬דוגמה קונספטואלית למעבר מלמידה "ליניארית" מבוססת הוראה לרשת למידה אדפטיבית‬ ‫>קריאתביניים גליון ‪ 31‬יולי ‪2018‬‬ ‫‪12‬‬ ‫את הטיסה הבאה‪ ,‬סביר להניח שמאחורי הקלעים קיים מנגנון‬ ‫היקף ההשתתפות בפורומים‪ ,‬הזמן שלוקח לסטודנטים‬ ‫מבוסס‪-‬למידה חישובית המעריך את המחיר שאנו נהיה מוכנים‬ ‫להגיש עבודה וכו’‪.‬שימוש זה נפוץ מאוד בסביבות ‪MOOC’s-‬‬ ‫לשלם עבור המוצר או השירות‪ ,‬ובהתאם לכך קובע את מחירו‪.‬‬ ‫‪ massive open online course‬שבהן אחוז הנשירה גבוה‬ ‫במיוחד‪.‬‬ ‫לאור כל זאת החלו ממשלות ברחבי העולם לפתח רגולציה‬ ‫> >ניבוי הצלחה בקורס ‪ -‬מערכות חיווי אזהרה מוקדמת (‪EWIS‬‬ ‫שתגביל את איסוף הנתונים הקשורים בבני אדם ולהשתמש‬ ‫‪ )- early warning indicator system‬מאפשרות לנבא מגמות‬ ‫בהם‪.‬למשל‪ ,‬חוק הגנת הפרטיות בישראל מסדיר את פעילותם‬ ‫כמו מוכנות לאקדמיה של סטודנטים פוטנציאליים‪ ,‬הגדלת‬ ‫של מאגרי מידע הכוללים מידע פרטי ורגיש‪.‬במסגרת חוק זה כל‬ ‫פוטנציאל גיוס תלמידים למגמה מסוימת‪ ,‬לספק התראה‬ ‫בעל מאגר מידע מסוג זה חייב להירשם אצל רשם מאגרי המידע‪,‬‬ ‫מוקדמת אודות סיכונים ובעיות הנגזרים מפוטנציאל הנשירה‪,‬‬ ‫למנות מנהל שיהיה אחראי עליו‪ ,‬לפרט את המטרות שלשמן‬ ‫והחשוב מכך – מערכות אלו מספקות המלצות למניעת‬ ‫הוקם המאגר ולפעול אך ורק לפיהן‪.‬בנוסף כל אדם זכאי לעיין‬ ‫הנשירה של סטודנטים ותלמידים בסיכון‪.‬‬ ‫במידע המתייחס אליו המוחזק במאגר מידע (למעט מאגרי מידע‬ ‫של מערכת הביטחון)‪ ,‬ובעל המאגר חייב לאפשר לו לעיין במידע‬ ‫עפ”י דו״ח ‪ Horizon‬מ‪ 2017-‬נראה שב ‪ 5-3‬השנים הקרובות ייעשה‬ ‫זה‪.‬האיחוד האירופי הוא ללא ספק מוביל הרגולציה המתקדמת‬ ‫שימוש הולך וגובר בניתוח הנתונים ובשימוש בתובנות המערכת‬ ‫בתחום‪.‬בזמן כתיבת שורות אלה כללי ה‪General Data( GDPR-‬‬ ‫אשר ישפיעו כמעט מידית על הדרך שבה המורים מארגנים את‬ ‫‪ )Protection Regulation‬שנחקקו בשנת ‪ ,2016‬הופכים לבני אכיפה‬ ‫הרצף‪ ,‬המהלך והמרחבים של הלמידה כמו גם את אופן השימוש‬ ‫וכוללים מספר זכויות ובכללן‪ :‬הזכות להישכח‪ ,‬שלפיה לכל אדם‬ ‫בטכנולוגיה זו באופן רציף‪ EDM.‬הנו המונח אשר מעצב ויעצב‬ ‫עומדת הזכות למחיקת כל הנתונים שנאספו אודותיו או הזכות‬ ‫מחדש את תהליכי ההוראה ואת התהליכים הפדגוגיים‪ ,‬וניתן‬ ‫להתנגד לעיבוד אוטומטי של נתוניו‪ ,‬דהיינו‪ ,‬פלוני רשאי לסרב‬ ‫לשער שרעיונות אלו ימומשו יותר ויותר במערכות החינוך‪.‬‬ ‫שתתקבלנה החלטות בעניינו כתוצאה מניתוח אוטומטי של‬ ‫הנתונים שנאספו לגביו‪.‬‬ ‫לא הכול ורוד‬ ‫עידן ה‪ Big Data-‬טומן בחובו גם סכנות‪.‬הקלות הבלתי נסבלת‬ ‫ביג דאטה ובינה מלאכותית גם מעצבים מחדש את שוק העבודה‪.‬‬ ‫שבה נאספים נתונים אודותינו‪ ,‬עלולה לפגוע משמעותית‬ ‫מקצועות הצווארון הכחול (כגון נהגי משאית ופועלי ייצור) צפויים‬ ‫בפרטיות שלנו‪.‬נתון בודד כשלעצמו עשוי להיות בלתי מזיק‪.‬‬ ‫להיעלם מהעולם‪.‬אך גם מקצועות הצווארון הלבן עשויים להיות‬ ‫אך השילוב של נתונים שנאספים לאורך זמן עשויים לגלות‬ ‫מושפעים מהתפתחויות בתחום‪.‬למשל‪ ,‬לא נזדקק עוד לרופא‬ ‫טפחים רבים‪ ,‬גם כאלה שלא היינו רוצים לגלות‪.‬חלק מהנתונים‬ ‫רדיולוג כדי לפענח תוצרים של דימות רפואי‪.‬המחשב יכול למלא‬ ‫אנו מנדבים בעצמנו למשל‪ ,‬כאשר אנו מפרסמים ‪ Post‬ברשת‬ ‫את המשימה לאחר שהוא אומן באמצעות כמות גדולה של נתונים‬ ‫החברתית‪.‬אך חלק אחר מהנתונים מתפרסמים על ידי אחרים‪,‬‬ ‫ממקרי עבר שפוענחו ותויגו על ידי רדיולוגים‪.‬‬ ‫למשל‪ ,‬כאשר החברים שלנו ברשת החברתית מזכירים אותנו‬ ‫ב‪ Post-‬שלהם או מעלים תמונה שבה אנו מופיעים‪.‬זו הסיבה‬ ‫כאמור‪ ,‬גם בתחום החינוך ביג‪-‬דאטה ולמידה חישובית צפויים‬ ‫שבעידן הנוכחי קשה הרבה יותר להסתיר‪ ,‬למשל‪ ,‬נטייה מינית‪,‬‬ ‫לעשות מהפך‪.‬אולם מערכות מידע חכמות ככל שתהיינה אינן‬ ‫כי די בסקירת פרופילים של חבריו של פלוני ברשת חברתית‪ ,‬די‬ ‫תחליף למורים! יש להיזהר מהתפיסה שלפיה הנתונים הם חזות‬ ‫בה כדי להסיק פרטים גם לגביו (‘כלשון הפתגם ‘אמור לי מי הם‬ ‫הכול ושמחשב צמוד לתלמידים ונתונים בידי המורים הם הפתרון‬ ‫חבריך ‪ -‬ואומר לך מי אתה”)‪.‬‬ ‫לכל בעיות החינוך‪.‬לעולם לא יחליפו הנתונים את הקשר האישי‬ ‫לפיכך ברור שלעיתים איסוף הנתונים וניתוחם באתרי האינטרנט‬ ‫בין מורים לתלמידים ואת המסרים העוברים באמצעות קשר זה‪.‬‬ ‫השונים מיטיבים עם בעלי האתר על חשבון האינטרס שלנו‪.‬‬ ‫אם כך אין זה פלא שעל פי הדו”ח האחרון של ארגון ה‪,OECD-‬‬ ‫למעשה‪ ,‬בכל פעם שאנו רוכשים מוצר באינטרנט או בוחרים‬ ‫‪13‬‬ ‫>קריאתביניים גליון ‪ 31‬יולי ‪2018‬‬ ‫רשימת ספרות‬ ‫מקצועות החינוך הם בעלי הסיכוי הנמוך ביותר מכלל המקצועות‬ ‫אבני‪ ,‬ע‪ ,.‬ו אברום‪ ,‬ר‪.)2015(.‬ביג‪-‬דאטה‪ ,‬חינוך ואתיקה ‪ -‬מנתונים‬ ‫המועדים לאוטומציה‪ ,‬בכלל זה מקצועות הרפואה או הניהול‬ ‫לתובנות‪.‬ביג‪-‬דאטה‪ ,‬חינוך ואתיקה‪.33-1 ,‬‬ ‫(‪.)Nedelkoska and Quintini, 2018‬ברם תפקידם של המורים עתיד‬ ‫‪https://ianethics.com/wp -content /uploads/2015/02 /‬‬ ‫להשתנות‪.‬מערכות המידע מבוססות הביג‪-‬דאטה יעצימו את‬ ‫‪EduBigData-AI1-2015.pdf‬‬ ‫המורים ויאפשרו להם להגיע למלוא הפוטנציאל כאנשי מקצוע‪,‬‬ ‫ב ן ‪ -‬צ ד ו ק ‪ ,‬ג ‪. )2 011 (.‬כ ר י י ת נ ת ו נ י ם ל מ ט ר ת ח ק ר‬ ‫המכירים את תלמידיהם היטב‪ ,‬מלווים ומנחים אותם בדרך‬ ‫התנהגויות תלמידים בסביבות מתוקשבות‪.‬מכון מופ"ת‪.‬‬ ‫להישגים הטובים ביותר‪.‬‬ ‫‪http://portal.macam.ac.il/ArticlePage.aspx?id=4419‬‬ ‫ההשערה הרווחת היא שבעשור הבא יוכל המחשב לפתח מודעות‬ ‫זליקוביץ’׳‪ ,‬צ‪ ,.‬וגולדשטיין‪ ,‬א‪.)2011(.‬למידה מותאמת אישית‪.‬בתוך‬ ‫עצמית ויכולות קוגניטיביות אוטונומיות אשר יאפשרו לו לעצב‬ ‫מלמד‪ ,‬ע‪.‬וגולדשטיין‪ ,‬א‪(.‬עור')‪.‬הוראה ולמידה בעידן הדיגיטלי‪,‬‬ ‫עצמאית מודלים לקבלת החלטות‪.‬מודלים כאלו עשויים להוביל‬ ‫‪.96-77‬‬ ‫גם למשברים שכיום עדיין מנוהלים ידי בני אדם‪.‬למשל‪ ,‬בשנת‬ ‫שמש‪ ,‬א‪.)2017(.‬סקירת ספרות בנושא פרסונאליזציה בחינוך –‬ ‫‪ 2010‬התרחש אירוע המכונה ‪ Flash Crash‬שבו מדד הבורסה‬ ‫(‪)/http://piechallenge.org.il‬‬ ‫הראשי בניו‪-‬יורק נפל פתאומית וללא כל הסבר‪ ,‬ולאחר זמן קצר‬ ‫התאושש כאילו מעולם לא התרחש‪.‬חקירה שבאה בעקבות‬ ‫‪Duhiggfeb, C. (20012). How Companies Learn Your Secrets, The‬‬ ‫האירוע מגלה שהגורם העיקרי לקריסה היו מחשבי ַא ְלגו‪-‬טריידינג‬ ‫‪New-York Times Magazine, 16.‬‬ ‫(או בעברית מסחר אלגוריתמי) אשר מחליטים בעצמם לבצע‬ ‫‪Gardner, H. (1983). Frames of Mind: The Theory of Multiple‬‬ ‫פעולות של קנייה ומכירה בקצב גבוה על ידי ניתוח אוטומטי של‬ ‫‪Intelligences.‬‬ ‫נתוני המסחר‪.‬מאז התרחשו עוד מספר אירועי קריסה זמניים‬ ‫‪He, K., Zhang, X., Ren, S. and Sun, J. (2015). Delving deep into‬‬ ‫שנבעו מניתוח אוטומטי של נתונים‪.‬אירוע מעניין נוסף התרחש‬ ‫‪rectifiers: Surpassing human-level performance on imagenet‬‬ ‫בשנת ‪ 2016‬כאשר חברת מייקרוסופט שילבה צ’טבוט (רובוט‬ ‫‪classification. In Proceedings of the IEEE international conference‬‬ ‫שיחה) שנועד לצייץ אוטונומית ברשת ה‪.Twitter-‬האינטראקציה‬ ‫‪on computer vision (pp. 1026-1034).‬‬ ‫שהייתה לרובוט עם משתמשים אנושיים הפכה אותו בתוך ‪24‬‬ ‫‪IDC Digital Universe Study: Big Data, Bigger Digital Shadows and‬‬ ‫שעות למיזנתרופ וגזען עד שהמהנדסים של מיקרוסופט נאלצו‬ ‫‪Biggest Growth in the Far East, IDC (December 2012).‬‬ ‫לנתקו לאלתר מהרשת‪.‬‬ ‫‪Kosinski, M. Stillwell, D. & Graepel, T. (2013). Private traits and‬‬ ‫סינגולריות טכנולוגית היא נקודת הזמן שבה תשיג הבינה‬ ‫‪attributes are predictable from digital records of human behavior.‬‬ ‫המלאכותית יכולת אינטלקטואלית הגבוהה מזו של בני אדם‪.‬יש‬ ‫‪PNAS USA. 110 (15): 5802–5805.‬‬ ‫הרואים בכך את האמצאה האחרונה של האנושות‪.‬מאותו הרגע‬ ‫‪Maimon, O. & Rokach, L. (2010) Data Mining and Knowledge‬‬ ‫תוכל המכונה להפיק בעצמה את ההמצאות הבאות‪.‬כך אולי‬ ‫‪Discovery Handbook, 2nd ed. ISBN 978-0-387-09822-7‬‬ ‫תוכל האנושות למצוא מזור לבעיות שבני התמותה לא הצליחו‬ ‫)‪Mirsky, Y., Shabtai, A., Shapira, B., Elovici, Y., & Rokach, L. (2017‬‬ ‫עדיין לפתור‪ ,‬כגון מציאת תרופות למחלות חשוכות מרפא‪.‬כיום‬ ‫‪Anomaly detection for smartphone data streams. Pervasive and‬‬ ‫מספר המדענים שעוסקים בבעיית מחקר מסוימת הנו מוגבל‪.‬‬ ‫‪Mobile Computing 35: 83-107.‬‬ ‫אך כאשר תשיג מכונה את היכולת האינטלקטואליות של מדען‪,‬‬ ‫‪Nedelkoska, L. & Quintini, G. (2018). Automation, skills use and‬‬ ‫הרי שניתן יהיה להמשיך לשפרה כי אין לה מחסום ביולוגי‪.‬נקודת‬ ‫‪training, OECD Social, Employment and Migration Working‬‬ ‫הזמן הזו מעלה הרבה שאלות פילוסופיות ודילמות מוסריות כגון‪:‬‬ ‫‪Papers, No. 202, OECD Publishing, Paris.‬‬ ‫האם ניתן לפתח מצפון במכונות? כך או כך אנו חיים ללא ספק‬ ‫בעידן מרתק‪.‬‬ ‫>קריאתביניים גליון ‪ 31‬יולי ‪2018‬‬ ‫‪14‬‬

Use Quizgecko on...
Browser
Browser