קורס בינה מלאכותית סיכום חומר PDF

Summary

This document provides a summary of an artificial intelligence course, covering topics like supervised learning, unsupervised learning, and the introduction to artificial intelligence and historical development, as well as big data concepts.

Full Transcript

‫סיכום ותרגול למצגת ‪:1+2‬‬ ‫‪.1‬מבוא לבינה מלאכותית‬ ‫ בינה מלאכותית היא תחום המתמקד ביצירת מכונות חכמות המסוגלות לחקות יכולות‬ ‫קוגניטיביות אנושיות‬...

‫סיכום ותרגול למצגת ‪:1+2‬‬ ‫‪.1‬מבוא לבינה מלאכותית‬ ‫ בינה מלאכותית היא תחום המתמקד ביצירת מכונות חכמות המסוגלות לחקות יכולות‬ ‫קוגניטיביות אנושיות‬ ‫ ההגדרה של ג'ון מקארתי‪" :‬המדע וההנדסה של יצירת מכונות אינטליגנטיות"‬ ‫ ההגדרה של מרווין מינסקי‪" :‬הניסיון לבצע דברים שידרשו אינטליגנציה אם יבוצעו על ידי בני‬ ‫אדם"‬ ‫‪.2‬התפתחות היסטורית‬ ‫ אלן טיורינג ‪ -‬אבי מדעי המחשב והבינה המלאכותית‬ ‫ מבחן טיורינג (‪ - )1950‬הצעה לבדיקת אינטליגנציה של מכונות‬ ‫ ועידת דארטמות (‪ - )1956‬הטבעת המונח "בינה מלאכותית"‬ ‫‪.3‬סוגי למידת מכונה ‪:‬א‪.‬למידה מונחית‪(Supervised Learning):‬‬ ‫ מתבססת על נתונים מתויגים‬ ‫ סיווג ‪ (Classification) -‬תוצאות בדידות‬ ‫ רגרסיה ‪ (Regression) -‬תוצאות רציפות‬ ‫ב‪.‬למידה לא מונחית‪(Unsupervised Learning):‬‬ ‫ מציאת מבנים וקשרים בנתונים ללא תיוג‬ ‫ אשכול ‪ (Clustering) -‬מציאת קבוצות דומות בנתונים‬ ‫ג‪.‬למידת חיזוקים‪(Reinforcement Learning):‬‬ ‫ סוכן הלומד מאינטראקציה עם הסביבה‬ ‫ מקבל תגמול על פעולות נכונות‬ ‫ ‪RLHF -‬למידת חיזוקים עם משוב אנושי‬ ‫‪.4‬נתונים‪(Big Data):‬‬ ‫ חמשת ה ‪-V‬של ‪Big Data:‬‬ ‫‪Volume ( o‬נפח)‬ ‫‪Velocity ( o‬מהירות)‬ ‫‪Variety ( o‬מגוון)‬ ‫‪Veracity ( o‬אמינות)‬ ‫‪Value ( o‬ערך)‬ ‫שאלות ותשובות‪ -‬הכנה למבחן‪:‬‬ ‫‪.1‬מהי ההגדרה של בינה מלאכותית לפי ג'ון מקארתי?‬ ‫ג'ון מקארתי הגדיר בינה מלאכותית כ"המדע וההנדסה של יצירת מכונות אינטליגנטיות"‪.‬הגדרה זו‬ ‫מדגישה שני היבטים חשובים‪ :‬ראשית‪ ,‬את הצד המדעי‪-‬תיאורטי של התחום‪ ,‬ושנית‪ ,‬את הצד‬ ‫היישומי‪-‬הנדסי‪.‬מקארתי טבע את המונח בשנת ‪ 1956‬בוועידת דארטמות‪ ,‬שנחשבת לנקודת ציון‬ ‫משמעותית בהתפתחות התחום‪.‬‬ ‫‪.2‬הסבר את ההבדל בין למידה מונחית ולא מונחית‬ ‫למידה מונחית היא שיטה בה המודל לומד מדוגמאות מתויגות‪ ,‬כלומר‪ ,‬לכל קלט יש תווית המציינת‬ ‫את התוצאה הרצויה‪.‬למשל‪ ,‬בזיהוי תמונות‪ ,‬כל תמונה מתויגת עם התוכן שלה‪.‬לעומת זאת‪,‬‬ ‫בלמידה לא מונחית המודל מקבל נתונים ללא תיוג ומנסה למצוא בהם דפוסים ומבנים באופן עצמאי‪.‬‬ ‫דוגמה לכך היא אשכול לקוחות לקבוצות על פי התנהגות הקנייה שלהם‪.‬‬ ‫‪.3‬מהם המרכיבים העיקריים של למידת חיזוקים?‬ ‫למידת חיזוקים מורכבת מהמרכיבים הבאים‪:‬‬ ‫‪ -‬סוכן (‪ - )Agent‬המבצע פעולות‬ ‫‪ -‬סביבה (‪ - )Environment‬המצב בו הסוכן פועל‬ ‫‪ -‬מצב (‪ - )State‬המידע הזמין לסוכן בכל רגע נתון‬ ‫‪ -‬פעולה (‪ - )Action‬הבחירות האפשריות של הסוכן‬ ‫‪ -‬תגמול (‪ - )Reward‬המשוב שהסוכן מקבל על פעולותיו‬ ‫‪ -‬מדיניות (‪ - )Policy‬האסטרטגיה שהסוכן מפתח לבחירת פעולות‬ ‫‪.4‬תאר את מבחן טיורינג ומטרתו‬ ‫מבחן טיורינג‪ ,‬שהוצע על ידי אלן טיורינג ב‪ ,1950-‬נועד לבחון האם מכונה יכולה להציג התנהגות‬ ‫אינטליגנטית‪.‬במבחן‪ ,‬אדם משוחח עם שני משתתפים ‪ -‬אחד אנושי והשני מכונה ‪ -‬מבלי לדעת מי‬ ‫הוא מי‪.‬אם האדם אינו מצליח להבחין בין השניים‪ ,‬המכונה עוברת את המבחן‪.‬מטרת המבחן היא‬ ‫לספק קריטריון אופרטיבי להגדרת אינטליגנציה מלאכותית‪.‬‬ ‫‪.5‬מהם חמשת ה‪ V-‬של ‪?Big Data‬‬ ‫חמשת ה‪ V-‬מתארים את המאפיינים המרכזיים של נתוני עתק‪:‬‬ ‫‪( Volume -‬נפח) ‪ -‬כמות עצומה של נתונים‬ ‫‪( Velocity -‬מהירות) ‪ -‬קצב יצירת ועיבוד הנתונים‬ ‫‪( Variety -‬מגוון) ‪ -‬סוגים שונים של נתונים ופורמטים‬ ‫‪( Veracity -‬אמינות) ‪ -‬אמינות ואיכות הנתונים‬ ‫‪( Value -‬ערך) ‪ -‬התועלת העסקית שניתן להפיק מהנתונים‬ ‫‪.6‬הסבר את ההבדל בין סיווג לרגרסיה בלמידה מונחית‬ ‫סיווג ורגרסיה הם שני סוגים של למידה מונחית‪:‬‬ ‫סיווג עוסק בחיזוי קטגוריות או תוויות בדידות (למשל‪ ,‬זיהוי ספאם‪/‬לא ספאם)‪ ,‬בעוד רגרסיה‬ ‫מתמקדת בחיזוי ערכים רציפים (למשל‪ ,‬מחיר דירה)‪.‬ההבדל העיקרי הוא בסוג התוצאה‪ :‬בסיווג‬ ‫התוצאה היא קטגורית‪ ,‬ברגרסיה היא מספרית רציפה‪.‬‬ ‫‪.7‬מהי מטרת האשכול (‪ )Clustering‬בלמידה לא מונחית?‬ ‫אשכול היא טכניקה לגילוי קבוצות טבעיות בנתונים‪.‬המטרה היא למצוא תת‪-‬קבוצות של פריטים‬ ‫דומים זה לזה‪ ,‬כאשר הדמיון נמדד לפי קריטריונים מוגדרים‪.‬למשל‪ ,‬חלוקת לקוחות לקבוצות על פי‬ ‫דפוסי קנייה‪ ,‬או קיבוץ מסמכים לפי נושאים‪.‬האשכול מאפשר לגלות מבנים וקשרים בנתונים ללא ידע‬ ‫מוקדם‪.‬‬ ‫‪.8‬כיצד ‪ RLHF‬שונה מלמידת חיזוקים רגילה?‬ ‫)‪ RLHF (Reinforcement Learning from Human Feedback‬מוסיף ממד אנושי ללמידת חיזוקים‪.‬‬ ‫בעוד שבלמידת חיזוקים רגילה התגמול מוגדר מראש או נקבע אוטומטית‪ ,‬ב‪ RLHF-‬המשוב מגיע‬ ‫מבני אדם‪.‬זה מאפשר למודל ללמוד העדפות אנושיות מורכבות ולשפר את ביצועיו בהתאם לציפיות‬ ‫האנושיות‪.‬‬ ‫‪.9‬מהם האתגרים העיקריים בעבודה עם ‪?Big Data‬‬ ‫האתגרים המרכזיים כוללים‪:‬‬ ‫‪ -‬אחסון וניהול כמויות עצומות של נתונים‬ ‫‪ -‬עיבוד נתונים בזמן אמת‬ ‫‪ -‬טיפול במגוון סוגי נתונים‬ ‫‪ -‬הבטחת איכות ואמינות הנתונים‬ ‫‪ -‬אבטחת מידע ופרטיות‬ ‫‪ -‬מציאת תובנות משמעותיות מתוך כמות גדולה של מידע‬ ‫‪.10‬תאר את התפתחות הבינה המלאכותית מימי טיורינג ועד היום‬ ‫ההתפתחות כוללת מספר שלבים מרכזיים‪:‬‬ ‫‪ -‬שנות ה‪ :50-‬הצעת מבחן טיורינג וועידת דארטמות‬ ‫‪ -‬שנות ה‪ :60-70-‬פיתוח מערכות מומחה ראשונות‬ ‫‪ -‬שנות ה‪ :80-‬התפתחות רשתות עצביות‬ ‫‪ -‬שנות ה‪ :90-2000-‬התקדמות בלמידת מכונה‬ ‫‪ -‬שנות ה‪ 2010-‬ואילך‪ :‬התפתחות למידה עמוקה ומודלי שפה גדולים‬ ‫‪.11‬מהם היתרונות והחסרונות של למידה מונחית לעומת לא מונחית?‬ ‫למידה מונחית‪:‬‬ ‫יתרונות‪:‬‬ ‫‪ -‬תוצאות מדויקות יותר‬ ‫‪ -‬קל להעריך ביצועים‬ ‫‪ -‬מתאימה למשימות מוגדרות היטב‬ ‫חסרונות‪:‬‬ ‫‪ -‬דורשת נתונים מתויגים‬ ‫‪ -‬יקרה ומסובכת להכנה‬ ‫‪ -‬פחות גמישה לגילוי דפוסים חדשים‬ ‫למידה לא מונחית‪:‬‬ ‫יתרונות‪:‬‬ ‫‪ -‬לא דורשת תיוג נתונים‬ ‫‪ -‬יכולה לגלות דפוסים לא צפויים‬ ‫‪ -‬גמישה יותר‬ ‫חסרונות‪:‬‬ ‫‪ -‬תוצאות פחות מדויקות‬ ‫‪ -‬קשה להעריך ביצועים‬ ‫‪ -‬עלולה למצוא דפוסים לא רלוונטיים‬ ‫‪.12‬הסבר כיצד עובד אלגוריתם סיווג בסיסי‬ ‫אלגוריתם סיווג בסיסי פועל בשלבים הבאים‪:‬‬ ‫‪.1‬קבלת נתוני אימון מתויגים‬ ‫‪.2‬חילוץ מאפיינים רלוונטיים‬ ‫‪.3‬בניית מודל המקשר בין המאפיינים לתוויות‬ ‫‪.4‬שימוש במודל לחיזוי תוויות עבור נתונים חדשים‬ ‫‪.13‬מהו תפקיד פונקציית התגמול בלמידת חיזוקים?‬ ‫פונקציית התגמול מגדירה את המטרה שהסוכן צריך להשיג‪.‬היא מספקת משוב מיידי על כל פעולה‪,‬‬ ‫מכוונת את הלמידה ומאפשרת לסוכן לפתח אסטרטגיה אופטימלית להשגת המטרה‪.‬התגמול יכול‬ ‫להיות חיובי או שלילי‪ ,‬ומשקף את הערך של כל מצב או פעולה‪.‬‬ ‫‪.14‬כיצד מתמודדים עם נתונים חסרים בלמידת מכונה?‬ ‫ישנן מספר גישות‪:‬‬ ‫‪ -‬השלמת ערכים חסרים עם ממוצע או חציון‬ ‫‪ -‬שימוש באלגוריתמים מתקדמים להשלמת ערכים‬ ‫‪ -‬הסרת שורות עם נתונים חסרים‬ ‫‪ -‬שימוש בשיטות סטטיסטיות להערכת ערכים חסרים‬ ‫‪ -‬פיתוח מודלים העמידים לנתונים חסרים‬ ‫‪.15‬הסבר את המושג "מאפיינים" (‪ )Features‬בלמידת מכונה‬ ‫מאפיינים הם התכונות או המשתנים המשמשים לייצוג הנתונים במודל‪.‬הם המידע שהמודל משתמש‬ ‫בו כדי לבצע חיזויים או קבלת החלטות‪.‬בחירת מאפיינים מתאימים היא קריטית להצלחת המודל‪.‬‬ ‫‪.16‬מהי חשיבות התיוג בלמידה מונחית?‬ ‫התיוג מספק את "התשובות הנכונות" שהמודל צריך ללמוד‪.‬הוא מאפשר למודל‪:‬‬ ‫‪ -‬ללמוד את הקשר בין קלט לפלט‬ ‫‪ -‬להעריך את דיוק החיזויים‬ ‫‪ -‬לשפר את ביצועיו באופן שיטתי‬ ‫‪ -‬להתאים את עצמו למשימה ספציפית‬ ‫‪.17‬כיצד מודדים הצלחה של אלגוריתם למידת מכונה?‬ ‫מדדי הצלחה כוללים‪:‬‬ ‫‪ -‬דיוק (‪)Accuracy‬‬ ‫‪ -‬רגישות (‪)Sensitivity‬‬ ‫‪ -‬סגוליות (‪)Specificity‬‬ ‫‪F1 Score -‬‬ ‫‪ -‬שטח מתחת לעקומת ‪ROC‬‬ ‫‪ -‬טעות ריבועית ממוצעת (‪ )MSE‬ברגרסיה‬ ‫‪.18‬מהם השימושים העיקריים של בינה מלאכותית בעולם העסקי?‬ ‫שימושים נפוצים כוללים‪:‬‬ ‫‪ -‬חיזוי מכירות והתנהגות לקוחות‬ ‫‪ -‬זיהוי הונאות‬ ‫‪ -‬אוטומציה של תהליכים‬ ‫‪ -‬שירות לקוחות אוטומטי‬ ‫‪ -‬ניתוח נתונים עסקיים‬ ‫‪ -‬אופטימיזציה של מלאי ושרשרת אספקה‬ ‫‪.19‬הסבר את הקשר בין ‪ Big Data‬לבינה מלאכותית‬ ‫‪ Big Data‬מספק את חומר הגלם שמאפשר לאלגוריתמי בינה מלאכותית ללמוד ולשפר את ביצועיהם‪.‬‬ ‫ככל שיש יותר נתונים איכותיים‪ ,‬כך המודלים יכולים‪:‬‬ ‫‪ -‬לזהות דפוסים מורכבים יותר‬ ‫‪ -‬להגיע לדיוק גבוה יותר‬ ‫‪ -‬להתמודד עם מצבים מגוונים יותר‬ ‫‪ -‬לספק תובנות עמוקות יותר‬ ‫‪.20‬תאר את תהליך האימון של מודל למידת מכונה בסיסי‬ ‫התהליך כולל מספר שלבים‪:‬‬ ‫‪.1‬איסוף והכנת נתונים‬ ‫‪.2‬חלוקה לנתוני אימון ובדיקה‬ ‫‪.3‬עיבוד מקדים ונרמול נתונים‬ ‫‪.4‬בחירת ארכיטקטורת המודל‬ ‫‪.5‬אימון המודל על נתוני האימון‬ ‫‪.6‬כיוון פרמטרים (‪)Hyperparameter tuning‬‬ ‫‪.7‬הערכת ביצועים על נתוני הבדיקה‬ ‫‪.8‬פריסה ומעקב אחר ביצועים בסביבת הייצור‪.‬‬ ‫שאלות אמריקאיות‪:‬‬ ‫‪.1‬מהי ההגדרה הנכונה של בינה מלאכותית לפי ג'ון מקארתי?‬ ‫א‪.‬יכולת המחשב לחשוב כמו בני אדם‬ ‫ב‪.‬המדע וההנדסה של יצירת מכונות אינטליגנטיות‬ ‫ג‪.‬תוכנה המדמה התנהגות אנושית‬ ‫ד‪.‬מערכת המסוגלת ללמוד מניסיון‬ ‫‪.2‬מהו המאפיין העיקרי של למידה מונחית?‬ ‫א‪.‬אין צורך בתיוג נתונים‬ ‫ב‪.‬המודל לומד באופן עצמאי‬ ‫ג‪.‬נדרש תיוג מדויק של הנתונים‬ ‫ד‪.‬אין צורך באימון המודל‬ ‫‪.3‬איזה מהבאים אינו נכלל בחמשת ה‪ V-‬של ‪?Big Data‬‬ ‫א‪Volume.‬‬ ‫ב‪Velocity.‬‬ ‫ג‪Visibility.‬‬ ‫ד‪Value.‬‬ ‫‪.4‬מהי המטרה העיקרית של מבחן טיורינג?‬ ‫א‪.‬לבדוק מהירות עיבוד של מחשב‬ ‫ב‪.‬לבחון יכולת המחשב להתחזות לאדם‬ ‫ג‪.‬למדוד דיוק חישובים‬ ‫ד‪.‬לבדוק יכולת זיכרון‬ ‫‪.5‬איזה סוג למידת מכונה מתאים ביותר לחיזוי מחירי דירות?‬ ‫א‪.‬למידה לא מונחית‬ ‫ב‪.‬למידת חיזוקים‬ ‫ג‪.‬רגרסיה‬ ‫ד‪.‬סיווג‬ ‫‪.6‬מהו ‪?RLHF‬‬ ‫א‪.‬סוג של רשת עצבית‬ ‫ב‪.‬למידת חיזוקים עם משוב אנושי‬ ‫ג‪.‬אלגוריתם לעיבוד שפה‬ ‫ד‪.‬שיטה לאחסון נתונים‬ ‫‪.7‬מהו המרכיב החיוני בלמידת חיזוקים?‬ ‫א‪.‬תיוג נתונים‬ ‫ב‪.‬פונקציית תגמול‬ ‫ג‪.‬מסד נתונים‬ ‫ד‪.‬רשת עצבית‬ ‫‪.8‬איזו שיטה מתאימה לגילוי דפוסים בנתונים לא מתויגים?‬ ‫א‪.‬סיווג‬ ‫ב‪.‬רגרסיה‬ ‫ג‪.‬אשכול‬ ‫ד‪.‬למידת חיזוקים‬ ‫‪.9‬מהו היתרון העיקרי של למידה לא מונחית?‬ ‫א‪.‬דיוק גבוה יותר‬ ‫ב‪.‬לא נדרש תיוג נתונים‬ ‫ג‪.‬מהירות עיבוד גבוהה‬ ‫ד‪.‬פחות צורך בנתונים‬ ‫‪.10‬מתי נטבע המונח "בינה מלאכותית"?‬ ‫א‪1943.‬‬ ‫ב‪1950.‬‬ ‫ג‪1956.‬‬ ‫ד‪1960.‬‬ ‫‪.11‬מהי המטרה של אלגוריתם סיווג?‬ ‫א‪.‬חיזוי ערכים רציפים‬ ‫ב‪.‬חלוקה לקטגוריות‬ ‫ג‪.‬מציאת קשרים בין משתנים‬ ‫ד‪.‬אופטימיזציה של פרמטרים‬ ‫‪.12‬מהו הצעד הראשון בבניית מודל למידת מכונה?‬ ‫א‪.‬בחירת אלגוריתם‬ ‫ב‪.‬איסוף והכנת נתונים‬ ‫ג‪.‬הערכת ביצועים‬ ‫ד‪.‬כיוון פרמטרים‬ ‫‪.13‬מהי הדרך הנכונה להתמודד עם נתונים חסרים?‬ ‫א‪.‬תמיד למחוק שורות עם נתונים חסרים‬ ‫ב‪.‬להשתמש בערך אקראי‬ ‫ג‪.‬לבחור שיטה מתאימה בהתאם למקרה‬ ‫ד‪.‬להתעלם מהבעיה‬ ‫‪.14‬מהו ‪ Feature‬בלמידת מכונה?‬ ‫א‪.‬התוצאה הסופית‬ ‫ב‪.‬מאפיין או תכונה של הנתונים‬ ‫ג‪.‬שם המודל‬ ‫ד‪.‬סוג האלגוריתם‬ ‫‪.15‬איזה מהבאים אינו סוג של למידת מכונה?‬ ‫א‪.‬למידה מונחית‬ ‫ב‪.‬למידה לא מונחית‬ ‫ג‪.‬למידת חיזוקים‬ ‫ד‪.‬למידה אקראית‬ ‫‪.16‬מהו תפקיד ה‪ Agent-‬בלמידת חיזוקים?‬ ‫א‪.‬לאסוף נתונים‬ ‫ב‪.‬לבצע פעולות ולקבל החלטות‬ ‫ג‪.‬לתייג נתונים‬ ‫ד‪.‬לחשב סטטיסטיקות‬ ‫‪.17‬מהי המטרה של נרמול נתונים?‬ ‫א‪.‬להגדיל את כמות הנתונים‬ ‫ב‪.‬להאיץ את האימון‬ ‫ג‪.‬להביא את כל המאפיינים לסקאלה דומה‬ ‫ד‪.‬לתקן נתונים שגויים‬ ‫‪.18‬מהו מדד הצלחה מקובל בבעיות סיווג?‬ ‫א‪RMSE.‬‬ ‫ב‪R-squared.‬‬ ‫ג‪Accuracy.‬‬ ‫ד‪Standard Deviation.‬‬ ‫‪.19‬איזה סוג למידה מתאים למשחק שחמט?‬ ‫א‪.‬למידה מונחית‬ ‫ב‪.‬למידה לא מונחית‬ ‫ג‪.‬למידת חיזוקים‬ ‫ד‪.‬רגרסיה‬ ‫‪.20‬מהו ‪?Overfitting‬‬ ‫א‪.‬מודל שלומד טוב מדי את נתוני האימון‬ ‫ב‪.‬מודל שלא לומד מספיק‬ ‫ג‪.‬בעיה בהכנת הנתונים‬ ‫ד‪.‬שגיאה בתיוג‬ ‫סיכום ותרגול למצגת ‪:3‬‬ ‫רשתות נוירונים ולמידה עמוקה‪:‬‬ ‫רשתות נוירונים מלאכותיות (‪ )Artificial Neural Networks‬הן מודלים חישוביים המחקים את פעולת‬ ‫המוח האנושי‪.‬המבנה הבסיסי כולל‪:‬‬ ‫‪ -‬שכבת קלט (‪)Input Layer‬‬ ‫‪ -‬שכבות חבויות (‪)Hidden Layers‬‬ ‫‪ -‬שכבת פלט (‪)Output Layer‬‬ ‫‪ -‬משקולות (‪ )Weights‬המתעדכנות במהלך תהליך הלמידה‬ ‫תהליך הלמידה‪:‬‬ ‫‪.1‬התחלה עם משקולות רנדומליות‬ ‫‪.2‬העברת מידע דרך הרשת‬ ‫‪.3‬חישוב שגיאה (‪)Error‬‬ ‫‪.4‬עדכון משקולות באמצעות ‪Backpropagation‬‬ ‫‪.5‬חזרה על התהליך עד להשגת תוצאות טובות‬ ‫עיבוד שפה טבעית (‪:)NLP‬‬ ‫‪ -‬תרגום מכונה (‪)Machine Translation‬‬ ‫‪ -‬זיהוי רגשות (‪)Sentiment Analysis‬‬ ‫‪ -‬צ'טבוטים (‪)Chatbots‬‬ ‫‪ -‬מודלי שפה גדולים (‪)Large Language Models‬‬ ‫‪:Word Embeddings‬‬ ‫‪ -‬ייצוג מילים כווקטורים במרחב רב‪-‬ממדי‬ ‫‪ -‬מילים דומות ממוקמות קרוב זו לזו במרחב‬ ‫‪ -‬מאפשר פעולות מתמטיות על מילים (לדוגמה‪)king - man + woman = queen :‬‬ ‫‪:Transformers‬‬ ‫‪ -‬ארכיטקטורה פורצת דרך בתחום ה‪NLP-‬‬ ‫‪ -‬מנגנון תשומת לב (‪)Attention Mechanism‬‬ ‫‪ -‬יכולת להתמקד בחלקים שונים של המשפט‬ ‫‪ -‬משמש בסיס למודלים כמו ‪ GPT, BERT‬ואחרים‬ ‫שאלות לדוגמה למבחן‪:‬‬ ‫‪.1‬מהו תפקיד ה‪ Activation Function-‬ברשת נוירונים?‬ ‫א‪.‬קביעת משקולות התחלתיים‬ ‫ב‪.‬חישוב הפלט של כל נוירון‬ ‫ג‪.‬עדכון משקולות‬ ‫ד‪.‬חישוב שגיאות‬ ‫תשובה‪ :‬ב‬ ‫‪.2‬איזה מהבאים אינו שייך לתחום ה‪?NLP-‬‬ ‫א‪.‬זיהוי דיבור‬ ‫ב‪.‬תרגום מכונה‬ ‫ג‪.‬זיהוי תמונות‬ ‫ד‪.‬ניתוח רגשות‬ ‫תשובה‪ :‬ג‬ ‫‪.3‬מהו היתרון העיקרי של שימוש ב‪?Word Embeddings-‬‬ ‫א‪.‬חיסכון בזיכרון‬ ‫ב‪.‬מהירות עיבוד גבוהה‬ ‫ג‪.‬יכולת לייצג קשרים סמנטיים בין מילים‬ ‫ד‪.‬פשטות המימוש‬ ‫תשובה‪ :‬ג‬ ‫‪.4‬מהו תפקיד מנגנון ה‪ Attention-‬ב‪?Transformers-‬‬ ‫א‪.‬האצת תהליך האימון‬ ‫ב‪.‬הפחתת צריכת הזיכרון‬ ‫ג‪.‬זיהוי קשרים חשובים בין מילים במשפט‬ ‫ד‪.‬הגדלת מספר השכבות ברשת‬ ‫תשובה‪ :‬ג‬ ‫‪.5‬איזה מהבאים אינו יתרון של רשתות נוירונים?‬ ‫א‪.‬יכולת למידה אוטומטית‬ ‫ב‪.‬התמודדות עם בעיות מורכבות‬ ‫ג‪.‬שקיפות מלאה של תהליך קבלת ההחלטות‬ ‫ד‪.‬יכולת הכללה‬ ‫תשובה‪ :‬ג‬ ‫‪.6‬מהו ‪?Backpropagation‬‬ ‫א‪.‬שיטה לאתחול משקולות‬ ‫ב‪.‬אלגוריתם לעדכון משקולות בהתבסס על שגיאות‬ ‫ג‪.‬טכניקה לנרמול נתונים‬ ‫ד‪.‬שיטה לבחירת ארכיטקטורת הרשת‬ ‫תשובה‪ :‬ב‬ ‫‪.7‬מה מייחד את מודלי השפה הגדולים (‪?)LLMs‬‬ ‫א‪.‬עלות אימון נמוכה‬ ‫ב‪.‬פשטות הארכיטקטורה‬ ‫ג‪.‬יכולת הבנה והפקה של שפה טבעית‬ ‫ד‪.‬שימוש במעט נתוני אימון‬ ‫תשובה‪ :‬ג‬ ‫‪.8‬מהו היתרון של שימוש בטרנספורמרים על פני רשתות ‪?RNN‬‬ ‫א‪.‬פחות פרמטרים לאימון‬ ‫ב‪.‬יכולת עיבוד מקבילי‬ ‫ג‪.‬פחות צריכת זיכרון‬ ‫ד‪.‬ארכיטקטורה פשוטה יותר‬ ‫תשובה‪ :‬ב‬ ‫‪.9‬מהי מטרת השימוש ב‪ Tokenization-‬ב‪?NLP-‬‬ ‫א‪.‬הצפנת טקסט‬ ‫ב‪.‬פירוק טקסט ליחידות בסיסיות‬ ‫ג‪.‬תרגום אוטומטי‬ ‫ד‪.‬זיהוי שגיאות כתיב‬ ‫תשובה‪ :‬ב‬ ‫‪.10‬איזה מהבאים אינו שלב בתהליך אימון רשת נוירונים?‬ ‫א‪Forward propagation.‬‬ ‫ב‪.‬חישוב שגיאה‬ ‫ג‪Backpropagation.‬‬ ‫ד‪Random initialization of outputs.‬‬ ‫תשובה‪ :‬ד‬ ‫‪.11‬מהו תפקיד שכבת ה‪ Embedding-‬ב‪?NLP-‬‬ ‫א‪.‬האצת חישובים‬ ‫ב‪.‬המרת מילים לווקטורים‬ ‫ג‪.‬תיקון שגיאות כתיב‬ ‫ד‪.‬זיהוי שפה‬ ‫תשובה‪ :‬ב‬ ‫‪.12‬מהי בעיית ה‪?Vanishing Gradient-‬‬ ‫א‪.‬חוסר זיכרון‬ ‫ב‪.‬התכנסות איטית‬ ‫ג‪.‬הידרדרות הגרדיאנטים בשכבות העמוקות‬ ‫ד‪.‬שגיאות חישוב‬ ‫תשובה‪ :‬ג‬ ‫‪.13‬מהו יתרון השימוש ב‪?Transfer Learning-‬‬ ‫א‪.‬חיסכון בזמן אימון ובנתונים‬ ‫ב‪.‬דיוק גבוה יותר תמיד‬ ‫ג‪.‬פחות משאבי חישוב‬ ‫ד‪.‬פחות פרמטרים‬ ‫תשובה‪ :‬א‬ ‫‪.14‬מהו ‪?Zero-Shot Learning‬‬ ‫א‪.‬למידה ללא דוגמאות‬ ‫ב‪.‬למידה מדוגמה אחת‬ ‫ג‪.‬יכולת ביצוע משימות חדשות ללא אימון ספציפי‬ ‫ד‪.‬למידה ללא שגיאות‬ ‫תשובה‪ :‬ג‬ ‫‪.15‬איזה מהבאים אינו חלק ממודל הטרנספורמר?‬ ‫א‪Multi-Head Attention.‬‬ ‫ב‪Feed-Forward Network.‬‬ ‫ג‪Positional Encoding.‬‬ ‫ד‪Convolutional Layer.‬‬ ‫תשובה‪ :‬ד‬ ‫‪.16‬מהי מטרת ה‪?Batch Normalization-‬‬ ‫א‪.‬האצת האימון והפחתת ‪Overfitting‬‬ ‫ב‪.‬הגדלת מספר הפרמטרים‬ ‫ג‪.‬הקטנת גודל המודל‬ ‫ד‪.‬שיפור דיוק החיזוי בלבד‬ ‫תשובה‪ :‬א‬ ‫‪.17‬מהו ‪?Attention Mechanism‬‬ ‫א‪.‬מנגנון לבחירת שכבות‬ ‫ב‪.‬מנגנון למיקוד במידע רלוונטי‬ ‫ג‪.‬מנגנון לחיסכון בזיכרון‬ ‫ד‪.‬מנגנון לאתחול משקולות‬ ‫תשובה‪ :‬ב‬ ‫‪.18‬מהו היתרון העיקרי של ‪ Deep Learning‬על פני שיטות למידה קלאסיות?‬ ‫א‪.‬פשטות המימוש‬ ‫ב‪.‬מהירות האימון‬ ‫ג‪.‬יכולת למידת תכונות מורכבות באופן אוטומטי‬ ‫ד‪.‬צורך בפחות נתונים‬ ‫תשובה‪ :‬ג‬ ‫‪.19‬מהי שיטת ה‪?Dropout-‬‬ ‫א‪.‬שיטה לאתחול משקולות‬ ‫ב‪.‬טכניקה למניעת ‪Overfitting‬‬ ‫ג‪.‬שיטה לחישוב שגיאות‬ ‫ד‪.‬טכניקה לאופטימיזציה‬ ‫תשובה‪ :‬ב‬ ‫‪.20‬מהו תפקיד ה‪?Loss Function-‬‬ ‫א‪.‬אתחול משקולות‬ ‫ב‪.‬מדידת ביצועי המודל‬ ‫ג‪.‬קביעת ארכיטקטורת הרשת‬ ‫ד‪.‬בחירת שיטת האופטימיזציה‬ ‫תשובה‪ :‬ב‬ ‫סיכום ותרגול למצגת ‪: 4‬‬ ‫מהי הנדסת פרומפטים?‬ ‫הנדסת פרומפטים היא היכולת ליצור הנחיות והוראות אפקטיביות להכוונת התנהגות מודלי בינה‬ ‫מלאכותית‪.‬המטרה היא להשיג את התוצאות האופטימליות מהמודל‪.‬‬ ‫המרכיבים העיקריים בכתיבת פרומפט טוב‪:‬‬ ‫‪.1‬המשימה‬ ‫‪ -‬הגדרה ברורה של מה שאנחנו מבקשים מהמודל לבצע‬ ‫‪ -‬שימוש בפעלים ברורים כמו ‪Generate, Write, Create‬‬ ‫‪ -‬פירוט מדויק של התוצר המבוקש‬ ‫‪.2‬ההקשר‬ ‫‪ -‬מתן רקע רלוונטי למשימה‬ ‫‪ -‬הסבר על המשתמש הסופי והצרכים שלו‬ ‫‪ -‬הגדרת אילוצים ומגבלות (למשל תקציב או זמן)‬ ‫‪.3‬דוגמאות‬ ‫‪ -‬מתן דוגמאות מוחשיות לתוצר המבוקש‬ ‫‪ -‬שימוש בתבניות קיימות כבסיס‬ ‫‪ -‬הדגמת הפורמט הרצוי‬ ‫‪.4‬תפקיד המודל‬ ‫‪ -‬הגדרת הפרסונה או התפקיד שהמודל צריך לגלם‬ ‫‪ -‬למשל‪ :‬מומחה‪ ,‬מורה‪ ,‬יועץ וכו'‬ ‫‪ -‬הגדרת רמת המומחיות והטון‬ ‫‪.5‬פורמט התוצאות‬ ‫‪ -‬הגדרה ברורה של מבנה התוצר הסופי‬ ‫‪ -‬אפשרויות‪ :‬טבלה‪ ,‬רשימה‪ ,‬פסקאות‪ ,‬קוד וכו'‬ ‫‪ -‬הנחיות לגבי אורך ורמת פירוט‬ ‫עקרונות נוספים‪:‬‬ ‫‪.1‬שפה ברורה ותמציתית‬ ‫‪ -‬שימוש במילים פשוטות ומדויקות‬ ‫‪ -‬הימנעות מעמימות‬ ‫‪ -‬מבנה לוגי ומסודר‬ ‫‪.2‬חלוקה לשלבים‬ ‫‪ -‬פירוק משימות מורכבות לצעדים קטנים‬ ‫‪ -‬הנחיות הדרגתיות‬ ‫‪ -‬אפשרות למשוב ותיקון‬ ‫‪.3‬משוב ושיפור‬ ‫‪ -‬שימוש ב‪ Chain of Thought-‬להסבר תהליך החשיבה‬ ‫‪ -‬בקשת ביקורת עצמית מהמודל‬ ‫‪ -‬שיפור הדרגתי של הפרומפט‬ ‫‪.4‬טכניקות מתקדמות‬ ‫‪ :Self-prompting -‬שימוש במודל לשיפור הפרומפט‬ ‫‪ :Few-shot learning -‬שימוש בדוגמאות מרובות‬ ‫‪ :Iterative refinement -‬שיפור הדרגתי של התוצאות‬ ‫שאלות לדוגמה למבחן‪:‬‬ ‫‪.1‬מהי המטרה העיקרית של הנדסת פרומפטים?‬ ‫א‪.‬לכתוב קוד יעיל יותר‬ ‫ב‪.‬ליצור הנחיות אפקטיביות למודלי בינה מלאכותית‬ ‫ג‪.‬לשפר את ביצועי המחשב‬ ‫ד‪.‬לפתח אלגוריתמים חדשים‬ ‫תשובה‪ :‬ב‬ ‫‪.2‬איזה מהבאים הוא מרכיב חיוני בפרומפט טוב?‬ ‫א‪.‬קוד מקור‬ ‫ב‪.‬תמונות‬ ‫ג‪.‬הקשר ברור‬ ‫ד‪.‬פורמולות מתמטיות‬ ‫תשובה‪ :‬ג‬ ‫‪.3‬מהו "‪ "Chain of Thought‬בהקשר של הנדסת פרומפטים?‬ ‫א‪.‬שרשרת של פקודות תכנות‬ ‫ב‪.‬תהליך חשיבה מובנה והסבר שלבי הפתרון‬ ‫ג‪.‬רשת של מחשבים‬ ‫ד‪.‬סדרת משוואות‬ ‫תשובה‪ :‬ב‬ ‫‪.4‬איזה מהבאים אינו חלק מהגדרת תפקיד המודל?‬ ‫א‪.‬הגדרת מומחיות‬ ‫ב‪.‬קביעת טון‬ ‫ג‪.‬בחירת שפת תכנות‬ ‫ד‪.‬הגדרת פרסונה‬ ‫תשובה‪ :‬ג‬ ‫‪.5‬מהי המטרה של שימוש בדוגמאות בפרומפט?‬ ‫א‪.‬להאריך את הפרומפט‬ ‫ב‪.‬להדגים את הפורמט והסגנון הרצויים‬ ‫ג‪.‬להציג את יכולות המתכנת‬ ‫ד‪.‬לבדוק את המודל‬ ‫תשובה‪ :‬ב‬ ‫‪.6‬מהי הדרך הטובה ביותר לטפל במשימה מורכבת?‬ ‫א‪.‬לכתוב פרומפט ארוך במיוחד‬ ‫ב‪.‬לחלק אותה לצעדים קטנים‬ ‫ג‪.‬להשתמש רק בפקודות פשוטות‬ ‫ד‪.‬להתעלם מחלקים מורכבים‬ ‫תשובה‪ :‬ב‬ ‫‪.7‬מהו "‪?"Self-prompting‬‬ ‫א‪.‬כתיבת פרומפטים באופן אוטומטי‬ ‫ב‪.‬שימוש במודל לשיפור הפרומפט‬ ‫ג‪.‬בדיקה עצמית של קוד‬ ‫ד‪.‬תיעוד עצמי‬ ‫תשובה‪ :‬ב‬ ‫‪.8‬איזה מרכיב בפרומפט מגדיר את אופן הצגת התוצאות?‬ ‫א‪.‬המשימה‬ ‫ב‪.‬ההקשר‬ ‫ג‪.‬הפורמט‬ ‫ד‪.‬הדוגמאות‬ ‫תשובה‪ :‬ג‬ ‫‪.9‬מהי החשיבות של הגדרת הקשר בפרומפט?‬ ‫א‪.‬להאריך את הפרומפט‬ ‫ב‪.‬לספק רקע ומידע חיוני למשימה‬ ‫ג‪.‬להרשים את המודל‬ ‫ד‪.‬לשפר את מהירות העיבוד‬ ‫תשובה‪ :‬ב‬ ‫‪.10‬מהו היתרון של שימוש בביקורת עצמית (‪?)Self-critic‬‬ ‫א‪.‬חיסכון בזמן‬ ‫ב‪.‬שיפור איכות התוצאות‬ ‫ג‪.‬הפחתת עלויות‬ ‫ד‪.‬האצת העיבוד‬ ‫תשובה‪ :‬ב‬ ‫‪.11‬איך מומלץ להגדיר את המשימה בפרומפט?‬ ‫א‪.‬בצורה עמומה ופתוחה‬ ‫ב‪.‬בצורה ברורה עם פעלים מדויקים‬ ‫ג‪.‬באמצעות קוד בלבד‬ ‫ד‪.‬בשפה טכנית מורכבת‬ ‫תשובה‪ :‬ב‬ ‫‪.12‬מה החשיבות של הגדרת טון בפרומפט?‬ ‫א‪.‬יצירת אווירה נעימה‬ ‫ב‪.‬התאמת הסגנון למטרה ולקהל היעד‬ ‫ג‪.‬הארכת הפרומפט‬ ‫ד‪.‬שיפור מהירות העיבוד‬ ‫תשובה‪ :‬ב‬ ‫‪.13‬מתי כדאי להשתמש בשיטת ‪?Few-shot learning‬‬ ‫א‪.‬כשרוצים לחסוך זמן‬ ‫ב‪.‬כשיש צורך בדוגמאות מרובות להדגמת התבנית הרצויה‬ ‫ג‪.‬כשעובדים עם קבצים קטנים‬ ‫ד‪.‬רק בפרויקטים גדולים‬ ‫תשובה‪ :‬ב‬ ‫‪.14‬מהו היתרון של פירוק משימה לשלבים קטנים?‬ ‫א‪.‬יותר קל לדבג‬ ‫ב‪.‬משפר את מהירות העיבוד‬ ‫ג‪.‬מאפשר בקרה ודיוק טובים יותר בכל שלב‬ ‫ד‪.‬חוסך זיכרון‬ ‫תשובה‪ :‬ג‬ ‫‪.15‬איזו מהטכניקות הבאות מתאימה במיוחד לשיפור איכות התוצאות?‬ ‫א‪.‬הגדלת אורך הפרומפט‬ ‫ב‪.‬שימוש בביקורת עצמית (‪)Self-critic‬‬ ‫ג‪.‬הקטנת מספר הדוגמאות‬ ‫ד‪.‬שימוש בשפה טכנית‬ ‫תשובה‪ :‬ב‬ ‫‪.16‬מה תפקיד הדוגמאות בפרומפט?‬ ‫א‪.‬להאריך את הפרומפט‬ ‫ב‪.‬להדגים את הפורמט והתוצאה הרצויים‬ ‫ג‪.‬לבדוק את המודל‬ ‫ד‪.‬לשפר את זמני העיבוד‬ ‫תשובה‪ :‬ב‬ ‫‪.17‬איזה מידע חשוב לכלול בהגדרת ההקשר?‬ ‫א‪.‬רק מידע טכני‬ ‫ב‪.‬רק דוגמאות‬ ‫ג‪.‬מידע רלוונטי על המשתמש‪ ,‬מטרות ואילוצים‬ ‫ד‪.‬רק קוד מקור‬ ‫תשובה‪ :‬ג‬ ‫‪.18‬מהי המטרה של הגדרת פרסונה למודל?‬ ‫א‪.‬לשעשע את המשתמש‬ ‫ב‪.‬להתאים את הטון והמומחיות לצורך‬ ‫ג‪.‬לייפות את התוצאה‬ ‫ד‪.‬לשפר את מהירות העיבוד‬ ‫תשובה‪ :‬ב‬ ‫‪.19‬איך מומלץ להתמודד עם תשובה לא מספקת מהמודל?‬ ‫א‪.‬לוותר ולנסות משימה אחרת‬ ‫ב‪.‬להשתמש בפרומפט מורכב יותר‬ ‫ג‪.‬לשנות את הגישה ולנסח מחדש את הבקשה‬ ‫ד‪.‬להתעלם מהבעיה‬ ‫תשובה‪ :‬ג‬ ‫‪.20‬מהו העיקרון החשוב ביותר בהנדסת פרומפטים?‬ ‫א‪.‬שימוש במונחים טכניים‬ ‫ב‪.‬בהירות ודיוק בהנחיות‬ ‫ג‪.‬אורך הפרומפט‬ ‫ד‪.‬מספר הדוגמאות‬ ‫תשובה‪ :‬ב‬ ‫נושאים מרכזיים למיקוד‪:‬‬ ‫‪ -‬מבנה בסיסי של פרומפט טוב‬ ‫‪ -‬טכניקות מתקדמות כמו ‪ Chain of Thought‬ו‪Self-prompting-‬‬ ‫‪ -‬שיטות לשיפור ואופטימיזציה של תוצאות‬ ‫‪ -‬התמודדות עם מקרים מורכבים ומאתגרים‬ ‫‪ -‬הבנת החשיבות של הקשר ופורמט בפרומפט‬

Use Quizgecko on...
Browser
Browser