Podcast
Questions and Answers
מה היא המטרה העיקרית של למידה באמצעות חיזוק (reinforcement learning)?
מה היא המטרה העיקרית של למידה באמצעות חיזוק (reinforcement learning)?
- לקבל תוצאה מיטבית באמצעות ניסויים ופיצויים פשוטים
- להתאים את האסטרטגיה של הסוכן לסביבה על מנת להגדיל את התגמולים העתידיים (correct)
- לנצח את המומחים האנושיים במשחקים מאתגרים כמו גו ו-Starcraft
- להתמודד עם למידה עמוקה (deep learning) בנוסף ללמידה קלאסית
באיזה סוג של משימות יכולה להיות מיושמת למידה באמצעות חיזוק?
באיזה סוג של משימות יכולה להיות מיושמת למידה באמצעות חיזוק?
- בכל סוגי המשימות, הן וירטואליות והן פיזיות (correct)
- רק במשימות פיזיות של רובוטים
- רק במשימות וירטואליות כמו משחקי מחשב
- רק במשחקים מאתגרים כמו גו ו-Starcraft
מה הוא הבסיס ההצלחה המדהים של למידה עמוקה (deep learning) בניצחון על מומחים אנושיים במשחקים מאתגרים?
מה הוא הבסיס ההצלחה המדהים של למידה עמוקה (deep learning) בניצחון על מומחים אנושיים במשחקים מאתגרים?
- שימוש בחישובים מהירים ויעילים יותר
- עיצוב יותר אופטימלי של רשתות נוירונים עמוקות
- פיתוח אלגוריתמים חדשניים של למידה עמוקה
- שילוב של למידה עמוקה ולמידה באמצעות חיזוק (correct)
מדוע לא יטופל נושא למידה באמצעות חיזוק (reinforcement learning) בקורס זה?
מדוע לא יטופל נושא למידה באמצעות חיזוק (reinforcement learning) בקורס זה?
מהו העיקרון המרכזי בלמידה באמצעות חיזוק?
מהו העיקרון המרכזי בלמידה באמצעות חיזוק?
מהי המוטיבציה לנסח את בעיית הלמידה של SVM הקשיח באמצעות (24)?
מהי המוטיבציה לנסח את בעיית הלמידה של SVM הקשיח באמצעות (24)?
מהי מטרת הרגרסיה לוגיסטית?
מהי מטרת הרגרסיה לוגיסטית?
איזו פונקציה משמשת בהרגרסיה לוגיסטית על מנת להעביר את התוצאות למטווח [0, 1]?
איזו פונקציה משמשת בהרגרסיה לוגיסטית על מנת להעביר את התוצאות למטווח [0, 1]?
מהם התכונות של פונקציית הסיגמואיד?
מהם התכונות של פונקציית הסיגמואיד?
מדוע משתמשים בפונקציית הסיגמואיד בהרגרסיה לוגיסטית?
מדוע משתמשים בפונקציית הסיגמואיד בהרגרסיה לוגיסטית?
מהו ההבדל בין SVM הקשיח לרגרסיה לוגיסטית?
מהו ההבדל בין SVM הקשיח לרגרסיה לוגיסטית?
מה מייצג המרחב S בהקשר של פתרון בעיית סיווג תמונות?
מה מייצג המרחב S בהקשר של פתרון בעיית סיווג תמונות?
מהו ההבדל בין התפלגות המידע Px לבין התפלגות המידע Ps|x?
מהו ההבדל בין התפלגות המידע Px לבין התפלגות המידע Ps|x?
מה מייצג פורמלית את ההבדל בין Px ל- Ps|x?
מה מייצג פורמלית את ההבדל בין Px ל- Ps|x?
מהו חשיבותו של פונקציית האבד l בערכה?
מהו חשיבותו של פונקציית האבד l בערכה?
מה מיועד לשמש במרחב F?
מה מיועד לשמש במרחב F?
איזו פונקציית ממש שנבחרה f: X 7→ S, באמצעותה מבוצע חישוב?
איזו פונקציית ממש שנבחרה f: X 7→ S, באמצעותה מבוצע חישוב?
מה הכוונה בביטוי 'Batch normalization'?
מה הכוונה בביטוי 'Batch normalization'?
על פי הטקסט, מהו ההבדל בין Batch mean לְ-Standard deviation?
על פי הטקסט, מהו ההבדל בין Batch mean לְ-Standard deviation?
למה Batch normalization מאפשרת שימוש ב-learning rates גדולים יותר?
למה Batch normalization מאפשרת שימוש ב-learning rates גדולים יותר?
מהו הרעיון של Batch normalization לגבי תחילת האימון?
מהו הרעיון של Batch normalization לגבי תחילת האימון?
מה תהליך של Batch normalization מאפשר לרשת לעשות?
מה תהליך של Batch normalization מאפשר לרשת לעשות?
על פי הנתונים, למה Batch normalization משתנה בשלב ההערכה?
על פי הנתונים, למה Batch normalization משתנה בשלב ההערכה?
למה עיקרון ה momentum חשוב באופטימיזצית הגרדינט?
למה עיקרון ה momentum חשוב באופטימיזצית הגרדינט?
מהו טווח הערכים הנהוג של קבלת ה factor המעכב באופטימיזצית הגרדינט?
מהו טווח הערכים הנהוג של קבלת ה factor המעכב באופטימיזצית הגרדינט?
מה תורת Nesterov accelerated gradient?
מה תורת Nesterov accelerated gradient?
למה שימוש ב stochastic gradient descent is מנוי על momentum?
למה שימוש ב stochastic gradient descent is מנוי על momentum?
Flashcards are hidden until you start studying