מבוא למדעי הנתונים - שיטות וכלים - בחינה - תשפ"ד מועד ב

Document Details

RighteousRadium2668

Uploaded by RighteousRadium2668

מכון טכנולוגי חולון

2024

HIT

ד"ר יהונתן שלר ומר משה פרידמן

Tags

מדעי הנתונים python למידה ממוחשבת big data

Summary

הבחינה במבוא למדעי הנתונים - שיטות וכלים, תשפ"ד, מועד ב' במכון טכנולוגי חולון. הבחינה כוללת 20 שאלות בנושאים כמו מבני נתונים, למידה ממוחשבת, וסטטיסטיקה.

Full Transcript

‫קוד מבחן‪~RN20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫חולון‬ ‫מבוא למדעי הנתונים‪-‬שיטות וכלים‪67008 ,‬‬ ‫ד"ר יהונתן שלר ומר משה פרידמן‬...

‫קוד מבחן‪~RN20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫חולון‬ ‫מבוא למדעי הנתונים‪-‬שיטות וכלים‪67008 ,‬‬ ‫ד"ר יהונתן שלר ומר משה פרידמן‬ ‫תשפ''ד‪ ,‬סמסטר ב'‪ ,‬מועד ב'‪01/08/2024 ,‬‬ ‫משך הבחינה‪ :‬שעתיים‬ ‫ללא חומר עזר‬ ‫בבחינה ‪ 20‬שאלות‪ ,‬יש לענות על כולן‪.‬משקל השאלות זהה ‪ 5 -‬נקודות לשאלה‪.‬‬ ‫בכל שאלה יש לסמן את התשובה הנכונה ביותר )אחת בלבד(‪ ,‬באופן ברור‪ ,‬בדף התשובות בלבד‪.‬אם סימנת יותר‬ ‫מתשובה אחת ‪ -‬השאלה תיפסל!‬ ‫תתקבלנה תשובות שנכתבו על גבי דף התשובות בלבד‪.‬לא תבדקנה תשובות שלא תכתבנה בדף המיועד לכך‪.‬‬ ‫יש להחזיר את דף התשובות ביחד עם טופס הבחינה‪ ,‬אחרת הבחינה לא תיבדק‪.‬‬ ‫נא לשים לב כי דף התשובות מוכן לטופס בחינה של ‪ 6‬תשובות‪.‬בבחינה זו יש ‪ 4‬תשובות לכל היותר‪.‬‬ ‫יש להקפיד למלא את התשובות במקום הנכון!‬ ‫בהצלחה!‬ ‫עמוד ‪ 1‬מתוך ‪5‬‬ ‫קוד מבחן‪~RN20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫שאלה מספר ‪:1‬‬ ‫מה משמש מבנה הנתונים ‪?dictionary‬‬ ‫מבנה ‪) key‬מפתח( ו‪) value -‬ערך(‪ ,‬בו נגשים לאיברים דרך ה‪key-‬‬ ‫א‪.‬‬ ‫מילון מונחים על פקודות ב‪python-‬‬ ‫ב‪.‬‬ ‫מבנה מערך דו מימדי ב‪pandas -‬‬ ‫ג‪.‬‬ ‫מבנה נתונים של מערך דו מימדי ב‪numpy -‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:2‬‬ ‫כיצד מיוצגים מאפיינים )‪ (features‬ומופעים )‪ (instances‬ב‪ DataFrame-‬של ‪? Pandas‬‬ ‫מאפיינים בעמודות‪ ,‬מופעים בשורות‬ ‫א‪.‬‬ ‫מאפיינים בשורות‪ ,‬מופעים בעמודות‬ ‫ב‪.‬‬ ‫שניהם מיוצגים בעמודות‬ ‫ג‪.‬‬ ‫שניהם מיוצגים בשורות‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:3‬‬ ‫איזו בעיה מתאימה ללמידה לא מונחית )‪? (unsupervised learning‬‬ ‫אשכול לקוחות‬ ‫א‪.‬‬ ‫זיהוי ספאם‬ ‫ב‪.‬‬ ‫חיזוי מחירי דירות‬ ‫ג‪.‬‬ ‫זיהוי סוג האובייקט בתמונה‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:4‬‬ ‫מה יהיה הפלט של הפקודות הבאות‪:‬‬ ‫הפלט שיודפס‪:‬‬ ‫א‪.‬‬ ‫הפלט שיודפס‪:‬‬ ‫ב‪.‬‬ ‫הפלט שיודפס‪:‬‬ ‫ג‪.‬‬ ‫הפלט שיודפס‪:‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:5‬‬ ‫איזה מהאלגוריתמים הבאים הינו אלגוריתם למידה לא מונחית )‪?(unsupervised learning‬‬ ‫כל התשובות נכונות‬ ‫א‪.‬‬ ‫אלגוריתם ‪-k‬מרכזים )‪(K-Means‬‬ ‫ב‪.‬‬ ‫אלגוריתם ניתוח אשכולות היררכי )‪(agglomerative clustering‬‬ ‫ג‪.‬‬ ‫אלגוריתם ניתוח רכיבים ראשיים )‪(PCA‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:6‬‬ ‫כמה סוגי נתונים )מאפיינים( מעורבים )מספריים וקטגוריאלים( ניתן להציג תרשים פיזור )‪?(scatterplot‬‬ ‫ניתן להציג עד ‪ 6‬סוגי נתונים בעזרת מניפולציוית שונות ב ‪ scatterplot‬תלת מימדי‬ ‫א‪.‬‬ ‫ניתן להציג עד ‪ 3‬סוגי נתונים בעזרת ‪ scatterplot‬תלת מימדי‬ ‫ב‪.‬‬ ‫ניתן להציג עד ‪ 4‬סוגי נתונים בעזרת ‪ scatterplot‬דו מימדי‬ ‫ג‪.‬‬ ‫ניתן להציג ‪ 2‬סוגי נתונים בדיוק ב‪ scatterplot‬דו מימדי‬ ‫ד‪.‬‬ ‫עמוד ‪ 2‬מתוך ‪5‬‬ ‫קוד מבחן‪~RN20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫שאלה מספר ‪:7‬‬ ‫איך מחשבים את החציון של מערך נתונים?‬ ‫מיון הנתונים ובחירת הערך האמצעי‬ ‫א‪.‬‬ ‫מציאת הממוצע של הערך הקטן והגדול ביותר‬ ‫ב‪.‬‬ ‫סיכום כל הערכים וחלוקה במספר הערכים‬ ‫ג‪.‬‬ ‫זיהוי הערך השכיח ביותר‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:8‬‬ ‫איזו פקודה תמיר ‪ json‬למבנה נתונים של ‪: dictionary‬‬ ‫הפקודה ‪loads‬‬ ‫א‪.‬‬ ‫הפקודה ‪load‬‬ ‫ב‪.‬‬ ‫הפקודה ‪dumps‬‬ ‫ג‪.‬‬ ‫הפקודה ‪dump‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:9‬‬ ‫מה ידפיס הקוד הבא?‬ ‫א‪.‬‬ ‫ב‪.‬‬ ‫ג‪.‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:10‬‬ ‫כיצד יש לנהוג במקרה בו ישנם ערכים חסרים במאפיין מספרי?‬ ‫כל התשובות נכונות בתנאים מסוימים‬ ‫א‪.‬‬ ‫החלפת הערך החסר בשכיח‬ ‫ב‪.‬‬ ‫החלפת הערך החסר בערך ‪ 0‬כברירת מחדל‬ ‫ג‪.‬‬ ‫מחיקת המאפיין בו נמצאים הערכים החסרים‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:11‬‬ ‫בסטטיסטיקה‪ ,‬מה מטרת המדידה של סטיית התקן?‬ ‫תיאור התפשטות או פיזור הנתונים‬ ‫א‪.‬‬ ‫מדידת נטייה מרכזית‬ ‫ב‪.‬‬ ‫זיהוי חריגים‬ ‫ג‪.‬‬ ‫חישוב הסתברויות‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:12‬‬ ‫מהי המטרה העיקרית של אלגוריתם ניתוח רכיבים ראשיים )‪? (PCA‬‬ ‫להפחית ממדיות של נתונים‬ ‫א‪.‬‬ ‫לזהות דפוסים וקשרים בנתונים‬ ‫ב‪.‬‬ ‫לחזות אירועים עתידיים‬ ‫ג‪.‬‬ ‫לתרגם נתונים גדולים‬ ‫ד‪.‬‬ ‫עמוד ‪ 3‬מתוך ‪5‬‬ ‫קוד מבחן‪~RN20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫שאלה מספר ‪:13‬‬ ‫מה ההבדל בין האופרטור ** לאופרטור ‪?//‬‬ ‫הפלט של האופרטור ‪ //‬הוא מספר שלם‪ ,‬לעומת זאת הפלט של ** אינו בהכרח מספר שלם‬ ‫א‪.‬‬ ‫האופרטור ** מיועד רק למספרים שלמים‪ ,‬לעומת האופרטור ‪ //‬אינו בהכרח למספרים שלמים‬ ‫ב‪.‬‬ ‫האופרטור ** מציין את פעולת הביטים )‪ (bit operator‬של ‪ ,AND‬לעומת זאת אופרטור ‪ //‬מציין את פעולת הביטים של‬ ‫ג‪.‬‬ ‫‪NAND‬‬ ‫האופרטור ‪ //‬מסמן תחילת הערה‪ ,‬לעומת ** שהינו חלק מהערת ‪description‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:14‬‬ ‫מה ההבדל העיקרי בין מתאם )קורלציה( לסיבתיות )‪?(causation‬‬ ‫מתאם מודד את חוזק הקשר‪ ,‬קשר סיבתי מרמז על קשר של סיבה ותוצאה‬ ‫א‪.‬‬ ‫מתאם וסיבתי הם מונחים נרדפים‬ ‫ב‪.‬‬ ‫מתאם מרמז על קשר של סיבה ותוצאה‪ ,‬סיבתיות מודדת את עוצמת הקשר‬ ‫ג‪.‬‬ ‫לקורלציה ולסיבתיות אין קשר‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:15‬‬ ‫כיצד משפיעה הגדלת מספר התאים )‪ (bins‬בהיסטוגרמה על ערכי התאים?‬ ‫ערכי התאים יקטנו‬ ‫א‪.‬‬ ‫ערכי התאים יגדלו‬ ‫ב‪.‬‬ ‫אין השפעה על ערכי התאים‬ ‫ג‪.‬‬ ‫כל התשובות נכונות בתנאים מסוימים‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:16‬‬ ‫אילו מחרוזות יכול להחזיר הביטוי הרגולרי הבא‪:‬‬ ‫‪ ,‬אבל לא יכול להחזיר‬ ‫יכול להחזיר‬ ‫א‪.‬‬ ‫‪ ,‬אבל לא יכול להחזיר‬ ‫יכול להחזיר‬ ‫ב‪.‬‬ ‫‪ ,‬אבל לא יכול להחזיר‬ ‫יכול להחזיר‬ ‫ג‪.‬‬ ‫‪ ,‬אבל לא יכול להחזיר‬ ‫יכול להחזיר‬ ‫ד‪.‬‬ ‫עמוד ‪ 4‬מתוך ‪5‬‬ ‫קוד מבחן‪~RN20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫שאלה מספר ‪:17‬‬ ‫מה ניתן לומר על המתאם בין המאפיינים ‪ X2, X1‬בגרף הבא‪:‬‬ ‫ישנו מתאם )קורלציה( לינארית חיובית חלשה בין המאפיינים ‪ X1‬ו‪X2 -‬‬ ‫א‪.‬‬ ‫לא ניתן לדעת אם יש מתאם )קורלציה( בין המאפיינים ‪ X1‬ו‪X2 -‬‬ ‫ב‪.‬‬ ‫ישנו מתאם )קורלציה( גלית בין המאפיינים ‪ X1‬ו‪X2 -‬‬ ‫ג‪.‬‬ ‫ישנו מתאם )קורלציה( לינארית שלילית חלשה בין המאפיינים ‪ X1‬ו‪X2 -‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:18‬‬ ‫מה השלב השלישי בעבודת מדען הנתונים?‬ ‫טיפול בנתונים‬ ‫א‪.‬‬ ‫איסוף נתונים‬ ‫ב‪.‬‬ ‫ניתוח נתונים חקרני‬ ‫ג‪.‬‬ ‫הרכשת נתונים‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:19‬‬ ‫מהו ההבדל העיקרי בין סולם סדר )‪ (ordinal‬וסולם רווח )‪?(interval‬‬ ‫בסולם רווח המרווחים בין הערכים שווים‪ ,‬בסולם סדר לא בהכרח‬ ‫א‪.‬‬ ‫בסולם סדר אפשר לחשב ממוצע‪ ,‬בסולם רווח לא‬ ‫ב‪.‬‬ ‫סולם סדר מתאים רק למספרים שלמים‪ ,‬סולם רווח למספרים ממשיים‬ ‫ג‪.‬‬ ‫אין הבדל משמעותי ביניהם‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:20‬‬ ‫בלמידת מכונה‪ ,‬מה ההבדל העיקרי בין למידה מפוקחת )‪ (supervised learning‬ללמידה לא‬ ‫מפוקחת )‪?(unsupervised learning‬‬ ‫למידה מפוקחת כוללת נתונים שסומנו עם ערך מסוים ו‪/‬סווגו‪ ,‬בעוד שנתוני למידה לא מפוקחת אינם מסווגים ולא סומנו‬ ‫א‪.‬‬ ‫למידה מפוקחת מנוטרת מקרוב על ידי מדעני נתונים‪ ,‬בעוד שהם אינם ממלאים תפקיד בלמידה לא מפוקחת‬ ‫ב‪.‬‬ ‫למידה מפוקחת משמשת רק לזיהוי תמונות‪ ,‬בעוד שניתן להשתמש בלמידה לא מפוקחת עבור יישומי ניתוח שונים‬ ‫ג‪.‬‬ ‫בלמידה מפוקחת לומדים ערכים בתחום מסוים )מפוקח( בעוד שבלמידה לא מפוקחת לומדים ערכים בכל טווח )לא‬ ‫ד‪.‬‬ ‫מפוקח(‬ ‫‪ ---‬סוף המבחן ‪---‬‬ ‫עמוד ‪ 5‬מתוך ‪5‬‬

Use Quizgecko on...
Browser
Browser