מבוא למדעי הנתונים - שיטות וכלים - בחינה - תשפ"ד מועד ב
Document Details
Uploaded by RighteousRadium2668
מכון טכנולוגי חולון
2024
HIT
ד"ר יהונתן שלר ומר משה פרידמן
Tags
Summary
הבחינה במבוא למדעי הנתונים - שיטות וכלים, תשפ"ד, מועד ב' במכון טכנולוגי חולון. הבחינה כוללת 20 שאלות בנושאים כמו מבני נתונים, למידה ממוחשבת, וסטטיסטיקה.
Full Transcript
קוד מבחן~RN20M : מבחן מס' 000 חולון מבוא למדעי הנתונים-שיטות וכלים67008 , ד"ר יהונתן שלר ומר משה פרידמן...
קוד מבחן~RN20M : מבחן מס' 000 חולון מבוא למדעי הנתונים-שיטות וכלים67008 , ד"ר יהונתן שלר ומר משה פרידמן תשפ''ד ,סמסטר ב' ,מועד ב'01/08/2024 , משך הבחינה :שעתיים ללא חומר עזר בבחינה 20שאלות ,יש לענות על כולן.משקל השאלות זהה 5 -נקודות לשאלה. בכל שאלה יש לסמן את התשובה הנכונה ביותר )אחת בלבד( ,באופן ברור ,בדף התשובות בלבד.אם סימנת יותר מתשובה אחת -השאלה תיפסל! תתקבלנה תשובות שנכתבו על גבי דף התשובות בלבד.לא תבדקנה תשובות שלא תכתבנה בדף המיועד לכך. יש להחזיר את דף התשובות ביחד עם טופס הבחינה ,אחרת הבחינה לא תיבדק. נא לשים לב כי דף התשובות מוכן לטופס בחינה של 6תשובות.בבחינה זו יש 4תשובות לכל היותר. יש להקפיד למלא את התשובות במקום הנכון! בהצלחה! עמוד 1מתוך 5 קוד מבחן~RN20M : מבחן מס' 000 שאלה מספר :1 מה משמש מבנה הנתונים ?dictionary מבנה ) keyמפתח( ו) value -ערך( ,בו נגשים לאיברים דרך הkey- א. מילון מונחים על פקודות בpython- ב. מבנה מערך דו מימדי בpandas - ג. מבנה נתונים של מערך דו מימדי בnumpy - ד. שאלה מספר :2 כיצד מיוצגים מאפיינים ) (featuresומופעים ) (instancesב DataFrame-של ? Pandas מאפיינים בעמודות ,מופעים בשורות א. מאפיינים בשורות ,מופעים בעמודות ב. שניהם מיוצגים בעמודות ג. שניהם מיוצגים בשורות ד. שאלה מספר :3 איזו בעיה מתאימה ללמידה לא מונחית )? (unsupervised learning אשכול לקוחות א. זיהוי ספאם ב. חיזוי מחירי דירות ג. זיהוי סוג האובייקט בתמונה ד. שאלה מספר :4 מה יהיה הפלט של הפקודות הבאות: הפלט שיודפס: א. הפלט שיודפס: ב. הפלט שיודפס: ג. הפלט שיודפס: ד. שאלה מספר :5 איזה מהאלגוריתמים הבאים הינו אלגוריתם למידה לא מונחית )?(unsupervised learning כל התשובות נכונות א. אלגוריתם -kמרכזים )(K-Means ב. אלגוריתם ניתוח אשכולות היררכי )(agglomerative clustering ג. אלגוריתם ניתוח רכיבים ראשיים )(PCA ד. שאלה מספר :6 כמה סוגי נתונים )מאפיינים( מעורבים )מספריים וקטגוריאלים( ניתן להציג תרשים פיזור )?(scatterplot ניתן להציג עד 6סוגי נתונים בעזרת מניפולציוית שונות ב scatterplotתלת מימדי א. ניתן להציג עד 3סוגי נתונים בעזרת scatterplotתלת מימדי ב. ניתן להציג עד 4סוגי נתונים בעזרת scatterplotדו מימדי ג. ניתן להציג 2סוגי נתונים בדיוק ב scatterplotדו מימדי ד. עמוד 2מתוך 5 קוד מבחן~RN20M : מבחן מס' 000 שאלה מספר :7 איך מחשבים את החציון של מערך נתונים? מיון הנתונים ובחירת הערך האמצעי א. מציאת הממוצע של הערך הקטן והגדול ביותר ב. סיכום כל הערכים וחלוקה במספר הערכים ג. זיהוי הערך השכיח ביותר ד. שאלה מספר :8 איזו פקודה תמיר jsonלמבנה נתונים של : dictionary הפקודה loads א. הפקודה load ב. הפקודה dumps ג. הפקודה dump ד. שאלה מספר :9 מה ידפיס הקוד הבא? א. ב. ג. ד. שאלה מספר :10 כיצד יש לנהוג במקרה בו ישנם ערכים חסרים במאפיין מספרי? כל התשובות נכונות בתנאים מסוימים א. החלפת הערך החסר בשכיח ב. החלפת הערך החסר בערך 0כברירת מחדל ג. מחיקת המאפיין בו נמצאים הערכים החסרים ד. שאלה מספר :11 בסטטיסטיקה ,מה מטרת המדידה של סטיית התקן? תיאור התפשטות או פיזור הנתונים א. מדידת נטייה מרכזית ב. זיהוי חריגים ג. חישוב הסתברויות ד. שאלה מספר :12 מהי המטרה העיקרית של אלגוריתם ניתוח רכיבים ראשיים )? (PCA להפחית ממדיות של נתונים א. לזהות דפוסים וקשרים בנתונים ב. לחזות אירועים עתידיים ג. לתרגם נתונים גדולים ד. עמוד 3מתוך 5 קוד מבחן~RN20M : מבחן מס' 000 שאלה מספר :13 מה ההבדל בין האופרטור ** לאופרטור ?// הפלט של האופרטור //הוא מספר שלם ,לעומת זאת הפלט של ** אינו בהכרח מספר שלם א. האופרטור ** מיועד רק למספרים שלמים ,לעומת האופרטור //אינו בהכרח למספרים שלמים ב. האופרטור ** מציין את פעולת הביטים ) (bit operatorשל ,ANDלעומת זאת אופרטור //מציין את פעולת הביטים של ג. NAND האופרטור //מסמן תחילת הערה ,לעומת ** שהינו חלק מהערת description ד. שאלה מספר :14 מה ההבדל העיקרי בין מתאם )קורלציה( לסיבתיות )?(causation מתאם מודד את חוזק הקשר ,קשר סיבתי מרמז על קשר של סיבה ותוצאה א. מתאם וסיבתי הם מונחים נרדפים ב. מתאם מרמז על קשר של סיבה ותוצאה ,סיבתיות מודדת את עוצמת הקשר ג. לקורלציה ולסיבתיות אין קשר ד. שאלה מספר :15 כיצד משפיעה הגדלת מספר התאים ) (binsבהיסטוגרמה על ערכי התאים? ערכי התאים יקטנו א. ערכי התאים יגדלו ב. אין השפעה על ערכי התאים ג. כל התשובות נכונות בתנאים מסוימים ד. שאלה מספר :16 אילו מחרוזות יכול להחזיר הביטוי הרגולרי הבא: ,אבל לא יכול להחזיר יכול להחזיר א. ,אבל לא יכול להחזיר יכול להחזיר ב. ,אבל לא יכול להחזיר יכול להחזיר ג. ,אבל לא יכול להחזיר יכול להחזיר ד. עמוד 4מתוך 5 קוד מבחן~RN20M : מבחן מס' 000 שאלה מספר :17 מה ניתן לומר על המתאם בין המאפיינים X2, X1בגרף הבא: ישנו מתאם )קורלציה( לינארית חיובית חלשה בין המאפיינים X1וX2 - א. לא ניתן לדעת אם יש מתאם )קורלציה( בין המאפיינים X1וX2 - ב. ישנו מתאם )קורלציה( גלית בין המאפיינים X1וX2 - ג. ישנו מתאם )קורלציה( לינארית שלילית חלשה בין המאפיינים X1וX2 - ד. שאלה מספר :18 מה השלב השלישי בעבודת מדען הנתונים? טיפול בנתונים א. איסוף נתונים ב. ניתוח נתונים חקרני ג. הרכשת נתונים ד. שאלה מספר :19 מהו ההבדל העיקרי בין סולם סדר ) (ordinalוסולם רווח )?(interval בסולם רווח המרווחים בין הערכים שווים ,בסולם סדר לא בהכרח א. בסולם סדר אפשר לחשב ממוצע ,בסולם רווח לא ב. סולם סדר מתאים רק למספרים שלמים ,סולם רווח למספרים ממשיים ג. אין הבדל משמעותי ביניהם ד. שאלה מספר :20 בלמידת מכונה ,מה ההבדל העיקרי בין למידה מפוקחת ) (supervised learningללמידה לא מפוקחת )?(unsupervised learning למידה מפוקחת כוללת נתונים שסומנו עם ערך מסוים ו/סווגו ,בעוד שנתוני למידה לא מפוקחת אינם מסווגים ולא סומנו א. למידה מפוקחת מנוטרת מקרוב על ידי מדעני נתונים ,בעוד שהם אינם ממלאים תפקיד בלמידה לא מפוקחת ב. למידה מפוקחת משמשת רק לזיהוי תמונות ,בעוד שניתן להשתמש בלמידה לא מפוקחת עבור יישומי ניתוח שונים ג. בלמידה מפוקחת לומדים ערכים בתחום מסוים )מפוקח( בעוד שבלמידה לא מפוקחת לומדים ערכים בכל טווח )לא ד. מפוקח( ---סוף המבחן --- עמוד 5מתוך 5