מבוא למדעי הנתונים - שיטות וכלים 67008, מבחן תשפ"ד מועד א, 7.7.2024 PDF

Document Details

RighteousRadium2668

Uploaded by RighteousRadium2668

מכון טכנולוגי חולון

2024

ד"ר יהונתן שלר, מר פרידמן משה

Tags

Computer Science Data Science Python Programming Exam

Summary

This is a past exam paper for מבוא למדעי הנתונים - שיטות וכלים (67008) in Semester B, Exam Session A, 2024 (07/07/2024). The exam contains 20 questions, each worth 5 points, and covers topics in data science using Python, and focuses on programming concepts and data analysis.

Full Transcript

‫קוד מבחן‪~GQ20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫חולון‬ ‫מבוא למדעי הנתונים‪-‬שיטות וכלים‪67008 ,‬‬ ‫ד"ר יהונתן שלר‪ ,‬מר פרידמן משה‬...

‫קוד מבחן‪~GQ20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫חולון‬ ‫מבוא למדעי הנתונים‪-‬שיטות וכלים‪67008 ,‬‬ ‫ד"ר יהונתן שלר‪ ,‬מר פרידמן משה‬ ‫תשפ''ד‪ ,‬סמסטר ב'‪ ,‬מועד א'‪07/07/2024 ,‬‬ ‫משך הבחינה‪ :‬שעתיים‬ ‫חומר עזר‪ :‬מחשבון‬ ‫בבחינה ‪ 20‬שאלות‪ ,‬יש לענות על כולן‪.‬משקל השאלות זהה ‪ 5 -‬נקודות לשאלה‪.‬‬ ‫בכל שאלה יש לסמן את התשובה הנכונה ביותר )אחת בלבד(‪ ,‬באופן ברור‪ ,‬בדף התשובות בלבד‪.‬אם סימנת יותר‬ ‫מתשובה אחת ‪ -‬השאלה תיפסל!‬ ‫תתקבלנה תשובות שנכתבו על גבי דף התשובות בלבד‪.‬לא תבדקנה תשובות שלא תכתבנה בדף המיועד לכך‪.‬‬ ‫יש להחזיר את דף התשובות ביחד עם טופס הבחינה‪ ,‬אחרת הבחינה לא תיבדק‪.‬‬ ‫נא לשים לב כי דף התשובות מוכן לטופס בחינה של ‪ 6‬תשובות‪.‬בבחינה זו יש ‪ 4‬תשובות לכל היותר‪.‬‬ ‫יש להקפיד למלא את התשובות במקום הנכון!‬ ‫בהצלחה!‬ ‫עמוד ‪ 1‬מתוך ‪5‬‬ ‫קוד מבחן‪~GQ20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫שאלה מספר ‪:1‬‬ ‫איזה מבנה נתונים מתייחס למערך חד מימדי בספריית ‪?pandas‬‬ ‫‪Series‬‬ ‫א‪.‬‬ ‫‪Dataframe‬‬ ‫ב‪.‬‬ ‫‪Dictionary‬‬ ‫ג‪.‬‬ ‫‪List‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:2‬‬ ‫מהו התהליך המכונה‪?Outlier Detection‬‬ ‫תהליך זיהוי ערכים החוריגים באופן משמעותי מיתר הערכים במאפיין )‪ (features‬מסוים‪.‬‬ ‫א‪.‬‬ ‫תהליך זיהוי חיזויים שגויים במהלך תהליך שערוך איכות המודל )‪(performance evaluation‬‬ ‫ב‪.‬‬ ‫תהליך חיזוי "שקר" בבעיית ניתוח רגרסיה‬ ‫ג‪.‬‬ ‫כל התשובות שגויות‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:3‬‬ ‫באילו תחומים נעשה שימוש בלמידה לא מונחית )‪?(unsupervised learning‬‬ ‫כל התשובות נכונות )‪(all the answers are correct‬‬ ‫א‪.‬‬ ‫עיבוד תמונה )‪(image processing‬‬ ‫ב‪.‬‬ ‫עיבוד שפה טבעית )‪(natural language processing‬‬ ‫ג‪.‬‬ ‫ביולוגיה חישובית )‪(bioinformatics‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:4‬‬ ‫הוגדרה המחרוזת הבאה בפייתון‪:‬‬ ‫כעת הריצו את הפקודה הבאה‪:‬‬ ‫מהו הפלט שיודפס?‬ ‫הפלט שיודפס‪2 False True :‬‬ ‫א‪.‬‬ ‫הפלט שיודפס‪7 1 0 :‬‬ ‫ב‪.‬‬ ‫הפלט שיודפס‪4 True False :‬‬ ‫ג‪.‬‬ ‫הפלט שיודפס‪2 True True :‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:5‬‬ ‫איזה מהאלגוריתמים הבאים הינו אלגוריתם למידה לא מונחית )‪?(unsupervised learning‬‬ ‫אלגוריתם ניתוח רכיבים ראשיים )‪(PCA‬‬ ‫א‪.‬‬ ‫אלגוריתם רגרסיה לוגיסטית )‪(logistic regression‬‬ ‫ב‪.‬‬ ‫אלגוריתם רגרסיה לינארית )‪(linear regression‬‬ ‫ג‪.‬‬ ‫כל התשובות נכונות‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:6‬‬ ‫איזו פקודה ב ‪ pandas‬מציגה את מס' השורות והעמודות במסגרת נתונים?‬ ‫‪df.shape‬‬ ‫א‪.‬‬ ‫‪df.size‬‬ ‫ב‪.‬‬ ‫‪df.len‬‬ ‫ג‪.‬‬ ‫‪df.dimensions‬‬ ‫ד‪.‬‬ ‫עמוד ‪ 2‬מתוך ‪5‬‬ ‫קוד מבחן‪~GQ20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫שאלה מספר ‪:7‬‬ ‫איזו מודול )ספריה( מקובל לייבא כ‪?sns -‬‬ ‫המודל ‪seaborn‬‬ ‫א‪.‬‬ ‫המודול לניתוח הודעות טקסט‬ ‫ב‪.‬‬ ‫המודול ‪social networking service‬‬ ‫ג‪.‬‬ ‫מודול לביצוע ‪snapping & scraping‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:8‬‬ ‫כדי לכתוב ‪ DataFrame‬לקובץ ‪ csv‬יש להשתמש בפקודה הבאה‪:‬‬ ‫‪to_csv‬‬ ‫א‪.‬‬ ‫‪write _csv‬‬ ‫ב‪.‬‬ ‫‪dump _csv‬‬ ‫ג‪.‬‬ ‫‪dumps _csv‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:9‬‬ ‫השלימו את הפונקציה הבאה‪:‬‬ ‫א‪.‬‬ ‫ב‪.‬‬ ‫ג‪.‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:10‬‬ ‫איזה מדד‪/‬מטריקה מהמדדים הבאים משמש להחלפת ערכים חסרים בנתונים קטגוריאליים?‬ ‫הערך השכיח‬ ‫א‪.‬‬ ‫מדד שפיצר‬ ‫ב‪.‬‬ ‫הערך החציוני‬ ‫ג‪.‬‬ ‫מדד איכות‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:11‬‬ ‫איזה מהמודולים )ספריות( הבאים נשתמש כנראה לצורך הרכשת נתונים בעזרת ‪?web-API‬‬ ‫המודול ‪requests‬‬ ‫א‪.‬‬ ‫המודול ‪BeautifulSoup‬‬ ‫ב‪.‬‬ ‫המודול ‪Selenium‬‬ ‫ג‪.‬‬ ‫כל התשובות נכונות‬ ‫ד‪.‬‬ ‫עמוד ‪ 3‬מתוך ‪5‬‬ ‫קוד מבחן‪~GQ20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫שאלה מספר ‪:12‬‬ ‫מהי המטרה העיקרית של אלגוריתמי אשכול)‪? (clustering‬‬ ‫לזהות דפוסים וקשרים בנתונים‬ ‫א‪.‬‬ ‫להפחית ממדיות של נתונים‬ ‫ב‪.‬‬ ‫לחזות אירועים עתידיים‬ ‫ג‪.‬‬ ‫לתרגם נתונים גדולים‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:13‬‬ ‫לאיזו מהמטרות הבאות תתאים היסטוגרמה כשיטת ויזואליזציה?‬ ‫הצגת שכיחות טווח של ערכים רציפים באמצעות עמודות מלבניות‬ ‫א‪.‬‬ ‫הצגת קשרים וקורלציות בין משתנים שונים‬ ‫ב‪.‬‬ ‫הצגת נתונים קטגוריאליים באמצעות חלקי עוגה‬ ‫ג‪.‬‬ ‫הצגת מגמות בעיתיות של נתונים לאורך זמן‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:14‬‬ ‫איזו מהתשובות הבאות קשורה ל‪? json-‬‬ ‫פורמט אפשרי לקבלת תשובה משאילתא ל‪web -API -‬‬ ‫א‪.‬‬ ‫תת מקרה של קורולציה בין ערכים מספריים מסולם מנה‬ ‫ב‪.‬‬ ‫תת מקרה של קורולציה בין ערכים מספריים מסולם רווח‬ ‫ג‪.‬‬ ‫טרנספורמציה אפשרית של קוד פייתון לקוד ‪java‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:15‬‬ ‫מה ניתן לומר על המתאם בין המאפיינים ‪ X1, X2‬בגרף הבא‪:‬‬ ‫ישנו מתאם )קורלציה( לינארית שלילית בין המאפיינים ‪ X1‬ו‪X2 -‬‬ ‫א‪.‬‬ ‫ישנו מתאם )קורלציה( לינארית חיובית בין המאפיינים ‪ X1‬ו‪X2 -‬‬ ‫ב‪.‬‬ ‫ישנו מתאם )קורלציה( לינארית חיובית חזקה בין המאפיינים ‪ X1‬ו‪X2 -‬‬ ‫ג‪.‬‬ ‫אין כל מתאם )קורלציה( בין המאפיינים ‪ X1‬ו‪X2 -‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:16‬‬ ‫אילו מחרוזות יכול להחזיר הביטוי הרגולרי הבא‪:‬‬ ‫שם של בן אדם באנגלית עם תחילית השם האמצעי‬ ‫א‪.‬‬ ‫כתובת ‪ URL‬פשוטה‬ ‫ב‪.‬‬ ‫כתובת דוא"ל )‪(email‬‬ ‫ג‪.‬‬ ‫כל התשובות נכונות‬ ‫ד‪.‬‬ ‫עמוד ‪ 4‬מתוך ‪5‬‬ ‫קוד מבחן‪~GQ20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫שאלה מספר ‪:17‬‬ ‫מהי המטרה של ניתוח חקרני של נתונים )‪?( EDA‬‬ ‫לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם‪.‬‬ ‫א‪.‬‬ ‫לשאול את שאלות המחקר עליהם ינתנו התשובות בהמשך המחקר‪.‬‬ ‫ב‪.‬‬ ‫לקבוע את הסיבה והמסובב באופן מוחלט‪.‬‬ ‫ג‪.‬‬ ‫להכין נתונים למודלי למידת מכונה וניתוח מתקדם יותר‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:18‬‬ ‫מה השלב השני בעבודת מדען הנתונים‪ ,‬לאחר ניסוח שאלת המחקר?‬ ‫הרכשת נתונים‬ ‫א‪.‬‬ ‫ניתוח נתונים חקרני‬ ‫ב‪.‬‬ ‫בדיקת המודל‬ ‫ג‪.‬‬ ‫בניית מודל‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:19‬‬ ‫אילו סוגי נתונים ניתן לאחסן במסגרת נתונים ב‪?pandas -‬‬ ‫כל התשובות נכונות‬ ‫א‪.‬‬ ‫מספרים‬ ‫ב‪.‬‬ ‫טקסט‬ ‫ג‪.‬‬ ‫תאריכים‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:20‬‬ ‫מציע את השאלה הנוספת כדי להגיע ל‪:20‬‬ ‫מה מהבאים הינו מבנה נתונים בלתי ניתן לשינוי )‪(immutable‬‬ ‫טאפל )‪(tuple‬‬ ‫א‪.‬‬ ‫רשימה )‪(list‬‬ ‫ב‪.‬‬ ‫מילון )‪(dictionary‬‬ ‫ג‪.‬‬ ‫קבוצה )‪(set‬‬ ‫ד‪.‬‬ ‫‪ ---‬סוף המבחן ‪---‬‬ ‫עמוד ‪ 5‬מתוך ‪5‬‬

Use Quizgecko on...
Browser
Browser