מבוא למדעי הנתונים - שיטות וכלים 67008, מבחן תשפ"ד מועד א, 7.7.2024 PDF
Document Details
Uploaded by RighteousRadium2668
מכון טכנולוגי חולון
2024
ד"ר יהונתן שלר, מר פרידמן משה
Tags
Summary
This is a past exam paper for מבוא למדעי הנתונים - שיטות וכלים (67008) in Semester B, Exam Session A, 2024 (07/07/2024). The exam contains 20 questions, each worth 5 points, and covers topics in data science using Python, and focuses on programming concepts and data analysis.
Full Transcript
קוד מבחן~GQ20M : מבחן מס' 000 חולון מבוא למדעי הנתונים-שיטות וכלים67008 , ד"ר יהונתן שלר ,מר פרידמן משה...
קוד מבחן~GQ20M : מבחן מס' 000 חולון מבוא למדעי הנתונים-שיטות וכלים67008 , ד"ר יהונתן שלר ,מר פרידמן משה תשפ''ד ,סמסטר ב' ,מועד א'07/07/2024 , משך הבחינה :שעתיים חומר עזר :מחשבון בבחינה 20שאלות ,יש לענות על כולן.משקל השאלות זהה 5 -נקודות לשאלה. בכל שאלה יש לסמן את התשובה הנכונה ביותר )אחת בלבד( ,באופן ברור ,בדף התשובות בלבד.אם סימנת יותר מתשובה אחת -השאלה תיפסל! תתקבלנה תשובות שנכתבו על גבי דף התשובות בלבד.לא תבדקנה תשובות שלא תכתבנה בדף המיועד לכך. יש להחזיר את דף התשובות ביחד עם טופס הבחינה ,אחרת הבחינה לא תיבדק. נא לשים לב כי דף התשובות מוכן לטופס בחינה של 6תשובות.בבחינה זו יש 4תשובות לכל היותר. יש להקפיד למלא את התשובות במקום הנכון! בהצלחה! עמוד 1מתוך 5 קוד מבחן~GQ20M : מבחן מס' 000 שאלה מספר :1 איזה מבנה נתונים מתייחס למערך חד מימדי בספריית ?pandas Series א. Dataframe ב. Dictionary ג. List ד. שאלה מספר :2 מהו התהליך המכונה?Outlier Detection תהליך זיהוי ערכים החוריגים באופן משמעותי מיתר הערכים במאפיין ) (featuresמסוים. א. תהליך זיהוי חיזויים שגויים במהלך תהליך שערוך איכות המודל )(performance evaluation ב. תהליך חיזוי "שקר" בבעיית ניתוח רגרסיה ג. כל התשובות שגויות ד. שאלה מספר :3 באילו תחומים נעשה שימוש בלמידה לא מונחית )?(unsupervised learning כל התשובות נכונות )(all the answers are correct א. עיבוד תמונה )(image processing ב. עיבוד שפה טבעית )(natural language processing ג. ביולוגיה חישובית )(bioinformatics ד. שאלה מספר :4 הוגדרה המחרוזת הבאה בפייתון: כעת הריצו את הפקודה הבאה: מהו הפלט שיודפס? הפלט שיודפס2 False True : א. הפלט שיודפס7 1 0 : ב. הפלט שיודפס4 True False : ג. הפלט שיודפס2 True True : ד. שאלה מספר :5 איזה מהאלגוריתמים הבאים הינו אלגוריתם למידה לא מונחית )?(unsupervised learning אלגוריתם ניתוח רכיבים ראשיים )(PCA א. אלגוריתם רגרסיה לוגיסטית )(logistic regression ב. אלגוריתם רגרסיה לינארית )(linear regression ג. כל התשובות נכונות ד. שאלה מספר :6 איזו פקודה ב pandasמציגה את מס' השורות והעמודות במסגרת נתונים? df.shape א. df.size ב. df.len ג. df.dimensions ד. עמוד 2מתוך 5 קוד מבחן~GQ20M : מבחן מס' 000 שאלה מספר :7 איזו מודול )ספריה( מקובל לייבא כ?sns - המודל seaborn א. המודול לניתוח הודעות טקסט ב. המודול social networking service ג. מודול לביצוע snapping & scraping ד. שאלה מספר :8 כדי לכתוב DataFrameלקובץ csvיש להשתמש בפקודה הבאה: to_csv א. write _csv ב. dump _csv ג. dumps _csv ד. שאלה מספר :9 השלימו את הפונקציה הבאה: א. ב. ג. ד. שאלה מספר :10 איזה מדד/מטריקה מהמדדים הבאים משמש להחלפת ערכים חסרים בנתונים קטגוריאליים? הערך השכיח א. מדד שפיצר ב. הערך החציוני ג. מדד איכות ד. שאלה מספר :11 איזה מהמודולים )ספריות( הבאים נשתמש כנראה לצורך הרכשת נתונים בעזרת ?web-API המודול requests א. המודול BeautifulSoup ב. המודול Selenium ג. כל התשובות נכונות ד. עמוד 3מתוך 5 קוד מבחן~GQ20M : מבחן מס' 000 שאלה מספר :12 מהי המטרה העיקרית של אלגוריתמי אשכול)? (clustering לזהות דפוסים וקשרים בנתונים א. להפחית ממדיות של נתונים ב. לחזות אירועים עתידיים ג. לתרגם נתונים גדולים ד. שאלה מספר :13 לאיזו מהמטרות הבאות תתאים היסטוגרמה כשיטת ויזואליזציה? הצגת שכיחות טווח של ערכים רציפים באמצעות עמודות מלבניות א. הצגת קשרים וקורלציות בין משתנים שונים ב. הצגת נתונים קטגוריאליים באמצעות חלקי עוגה ג. הצגת מגמות בעיתיות של נתונים לאורך זמן ד. שאלה מספר :14 איזו מהתשובות הבאות קשורה ל? json- פורמט אפשרי לקבלת תשובה משאילתא לweb -API - א. תת מקרה של קורולציה בין ערכים מספריים מסולם מנה ב. תת מקרה של קורולציה בין ערכים מספריים מסולם רווח ג. טרנספורמציה אפשרית של קוד פייתון לקוד java ד. שאלה מספר :15 מה ניתן לומר על המתאם בין המאפיינים X1, X2בגרף הבא: ישנו מתאם )קורלציה( לינארית שלילית בין המאפיינים X1וX2 - א. ישנו מתאם )קורלציה( לינארית חיובית בין המאפיינים X1וX2 - ב. ישנו מתאם )קורלציה( לינארית חיובית חזקה בין המאפיינים X1וX2 - ג. אין כל מתאם )קורלציה( בין המאפיינים X1וX2 - ד. שאלה מספר :16 אילו מחרוזות יכול להחזיר הביטוי הרגולרי הבא: שם של בן אדם באנגלית עם תחילית השם האמצעי א. כתובת URLפשוטה ב. כתובת דוא"ל )(email ג. כל התשובות נכונות ד. עמוד 4מתוך 5 קוד מבחן~GQ20M : מבחן מס' 000 שאלה מספר :17 מהי המטרה של ניתוח חקרני של נתונים )?( EDA לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם. א. לשאול את שאלות המחקר עליהם ינתנו התשובות בהמשך המחקר. ב. לקבוע את הסיבה והמסובב באופן מוחלט. ג. להכין נתונים למודלי למידת מכונה וניתוח מתקדם יותר ד. שאלה מספר :18 מה השלב השני בעבודת מדען הנתונים ,לאחר ניסוח שאלת המחקר? הרכשת נתונים א. ניתוח נתונים חקרני ב. בדיקת המודל ג. בניית מודל ד. שאלה מספר :19 אילו סוגי נתונים ניתן לאחסן במסגרת נתונים ב?pandas - כל התשובות נכונות א. מספרים ב. טקסט ג. תאריכים ד. שאלה מספר :20 מציע את השאלה הנוספת כדי להגיע ל:20 מה מהבאים הינו מבנה נתונים בלתי ניתן לשינוי )(immutable טאפל )(tuple א. רשימה )(list ב. מילון )(dictionary ג. קבוצה )(set ד. ---סוף המבחן --- עמוד 5מתוך 5