מבוא למדעי הנתונים - שיטות וכלים 67008, תשפ"ד, סמסטר א', מועד ב', 08/04/2024, PDF

Document Details

RighteousRadium2668

Uploaded by RighteousRadium2668

Holon Institute of Technology

2024

HIT

יהונתן שלר, טוביס עידן

Tags

data science exam data science methods data science exams

Summary

This is a past paper for an introductory data science course at Holon Institute of Technology. The exam was held in semester A, 2024, and covers various topics in data science methods and tools. The paper includes 20 questions, with each question carrying 5 marks. It was created by יהונתן שלר, טוביס עידן

Full Transcript

‫קוד מבחן‪~YT20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫חולון‬ ‫מבוא למדעי הנתונים‪-‬שיטות וכלים ‪67008 ,‬‬ ‫ד"ר יהונתן שלר‪ ,‬ד"ר טוביס עידן‬...

‫קוד מבחן‪~YT20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫חולון‬ ‫מבוא למדעי הנתונים‪-‬שיטות וכלים ‪67008 ,‬‬ ‫ד"ר יהונתן שלר‪ ,‬ד"ר טוביס עידן‬ ‫תשפ''ד‪ ,‬סמסטר א'‪ ,‬מועד ב'‪08/04/2024 ,‬‬ ‫משך הבחינה‪ :‬שעתיים‬ ‫חומר עזר‪ :‬מחשבון‬ ‫בבחינה ‪ 20‬שאלות‪ ,‬יש לענות על כולן‪.‬משקל השאלות זהה ‪ 5 -‬נקודות לשאלה‪.‬‬ ‫בכל שאלה יש לסמן את התשובה הנכונה ביותר )אחת בלבד(‪ ,‬באופן ברור‪ ,‬בדף התשובות בלבד‪.‬אם סימנת יותר‬ ‫מתשובה אחת ‪ -‬השאלה תיפסל!‬ ‫תתקבלנה תשובות שנכתבו על גבי דף התשובות בלבד‪.‬לא תבדקנה תשובות שלא תכתבנה בדף המיועד לכך‪.‬‬ ‫יש להחזיר את דף התשובות ביחד עם טופס הבחינה‪ ,‬אחרת הבחינה לא תיבדק‪.‬‬ ‫נא לשים לב כי דף התשובות מוכן לטופס בחינה של ‪ 6‬תשובות‪.‬בבחינה זו יש ‪ 4‬תשובות לכל היותר‪.‬‬ ‫יש להקפיד למלא את התשובות במקום הנכון!‬ ‫בהצלחה!‬ ‫עמוד ‪ 1‬מתוך ‪7‬‬ ‫קוד מבחן‪~YT20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫שאלה מספר ‪:1‬‬ ‫אתם מנסים לבצע אשכול )‪ (clustering‬של מבנה נתונים שנראה כך‬ ‫איזה אלגוריתם יאפשר לאשכל את הנתונים בצורה הטובה ביותר?‬ ‫אלגוריתם ‪ KMeans‬עם ‪K=4‬‬ ‫א‪.‬‬ ‫אלגוריתם ‪ DBSCAN‬עם ‪eps=4‬‬ ‫ב‪.‬‬ ‫אלגוריתם ‪ DBSCAN‬עם ‪eps=5‬‬ ‫ג‪.‬‬ ‫אלגוריתם ‪ KMeans‬עם ‪K=5‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:2‬‬ ‫מה ניתן לומר על המתאם בין המאפיינים ‪ Y,X‬בכל אחד מהתרשימים הבאים?‬ ‫בגרף הימני יש מתאם לינארי אפס‪ ,‬באמצעי ובשמאלי חיוביים‬ ‫א‪.‬‬ ‫בגרף הימני יש מתאם לינארי שלילי‪ ,‬בגרף האמצעי חיובי ובגרף השמאלי אפס‬ ‫ב‪.‬‬ ‫בגרף הימני יש מתאם כללי‪ ,‬באמצעי פרבולי ובשמאלי מדורג‬ ‫ג‪.‬‬ ‫רק בגרף השמאלי יש מתאם חיובי‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:3‬‬ ‫מה השלב הראשון בשלבי עבודתו של מדען הנתונים?‬ ‫ניסוח שאלת מחקר‬ ‫א‪.‬‬ ‫ניתוח נתונים חקרני‬ ‫ב‪.‬‬ ‫איסוף נתונים‬ ‫ג‪.‬‬ ‫בניית מודל‬ ‫ד‪.‬‬ ‫עמוד ‪ 2‬מתוך ‪7‬‬ ‫קוד מבחן‪~YT20M :‬‬ ‫מבחן מס' ‪000‬‬ ‫שאלה מספר ‪:4‬‬ ‫מה מטרת הביטוי הרגולרי )‪re.findall(r"\b[A-Z][a-z]*\b", text‬‬ ‫למצוא כל המילים שמתחילות באות גדולה וממשיכות באותיות קטנות‪ ,‬בודדות משאר הטקסט‪.‬‬ ‫א‪.‬‬ ‫לחפש אותיות גדולות בתחילת כל מילה במחרוזת ללא תלות בהמשך המלה‬ ‫ב‪.‬‬ ‫לאתר מחרוזות שמכילות אותיות גדולות בלבד‪.‬‬ ‫ג‪.‬‬ ‫למצוא כל מילה במחרוזת שאינה מכילה אותיות קטנות‪.‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:5‬‬ ‫איזה מהביטויים הרגולריים הבאים משמש לזיהוי מחרוזת המכילה מספר שלם )ללא אפס בתחילתו( ואחריו מספר‬ ‫עשרוני )שהספרה הראשונה לפני הנקודה העשרונית יכולה להיות אפס(‪ ,‬כאשר שני המספרים מופרדים על ידי‬ ‫פסיק או רווח? לדוגמה‪ "0.56 ,23" ,‬או "‪."1.23 4‬שימו לב שהמספר השלם והעשרוני יכולים להופיע גם בלי פסיק‬ ‫או רווח ביניהם‪.‬‬ ‫"‪r"\b[1-9]\d*\s*(?:,|\s) \s*(?:0|[1-9]\d*)\.\d+\b‬‬ ‫א‪.‬‬ ‫"‪r"\d+\s*,\s*\d+‬‬ ‫ב‪.‬‬ ‫"‪r"\b0*\d+\.?\d*\b‬‬ ‫ג‪.‬‬ ‫”‪r"[1-9]\d*\.\d‬‬ ‫ד‪.‬‬ ‫שאלה מספר ‪:6‬‬ ‫מה מהטענות הבאות נכון לגבי תרשים עוגה )‪?(Pie Chart‬‬ ‫יש להשתמש בתרשימי עוגה כדי להציג את הרכב השלם עבור מספר קטגוריות מועטות‪.‬‬ ‫א‪.‬‬ ‫תרשימי עוגה הם דרך יעילה להמחיש ולהשוות ערכים במספר רב )

Use Quizgecko on...
Browser
Browser