מבחן לדוגמה_עם_פתרון PDF

Summary

This is a past exam paper from Holon Institute of Technology for the Introduction to Data Science course, covering topics in data science, including supervised and unsupervised learning, data visualization, and data analysis methods. The exam paper contains multiple-choice question.

Full Transcript

‫מבחן לדוגמה בקורס‪ :‬מבוא למדעי הנתונים‬ ‫מספר קורס‪:‬‬ ‫סמסטר חורף תשפ״ה‬ ‫תאריך הבחינה‪:‬‬ ‫שמות המרצים‪ :‬פרופ' יהונתן שלר‪ ,‬ד"ר נעמה קופלמן‬ ‫משך הבחינה‪ :‬שעתיים‪.‬‬...

‫מבחן לדוגמה בקורס‪ :‬מבוא למדעי הנתונים‬ ‫מספר קורס‪:‬‬ ‫סמסטר חורף תשפ״ה‬ ‫תאריך הבחינה‪:‬‬ ‫שמות המרצים‪ :‬פרופ' יהונתן שלר‪ ,‬ד"ר נעמה קופלמן‬ ‫משך הבחינה‪ :‬שעתיים‪.‬‬ ‫ ‬ ‫חומר עזר‪ :‬מחשבון‪.‬‬ ‫ ‬ ‫מבנה הבחינה‪ :‬בחינה רב ברירתית‬ ‫ ‬ ‫הוראות כלליות‪ :‬יש לסמן את התשובה הנכונה ביותר מבין ארבע אפשרויות‬ ‫ ‬ ‫בהצלחה!‬ ‫‪.1‬מה ההבדל בין למידה מונחית ולמידה בלתי מונחית?‬ ‫א‪.‬בלמידה מונחית יש משימה‪.‬בלמידה בלתי מונחית מה שיוצא יוצא‬ ‫ב‪.‬בלמידה מונחית יש תויות‪ ,‬בלמידה בלתי מונחית אין‬ ‫ג‪.‬בלמידה מונחית המתכנת בודק את התוצאות ומנחה את האלגוריתם איך‬ ‫להתאמן במהלך האימון‪.‬בלמידה בלתי מונחית אין‪.‬‬ ‫ד‪.‬בלמידה מונחית משתמשים באלגוריתם בקרה‪ ,‬בלמידה בלתי מונחית לא‪.‬‬ ‫תשובה נכונה )ב(‪.‬‬ ‫‪.2‬מה ההבדל בין סיווג ונסיגה )רגרסיה(?‬ ‫א‪.‬סיווג זה תהליך שבו מחליטים אילו נתונים בלתי מסווגים וניתן לאמן איתם את‬ ‫המודל ואילו מסווגים ולא ניתן למודל להיחשף אליהם‪.‬נסיגה זה תהליך שבו‬ ‫המודל חוזר לנתונים שהוא כבר נחשף אליהם‪.‬‬ ‫ב‪.‬בסיווג‪ ,‬התויות הינה שמית או סודרת‪.‬בנסיגה התויות היא מספר‪.‬‬ ‫ג‪.‬בסיווג‪ ,‬הנתונים הינם קטגוריאליים ובנסיגה הנתונים הינם מספריים‬ ‫ד‪.‬בסיווג יש תויות ובנסיגה אין‪.‬‬ ‫תשובה נכונה )ב(‬ ‫‪.3‬מה מהבאים נכון לגבי ההבדל בין סולם רווח וסולם מנה?‬ ‫א‪.‬בסולם רווח אנחנו מחשבים פונקציית רווח ובסולם מנה אנחנו מחשבים פונקציית‬ ‫הפסד )כלומר אחד חלקי הרווח(‬ ‫ב‪.‬בסולם רווח אנחנו עולים כל פעם שלב אחד בתהליך הלמידה ובסולם מנה‬ ‫תהליך הלמידה הוא רציף‬ ‫ג‪.‬בסולם רווח אפשר לחשב ממוצע אלגברי ובסולם מנה אפשר לחשב ממוצע‬ ‫הנדסי‬ ‫ד‪.‬בסולם רווח המספרים הם שלמים )כלומר יש בינהם מרווח קבוע שהוא מספר‬ ‫שלם( ובסולם מנה הם רציונליים )המרווחים בינהם יכולים להיות מבוטאים כמנה‬ ‫של שני מספרים(‬ ‫תשובה נכונה )ג( )תשובה ד אינה נכונה – כי המספרים לא חייבים להיות שלמים‬ ‫בסולם רווח ולא חייבים להיות רציונלים בסולם מנה(‬ ‫‪.4‬אילו מחרוזות יחזיר הביטוי הרגולרי ’‪r’\b[Aa]\w+‬‬ ‫א‪.‬מלים שמתחילות באות ‪ A‬גדולה או קטנה‬ ‫ב‪.‬מלים שמכילות את האות ‪a‬‬ ‫ג‪.‬מחרוזות שמתחילות באות ‪ A‬ונגמרות ברווח‬ ‫ד‪.‬מחרוזות באנגלית שמתחילות בצירוף ‪ Aa‬כמו למשל ‪Aardvark‬‬ ‫תשובה נכונה )א(‬ ‫‪.5‬מהו תרשים כינור?‬ ‫א‪.‬תרשים שמשלב תרשים קופסה יחד עם ההתפלגות של נתון מסויים‬ ‫ב‪.‬תרשים שממפה גלי קול ממרחב הזמן למרחב התדר‬ ‫ג‪.‬תרשים שמראה את התדירות של הופעה של נתון מסויים‬ ‫ד‪.‬מדד שיערוך למודל סיווג שמתבסס על דציבלים‬ ‫תשובה נכונה )א(‬ ‫‪.6‬מהו ‪?Z-Score‬‬ ‫א‪.‬ערך שמחושב מתוך התפלגות הנתונים ומייצג את הערך המקסימלי בסט‬ ‫נתונים‪.‬‬ ‫ב‪.‬מדד שמציין את מספר סטיות התקן שהערך נמצא מעל או מתחת לממוצע‪.‬‬ ‫ג‪.‬מדד שמייצג את הסיכוי של ערך מסוים להופיע בסט נתונים נורמלי‪.‬‬ ‫ד‪.‬פונקציה מתמטית שמחשבת את ההסתברות שהערך יהיה מעל הממוצע‬ ‫‪.‬תשובה נכונה )ב(‬ ‫‪.7‬איזה מושג מתואר בדיאגרמה הבאה?‬ ‫הטיית אישור‬ ‫א‪.‬‬ ‫הטיית השורד‬ ‫ב‪.‬‬ ‫קטיף דובדבנים‬ ‫ג‪.‬‬ ‫הטיית הבדיעבד‬ ‫ד‪.‬‬ ‫תשובה נכונה )א(‬ ‫‪.8‬חשבו את סטיית התקן הלא מוטית של הנתונים הבאים‪[4,8,6,5,3]:‬‬ ‫א‪1.92.‬‬ ‫ב‪1.58.‬‬ ‫ג‪2.58.‬‬ ‫ד‪1.87.‬‬ ‫תשובה נכונה )א(‬ ‫‪.9‬מה ניתן לומר על המתאם בין המאפיינים ‪ X1, X2‬בכל אחד מהתרשימים הבאים?‬ ‫א‪.‬בגרף הימני יש מתאם קרוב לאפס‪ ,‬בגרף האמצעי שלילי ובגרף השמאלי חיובי‬ ‫ב‪.‬בגרף הימני יש מתאם שלילי‪ ,‬בגרף האמצעי חיובי ובגרף השמאלי קרוב לאפס‬ ‫ג‪.‬בגרף הימני יש מתאם חיובי‪ ,‬בגרף האמצעי שלילי ובגרף השמאלי קרוב לאפס‬ ‫ד‪.‬רק בגרף השמאלי יש מתאם‬ ‫תשובה נכונה )א(‬ ‫‪.10‬איזו ספרייה בפייתון משמשת לביצוע ניתוח וטיפול במידע?‬ ‫א‪Pandas.‬‬ ‫ב‪Matplotlib.‬‬ ‫ג‪SciPy.‬‬ ‫ד‪Huggingface.‬‬ ‫תשובה נכונה )א(‬ ‫‪.11‬מבין האפשרויות הבאות‪ ,‬מהי המטרה המרכזית של ויזואליזציה?‬ ‫א‪.‬לבצע דחיסה של הנתונים‬ ‫ב‪.‬לתקשר מידע באופן אפקטיבי‬ ‫ג‪.‬להאיץ את מהירות החישוב‬ ‫ד‪.‬לאחסן נתונים באופן יעיל‬ ‫תשובה נכונה )ב(‬ ‫‪.12‬מה ההבדל בין ‪ DataFrame‬לבין ?‪Series‬‬ ‫א‪ DataFrame.‬משמש לנתונים מספריים בלבד בעוד ‪ Series‬יכול לשמש לכל סוג‬ ‫של נתונים‬ ‫ב‪DataFrame.‬הוא דו מימדי בעוד ‪Series‬הוא חד מימדי‬ ‫ג‪ DataFrame.‬משמש לאחסון וייצוג של נתוני עתק )‪ (big data‬בעוד ‪series‬‬ ‫משמש לנתנים רגילים‬ ‫ד‪.‬אין הבדל‪ ,‬אלו שני שמות לאותו מבנה נתונים‬ ‫תשובה נכונה )ב(‬ ‫‪.13‬איזו ספרייה מהבאות משמשת לביצוע ?‪scraping‬‬ ‫א‪BeautifulSoup.‬‬ ‫ב‪flask.‬‬ ‫ג‪pandas.‬‬ ‫ד‪matplotlib.‬‬ ‫תשובה נכונה )א(‬ ‫‪.14‬למה משמשת פקודת ?)( ‪find_all‬‬ ‫א‪.‬למצוא ולהחליף טקסט במסמך‬ ‫ב‪.‬להחזיר רשימה של כל התגיות שמתאימות לקריטריון נתון במסמך‬ ‫ג‪.‬למצוא את כל הקישורים החיצוניים במסמך ולהוריד אותם לקובץ‬ ‫ד‪.‬למצוא את כל סגנונות ה ‪ CSS‬בקובץ ‪HTML‬‬ ‫תשובה נכונה )ב(‬ ‫‪.15‬איזה קוד ‪ HTTP‬מסמן פקודת ‪ GET‬שהצליחה?‬ ‫א‪404.‬‬ ‫ב‪500.‬‬ ‫ג‪200.‬‬ ‫ד‪302.‬‬ (‫תשובה נכונה )ג‬ get? ‫שקיבלנו בפקודת‬response ‫ איזו פקודה משמשת לקבלת התוכן של‬.16 response.content().‫א‬ response.text.‫ב‬ response.html().‫ג‬ response.data().‫ד‬ (response.content() ‫ אפשרי אך לא‬response.content ‫תשובה נכונה )ב( )שימו לב‬ plt? ‫ איזו תת ספרייה מקובל לייבא כ‬.17 matplotlib.pyplot.‫א‬ plotly.‫ב‬ plotlib.graph.‫ג‬ visplot.‫ד‬ (‫תשובה נכונה )א‬ ?‫ איך מוסיפים מקרא לגרף‬.18 plt.show_legend().‫א‬ plt.legend_display().‫ב‬ plt.legend().‫ג‬ plt.add_legend().‫ד‬ (‫תשובה נכונה )ג‬ :‫ השלימו את קטע הקוד הבא‬.19 import pandas as pd import numpy as np df = pd.DataFrame({ 'A': [1, 2, np.nan, 4, 5], 'B': [3, np.nan, np.nan, 8, 9], 'C': [10, 11, 12, np.nan, 14] }) ### YOUR CODE HERE ### df.fillna(df.mean().to_dict, inplace=True).‫א‬ df.fillna(df.median(), inplace='True').‫ב‬ df = df.replace(np.nan, df.mean()).‫ג‬ df.dropna(df.sum()/3, inplace = ‘False’).‫ד‬ (‫תשובה נכונה )ג( )בכל שאר התשובות יש שגיאת סינטקס‬ ?‫ מה מהבאים הוא מודל למידה לא מונחית‬.20 Kmeans.‫א‬ KNN.‫ב‬ Linear regression.‫ג‬ Gradient descent.‫ד‬ (‫תשובה נכונה )א‬ ?‫ איזו מהספריות הבאות בפייתון משמשת לעיתים קרובות עבור למידה מונחית‬.21 NumPy.‫א‬ pandas.‫ב‬ scikit-learn.‫ג‬ matplotlib.‫ד‬ (‫ )ג‬:‫תשובה נכונה‬ ?‫ איזה מאלגוריתמי הלמידה הבאים שייך ללמידה מונחית‬.22 K-Means.‫א‬ SVM (Support Vector Machine).‫ב‬ PCA (Principal Component Analysis).‫ג‬ DBSCAN.‫ד‬ (‫תשובה נכונה )ב‬ scikit-learn?‫מתוך הספרייה‬-KMeans ‫ כיצד ניתן להשתמש ב‬.23 from sklearn.cluster import KMeans ‫ באמצעות‬.‫א‬ from sklearn.tree import KMeans ‫ באמצעות‬.‫ב‬ from sklearn.linear_model import KMeans ‫ באמצעות‬.‫ג‬ from sklearn.decomposition import KMeans ‫ באמצעות‬.‫ד‬ (‫תשובה נכונה )א‬ df? ‫בשם‬-DataFrame ‫ מה תחזיר הפקודה הבאה ב‬.24 df.loc[df['A'].isnull(), 'B'] = df['B'].mean() ‫א‪.‬היא תמלא את הערכים הריקים )‪ (NaN‬בעמודה ‪A‬עם הממוצע של עמודה ‪B.‬‬ ‫ב‪.‬היא תמלא את הערכים הריקים )‪ (NaN‬בעמודה ‪B‬עם הממוצע של עמודה ‪B,‬‬ ‫רק עבור השורות שבהן הערך ב ‪-A‬הוא‪NaN.‬‬ ‫ג‪.‬היא תסיר את כל השורות שבהן הערך ב ‪-A‬הוא‪NaN.‬‬ ‫ד‪.‬היא תגרום לשגיאה כיוון שלא ניתן להשתמש בפקודה ‪loc‬בצורה זו‪.‬‬ ‫תשובה נכונה )ב(‬ ‫‪.25‬כיצד ניתן לזהות ‪) Outliers‬חריגים( בעמודה ‪ column1‬ב ‪-DataFrame‬באמצעות‬ ‫השיטה של טווח בין‪-‬רבעוני )‪?(IQR‬‬ ‫)([‪. df[df['column1'] > df['column1'].mean() + 3 * df['column1'].std‬א‬ ‫)‪. q1 = df['column1'].quantile(0.25‬ב‬ ‫)‪q3 = df['column1'].quantile(0.75‬‬ ‫‪iqr = q3 - q1‬‬ ‫])‪df[(df['column1'] < q1 - 1.5 * iqr) | (df['column1'] > q3 + 1.5 * iqr‬‬ ‫])(‪. df[df['column1'] > df['column1'].median() + 1.5 * df['column1'].std‬ג‬ ‫> ]'‪. df[df['column1'] < df['column1'].quantile(0.05) | df['column1‬ד‬ ‫])‪df['column1'].quantile(0.95‬‬ ‫תשובה נכונה‪) :‬ב(‬ ‫בהצלחה!‬

Use Quizgecko on...
Browser
Browser