מבחן לדוגמה_עם_פתרון PDF
Document Details
Uploaded by RighteousRadium2668
Holon Institute of Technology
2025
Tags
Summary
This is a past exam paper from Holon Institute of Technology for the Introduction to Data Science course, covering topics in data science, including supervised and unsupervised learning, data visualization, and data analysis methods. The exam paper contains multiple-choice question.
Full Transcript
מבחן לדוגמה בקורס :מבוא למדעי הנתונים מספר קורס: סמסטר חורף תשפ״ה תאריך הבחינה: שמות המרצים :פרופ' יהונתן שלר ,ד"ר נעמה קופלמן משך הבחינה :שעתיים....
מבחן לדוגמה בקורס :מבוא למדעי הנתונים מספר קורס: סמסטר חורף תשפ״ה תאריך הבחינה: שמות המרצים :פרופ' יהונתן שלר ,ד"ר נעמה קופלמן משך הבחינה :שעתיים. חומר עזר :מחשבון. מבנה הבחינה :בחינה רב ברירתית הוראות כלליות :יש לסמן את התשובה הנכונה ביותר מבין ארבע אפשרויות בהצלחה! .1מה ההבדל בין למידה מונחית ולמידה בלתי מונחית? א.בלמידה מונחית יש משימה.בלמידה בלתי מונחית מה שיוצא יוצא ב.בלמידה מונחית יש תויות ,בלמידה בלתי מונחית אין ג.בלמידה מונחית המתכנת בודק את התוצאות ומנחה את האלגוריתם איך להתאמן במהלך האימון.בלמידה בלתי מונחית אין. ד.בלמידה מונחית משתמשים באלגוריתם בקרה ,בלמידה בלתי מונחית לא. תשובה נכונה )ב(. .2מה ההבדל בין סיווג ונסיגה )רגרסיה(? א.סיווג זה תהליך שבו מחליטים אילו נתונים בלתי מסווגים וניתן לאמן איתם את המודל ואילו מסווגים ולא ניתן למודל להיחשף אליהם.נסיגה זה תהליך שבו המודל חוזר לנתונים שהוא כבר נחשף אליהם. ב.בסיווג ,התויות הינה שמית או סודרת.בנסיגה התויות היא מספר. ג.בסיווג ,הנתונים הינם קטגוריאליים ובנסיגה הנתונים הינם מספריים ד.בסיווג יש תויות ובנסיגה אין. תשובה נכונה )ב( .3מה מהבאים נכון לגבי ההבדל בין סולם רווח וסולם מנה? א.בסולם רווח אנחנו מחשבים פונקציית רווח ובסולם מנה אנחנו מחשבים פונקציית הפסד )כלומר אחד חלקי הרווח( ב.בסולם רווח אנחנו עולים כל פעם שלב אחד בתהליך הלמידה ובסולם מנה תהליך הלמידה הוא רציף ג.בסולם רווח אפשר לחשב ממוצע אלגברי ובסולם מנה אפשר לחשב ממוצע הנדסי ד.בסולם רווח המספרים הם שלמים )כלומר יש בינהם מרווח קבוע שהוא מספר שלם( ובסולם מנה הם רציונליים )המרווחים בינהם יכולים להיות מבוטאים כמנה של שני מספרים( תשובה נכונה )ג( )תשובה ד אינה נכונה – כי המספרים לא חייבים להיות שלמים בסולם רווח ולא חייבים להיות רציונלים בסולם מנה( .4אילו מחרוזות יחזיר הביטוי הרגולרי ’r’\b[Aa]\w+ א.מלים שמתחילות באות Aגדולה או קטנה ב.מלים שמכילות את האות a ג.מחרוזות שמתחילות באות Aונגמרות ברווח ד.מחרוזות באנגלית שמתחילות בצירוף Aaכמו למשל Aardvark תשובה נכונה )א( .5מהו תרשים כינור? א.תרשים שמשלב תרשים קופסה יחד עם ההתפלגות של נתון מסויים ב.תרשים שממפה גלי קול ממרחב הזמן למרחב התדר ג.תרשים שמראה את התדירות של הופעה של נתון מסויים ד.מדד שיערוך למודל סיווג שמתבסס על דציבלים תשובה נכונה )א( .6מהו ?Z-Score א.ערך שמחושב מתוך התפלגות הנתונים ומייצג את הערך המקסימלי בסט נתונים. ב.מדד שמציין את מספר סטיות התקן שהערך נמצא מעל או מתחת לממוצע. ג.מדד שמייצג את הסיכוי של ערך מסוים להופיע בסט נתונים נורמלי. ד.פונקציה מתמטית שמחשבת את ההסתברות שהערך יהיה מעל הממוצע .תשובה נכונה )ב( .7איזה מושג מתואר בדיאגרמה הבאה? הטיית אישור א. הטיית השורד ב. קטיף דובדבנים ג. הטיית הבדיעבד ד. תשובה נכונה )א( .8חשבו את סטיית התקן הלא מוטית של הנתונים הבאים[4,8,6,5,3]: א1.92. ב1.58. ג2.58. ד1.87. תשובה נכונה )א( .9מה ניתן לומר על המתאם בין המאפיינים X1, X2בכל אחד מהתרשימים הבאים? א.בגרף הימני יש מתאם קרוב לאפס ,בגרף האמצעי שלילי ובגרף השמאלי חיובי ב.בגרף הימני יש מתאם שלילי ,בגרף האמצעי חיובי ובגרף השמאלי קרוב לאפס ג.בגרף הימני יש מתאם חיובי ,בגרף האמצעי שלילי ובגרף השמאלי קרוב לאפס ד.רק בגרף השמאלי יש מתאם תשובה נכונה )א( .10איזו ספרייה בפייתון משמשת לביצוע ניתוח וטיפול במידע? אPandas. בMatplotlib. גSciPy. דHuggingface. תשובה נכונה )א( .11מבין האפשרויות הבאות ,מהי המטרה המרכזית של ויזואליזציה? א.לבצע דחיסה של הנתונים ב.לתקשר מידע באופן אפקטיבי ג.להאיץ את מהירות החישוב ד.לאחסן נתונים באופן יעיל תשובה נכונה )ב( .12מה ההבדל בין DataFrameלבין ?Series א DataFrame.משמש לנתונים מספריים בלבד בעוד Seriesיכול לשמש לכל סוג של נתונים בDataFrame.הוא דו מימדי בעוד Seriesהוא חד מימדי ג DataFrame.משמש לאחסון וייצוג של נתוני עתק ) (big dataבעוד series משמש לנתנים רגילים ד.אין הבדל ,אלו שני שמות לאותו מבנה נתונים תשובה נכונה )ב( .13איזו ספרייה מהבאות משמשת לביצוע ?scraping אBeautifulSoup. בflask. גpandas. דmatplotlib. תשובה נכונה )א( .14למה משמשת פקודת ?)( find_all א.למצוא ולהחליף טקסט במסמך ב.להחזיר רשימה של כל התגיות שמתאימות לקריטריון נתון במסמך ג.למצוא את כל הקישורים החיצוניים במסמך ולהוריד אותם לקובץ ד.למצוא את כל סגנונות ה CSSבקובץ HTML תשובה נכונה )ב( .15איזה קוד HTTPמסמן פקודת GETשהצליחה? א404. ב500. ג200. ד302. (תשובה נכונה )ג get? שקיבלנו בפקודתresponse איזו פקודה משמשת לקבלת התוכן של.16 response.content().א response.text.ב response.html().ג response.data().ד (response.content() אפשרי אך לאresponse.content תשובה נכונה )ב( )שימו לב plt? איזו תת ספרייה מקובל לייבא כ.17 matplotlib.pyplot.א plotly.ב plotlib.graph.ג visplot.ד (תשובה נכונה )א ? איך מוסיפים מקרא לגרף.18 plt.show_legend().א plt.legend_display().ב plt.legend().ג plt.add_legend().ד (תשובה נכונה )ג : השלימו את קטע הקוד הבא.19 import pandas as pd import numpy as np df = pd.DataFrame({ 'A': [1, 2, np.nan, 4, 5], 'B': [3, np.nan, np.nan, 8, 9], 'C': [10, 11, 12, np.nan, 14] }) ### YOUR CODE HERE ### df.fillna(df.mean().to_dict, inplace=True).א df.fillna(df.median(), inplace='True').ב df = df.replace(np.nan, df.mean()).ג df.dropna(df.sum()/3, inplace = ‘False’).ד (תשובה נכונה )ג( )בכל שאר התשובות יש שגיאת סינטקס ? מה מהבאים הוא מודל למידה לא מונחית.20 Kmeans.א KNN.ב Linear regression.ג Gradient descent.ד (תשובה נכונה )א ? איזו מהספריות הבאות בפייתון משמשת לעיתים קרובות עבור למידה מונחית.21 NumPy.א pandas.ב scikit-learn.ג matplotlib.ד ( )ג:תשובה נכונה ? איזה מאלגוריתמי הלמידה הבאים שייך ללמידה מונחית.22 K-Means.א SVM (Support Vector Machine).ב PCA (Principal Component Analysis).ג DBSCAN.ד (תשובה נכונה )ב scikit-learn?מתוך הספרייה-KMeans כיצד ניתן להשתמש ב.23 from sklearn.cluster import KMeans באמצעות.א from sklearn.tree import KMeans באמצעות.ב from sklearn.linear_model import KMeans באמצעות.ג from sklearn.decomposition import KMeans באמצעות.ד (תשובה נכונה )א df? בשם-DataFrame מה תחזיר הפקודה הבאה ב.24 df.loc[df['A'].isnull(), 'B'] = df['B'].mean() א.היא תמלא את הערכים הריקים ) (NaNבעמודה Aעם הממוצע של עמודה B. ב.היא תמלא את הערכים הריקים ) (NaNבעמודה Bעם הממוצע של עמודה B, רק עבור השורות שבהן הערך ב -AהואNaN. ג.היא תסיר את כל השורות שבהן הערך ב -AהואNaN. ד.היא תגרום לשגיאה כיוון שלא ניתן להשתמש בפקודה locבצורה זו. תשובה נכונה )ב( .25כיצד ניתן לזהות ) Outliersחריגים( בעמודה column1ב -DataFrameבאמצעות השיטה של טווח בין-רבעוני )?(IQR )([. df[df['column1'] > df['column1'].mean() + 3 * df['column1'].stdא ). q1 = df['column1'].quantile(0.25ב )q3 = df['column1'].quantile(0.75 iqr = q3 - q1 ])df[(df['column1'] < q1 - 1.5 * iqr) | (df['column1'] > q3 + 1.5 * iqr ])(. df[df['column1'] > df['column1'].median() + 1.5 * df['column1'].stdג > ]'. df[df['column1'] < df['column1'].quantile(0.05) | df['column1ד ])df['column1'].quantile(0.95 תשובה נכונה) :ב( בהצלחה!