מבחן לדוגמה - מבוא למדעי הנתונים

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

מה המשמעות של השורה הבאה בפסוקוד קוד?

df[df['column1'] > df['column1'].mean() + 3 * df['column1'].std()]

  • הדפסת כל השורות בטבלה שהערך של עמודה 1 בהן עולה על הממוצע של עמודה 1 בתוספת פי 3 מהשונות של עמודה 1
  • הדפסת כל השורות בטבלה שהערך של עמודה 1 בהן עולה על הממוצע של עמודה 1 בתוספת פי 3 מהסטייה הסטנדרטית של עמודה 1 (correct)
  • הדפסת כל השורות בטבלה שהערך של עמודה 1 בהן קטן מהממוצע של עמודה 1 בתוספת פי 3 מהשונות של עמודה 1
  • הדפסת כל השורות בטבלה שהערך של עמודה 1 בהן קטן מהממוצע של עמודה 1 בתוספת פי 3 מהסטייה הסטנדרטית של עמודה 1

מה תפקיד השורה הבאה בפסוקוד קוד?

q1 = df['column1'].quantile(0.25)

  • חישוב קוורטיל 1 של עמודה 1 (correct)
  • חישוב הממוצע של עמודה 1
  • חישוב קוורטיל 3 של עמודה 1
  • חישוב השונות של עמודה 1

מה תפקיד השורה הבאה בפסוקוד קוד?

iqr = q3 - q1

  • חישוב קוורטיל 1
  • חישוב קוורטיל 3
  • חישוב השונות
  • חישוב תחום בין-קוורטילי (correct)

מה תפקיד השורות הבאות בפסוקוד קוד?

df[(df['column1'] < q1 - 1.5 * iqr) | (df['column1'] > q3 + 1.5 * iqr)]

<p>זיהוי חריגים לפי תחום בין-קוורטילי (A)</p> Signup and view all the answers

איזו גישה לזיהוי חריגים מתוארת בפסוקוד קוד?

df[df['column1'] > df['column1'].mean() + 3 * df['column1'].std()]
df[(df['column1'] < q1 - 1.5 * iqr) | (df['column1'] > q3 + 1.5 * iqr)]

<p>שתי הגישות מתוארות בפסוקוד קוד (C)</p> Signup and view all the answers

מהי ההשפעה של הפקודה df.loc[df['A'].isnull(), 'B'] = df['B'].mean() על DataFrame?

<p>הפקודה תמלא את הערכים הריקים בעמודה B בממוצע של עמודה B, רק עבור השורות שבהן הערך בעמודה A הוא NaN. (C)</p> Signup and view all the answers

באיזו משוואה נוכל להשתמש כדי למצוא את גבולות ה-IQR לזיהוי חריגים בעמודה column1?

<p>Q1 - 1.5 * IQR &lt;= column1 &lt;= Q3 + 1.5 * IQR (B)</p> Signup and view all the answers

מהי ההשפעה של הפקודה df.dropna(subset=['A'], inplace=True) על DataFrame?

<p>הפקודה תמחק את כל השורות שבהן הערך בעמודה A הוא NaN. (A)</p> Signup and view all the answers

מהי הפקודה הנכונה לחישוב הממוצע של עמודה 'column1' ב-DataFrame?

<p>df['column1'].mean() (C)</p> Signup and view all the answers

איזו פקודה תמחק את כל השורות שבהן יש ערך ריק (NaN) בכל עמודה ב-DataFrame?

<p>df.dropna(how='all', inplace=True) (C)</p> Signup and view all the answers

מהי הדרך הנכונה למיין את DataFrame לפי עמודה 'column1' בסדר יורד (מהגדול לקטן)?

<p>df.sort_values(by='column1', ascending=False) (A)</p> Signup and view all the answers

מהו השימוש הפוטנציאלי בפונקציה df.describe() על DataFrame?

<p>הפקודה תציג סטָטִיסטִיקות בסיסיות עבור כל עמודה נומרית ב-DataFrame. (D)</p> Signup and view all the answers

מהי הפקודה הנכונה ליצירת גרף רצועות (Bar Chart) עבור DataFrame?

<p>df.plot(kind='bar') (B)</p> Signup and view all the answers

מהי הדרך הנכונה להוסיף עמודה חדשה בשם 'column2' ל-DataFrame עם ערך קבוע של 10?

<p>df['column2'] = 10 (D)</p> Signup and view all the answers

איזה מהבאים מייצג את השימוש הנכון בפונקציה plt.legend()?

<p>plt.legend(title='מקרא', labels=['אדום', 'ירוק', 'כחול']) (B)</p> Signup and view all the answers

מהי תוצאת הקוד הבא?

import numpy as np
import pandas as pd
df = pd.DataFrame({'A': [1, 2, np.nan, 4, 5], 'B': [3, np.nan, np.nan, 8, 9], 'C': [10, 11, 12, np.nan, 14]})
df.fillna(df.mean().to_dict(), inplace=True)
print(df)

<p>מטריצה עם ערכים חסרים המתמלאים בממוצע עבור כל עמודה (D)</p> Signup and view all the answers

איזה מהבאים מייצג נכון את השימוש בספריית scikit-learn עבור למידה מונחית?

<p>כל האפשרויות הנכונות (D)</p> Signup and view all the answers

מהו ההבדל העיקרי בין אלגוריתם למידה מונחית לאלגוריתם למידה לא מונחית?

<p>אלגוריתם למידה מונחית נדרש לנתונים מתוייגים, בעוד שאלגוריתם למידה לא מונחית אינו נדרש לכך (B)</p> Signup and view all the answers

איזה מהבאים מתאר נכון את תהליך למידה מונחית?

<p>הכנת קבוצת נתונים, אימון מודל על קבוצת הנתונים, חיזוי ערכים חדשים באמצעות המודל (C)</p> Signup and view all the answers

מהו ההבדל העיקרי בין plt.legend() ל-plt.show_legend()?

<p><code>plt.legend()</code> מציג מקרא בגרף, בעוד ש <code>plt.show_legend()</code> לא מציג מקרא בגרף (B)</p> Signup and view all the answers

מהו ההבדל העיקרי בין K-Means (למידה לא מונחית) ו-Linear Regression (למידה מונחית)?

<p>K-Means מנסה לחלק את הנתונים לקבוצות, בעוד ש-Linear Regression מנסה למצוא קשר ליניארי בין משתנים (C)</p> Signup and view all the answers

איזו מהבאים אינה מייצגת שיטה לייבוא מודלים של למידה מונחית מספריית scikit-learn?

<p><code>from sklearn.model_selection import train_test_split</code> (A)</p> Signup and view all the answers

מהו המיקום הנכון בקוד עבור הקטע הבא: df.fillna(df.mean().to_dict(), inplace=True)?

<p>ההשפעה של קוד זה היא על <code>df</code>, יש לשים אותו <strong>אחרי</strong> ההגדרה של <code>df</code> (C)</p> Signup and view all the answers

איזו מהאפשרויות הבאות היא דרך נכונה לקבלת התוכן של response בפקודת plt?

<p>response.text() (B)</p> Signup and view all the answers

מה ההבדל בין response.text() ל response.html() ב plt?

<p>response.text() מחזיר את התוכן כטמליל טקסט פשוט, בעוד ש response.html() מחזיר את התוכן כתגיות HTML. (B)</p> Signup and view all the answers

איזו מהטענות הבאות נכונה בנוגע לשימוש בפקודת plt?

<p>plt משמשת לעיבוד נתונים גרפיים ותמלילים כאחד. (D)</p> Signup and view all the answers

מהו יתרון בשימוש בפקודה response.text() ב plt לעומת קבלת התוכן ישירות?

<p>response.text() מאפשרת גישה נוחה לטקסט ללא תגיות HTML. (B)</p> Signup and view all the answers

מהו ייעודו של response ב plt?

<p>response הוא אובייקט המייצג את התשובה מהשרת. (B)</p> Signup and view all the answers

איזו מהפעולות הבאות לא ניתן לעשות באמצעות plt?

<p>לשלוח דואר אלקטרוני. (D)</p> Signup and view all the answers

מהו response.content() ב plt?

<p>הפקודה response.content() היא דרך מקיפה לקבלת התוכן מכל סוגי תגובות השרת. (C)</p> Signup and view all the answers

איזה מהאפשרויות הבאות שימושית לחילוץ נתונים ספציפיים מתוך טקסט response ב plt?

<p>response.text() (D)</p> Signup and view all the answers

איזה מההצהרות הבאות נכונה בקשר לשילוב פקודות שונות ב plt?

<p>ניתן לשלב פקודות plt עם פקודות אחרות מתוך python לפי הצורך. (B)</p> Signup and view all the answers

אילו מהטענות הבאות נכונות לגבי הטיית האישור? (בחר את כל התשובות הנכונות)

<p>הטיית האישור גורמת לנו לזלזל במידע שיכול לסתור את אמונתנו, גם אם הוא מוצג כראיה אובייקטיבית. (A), הטיית האישור עלולה להשפיע על תהליך קבלת ההחלטות שלנו, מכיוון שאנו עלולים להעריך באופן שגוי את עוצמת הראיות התומכות בהחלטה. (B), הטיית האישור גורמת לנו להעדיף מידע התומך באמונות הקיימות שלנו ולדחות מידע סותר אותן. (D)</p> Signup and view all the answers

אילו מהמשפטים הבאים נכון לגבי סטיית התקן בסט נתונים? (בחר את כל התשובות הנכונות)

<p>סטיית התקן מתארת את הפיזור של הנתונים סביב הממוצע. (A), סטיית התקן גדולה יותר כאשר הנתונים מפוזרים יותר סביב הממוצע. (B)</p> Signup and view all the answers

מהו המושג ״‪Z-Score״‬ המשמש בסטטיסטיקה, ומה השימוש בו? (בחר את התשובה הנכונה ביותר)

<p>‪Z-Score‬ מסמן את מספר סטיות התקן שהערך נמצא מעל או מתחת לממוצע. הוא מאפשר להשוות בין נתונים בסטים שונים שיש להם יחידות מדידה שונות. (D)</p> Signup and view all the answers

אילו מהטענות הבאות לגבי תרשים כינור נכונות ? (בחר את כל התשובות הנכונות)

<p>תרשים כינור מוסיף על תרשים קופסה מידע על ההתפלגות של הנתונים. (A), תרשים כינור משמש להצגת התפלגות הנתונים בקבוצות שונות באופן ויזואלי. (D)</p> Signup and view all the answers

אילו מהטענות הבאות לגבי ״‪Scraping‬״ נכונות? (בחר את כל התשובות הנכונות)

<p>‪Scraping‬ הוא תהליך שמורה המידע שנאסף במסד נתונים, ובכך מאפשר גישה מהירה ל ה מידע. (A), ‪Scraping‬ משמש לניתוח נתונים מאתרים אינטרנטיים לצורך הבנת התנהגות הגולשים. (C), ‪Scraping‬ הוא תהליך איסוף מידע מאתרים אינטרנטיים באופן אוטומטי. (D)</p> Signup and view all the answers

אילו מהטענות הבאות לגבי פקודת ‪find_all()‬ ב ‪BeautifulSoup‬ נכונות? (בחר את ה ת ש ו ב ו ת ה נ כ נ ו ת)

<p>הפקודה ‪find_all()‬ מאפשרת לחפש בתוך מסמך XML את כל ה ת ג י ו ת ש מ ת א י מ ו ת ל ק ר י ט ר י ו ן נ ת ו ן. (A), הפקודה ‪find_all()‬ מאפשרת להגדיר את ה א י פ ו י ו ת ש ל ה ט ק ס ט ש מ ת א י מ ו ת ב ה ת ג י ו ת מ מ ת א י מ ו ת ל ק ר י ט ר י ו ן נ ת ו ן, ו ב כ ך ב נ י ה ה ת ג י ו ת ה ע כ ש ו ו ה י ת ו א י מ ו נ י ו ת ל ה מ ש י מ ה. (B), הפקודה ‪find_all()‬ מחזירה רשימה המכילה את כל ה ת ג י ו ת המ מ ת א י מ ו ת ל ק ר י ט ר י ו ן נ ת ו ן ב מ ס מ ך, וה ר ש י מ ה ה ז ו ה י ה י ה א י מ ו נ י ת ל מ ש י מ ה ש ו נ ו ת. (C), הפקודה ‪find_all()‬ מאפשרת לחפש בתוך מסמך HTML את כל ה ת ג י ו ת ש מ ת א י מ ו ת ל ק ר י ט ר י ו ן נ ת ו ן. (D)</p> Signup and view all the answers

אילו מהטענות הבאות לגבי ‪DataFrame‬ ב ‪Pandas‬ נכונות? (בחר א ת ה ת ש ו ב ו ת ה נ כ נ ו ת)

<p>‪DataFrame‬ הוא מבנה נתונים דו מ י ד י ש מ א פ ש ר ל ע ב ו ד א ת ו ב א ו פ ן יעיל מ א ו ד מ ב ח י ן ש ו ת ו ת מ ב נ י ב ש ו ת ו ס י מ ו ן ב ת י ו כ ו ן ה י י ו ת ש ל ש ו ת ו ת ע מ ו ד ו ת נ ת ו נ י ם. (A), ‪DataFrame‬ הוא כ ל י ס ת ו ד ר ת ל ע ב ו ר ה ד ו ד ו ת ב מ י ד ע ו ב ק ש ר ה ב י ן נ ת ו נ י ם ב ד ו ג ו ן ש ו נ ה ב א ו פ ן מ ת מ טי ו ת י כ ו ן ה י י ו ת ש ל ב ח י נ ה ב י ן ש ו ת ו ת נ ת ו נ י ם. (B), ‪DataFrame‬ הוא כ ל י ש א ף ל ו י ז ו א ל י ז א ק י ה מ ב ח י ן ש ו ת ו ת נ ת ו נ י ם, כ ל ומר הוא מ א פ ש ר ל ה צ י ר ל ב י ת ו נ ו ב א ו פ ן ש מ ת מ טי, ו מ א פ ש ר ל ע ב ו ד א ת ה נ ת ו נ י ם ב א ו פ ן יעיל פ י ז י ק א ל י. (C)</p> Signup and view all the answers

Flashcards

למידה מונחית

Process where the algorithm is trained with labeled data.

למידה בלתי מונחית

Process where the algorithm learns from unlabeled data without guidance.

סיווג

Classification where data is categorized into predefined labels.

נסיגה (רגרסיה)

Regression measures relationships among numerical data outputs.

Signup and view all the flashcards

Z-Score

A measure of how many standard deviations a value is from the mean.

Signup and view all the flashcards

DataFrame

A two-dimensional data structure to store data in rows and columns.

Signup and view all the flashcards

BeautifulSoup

Python library used for web scraping and HTML parsing.

Signup and view all the flashcards

response.content()

פקודה לקבלת תוכן התגובה בפורמט גולמי.

Signup and view all the flashcards

response.text

פקודה שמביאה את התוכן כמחרוזת טקסט.

Signup and view all the flashcards

response.html()

פקודה לשליפת תוכן התגובה בפורמט HTML.

Signup and view all the flashcards

response.data()

פקודה שאינה קיימת, לא נכונה לקבלת תוכן.

Signup and view all the flashcards

חשיבות response

דרכי קבלת תוכן התשובה מאפשרות ניתוח קל.

Signup and view all the flashcards

שימושים בתגובות

ניתן להשתמש בתגובות לניתוח נתונים או הצגת מידע.

Signup and view all the flashcards

response במערכות

אחד מהמרכיבים המרכזיים בתקשורת רשת.

Signup and view all the flashcards

פורמטים של תוכן

תוכן התגובה יכול להיות טקסט, HTML, או גולמי.

Signup and view all the flashcards

מעבדת מידע

סביבת העבודה שבה מנתחים תגובות.

Signup and view all the flashcards

ממוצע

הערך הממוצע של נתונים בעמודה.

Signup and view all the flashcards

סטיית תקן

מדד לפיזור הנתונים סביב הממוצע.

Signup and view all the flashcards

קוונטיל (אחוזון)

ערך שמפריד בין אחוז מסוים של נתונים.

Signup and view all the flashcards

IQR

ההפרש בין הקוונטיל העליון לתחתון (Q3 - Q1).

Signup and view all the flashcards

חוץ קורלטיבי

נתונים שנמצאים מחוץ לגבולות הרגילים, מעל או מתחת לפיזור.

Signup and view all the flashcards

ייבוא matplotlib

ייבוא תת ספרייה לפייתון עבור גרפים.

Signup and view all the flashcards

שיטה להוסיף מקרא לגרף

שיטה מפייתון שמוסיפה מקרא לגרף.

Signup and view all the flashcards

סינון נתוני NaN

שיטה שמחליפה ערכי NaN עם ממוצע הנתונים.

Signup and view all the flashcards

מודל למידה לא מונחית

אלגוריתם לימוד שאינו מצריך תוויות נתונים, כמו K-Means.

Signup and view all the flashcards

אלגוריתם SVM

אלגוריתם למידה מונחית שמשמש לסיווג.

Signup and view all the flashcards

ייבוא KMeans

שיטה לייבוא אלגוריתם קלאסטרינג מתוך scikit-learn.

Signup and view all the flashcards

פלטפורמת Pandas

ספרייה של פייתון לעבודה עם נתונים מסודרים.

Signup and view all the flashcards

אלגוריתם KNN

אלגוריתם למידה מונחית לסיווג נתונים.

Signup and view all the flashcards

numpy

ספריית פייתון לעיבוד נתונים מספריים.

Signup and view all the flashcards

פקודת loc

פקודה ב-Pandas המאפשרת גישה לערכים ע"פ ת label.

Signup and view all the flashcards

NaN

מייצג ערך חסר או לא זמין במסגרת נתונים.

Signup and view all the flashcards

Outliers

ערכים קיצוניים בנתונים שסטייתם מהשאר גבוהה.

Signup and view all the flashcards

stock logic

תהליך חישוב יחס בין ערכים ב-DATAFRAME לפי גישה מבחינת התווית.

Signup and view all the flashcards

שגיאה בפקודה

מצב שבו הפקודה לא מצליחה לפעול כתוצאה מלא נכונה.

Signup and view all the flashcards

מילוי ערכים ריקים

תהליך שבה ערכים חסרים ממולאים בערכים סטטיסטיים או אחרים.

Signup and view all the flashcards

שורות ב-DataFrame

קבוצת ערכים מסודרת של נתונים, דומה לטבלה.

Signup and view all the flashcards

ערכים בעמודות

אוסף נתונים המתקבצים לפי משתנים ב-DataFrame.

Signup and view all the flashcards

Study Notes

מבחן לדוגמה - מבוא למדעי הנתונים

  • נושא: מבחן לדוגמה בקורס מבוא למדעי הנתונים במכון הטכנולוגי חולון.
  • תאריך: לא צוין.
  • מרצים: פרופ' יהונתן שלר וד"ר נעמה קופלמן.
  • משך הבחינה: שעתיים.
  • חומר עזר: מחשבון.
  • סוג הבחינה: רב ברירה.
  • הוראות: לסמן את התשובה הנכונה ביותר.
  • בהצלחה!

שאלות והתשובות

  • שאלה 1: מה ההבדל בין למידה מונחית ולמידה בלתי מונחית?

    • תשובה נכונה: בלמידה מונחית יש תויות, בלמידה בלתי מונחית אין.
  • שאלה 2: מה ההבדל בין סיווג ונסיגה (רגרסיה)?

    • תשובה נכונה: בסיווג, התויות שמית או סידורית. בנסיגה, התויות הן מספר.
  • שאלה 3: מה מהבאים נכון לגבי ההבדל בין סולם רווח וסולם מנה?

    • תשובה נכונה: בסולם רווח אפשר לחשב ממוצע אלגברי, ובסולם מנה אפשר לחשב ממוצע הנדסי.
  • שאלה 4: אילו מחרוזות יחזיר הביטוי הרגולרי '+r'\b[a]\w?

    • תשובה נכונה: מלים שמתחילות באות A גדולה או קטנה.
  • שאלה 5: מהו תרשים כינור?

    • תשובה נכונה: תרשים שמשלב תרשים קופסה עם ההתפלגות של נתון מסוים.
  • שאלה 6: מהו Z-Score?

    • תשובה נכונה: מדד שמציין את מספר סטיות התקן שהערך נמצא מעל או מתחת לממוצע.
  • שאלה 7: איזה מושג מתואר בדיאגרמה של (science) ו (your prior beliefs)?

    • תשובה נכונה: הטיית אישור.
  • שאלה 8: חשבו את סטיית התקן הלא מוטית של הנתונים הבאים [48,65,3 ,1.92, מאמא, 1.58, 2.58, 1.87].

    • תשובה נכונה: 1.92.
  • שאלה 9: מה ניתן לומר על המתאם בין המאפיינים X1,X2 בכל אחד מהתרשימים הבאים?

    • תשובה נכונה: בתרשים הימני יש מתאם קרוב לאפס, בתרשים האמצעי מתאם שלילי, ובתרשים השמאלי מתאם חיובי.
  • שאלה 10: איזו ספרייה בפייתון משמשת לביצוע ניתוח וטיפול במידע?

    • תשובה נכונה: Pandas.
  • שאלה 11: מהי המטרה המרכזית של ויזואליזציה?

    • תשובה נכונה: לתקשר מידע באופן אפקטיבי.
  • שאלה 12: מה ההבדל בין DataFrame לבין Series?

    • תשובה נכונה: DataFrame הוא דו-ממדי, בעוד Series הוא חד-ממדי.
  • שאלה 13: איזו ספרייה משמשת לביצוע scraping?

    • תשובה נכונה: BeautifulSoup.
  • שאלה 14: למה משמשת הפקודה find_all()?

    • תשובה נכונה: להחזיר רשימה של תגיות שמתאימות לקריטריון מסוים במסמך.
  • שאלה 15: איזה קוד HTTP מסמן פקודת GET שהצליחה?

    • תשובה נכונה: 200 (OK).
  • שאלה 16: איזו פקודה משמשת לקבלת התוכן של response שקיבלתם בפקודת get?

    • תשובה נכונה: response.text.
  • שאלה 17: איזו תת-ספריה מקובל לייבא כ-plt?

    • תשובה נכונה: matplotlib.pyplot.
  • שאלה 18: איך מוסיפים מקרא לגרף?

    • תשובה נכונה: plt.legend().
  • שאלה 19: השלימו את קטע הקוד הבא (חלק מהקוד חסר).

    • תשובה נכונה: df.fillna(df.mean(), inplace=True).
  • שאלה 20: מה מהבאים הוא מודל למידה לא מונחית?

    • תשובה נכונה: Kmeans.
  • שאלה 21: איזו מהספריות הבאות בפייתון משמשת לעיתים קרובות עבור למידה מונחית?

    • תשובה נכונה: Scikit-learn.
  • שאלה 22: איזה מאלגוריתמי הלמידה הבאים שייך ללמידה מונחית?

    • תשובה נכונה: SVM (Support Vector Machine).
  • שאלה 23: כיצד ניתן להשתמש ב-KMeans מתוך הספרייה scikit-learn?

    • תשובה נכונה: from sklearn.cluster import KMeans.
  • שאלה 24: מה תחזיר הפקודה הבאה ב-DataFrame בשם df?

    • תשובה נכונה: תמלא את הערכים הריקים (NaN) בעמודה B עם הממוצע של עמודה B, רק עבור השורות שבהן הערך ב-A הוא NaN.
  • שאלה 25: כיצד ניתן לזהות Outliers (חריגים) בעמודה column1 ב-DataFrame באמצעות השיטה של טווח בין-רבעוני (IQR)?

    • תשובה נכונה: q1 = df['column1'].quantile(0.25), q3 = df['column1'].quantile(0.75), iqr = q3 - q1, df[(df['column1'] < q1 - 1.5 * iqr) | (df['column1'] > q3 + 1.5 * iqr)].

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser