Data Science - Pandas Quiz

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

איזו פקודה משמשת לקבלת התוכן של response?

  • response.html()
  • response.data()
  • response.content()
  • response.text. (correct)

מהו הפלט שמתקבל כאשר משתמשים בפקודת response.content()?

  • מחרוזת של טקסט
  • בייטים גולמיים (correct)
  • קובץ HTML
  • נתוני JSON

מה ההבדל בין response.text ל-response.content?

  • אין הבדל ביניהם
  • response.text מחזירה בייטים גולמיים בלבד
  • response.text לפורמט UTF-8, response.content לא (correct)
  • response.content מחזירה מחרוזת של טקסט

מה לא נכון לגבי response.data()?

<p>זו פקודה קיימת (D)</p> Signup and view all the answers

איזו פקודה לא מתאימה לאיסוף תוכן מגזירת response?

<p>response.all() (C)</p> Signup and view all the answers

מה התוצאה שהפקודה 'df.loc[df['A'].isnull(), 'B'] = df['B'].mean()' תחזיר?

<p>היא תמלא את הערכים הריקים בעמודה B עם הממוצע של עמודה B, רק עבור השורות שבהן הערך ב-A הוא NaN. (B)</p> Signup and view all the answers

מהי השיטה הנכונה לזיהוי חריגים בעמודה column1 ב-DataFrame בעזרת טווח בין-רבעוני (IQR)?

<p>קובעים את טווח IQR ומחליטים על חריגים כחורגים מהגבול הנמוך והגבוה של הטווח. (A)</p> Signup and view all the answers

מהי השגיאה הנפוצה כאשר מנסים למלא ערכים ריקים בעמודה תוך שימוש ב-DataFrame?

<p>שגיאה בגישה לעמודה שאינה קיימת ב-DataFrame. (B)</p> Signup and view all the answers

אילו ערכים יוכלו להיחשב חריגים בעזרת טווח IQR?

<p>ערכים גבוהים במיוחד או נמוכים במיוחד בהשוואה לשאר הנתונים. (A)</p> Signup and view all the answers

מה נכון לגבי השימוש בפקודה 'loc' ב-DataFrame?

<p>הפקודה loc ניתן להשתמש בה גם למילוי ערכים בתנאים מסוימים. (A)</p> Signup and view all the answers

מהי המטרה של השורות בקוד המוצג?

<p>למצוא ערכים שנמצאים מתחת לאחוזון 5 בעמודה. (A), למצוא ערכים שנמצאים מחוץ לאחוזון 95 בעמודה. (D)</p> Signup and view all the answers

מה משמעות המונח 'quantile' בהקשר של הנתונים בקוד?

<p>סטטיסטיקה המחלקת את הנתונים לחלקים שווים. (A)</p> Signup and view all the answers

מהו החישוב המבוצע כדי לקבוע את הגבול העליון לקביעת ערכים חריגים?

<p>$ ext{median} + 1.5 imes ext{std}$ (A)</p> Signup and view all the answers

מהו חישוב השונות המופיע בשורות הקוד?

<p>חישוב הפיזור של הערכים סביב הממוצע. (C)</p> Signup and view all the answers

מהו השימוש ב-Filters בפנדס כדי לזהות ערכים חריגים בעמודה?

<p>השוואת ערכים לגבול הקטגוריה של 1.5 IQR (A), הוספת תנאים כדי למצוא ערכים שעולים על ממוצע + 3 סטיות תקן (B)</p> Signup and view all the answers

מהו תפקיד הפונקציה std בהקשר של עמודה בקוד?

<p>לחישוב הסטיית תקן של הנתונים. (C)</p> Signup and view all the answers

מהו ה-IQR בעבודה עם נתונים?

<p>ההפרש בין הרבעון השלישי לרבעון הראשון (A)</p> Signup and view all the answers

באיזה מצב נחשב ערך לחריג בעבודת פנדס?

<p>כאשר ערך גבוה מהממוצע + 3 סטיות תקן (B)</p> Signup and view all the answers

כיצד בונים את ה-IQR בעבודה עם נתונים?

<p>על ידי חיסור של הרבעון הראשון מהרבעון השלישי (A)</p> Signup and view all the answers

מהו התהליך הנדרש למציאת הרבעונים בעבודה עם עמודה בפנדס?

<p>שימוש בפונקציות כמו quantile כדי למצוא את ערכי הרבעונים (D)</p> Signup and view all the answers

איזו תת ספרייה מקובל לייבא כ matplotlib.pyplot?

<p>matplotlib (C)</p> Signup and view all the answers

איך מוסיפים מקרא לגרף?

<p>plt.legend() (A)</p> Signup and view all the answers

מהו הקוד המלא המתאים ל- fillna של DataFrame?

<p>df = df.replace(np.nan, df.mean()) (A)</p> Signup and view all the answers

מה מהבאים הוא מודל למידה לא מונחית?

<p>Kmeans (B)</p> Signup and view all the answers

איזו מהספריות הבאות בפייתון משמשת לעיתים קרובות עבור למידה מונחית?

<p>scikit-learn (D)</p> Signup and view all the answers

איזה מאלגוריתמי הלמידה הבאים שייך ללמידה מונחית?

<p>SVM (Support Vector Machine) (D)</p> Signup and view all the answers

כיצד ניתן להשתמש ב-KMeans מתוך הספרייה scikit-learn?

<p>from sklearn.cluster import KMeans (A)</p> Signup and view all the answers

איזו ספרייה היא לא ספריית נתונים בקוד של DataFrame?

<p>matplotlib (C)</p> Signup and view all the answers

מהי הפעולה הנכונה לדווג על מנת להמיר ערכים חסרים ב-median?

<p>df.fillna(df.median(), inplace=True) (A)</p> Signup and view all the answers

איזו פונקציה נפוצה דווקא לא משמשת להוספת מקרא?

<p>plt.add_legend() (D)</p> Signup and view all the answers

מה ההבדל העיקרי בין למידה מונחית ולמידה בלתי מונחית?

<p>בלמידה מונחית יש תויות שמסייעות לאלגוריתם, בבלתי מונחית אין. (A)</p> Signup and view all the answers

במה מתבטא ההבדל בין סיווג לנסיגה (רגרסיה)?

<p>נסיגה מתמקדת בנתונים מספריים ובסיווג בקטגוריאליים. (D)</p> Signup and view all the answers

איזו סוג פונקציה מחושב בסולם רווח?

<p>פונקציית רווח בלבד. (D)</p> Signup and view all the answers

מה תכלול המחרוזת המוחזרת על ידי הביטוי הרגולרי 'r\b[Aa]\w+'?

<p>מילים שמתחילות באות A גדולה. (D)</p> Signup and view all the answers

מהו תרשים כינור?

<p>תרשים המשלב את התפלגות הנתון. (D)</p> Signup and view all the answers

מה מדד ה-Z-Score?

<p>ערך שמייצג את המיקום היחסי של ערך מקורי. (C)</p> Signup and view all the answers

מהו ביטוי 'הטיית אישור'?

<p>התמקדות במידע המאשר הנחות קיימות. (C)</p> Signup and view all the answers

מהי סטיית התקן הלא מוטית של הנתונים הבאים [4,8,6,5,3]?

<p>1.92. (B)</p> Signup and view all the answers

מה ניתן לומר על המתאם בין המאפיינים X1, X2 בתרשים?

<p>יש מתאם חיובי, שלילי או קרוב לאפס בהתאם לגרף. (D)</p> Signup and view all the answers

איזו ספריה בפייתון מתמקדת בניתוח נתונים?

<p>Pandas. (C)</p> Signup and view all the answers

מהי המטרה המרכזית של ויזואליזציה?

<p>תקשורת מידע בצורה בהירה. (D)</p> Signup and view all the answers

מה ההגדרה של DataFrame?

<p>דו מימדי, מכיל מערכות נתונים מורכבות. (C)</p> Signup and view all the answers

איזו ספריה משמשת ל-scraping?

<p>BeautifulSoup. (A)</p> Signup and view all the answers

למה פקודת find_all משמשת?

<p>להחזיר את כל התגיות במסמך. (D)</p> Signup and view all the answers

איזה קוד HTTP מציין שהפקודה GET הצליחה?

<ol start="200"> <li>(D)</li> </ol> Signup and view all the answers

Flashcards

response.content()

פקודה שמחזירה את תוכן התגובה כ-Binary.

response.text

פקודה הממירה את תוכן התגובה לטקסט Unicode.

response.html()

פקודה לא קיימת לקבלת תוכן HTML.

response.data()

פקודה לא קיימת במילון הפקודות.

Signup and view all the flashcards

בחירת פקודות

יש לבחור את הפקודה הנכונה לפי ההקשר.

Signup and view all the flashcards

למידה מונחית

למידה שבה מתבצע תהליך עם משימה ותוויות נתונים.

Signup and view all the flashcards

למידה בלתי מונחית

למידה ללא תוויות, שלא מספקת הנחיות.

Signup and view all the flashcards

סיווג

תהליך שבו מזהים תוויות לנתונים ממוסדים.

Signup and view all the flashcards

נסיגה (רגרסיה)

תהליך שבו המודל חוזר לנתונים שהוא כבר נחשף אליהם.

Signup and view all the flashcards

סולם רווח

סולם שבו המספרים הם שלמים וישם מרווחים קבועים.

Signup and view all the flashcards

סולם מנה

סולם שבו המרווחים בין המספרים יכולים להיות רציונליים.

Signup and view all the flashcards

Z-Score

מדד המציין סטיות תקן מעל או מתחת לממוצע.

Signup and view all the flashcards

הטיית אישור

נטייה לאשר מידע שמאמת את העמדות שלנו.

Signup and view all the flashcards

סטיית תקן

מדד המראה את הפיזור של ערכים סביב הממוצע.

Signup and view all the flashcards

ספריית Pandas

ספרייה בפייתון המיועדת לניתוח וטיפול במידע.

Signup and view all the flashcards

ויזואליזציה

הצגת נתונים באופן המקל על הבנת המידע.

Signup and view all the flashcards

DataFrame

מבנה נתונים דו-מימדי בפייתון לאחסון נתונים.

Signup and view all the flashcards

Series

מבנה נתונים חד-מימדי בפייתון.

Signup and view all the flashcards

BeautifulSoup

ספרייה בפייתון לביצוע scraping של מידע.

Signup and view all the flashcards

פקודת find_all

מוצאת את כל התגיות שמתאימות לקריטריון במסמך.

Signup and view all the flashcards

חציון רבעון ראשון (Q1)

ערך שמפריד בין 25% מהנתונים הנמוכים ל-75% הגבוהים.

Signup and view all the flashcards

חציון רבעון שלישי (Q3)

ערך שמפריד בין 75% מהנתונים הנמוכים ל-25% הגבוהים.

Signup and view all the flashcards

אינטרקוורטיל טווח (IQR)

ההפרש בין החציון הרבעון שלישי לחציון רבעון ראשון.

Signup and view all the flashcards

זיהוי ערכים חריגים

הליך לזיהוי נתונים שמחוץ לטווח הנורמלי.

Signup and view all the flashcards

סינון ערכים חריגים

הסרת ערכים מוגזמים לפי גבולות IQR.

Signup and view all the flashcards

פקודת loc

משתמשים בה כדי לבחור שורות ועמודות ב-DataFrame לפי תוויות.

Signup and view all the flashcards

ממוצע של עמודה B

סכום כל הערכים בעמודה B חלקי מספר הערכים הלא ריקים.

Signup and view all the flashcards

ערכים ריקים (NaN)

ערכים שאין להם נתון או הם חסרים ב-DataFrame.

Signup and view all the flashcards

חריגים (Outliers)

ערכים בולטים שאינם תואמים את יתר הנתונים בעמודה.

Signup and view all the flashcards

שיטה של טווח בין-רבעוני (IQR)

שיטה לחישוב גבולות לתחום הנתונים ולזיהוי חריגים.

Signup and view all the flashcards

מדד סטנדרטי

ערך המודד את הפיזור של נתונים סביב הממוצע.

Signup and view all the flashcards

חציון

הערך שבחציו של סדר הנתונים ממוקמים ערכים קטנים וגדולים בשוויון.

Signup and view all the flashcards

חוקו של 1.5

שיטה לזיהוי ערכים חריגים על סמך סטנדרטים של חציון וסטנדרט.

Signup and view all the flashcards

קוונטיל

מקטע של נתונים המפריד את הערכים לקטע נמוך וקטע גבוה.

Signup and view all the flashcards

ערכים חריגים

נתונים שנמצאים מחוץ לתחום הצפוי או התקני.

Signup and view all the flashcards

ייבוא matplotlib

הספריה הנפוצה ליצירת גרפים בפייתון.

Signup and view all the flashcards

הוספת מקרא לגרף

פקודת התכנה להוספת תוויות לגרפים במ matplotlib.

Signup and view all the flashcards

שימוש בfillna

שיטה למילוי ערכי NaN ב-dataframe.

Signup and view all the flashcards

למידה לא מונחית

סוג למידה המזהה דפוסים ללא תוויות.

Signup and view all the flashcards

ספריית scikit-learn

ספריית פייתון פופולרית למודלים של למידה חישובית.

Signup and view all the flashcards

SVM

אלגוריתם למידה מונחית המפריד בין קבוצות.

Signup and view all the flashcards

ייבוא KMeans

פקודת ייבוא אלגוריתם הקלאסטרינג KMeans מ-scikit-learn.

Signup and view all the flashcards

NaN

ייצוג עבור ערך חסר ב-dataframe.

Signup and view all the flashcards

מילוי עם ממוצע

שיטה למילוי ערכי NaN לפי ממוצע עמודה.

Signup and view all the flashcards

Study Notes

מבחן לדוגמה - מבוא למדעי הנתונים

  • מספר קורס: לא צוין
  • סמסטר: חורף תשפ"ה
  • תאריך הבחינה: לא צוין
  • מרצים: פרופ' יהונתן שלר, ד"ר נעמה קופלמן
  • משך הבחינה: שעתיים
  • חומר עזר: מחשבון
  • מבנה הבחינה: בחינה רב-ברירתית
  • הוראות כלליות: לסמן את התשובה הנכונה מבין ארבע אפשרויות. בהצלחה!

שאלות בחינה

  • שאלה 1: השוואה בין למידה מונחית בלתי מונחית. התשובה הנכונה: בלמידה מונחית יש תויות, בלמידה בלתי מונחית אין.
  • שאלה 2: השוואה בין סיווג ונסיגה. התשובה הנכונה: בסיווג, התויות הן שמית או סידורית. בנסיגה התויות הן מספרים.
  • שאלה 3: השוואה בין סולם רווח וסולם מנה. התשובה הנכונה: בסולם רווח אפשר לחשב ממוצע אלגברי, ובסולם מנה אפשר לחשב ממוצע הנדסי.
  • שאלה 4: ניתוח ביטוי רגולרי '+r'\b[a]\w. התשובה הנכונה: מלים שמתחילות באות A גדולה או קטנה.
  • שאלה 5: מהו תרשים כינור? התשובה הנכונה: תרשים המשלב תרשים קופסה יחד עם ההתפלגות של נתון מסוים.
  • שאלה 6: מהו Z-Score? התשובה הנכונה: מדד המציין את מספר סטיות התקן שהערך נמצא מעל או מתחת לממוצע.
  • שאלה 7: מושג מתואר בדיאגרמה. התשובה הנכונה: הטיית אישור.
  • שאלה 8: חישוב סטיית תקן לא מוטית. התשובה היא 1.92
  • שאלה 9: מתאם בין מאפיינים X1 ו-X2 בתרשימים. התשובה הנכונה: בגרף הימני מתאם קרוב לאפס, בגרף האמצעי שלילי, בגרף השמאלי חיובי.
  • שאלה 10: ספרייה לניתוח וטיפול בנתונים בפייתון. התשובה הנכונה: Pandas.
  • שאלה 11: מטרה מרכזית של ויזואליזציה. התשובה הנכונה: לתקשר מידע באופן אפקטיבי.
  • שאלה 12: הבדל בין DataFrame ו-Series. התשובה הנכונה: DataFrame דו-מימדי, Series חד-מימדי.
  • שאלה 13: ספרייה ל-Scraping. התשובה הנכונה: Beautiful Soup.
  • שאלה 14: תפקיד הפקודה find_all. התשובה הנכונה: להחזיר רשימה של כל התגיות שמתאימות לקריטריון במסמך.
  • שאלה 15: קוד HTTP ל-GET מוצלח. התשובה הנכונה: 200
  • שאלה 16: קבלת תוכן של response. התשובה הנכונה: response.text
  • שאלה 17: תת-ספרייה להצגת גרפים. התשובה הנכונה: matplotlib.pyplot
  • שאלה 18: הוספת מקרא לגרף. התשובה הנכונה: plt.legend
  • שאלה 19: מילוי ערכים חסרים ב-DataFrame. התשובה הנכונה: df = df.replace(np.nan, df.mean()).
  • שאלה 20: מודל למידה לא מונחית. התשובה הנכונה: K-Means.
  • שאלה 21: ספרייה בפייתון ללמידה מונחית. התשובה הנכונה: scikit-learn.
  • שאלה 22: אלגוריתם למידה מונחית. התשובה הנכונה: SVM (Support Vector Machine).
  • שאלה 23: שימוש ב-KMeans מ-scikit-learn. התשובה הנכונה: from sklearn.cluster import KMeans.
  • שאלה 24: פעולה על עמודה ב-DataFrame. התשובה הנכונה: ממלאת את ה-NaNs בעמודה 'B' בערך הממוצע של 'B'.
  • שאלה 25: זיהוי Outliers בשיטה IQR. התשובה הנכונה: q1 = df['column1'].quantile(0.25); q3 = df['column1'].quantile(0.75); iqr = q3 - q1; df[(df['column1'] < q1 - 1.5 * iqr) | (df['column1'] > q3 + 1.5 * iqr)].

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Pandas DataFrame Selection Quiz
12 questions
Pandas DataFrame Operations
42 questions
Use Quizgecko on...
Browser
Browser