Data Science - Pandas Quiz
45 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

איזו פקודה משמשת לקבלת התוכן של response?

  • response.html()
  • response.data()
  • response.content()
  • response.text. (correct)
  • מהו הפלט שמתקבל כאשר משתמשים בפקודת response.content()?

  • מחרוזת של טקסט
  • בייטים גולמיים (correct)
  • קובץ HTML
  • נתוני JSON
  • מה ההבדל בין response.text ל-response.content?

  • אין הבדל ביניהם
  • response.text מחזירה בייטים גולמיים בלבד
  • response.text לפורמט UTF-8, response.content לא (correct)
  • response.content מחזירה מחרוזת של טקסט
  • מה לא נכון לגבי response.data()?

    <p>זו פקודה קיימת (D)</p> Signup and view all the answers

    איזו פקודה לא מתאימה לאיסוף תוכן מגזירת response?

    <p>response.all() (C)</p> Signup and view all the answers

    מה התוצאה שהפקודה 'df.loc[df['A'].isnull(), 'B'] = df['B'].mean()' תחזיר?

    <p>היא תמלא את הערכים הריקים בעמודה B עם הממוצע של עמודה B, רק עבור השורות שבהן הערך ב-A הוא NaN. (B)</p> Signup and view all the answers

    מהי השיטה הנכונה לזיהוי חריגים בעמודה column1 ב-DataFrame בעזרת טווח בין-רבעוני (IQR)?

    <p>קובעים את טווח IQR ומחליטים על חריגים כחורגים מהגבול הנמוך והגבוה של הטווח. (A)</p> Signup and view all the answers

    מהי השגיאה הנפוצה כאשר מנסים למלא ערכים ריקים בעמודה תוך שימוש ב-DataFrame?

    <p>שגיאה בגישה לעמודה שאינה קיימת ב-DataFrame. (B)</p> Signup and view all the answers

    אילו ערכים יוכלו להיחשב חריגים בעזרת טווח IQR?

    <p>ערכים גבוהים במיוחד או נמוכים במיוחד בהשוואה לשאר הנתונים. (A)</p> Signup and view all the answers

    מה נכון לגבי השימוש בפקודה 'loc' ב-DataFrame?

    <p>הפקודה loc ניתן להשתמש בה גם למילוי ערכים בתנאים מסוימים. (A)</p> Signup and view all the answers

    מהי המטרה של השורות בקוד המוצג?

    <p>למצוא ערכים שנמצאים מתחת לאחוזון 5 בעמודה. (A), למצוא ערכים שנמצאים מחוץ לאחוזון 95 בעמודה. (D)</p> Signup and view all the answers

    מה משמעות המונח 'quantile' בהקשר של הנתונים בקוד?

    <p>סטטיסטיקה המחלקת את הנתונים לחלקים שווים. (A)</p> Signup and view all the answers

    מהו החישוב המבוצע כדי לקבוע את הגבול העליון לקביעת ערכים חריגים?

    <p>$ ext{median} + 1.5 imes ext{std}$ (A)</p> Signup and view all the answers

    מהו חישוב השונות המופיע בשורות הקוד?

    <p>חישוב הפיזור של הערכים סביב הממוצע. (C)</p> Signup and view all the answers

    מהו השימוש ב-Filters בפנדס כדי לזהות ערכים חריגים בעמודה?

    <p>השוואת ערכים לגבול הקטגוריה של 1.5 IQR (A), הוספת תנאים כדי למצוא ערכים שעולים על ממוצע + 3 סטיות תקן (B)</p> Signup and view all the answers

    מהו תפקיד הפונקציה std בהקשר של עמודה בקוד?

    <p>לחישוב הסטיית תקן של הנתונים. (C)</p> Signup and view all the answers

    מהו ה-IQR בעבודה עם נתונים?

    <p>ההפרש בין הרבעון השלישי לרבעון הראשון (A)</p> Signup and view all the answers

    באיזה מצב נחשב ערך לחריג בעבודת פנדס?

    <p>כאשר ערך גבוה מהממוצע + 3 סטיות תקן (B)</p> Signup and view all the answers

    כיצד בונים את ה-IQR בעבודה עם נתונים?

    <p>על ידי חיסור של הרבעון הראשון מהרבעון השלישי (A)</p> Signup and view all the answers

    מהו התהליך הנדרש למציאת הרבעונים בעבודה עם עמודה בפנדס?

    <p>שימוש בפונקציות כמו quantile כדי למצוא את ערכי הרבעונים (D)</p> Signup and view all the answers

    איזו תת ספרייה מקובל לייבא כ matplotlib.pyplot?

    <p>matplotlib (C)</p> Signup and view all the answers

    איך מוסיפים מקרא לגרף?

    <p>plt.legend() (A)</p> Signup and view all the answers

    מהו הקוד המלא המתאים ל- fillna של DataFrame?

    <p>df = df.replace(np.nan, df.mean()) (A)</p> Signup and view all the answers

    מה מהבאים הוא מודל למידה לא מונחית?

    <p>Kmeans (B)</p> Signup and view all the answers

    איזו מהספריות הבאות בפייתון משמשת לעיתים קרובות עבור למידה מונחית?

    <p>scikit-learn (D)</p> Signup and view all the answers

    איזה מאלגוריתמי הלמידה הבאים שייך ללמידה מונחית?

    <p>SVM (Support Vector Machine) (D)</p> Signup and view all the answers

    כיצד ניתן להשתמש ב-KMeans מתוך הספרייה scikit-learn?

    <p>from sklearn.cluster import KMeans (A)</p> Signup and view all the answers

    איזו ספרייה היא לא ספריית נתונים בקוד של DataFrame?

    <p>matplotlib (C)</p> Signup and view all the answers

    מהי הפעולה הנכונה לדווג על מנת להמיר ערכים חסרים ב-median?

    <p>df.fillna(df.median(), inplace=True) (A)</p> Signup and view all the answers

    איזו פונקציה נפוצה דווקא לא משמשת להוספת מקרא?

    <p>plt.add_legend() (D)</p> Signup and view all the answers

    מה ההבדל העיקרי בין למידה מונחית ולמידה בלתי מונחית?

    <p>בלמידה מונחית יש תויות שמסייעות לאלגוריתם, בבלתי מונחית אין. (A)</p> Signup and view all the answers

    במה מתבטא ההבדל בין סיווג לנסיגה (רגרסיה)?

    <p>נסיגה מתמקדת בנתונים מספריים ובסיווג בקטגוריאליים. (D)</p> Signup and view all the answers

    איזו סוג פונקציה מחושב בסולם רווח?

    <p>פונקציית רווח בלבד. (D)</p> Signup and view all the answers

    מה תכלול המחרוזת המוחזרת על ידי הביטוי הרגולרי 'r\b[Aa]\w+'?

    <p>מילים שמתחילות באות A גדולה. (D)</p> Signup and view all the answers

    מהו תרשים כינור?

    <p>תרשים המשלב את התפלגות הנתון. (D)</p> Signup and view all the answers

    מה מדד ה-Z-Score?

    <p>ערך שמייצג את המיקום היחסי של ערך מקורי. (C)</p> Signup and view all the answers

    מהו ביטוי 'הטיית אישור'?

    <p>התמקדות במידע המאשר הנחות קיימות. (C)</p> Signup and view all the answers

    מהי סטיית התקן הלא מוטית של הנתונים הבאים [4,8,6,5,3]?

    <p>1.92. (B)</p> Signup and view all the answers

    מה ניתן לומר על המתאם בין המאפיינים X1, X2 בתרשים?

    <p>יש מתאם חיובי, שלילי או קרוב לאפס בהתאם לגרף. (D)</p> Signup and view all the answers

    איזו ספריה בפייתון מתמקדת בניתוח נתונים?

    <p>Pandas. (C)</p> Signup and view all the answers

    מהי המטרה המרכזית של ויזואליזציה?

    <p>תקשורת מידע בצורה בהירה. (D)</p> Signup and view all the answers

    מה ההגדרה של DataFrame?

    <p>דו מימדי, מכיל מערכות נתונים מורכבות. (C)</p> Signup and view all the answers

    איזו ספריה משמשת ל-scraping?

    <p>BeautifulSoup. (A)</p> Signup and view all the answers

    למה פקודת find_all משמשת?

    <p>להחזיר את כל התגיות במסמך. (D)</p> Signup and view all the answers

    איזה קוד HTTP מציין שהפקודה GET הצליחה?

    <ol start="200"> <li>(D)</li> </ol> Signup and view all the answers

    Flashcards

    response.content()

    פקודה שמחזירה את תוכן התגובה כ-Binary.

    response.text

    פקודה הממירה את תוכן התגובה לטקסט Unicode.

    response.html()

    פקודה לא קיימת לקבלת תוכן HTML.

    response.data()

    פקודה לא קיימת במילון הפקודות.

    Signup and view all the flashcards

    בחירת פקודות

    יש לבחור את הפקודה הנכונה לפי ההקשר.

    Signup and view all the flashcards

    למידה מונחית

    למידה שבה מתבצע תהליך עם משימה ותוויות נתונים.

    Signup and view all the flashcards

    למידה בלתי מונחית

    למידה ללא תוויות, שלא מספקת הנחיות.

    Signup and view all the flashcards

    סיווג

    תהליך שבו מזהים תוויות לנתונים ממוסדים.

    Signup and view all the flashcards

    נסיגה (רגרסיה)

    תהליך שבו המודל חוזר לנתונים שהוא כבר נחשף אליהם.

    Signup and view all the flashcards

    סולם רווח

    סולם שבו המספרים הם שלמים וישם מרווחים קבועים.

    Signup and view all the flashcards

    סולם מנה

    סולם שבו המרווחים בין המספרים יכולים להיות רציונליים.

    Signup and view all the flashcards

    Z-Score

    מדד המציין סטיות תקן מעל או מתחת לממוצע.

    Signup and view all the flashcards

    הטיית אישור

    נטייה לאשר מידע שמאמת את העמדות שלנו.

    Signup and view all the flashcards

    סטיית תקן

    מדד המראה את הפיזור של ערכים סביב הממוצע.

    Signup and view all the flashcards

    ספריית Pandas

    ספרייה בפייתון המיועדת לניתוח וטיפול במידע.

    Signup and view all the flashcards

    ויזואליזציה

    הצגת נתונים באופן המקל על הבנת המידע.

    Signup and view all the flashcards

    DataFrame

    מבנה נתונים דו-מימדי בפייתון לאחסון נתונים.

    Signup and view all the flashcards

    Series

    מבנה נתונים חד-מימדי בפייתון.

    Signup and view all the flashcards

    BeautifulSoup

    ספרייה בפייתון לביצוע scraping של מידע.

    Signup and view all the flashcards

    פקודת find_all

    מוצאת את כל התגיות שמתאימות לקריטריון במסמך.

    Signup and view all the flashcards

    חציון רבעון ראשון (Q1)

    ערך שמפריד בין 25% מהנתונים הנמוכים ל-75% הגבוהים.

    Signup and view all the flashcards

    חציון רבעון שלישי (Q3)

    ערך שמפריד בין 75% מהנתונים הנמוכים ל-25% הגבוהים.

    Signup and view all the flashcards

    אינטרקוורטיל טווח (IQR)

    ההפרש בין החציון הרבעון שלישי לחציון רבעון ראשון.

    Signup and view all the flashcards

    זיהוי ערכים חריגים

    הליך לזיהוי נתונים שמחוץ לטווח הנורמלי.

    Signup and view all the flashcards

    סינון ערכים חריגים

    הסרת ערכים מוגזמים לפי גבולות IQR.

    Signup and view all the flashcards

    פקודת loc

    משתמשים בה כדי לבחור שורות ועמודות ב-DataFrame לפי תוויות.

    Signup and view all the flashcards

    ממוצע של עמודה B

    סכום כל הערכים בעמודה B חלקי מספר הערכים הלא ריקים.

    Signup and view all the flashcards

    ערכים ריקים (NaN)

    ערכים שאין להם נתון או הם חסרים ב-DataFrame.

    Signup and view all the flashcards

    חריגים (Outliers)

    ערכים בולטים שאינם תואמים את יתר הנתונים בעמודה.

    Signup and view all the flashcards

    שיטה של טווח בין-רבעוני (IQR)

    שיטה לחישוב גבולות לתחום הנתונים ולזיהוי חריגים.

    Signup and view all the flashcards

    מדד סטנדרטי

    ערך המודד את הפיזור של נתונים סביב הממוצע.

    Signup and view all the flashcards

    חציון

    הערך שבחציו של סדר הנתונים ממוקמים ערכים קטנים וגדולים בשוויון.

    Signup and view all the flashcards

    חוקו של 1.5

    שיטה לזיהוי ערכים חריגים על סמך סטנדרטים של חציון וסטנדרט.

    Signup and view all the flashcards

    קוונטיל

    מקטע של נתונים המפריד את הערכים לקטע נמוך וקטע גבוה.

    Signup and view all the flashcards

    ערכים חריגים

    נתונים שנמצאים מחוץ לתחום הצפוי או התקני.

    Signup and view all the flashcards

    ייבוא matplotlib

    הספריה הנפוצה ליצירת גרפים בפייתון.

    Signup and view all the flashcards

    הוספת מקרא לגרף

    פקודת התכנה להוספת תוויות לגרפים במ matplotlib.

    Signup and view all the flashcards

    שימוש בfillna

    שיטה למילוי ערכי NaN ב-dataframe.

    Signup and view all the flashcards

    למידה לא מונחית

    סוג למידה המזהה דפוסים ללא תוויות.

    Signup and view all the flashcards

    ספריית scikit-learn

    ספריית פייתון פופולרית למודלים של למידה חישובית.

    Signup and view all the flashcards

    SVM

    אלגוריתם למידה מונחית המפריד בין קבוצות.

    Signup and view all the flashcards

    ייבוא KMeans

    פקודת ייבוא אלגוריתם הקלאסטרינג KMeans מ-scikit-learn.

    Signup and view all the flashcards

    NaN

    ייצוג עבור ערך חסר ב-dataframe.

    Signup and view all the flashcards

    מילוי עם ממוצע

    שיטה למילוי ערכי NaN לפי ממוצע עמודה.

    Signup and view all the flashcards

    Study Notes

    מבחן לדוגמה - מבוא למדעי הנתונים

    • מספר קורס: לא צוין
    • סמסטר: חורף תשפ"ה
    • תאריך הבחינה: לא צוין
    • מרצים: פרופ' יהונתן שלר, ד"ר נעמה קופלמן
    • משך הבחינה: שעתיים
    • חומר עזר: מחשבון
    • מבנה הבחינה: בחינה רב-ברירתית
    • הוראות כלליות: לסמן את התשובה הנכונה מבין ארבע אפשרויות. בהצלחה!

    שאלות בחינה

    • שאלה 1: השוואה בין למידה מונחית בלתי מונחית. התשובה הנכונה: בלמידה מונחית יש תויות, בלמידה בלתי מונחית אין.
    • שאלה 2: השוואה בין סיווג ונסיגה. התשובה הנכונה: בסיווג, התויות הן שמית או סידורית. בנסיגה התויות הן מספרים.
    • שאלה 3: השוואה בין סולם רווח וסולם מנה. התשובה הנכונה: בסולם רווח אפשר לחשב ממוצע אלגברי, ובסולם מנה אפשר לחשב ממוצע הנדסי.
    • שאלה 4: ניתוח ביטוי רגולרי '+r'\b[a]\w. התשובה הנכונה: מלים שמתחילות באות A גדולה או קטנה.
    • שאלה 5: מהו תרשים כינור? התשובה הנכונה: תרשים המשלב תרשים קופסה יחד עם ההתפלגות של נתון מסוים.
    • שאלה 6: מהו Z-Score? התשובה הנכונה: מדד המציין את מספר סטיות התקן שהערך נמצא מעל או מתחת לממוצע.
    • שאלה 7: מושג מתואר בדיאגרמה. התשובה הנכונה: הטיית אישור.
    • שאלה 8: חישוב סטיית תקן לא מוטית. התשובה היא 1.92
    • שאלה 9: מתאם בין מאפיינים X1 ו-X2 בתרשימים. התשובה הנכונה: בגרף הימני מתאם קרוב לאפס, בגרף האמצעי שלילי, בגרף השמאלי חיובי.
    • שאלה 10: ספרייה לניתוח וטיפול בנתונים בפייתון. התשובה הנכונה: Pandas.
    • שאלה 11: מטרה מרכזית של ויזואליזציה. התשובה הנכונה: לתקשר מידע באופן אפקטיבי.
    • שאלה 12: הבדל בין DataFrame ו-Series. התשובה הנכונה: DataFrame דו-מימדי, Series חד-מימדי.
    • שאלה 13: ספרייה ל-Scraping. התשובה הנכונה: Beautiful Soup.
    • שאלה 14: תפקיד הפקודה find_all. התשובה הנכונה: להחזיר רשימה של כל התגיות שמתאימות לקריטריון במסמך.
    • שאלה 15: קוד HTTP ל-GET מוצלח. התשובה הנכונה: 200
    • שאלה 16: קבלת תוכן של response. התשובה הנכונה: response.text
    • שאלה 17: תת-ספרייה להצגת גרפים. התשובה הנכונה: matplotlib.pyplot
    • שאלה 18: הוספת מקרא לגרף. התשובה הנכונה: plt.legend
    • שאלה 19: מילוי ערכים חסרים ב-DataFrame. התשובה הנכונה: df = df.replace(np.nan, df.mean()).
    • שאלה 20: מודל למידה לא מונחית. התשובה הנכונה: K-Means.
    • שאלה 21: ספרייה בפייתון ללמידה מונחית. התשובה הנכונה: scikit-learn.
    • שאלה 22: אלגוריתם למידה מונחית. התשובה הנכונה: SVM (Support Vector Machine).
    • שאלה 23: שימוש ב-KMeans מ-scikit-learn. התשובה הנכונה: from sklearn.cluster import KMeans.
    • שאלה 24: פעולה על עמודה ב-DataFrame. התשובה הנכונה: ממלאת את ה-NaNs בעמודה 'B' בערך הממוצע של 'B'.
    • שאלה 25: זיהוי Outliers בשיטה IQR. התשובה הנכונה: q1 = df['column1'].quantile(0.25); q3 = df['column1'].quantile(0.75); iqr = q3 - q1; df[(df['column1'] < q1 - 1.5 * iqr) | (df['column1'] > q3 + 1.5 * iqr)].

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Description

    מבחן זה עוסק בשאלות שונות על ספריית פנדה ב-Python. תמצאו שאלות על שימוש בפקודות שונות, טיפול בערכים חסרים וזיהוי חריגים במסגרת DataFrame. זהו מבחן חובה לכל המעוניינים לחדד את הידע שלהם בעבודה עם נתונים.

    More Like This

    Use Quizgecko on...
    Browser
    Browser