מבחן מבוא למדעי הנתונים
32 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

מה ייחודי לגבי מטרת הקלאסטרינג בניתוח נתונים?

  • להציג נתונים באופן מסורתי
  • לשפר את איכות הנתונים
  • לפי דפוסים וקשרים בנתונים (correct)
  • לשמור על כל הממדים הנתונים

איזו מטרה מתאימה ביותר להיסטוגרמה כשיטת ויזואליזציה?

  • הצגת מגמות בעיתיות של נתונים לאורך זמן
  • הצגת קשרים בין משתנים שונים
  • הצגת נתונים קטגוריאליים באמצעות חלקי עוגה
  • הצגת שכיחות טווח של ערכים רציפים (correct)

איזו מטרה מתוך האפשרויות נחשבת להעיקרית בשימוש בכלי חיזוי?

  • הפחתת ממדיות של נתונים
  • חיזוי אירועים עתידיים (correct)
  • תרגום נתונים גדולים לפרמטרים מדויקים
  • זיהוי דפוסים היסטוריים

איזו משיטות הויזואליזציה מתאימה להציג נתונים קטגוריאליים?

<p>תרשים עוגה (A)</p> Signup and view all the answers

מהי אחת המטרות העיקריות של הפחתת ממדי נתונים?

<p>להפוך את הנתונים ליותר נגישים להבנה (B)</p> Signup and view all the answers

מה ניתן לומר על המתאם בין המאפיינים X1 ו-X2 בגרף הבא?

<p>ישנו מתאם (קורלציה) לינארית שלילית בין המאפיינים X1 ו-X2. (B)</p> Signup and view all the answers

אילו מחרוזות יכול להחזיר הביטוי הרגולרי הבא?

<p>כל התשובות נכונות. (A)</p> Signup and view all the answers

מהי המטרה של ניתוח חקרני של נתונים (EDA)?

<p>לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם. (A)</p> Signup and view all the answers

מה השלב השני בעבודת מדען הנתונים, לאחר ניסוח שאלת המחקר?

<p>הרכשת נתונים. (A)</p> Signup and view all the answers

אילו סוגי נתונים ניתן לאחסן במסגרת נתונים ב-pandas?

<p>כל התשובות נכונות. (A)</p> Signup and view all the answers

מה מהבאים הינו מבנה נתונים בלתי ניתן לשינוי (immutable)?

<p>טאפל (tuple). (C)</p> Signup and view all the answers

מהו תהליך החקר של נתונים שעוזר להבין את התכנים בצורה מעמיקה?

<p>ניתוח נתונים חקרני. (B)</p> Signup and view all the answers

מה התוצאה של חקר נתונים עם שאילתות לא מתאימות?

<p>גישות לא מדויקות. (C)</p> Signup and view all the answers

כיצד ניתן למשוך נתונים ממקורות חיצוניים לתוך סביבת פיתוח?

<p>לפי אחת מהשיטות הנ״ל. (B)</p> Signup and view all the answers

מהי הסיבה העיקרית להשתמש בניתוח חקרני של נתונים?

<p>לגלות תובנות שלא היו ידועות קודם. (C)</p> Signup and view all the answers

מה תפקיד הטכניקות הסטטיסטיות בניתוח נתונים?

<p>לזהות תבניות ולקבוע מתאם. (D)</p> Signup and view all the answers

מה התוצאה של ניתוח לא מדויק של נתונים?

<p>תובנות שגויות. (A)</p> Signup and view all the answers

מה חשוב לעשות לפני שמתחילים בניתוח נתונים?

<p>להגדיר מטרות ברורות לניתוח. (A)</p> Signup and view all the answers

איזה מבנה נתונים מתייחס למערך חד מימדי בספריית pandas?

<p>Series (A)</p> Signup and view all the answers

מהו תהליך Outlier Detection?

<p>זיהוי ערכים החוריגים מהמאפיין המסוים (A)</p> Signup and view all the answers

באילו תחומים נעשה שימוש בלמידה לא מונחית?

<p>עיבוד שפה טבעית (A), עיבוד תמונה (B), ביולוגיה חישובית (C)</p> Signup and view all the answers

מהו הפלט שיודפס לאחר הרצת פקודה מסוימת על מחרוזת שהוגדרה?

<p>7 1 0 (A)</p> Signup and view all the answers

איזה מהאלגוריתמים הבאים הוא אלגוריתם למידה לא מונחית?

<p>אלגוריתם ניתוח רכיבים ראשיים (PCA) (A)</p> Signup and view all the answers

איזו פקודה ב pandas מציגה את מספר השורות והעמודות במסגרת נתונים?

<p>df.shape (B)</p> Signup and view all the answers

איזו מודול מקובל לייבא כ sns?

<p>seaborn (C)</p> Signup and view all the answers

כדי לכתוב DataFrame לקובץ csv יש להשתמש בפקודה הבאה?

<p>to_csv (C)</p> Signup and view all the answers

איזה מדד/מטריקה משמש להחלפת ערכים חסרים בנתונים קטגוריאליים?

<p>הערך השכיח (C)</p> Signup and view all the answers

איזה מהמודולים הבאים נשתמש לצורך הרכשת נתונים בעזרת web-API?

<p>requests (B)</p> Signup and view all the answers

מהי המטרה העיקרית של אלגוריתמי אשכול?

<p>קיבוץ נתונים דומים (B)</p> Signup and view all the answers

מהו תהליך חיזוי בבעיית ניתוח רגרסיה?

<p>קביעת ערך חדש על בסיס נתונים קודמים (A)</p> Signup and view all the answers

איזה מודול בשפת הפייתון שמים בדרך כלל לצורך ניתוח טקסט?

<p>nltk (D)</p> Signup and view all the answers

מהו תהליך פאונארדינג ב-pandas?

<p>אחזור נתונים מסוימים (A)</p> Signup and view all the answers

Flashcards

קיבוץ (Clustering)

שיטה המזהה דפוסים וקשרים בנתונים כדי להפחית ממדיות.

היסטוגרמה

שיטת ויזואליזציה להצגת שכיחות ערכים רציפים בעמודות מלבניות.

הפחתת ממדיות

תהליך לצמצום כמות הנתונים תוך שמירה על מידע משמעותי.

חזיית אירועים עתידיים

שיטה שמסייעת לחזות מגמות או תוצאות על סמך נתונים קיימים.

Signup and view all the flashcards

קשרי קורלציות

הצגת הקשרים בין משתנים שונים בעזרתה של גרפיקת נתונים.

Signup and view all the flashcards

קורלציה שלילית

מתאם לינארי בין משתנים שבו עלייה באחד מביאה לירידה באחר.

Signup and view all the flashcards

קורלציה חיובית

מתאם לינארי בין משתנים שבו עלייה באחד מביאה לעלייה גם באחר.

Signup and view all the flashcards

EDA

תהליך זיהוי תבניות בקבוצות נתונים, שאינן מובנות מאליהן.

Signup and view all the flashcards

שאלת מחקר

שאלה המנחה את המחקר ומניעה את התהליך.

Signup and view all the flashcards

הרכשת נתונים

שלב בו אוספים נתונים כדי לבדוק את שאלת המחקר.

Signup and view all the flashcards

מבנה נתונים בלתי ניתן לשינוי

טיפוס נתונים שלא ניתן לשנות לאחר יצירתו, כמו טאפל.

Signup and view all the flashcards

pandas

ספרייה ב-Python לאחסון וניתוח נתונים, תומכת במבנים כמו מס' וטקסט.

Signup and view all the flashcards

כתובת דוא''ל

מחרוזת המייצגת כתובת כדי לשלוח ולקבל מיילים.

Signup and view all the flashcards

כתובת URL פשוטה

מחרוזת המספקת כתובת לאתר באינטרנט.

Signup and view all the flashcards

מתאם לינארי

תיאור סטטיסטי של הקשר בין שני משתנים, חיובי או שלילי.

Signup and view all the flashcards

ניתוח מתקדם

תהליך שמערב מודלים מתודיים כדי להפיק תובנות מנתונים.

Signup and view all the flashcards

סולם מנה

סולם מדידה שבו אין אפס מוחלט והמרחקים משמעותיים.

Signup and view all the flashcards

סולם רווח

סולם מדידה שבו המרחקים משמעותיים ויש אפס מוחלט.

Signup and view all the flashcards

מבנה נתונים במערך חד מימדי

המבנה הנתונים המתאים לכך בספריית pandas הוא Series.

Signup and view all the flashcards

Outlier Detection

תהליך זיהוי ערכים החורגים באופן משמעותי משאר הערכים.

Signup and view all the flashcards

למידה לא מונחית

שיטה בה משתמשים בתהליך עיבוד ללא תוויות נתונים ידועות.

Signup and view all the flashcards

פלט בפייתון

הפלט שיודפס תלוי בקוד שהוגדר, כמו 2 False True.

Signup and view all the flashcards

אלגוריתם למידה לא מונחית

דוגמה לזה הוא אלגוריתם ניתוח רכיבים ראשיים (PCA).

Signup and view all the flashcards

פקודה להצגת תצורת הנתונים

הפקודה df.shape מציגה את מספר השורות והעמודות במסגרת הנתונים.

Signup and view all the flashcards

מודול seaborn

מודול פופולרי לצורך אנליזת נתונים וויזואליזציה.

Signup and view all the flashcards

כתיבת DataFrame לקובץ

יש להשתמש בפקודת to_csv כדי לכתוב DataFrame לקובץ csv.

Signup and view all the flashcards

החלפת ערכים חסרים

הערך השכיח משמש להחלפת ערכים חסרים בנתונים קטגוריאליים.

Signup and view all the flashcards

מודולים להרכשת נתונים

בעזרת web-API, המודול requests נפוץ ביותר.

Signup and view all the flashcards

אלגוריתמי אשכול

מטרת אלגוריתמים אלו היא לארגן נתונים לקבוצות על סמך דמיון.

Signup and view all the flashcards

פקודות ב-Pandas

פקודות שונות בפנדס מסייעות בניתוח ועיבוד נתונים.

Signup and view all the flashcards

עיבוד שפה טבעית

תחום בו עושים שימוש בלמידה מכונה לניתוח טקסט.

Signup and view all the flashcards

ביולוגיה חישובית

שימוש בטכניקות חישוביות כדי לנתח נתונים ביולוגיים.

Signup and view all the flashcards

Study Notes

מבחן מבוא למדעי הנתונים - שאלות ותשובות

  • שאלה 1: איזה מבנה נתונים מתייחס למערך חד מימדי בספריית pandas?

    • התשובה הנכונה היא: Series
  • שאלה 2: מהו התהליך המכונה Outlier Detection?

    • זיהוי ערכים החורגים באופן משמעותי מיתר הערכים במאפיין מסוים.
  • שאלה 3: באילו תחומים נעשה שימוש בלמידה לא מונחית (unsupervised learning)?

    • כל התשובות נכונות: עיבוד תמונה (image processing), עיבוד שפה טבעית (natural language processing), ועוד.
  • שאלה 4: מהו הפלט שיוצא מהפקודה הבאה בפייתון? print(txt.count("one"),txt.startswith("one"), txt.endswith("one")) בהינתן txt = "one two One one two two ONE"

    • התשובה הנכונה היא: 2 False True
  • שאלה 5: איזה מהאלגוריתמים הבאים הינו אלגוריתם למידה לא מונחית (unsupervised learning)?

    • אלגוריתם ניתוח רכיבים ראשיים (PCA)
  • שאלה 6: איזו פקודה ב-pandas מציגה את מס' השורות והעמודות במסגרת נתונים?

    • df.shape
  • שאלה 7: איזו מודול (ספריה) מקובל לייבא כ- sns?

    • seaborn
  • שאלה 8: כדי לכתוב DataFrame לקובץ csv יש להשתמש בפקודה הבאה:

    • to_csv
  • שאלה 9: השלימו את הפונקציה הבאה... (ניתן למצוא את הפונקציה המלאה והתשובות לשאלות 9, 1)

  • שאלה 10: איזה מדד/מטריקה משמש להחלפת ערכים חסרים בנתונים קטגוריאליים?

    • הערך השכיח
  • שאלה 11: איזה מודולים משמשים להרשת נתונים בעזרת web-API?

    • requests, BeautifulSoup, Selenium (כל התשובות נכונות)
  • שאלה 12: מהי המטרה העיקרית של אלגוריתמי אשכול (clustering)?

    • לזהות דפוסים וקשרים בנתונים
  • שאלה 13: לאיזו מהמטרות הבאות תתאים היסטוגרמה?

    • הצגת שכיחות טווח של ערכים רציפים
  • שאלה 14: מה קשור ל-json?

    • פורמט אפשרי לקבלת תשובה משאילתא ל-web-API
  • שאלה 15: מה ניתן לומר על המתאם בין המאפיינים X1, X2 בגרף?

    • אין מתאם (קורלציה) לינארית (או תיאור אחר לפי הגרף)
  • שאלה 16: אילו מחרוזות יכול להחזיר הביטוי הרגולרי?

    • שם של בן אדם באנגלית עם תחילית השם האמצעי
  • שאלה 17: מהי המטרה של ניתוח חקרני של נתונים (EDA)?

    • לזהות תבניות וקשרים בנתונים
  • שאלה 18: מה השלב השני בעבודת מדען הנתונים לאחר ניסוח שאלת המחקר?

    • הרכשת נתונים
  • שאלה 19: אילו סוגי נתונים ניתן לאחסן במסגרת נתונים ב-pandas?

    • כל התשובות נכונות (מספרים, טקסט, תאריכים)
  • שאלה 20: מה מהבאים הוא מבנה נתונים בלתי ניתן לשינוי (immutable)?

    • טאפל (tuple)

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Description

מבחן זה מיועד לבדוק את הבנתך בתחומי מדעי הנתונים, כולל שאלות על מבני נתונים ב-Pandas, תהליכים כמו זיהוי ערכים חריגים ולמידה לא מונחית. הוא כולל שאלות על אלגוריתמים, פקודות בשפת פייתון ויישומים שונים במדיגה. קחו את המבחן ובדקו את הידע שלכם.

More Like This

Python Data Science Libraries Overview
12 questions
Pandas DataFrame Operations
42 questions
Python Programming Exercises for Class 12
5 questions
Data Science CSV Handling in Python
5 questions
Use Quizgecko on...
Browser
Browser