מבחן מבוא למדעי הנתונים - שיטות וכלים
19 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

מהו הדפוס שמתאר מספרים עם ערך עשרוני?

  • r\b[1-9]\d*\s*(?:,|\s)\s*(?:0|[1-9]\d*)\.\d+ (correct)
  • r\b0*\d+\.\d*\b
  • r\b[1-9]\d*\.\d
  • r\d+\s*,\s*\d+
  • כיצד יש להשתמש בתרשימי עוגה?

  • להציג הקבלה בין ערכים שונים
  • להציג את הרכב השלם עבור מספר קטגוריות מועטות (correct)
  • להציג ערכים במספר רב של קטגוריות
  • להשוות בין ערכים בטווחים שונים
  • מה נכון לגבי הדפוס r\b0*\d+.\d*\b?

  • מתאר מספרים שלמים בלבד
  • מתאר מספרים עם ערך שלם ועשרוני (correct)
  • מתאר את המספר 0 בלבד
  • מתאר מספרים עשרוניים בלי מקום שלם
  • איזה מבין הדפוסים אינו מתאים לתאר מספרים עשרוניים?

    <p>r\b[0-9]+\s*\d+ (C)</p> Signup and view all the answers

    מה נכון לגבי השוואת ערכים בתרשים עוגה?

    <p>תרשימי עוגה פחות יעילים בהשוואת ערכים (A)</p> Signup and view all the answers

    איזה אלגוריתם יחשב את האשכולות בצורה הטובה ביותר כאשר K שווה ל-4?

    <p>אלגוריתם KMeans עם K=4 (A)</p> Signup and view all the answers

    מהו המתאם בין המאפיינים X ו-Y בהתאם לתרשימים המצוינים?

    <p>בגרף הימני יש מתאם לינארי אפס, בבינוני ובשמאלי חיוביים (A)</p> Signup and view all the answers

    מה מהשלבים הבאים הוא השלב הראשון בעבודתו של מדען הנתונים?

    <p>ניסוח שאלת מחקר (B)</p> Signup and view all the answers

    מה מטרת הביטוי הרגולרי 're.findall(r"\b[A-Z][a-z]*\b", text)'?

    <p>למצוא כל המילים שמתחילות באות גדולה וממשיכות באותיות קטנות (A)</p> Signup and view all the answers

    איזה ביטוי רגולרי מתאים לזיהוי מחרוזת הכוללת מספר שלם ואחריו מספר עשרוני?

    <p>^0*[1-9]\d*[,.]\d*$ (D)</p> Signup and view all the answers

    מה תפקידו של אלגוריתם DBSCAN בזיהוי אשכולות?

    <p>ליצור קבוצות נתונים משנה ללא קביעת מספר האשכולות מראש (D)</p> Signup and view all the answers

    מה מייצג תהליך ניתוח הנתונים החקרני במדע הנתונים?

    <p>חקר והבנה של דפוסים ומגמות (B)</p> Signup and view all the answers

    איזה מהמאפיינים נדרש על מנת לבצע מודל חיזוי מדויק?

    <p>איסוף נתונים איכותיים ומקיפים (B)</p> Signup and view all the answers

    מה היתרון של אלגוריתם KMeans בתחום חקר הנתונים?

    <p>פשטות השימוש והיישום (C)</p> Signup and view all the answers

    מהו העיקרון שמנחה את מדעי הנתונים בעת איסוף נתונים?

    <p>מגוון הנתונים משפיע על תוצאות הניתוח (A)</p> Signup and view all the answers

    מהו האלמנט המוודא שהתוצאות במדעי הנתונים הן מדויקות?

    <p>הפחתת הרעש בנתונים (B)</p> Signup and view all the answers

    אתגרי מהות במדעי הנתונים כוללים?

    <p>זיהוי מידע חסר וניפוי נתונים (D)</p> Signup and view all the answers

    מהו יתרון השימוש בביטויים רגולריים בניתוח נתונים?

    <p>הקלות באיתור דפוסים חוזרים (C)</p> Signup and view all the answers

    מהי השפעת הננופילטות על תהליך ניתוח הנתונים?

    <p>היא מקלה על בניית מודלים חזקים יותר (B)</p> Signup and view all the answers

    Flashcards

    מספר חיובי עם נקודה עשרונית

    מספר שכולל חלק שלם וחלק עשרוני, לדוגמה 1.23.

    תרשימי עוגה

    דרך לשדר מידע חזותי על הרכב השלם של קטגוריות שונות.

    קוד רגקס מספרים

    שימוש ב-Regex למציאת מספרים במסמכים. לדוגמה, r\b[1-9]\d*\s*(?:,|\s)\s*(?:0|[1-9]\d*).\d+

    חלק שלם וחלק עשרוני

    החלק של המספר לפני ואחרי הנקודה העשרונית. לדוגמה, 0.56 - חלק שלם 0, חלק עשרוני 56.

    Signup and view all the flashcards

    קוד Regular Expression

    שיטה לחיפוש ודפוס של טקסטים, בעיקר בשפה של קומפיילרים או ניתוח טקסטים.

    Signup and view all the flashcards

    אשכול (Clustering)

    שיטה לקבץ נתונים על פי דמיון או קרבה.

    Signup and view all the flashcards

    אלגוריתם KMeans

    שיטת אשכול המחשבת את מרכזי הקבוצות.

    Signup and view all the flashcards

    אלגוריתם DBSCAN

    אלגוריתם לאשכול המבוסס על צפיפות נתונים.

    Signup and view all the flashcards

    מתאם לינארי

    מדד לקשר בין שני משתנים בעזרת קו ישר.

    Signup and view all the flashcards

    שלב ראשון במדעי הנתונים

    ניסוח שאלת מחקר הוא השלב הראשוני.

    Signup and view all the flashcards

    ביטוי רגולרי

    תבנית לחיפוש מחרוזות בהתאם לכללים מסוימים.

    Signup and view all the flashcards

    re.findall

    שיטה לחיפוש של כל המילים התואמות לביטוי רגולרי.

    Signup and view all the flashcards

    איסוף נתונים

    שלב בהכנת מחקר שבו אספים את הנתונים הדרושים.

    Signup and view all the flashcards

    חיפוש באותיות גדולות

    חיפוש של כל המילים שמתחילות באות גדולה.

    Signup and view all the flashcards

    מספרים שלמים ועשרוניים

    הכנסת תנאים למצוא מספרים מסוימים בהתאם למבנה שלהם.

    Signup and view all the flashcards

    תרשימים

    ייצוג גרפי של נתונים לשם ניתוח מתאם.

    Signup and view all the flashcards

    פסילה בשאלות

    אם מציינים יותר מתשובה אחת, השאלה תיפסל.

    Signup and view all the flashcards

    מרכזי קבוצה

    תוצאה של אלגוריתם KMeans, מייצג את המיקום של הקבוצה.

    Signup and view all the flashcards

    נתונים צפופים

    אזורי נתונים שבהם הנתונים מרוכזים יותר.

    Signup and view all the flashcards

    Study Notes

    מבחן מבוא למדעי הנתונים - שיטות וכלים

    • היקף הבחינה: 20 שאלות, משקל שווה לכל שאלה (5 נקודות).
    • משך הבחינה: שעתיים.
    • חומר עזר: מחשבון.
    • אופן התשובה: יש לענות על כל השאלות, ולהקיף את התשובה הנכונה על גבי דף התשובות. יש לסמן תשובה אחת בלבד לכל שאלה; תשובות שמסומנות ביותר משאלת אחת לא ייבדקו.
    • הוראות חשובות: יש להחזיר את דף התשובות יחד עם טופס הבחינה.
    • מגבלה בדף התשובות: דף התשובות מיועד ל-6 שאלות, אך בבחינה זו יש עד 4 שאלות לכל היותר. יש לענות במיקום הנכון.

    שאלה 1: אשכול (Clustering)

    • הנתונים: מבנה נתונים (מאפיין 1 ו- מאפיין 2) להצגת אשכולות.
    • האלגוריתם: יש לבחור את האלגוריתם המתאים ביותר לאשכולות:
      • KMeans עם K=4
      • DBSCAN עם eps=4
      • DBSCAN עם eps=5
      • KMeans עם K=5

    שאלה 2: מתאם בין מאפיינים

    • הנתונים: תרשימים (3) של Y ו -X.
    • השאלה: יש לזהות את סוגי המתאם (חיובי, שלילי, אפס) בכל תרשים.

    שאלה 3: שלב ראשון במדע נתונים

    • השאלה: מהו השלב הראשון בתהליך של מדען נתונים?
    • התשובה: ניסוח שאלת מחקר.

    שאלה 4: ביטוי רגולרי (Regular Expression)

    • הביטוי: re.findall(r"\b[A-Z][a-z]*\b", text)
    • המטרה: למצוא מילים שמתחילות באותיות גדולות ובאותיות קטנות.

    שאלה 5: ביטוי רגולרי (Regular Expression)

    • המטרה: זיהוי מחרוזת המכילה מספר שלם ואחריו מספר עשרוני, המופרדים על ידי פסיק או רווח.
    • דוגמאות: "23, 0.56" או "4 1.23".

    שאלה 6: תרשים עוגה (Pie Chart)

    • שימוש נכון: להצגת הרכב עבור מספר קטן של קטגוריות.

    שאלה 7: פונקציה ב-Beautiful Soup

    • פונקציה: get_text() לאחזור תוכן טקסט מאלמנט HTML.

    שאלה 8: מאפיין ב-HTML

    • המאפיין: Class מייצג את המחלקה של אלמנט HTML.

    שאלה 9: תרשים פזור (Scatter Plot)

    • תיאור: תרשים פזור של X1 ו-X2.
    • ההשערה: יש לבחור את ההשערה הסבירה ביותר הקשורה לנתונים, בהתבסס על התרשים הפזור:
      • ערכים ייחודיים של X1
      • קשר חזק וברור בין X1 ל-X2
      • X1 כמושתנה רציף, אולם התפלגות הנקודות מראה כי הוא קטגורי.
      • קשר ליניארי בין X1 ל-X2.

    שאלה 10: מאפיין DataFrame ב-Pandas

    • מאפיין: shape[1] מייצג את מספר העמודות ב-DataFrame.

    שאלה 11: מילוי ערכים חסרים ב-Pandas

    • השאלה: איך למלא ערכים חסרים (NaN) ב-DataFrame.
    • הפתרון: שימוש ב- mode כדי למלא ערכים חסרים. df['A'].fillna(df['A'].mode()[0], inplace=True)

    שאלה 12: סוג בעיה בלימוד מכונה

    • הבעיה: הצגת לקוחות בצורה ויזואלית נוחה למצגת.
    • סוג הבעיה: בעיה של למידה לא מונחית (unsupervised learning), ספציפית בעיית אשכול (clustering).

    שאלה 13: סולם מדידה

    • סוג הסולם: סולם מנה.

    שאלה 14: השפעת whis ב-box plot

    • ההשפעה: הערך whis=5 של boxplot מצמצם את הנתונים החריגים המוצגים בתרשים.

    שאלה 15: מדד למרכז נתונים

    • מדד: median הוא המדד המשמש למציאת מרכז נתונים עם צידוד.

    שאלה 16: מבנה נתונים

    • המבנה: מילון (Dictionary).

    שאלה 17: שפת תכנות

    • השפה: פיתו́n.

    שאלה 18: שיטה למיין DataFrame

    • השיטה: sort_values().

    שאלה 19: חישוב האחוזון ה-20

    • חישוב: המדידה ה-10 מתוך סדר עולה ממוין.

    שאלה 20: ייצוג קורס ב-JSON

    • הייצוג הנכון:
    {
      "course_name": "intro2DS",
      "year": 2024,
      "semester": "winter"
    }
    

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    מבחן זה כולל 20 שאלות הנוגעות לשיטות וכלים במדעי הנתונים. הבחינה בודקת יכולות כמו זיהוי אשכולות ומתאם בין מאפיינים. יש להקיף את התשובות הנכונות בהתאם להנחיות שניתנו.

    More Like This

    Data Analysis Techniques Quiz
    24 questions
    Data Science Concepts Quiz
    41 questions

    Data Science Concepts Quiz

    PleasurableGreatWallOfChina avatar
    PleasurableGreatWallOfChina
    K-Means Clustering Concepts
    48 questions
    מבחן מבוא למדעי הנתונים
    20 questions
    Use Quizgecko on...
    Browser
    Browser