מבחן מבוא למדעי הנתונים - שיטות וכלים

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

מהו הדפוס שמתאר מספרים עם ערך עשרוני?

  • r\b[1-9]\d*\s*(?:,|\s)\s*(?:0|[1-9]\d*)\.\d+ (correct)
  • r\b0*\d+\.\d*\b
  • r\b[1-9]\d*\.\d
  • r\d+\s*,\s*\d+

כיצד יש להשתמש בתרשימי עוגה?

  • להציג הקבלה בין ערכים שונים
  • להציג את הרכב השלם עבור מספר קטגוריות מועטות (correct)
  • להציג ערכים במספר רב של קטגוריות
  • להשוות בין ערכים בטווחים שונים

מה נכון לגבי הדפוס r\b0*\d+.\d*\b?

  • מתאר מספרים שלמים בלבד
  • מתאר מספרים עם ערך שלם ועשרוני (correct)
  • מתאר את המספר 0 בלבד
  • מתאר מספרים עשרוניים בלי מקום שלם

איזה מבין הדפוסים אינו מתאים לתאר מספרים עשרוניים?

<p>r\b[0-9]+\s*\d+ (C)</p> Signup and view all the answers

מה נכון לגבי השוואת ערכים בתרשים עוגה?

<p>תרשימי עוגה פחות יעילים בהשוואת ערכים (A)</p> Signup and view all the answers

איזה אלגוריתם יחשב את האשכולות בצורה הטובה ביותר כאשר K שווה ל-4?

<p>אלגוריתם KMeans עם K=4 (A)</p> Signup and view all the answers

מהו המתאם בין המאפיינים X ו-Y בהתאם לתרשימים המצוינים?

<p>בגרף הימני יש מתאם לינארי אפס, בבינוני ובשמאלי חיוביים (A)</p> Signup and view all the answers

מה מהשלבים הבאים הוא השלב הראשון בעבודתו של מדען הנתונים?

<p>ניסוח שאלת מחקר (B)</p> Signup and view all the answers

מה מטרת הביטוי הרגולרי 're.findall(r"\b[A-Z][a-z]*\b", text)'?

<p>למצוא כל המילים שמתחילות באות גדולה וממשיכות באותיות קטנות (A)</p> Signup and view all the answers

איזה ביטוי רגולרי מתאים לזיהוי מחרוזת הכוללת מספר שלם ואחריו מספר עשרוני?

<p>^0*[1-9]\d*[,.]\d*$ (D)</p> Signup and view all the answers

מה תפקידו של אלגוריתם DBSCAN בזיהוי אשכולות?

<p>ליצור קבוצות נתונים משנה ללא קביעת מספר האשכולות מראש (D)</p> Signup and view all the answers

מה מייצג תהליך ניתוח הנתונים החקרני במדע הנתונים?

<p>חקר והבנה של דפוסים ומגמות (B)</p> Signup and view all the answers

איזה מהמאפיינים נדרש על מנת לבצע מודל חיזוי מדויק?

<p>איסוף נתונים איכותיים ומקיפים (B)</p> Signup and view all the answers

מה היתרון של אלגוריתם KMeans בתחום חקר הנתונים?

<p>פשטות השימוש והיישום (C)</p> Signup and view all the answers

מהו העיקרון שמנחה את מדעי הנתונים בעת איסוף נתונים?

<p>מגוון הנתונים משפיע על תוצאות הניתוח (A)</p> Signup and view all the answers

מהו האלמנט המוודא שהתוצאות במדעי הנתונים הן מדויקות?

<p>הפחתת הרעש בנתונים (B)</p> Signup and view all the answers

אתגרי מהות במדעי הנתונים כוללים?

<p>זיהוי מידע חסר וניפוי נתונים (D)</p> Signup and view all the answers

מהו יתרון השימוש בביטויים רגולריים בניתוח נתונים?

<p>הקלות באיתור דפוסים חוזרים (C)</p> Signup and view all the answers

מהי השפעת הננופילטות על תהליך ניתוח הנתונים?

<p>היא מקלה על בניית מודלים חזקים יותר (B)</p> Signup and view all the answers

Flashcards

מספר חיובי עם נקודה עשרונית

מספר שכולל חלק שלם וחלק עשרוני, לדוגמה 1.23.

תרשימי עוגה

דרך לשדר מידע חזותי על הרכב השלם של קטגוריות שונות.

קוד רגקס מספרים

שימוש ב-Regex למציאת מספרים במסמכים. לדוגמה, r\b[1-9]\d*\s*(?:,|\s)\s*(?:0|[1-9]\d*).\d+

חלק שלם וחלק עשרוני

החלק של המספר לפני ואחרי הנקודה העשרונית. לדוגמה, 0.56 - חלק שלם 0, חלק עשרוני 56.

Signup and view all the flashcards

קוד Regular Expression

שיטה לחיפוש ודפוס של טקסטים, בעיקר בשפה של קומפיילרים או ניתוח טקסטים.

Signup and view all the flashcards

אשכול (Clustering)

שיטה לקבץ נתונים על פי דמיון או קרבה.

Signup and view all the flashcards

אלגוריתם KMeans

שיטת אשכול המחשבת את מרכזי הקבוצות.

Signup and view all the flashcards

אלגוריתם DBSCAN

אלגוריתם לאשכול המבוסס על צפיפות נתונים.

Signup and view all the flashcards

מתאם לינארי

מדד לקשר בין שני משתנים בעזרת קו ישר.

Signup and view all the flashcards

שלב ראשון במדעי הנתונים

ניסוח שאלת מחקר הוא השלב הראשוני.

Signup and view all the flashcards

ביטוי רגולרי

תבנית לחיפוש מחרוזות בהתאם לכללים מסוימים.

Signup and view all the flashcards

re.findall

שיטה לחיפוש של כל המילים התואמות לביטוי רגולרי.

Signup and view all the flashcards

איסוף נתונים

שלב בהכנת מחקר שבו אספים את הנתונים הדרושים.

Signup and view all the flashcards

חיפוש באותיות גדולות

חיפוש של כל המילים שמתחילות באות גדולה.

Signup and view all the flashcards

מספרים שלמים ועשרוניים

הכנסת תנאים למצוא מספרים מסוימים בהתאם למבנה שלהם.

Signup and view all the flashcards

תרשימים

ייצוג גרפי של נתונים לשם ניתוח מתאם.

Signup and view all the flashcards

פסילה בשאלות

אם מציינים יותר מתשובה אחת, השאלה תיפסל.

Signup and view all the flashcards

מרכזי קבוצה

תוצאה של אלגוריתם KMeans, מייצג את המיקום של הקבוצה.

Signup and view all the flashcards

נתונים צפופים

אזורי נתונים שבהם הנתונים מרוכזים יותר.

Signup and view all the flashcards

Study Notes

מבחן מבוא למדעי הנתונים - שיטות וכלים

  • היקף הבחינה: 20 שאלות, משקל שווה לכל שאלה (5 נקודות).
  • משך הבחינה: שעתיים.
  • חומר עזר: מחשבון.
  • אופן התשובה: יש לענות על כל השאלות, ולהקיף את התשובה הנכונה על גבי דף התשובות. יש לסמן תשובה אחת בלבד לכל שאלה; תשובות שמסומנות ביותר משאלת אחת לא ייבדקו.
  • הוראות חשובות: יש להחזיר את דף התשובות יחד עם טופס הבחינה.
  • מגבלה בדף התשובות: דף התשובות מיועד ל-6 שאלות, אך בבחינה זו יש עד 4 שאלות לכל היותר. יש לענות במיקום הנכון.

שאלה 1: אשכול (Clustering)

  • הנתונים: מבנה נתונים (מאפיין 1 ו- מאפיין 2) להצגת אשכולות.
  • האלגוריתם: יש לבחור את האלגוריתם המתאים ביותר לאשכולות:
    • KMeans עם K=4
    • DBSCAN עם eps=4
    • DBSCAN עם eps=5
    • KMeans עם K=5

שאלה 2: מתאם בין מאפיינים

  • הנתונים: תרשימים (3) של Y ו -X.
  • השאלה: יש לזהות את סוגי המתאם (חיובי, שלילי, אפס) בכל תרשים.

שאלה 3: שלב ראשון במדע נתונים

  • השאלה: מהו השלב הראשון בתהליך של מדען נתונים?
  • התשובה: ניסוח שאלת מחקר.

שאלה 4: ביטוי רגולרי (Regular Expression)

  • הביטוי: re.findall(r"\b[A-Z][a-z]*\b", text)
  • המטרה: למצוא מילים שמתחילות באותיות גדולות ובאותיות קטנות.

שאלה 5: ביטוי רגולרי (Regular Expression)

  • המטרה: זיהוי מחרוזת המכילה מספר שלם ואחריו מספר עשרוני, המופרדים על ידי פסיק או רווח.
  • דוגמאות: "23, 0.56" או "4 1.23".

שאלה 6: תרשים עוגה (Pie Chart)

  • שימוש נכון: להצגת הרכב עבור מספר קטן של קטגוריות.

שאלה 7: פונקציה ב-Beautiful Soup

  • פונקציה: get_text() לאחזור תוכן טקסט מאלמנט HTML.

שאלה 8: מאפיין ב-HTML

  • המאפיין: Class מייצג את המחלקה של אלמנט HTML.

שאלה 9: תרשים פזור (Scatter Plot)

  • תיאור: תרשים פזור של X1 ו-X2.
  • ההשערה: יש לבחור את ההשערה הסבירה ביותר הקשורה לנתונים, בהתבסס על התרשים הפזור:
    • ערכים ייחודיים של X1
    • קשר חזק וברור בין X1 ל-X2
    • X1 כמושתנה רציף, אולם התפלגות הנקודות מראה כי הוא קטגורי.
    • קשר ליניארי בין X1 ל-X2.

שאלה 10: מאפיין DataFrame ב-Pandas

  • מאפיין: shape[1] מייצג את מספר העמודות ב-DataFrame.

שאלה 11: מילוי ערכים חסרים ב-Pandas

  • השאלה: איך למלא ערכים חסרים (NaN) ב-DataFrame.
  • הפתרון: שימוש ב- mode כדי למלא ערכים חסרים. df['A'].fillna(df['A'].mode()[0], inplace=True)

שאלה 12: סוג בעיה בלימוד מכונה

  • הבעיה: הצגת לקוחות בצורה ויזואלית נוחה למצגת.
  • סוג הבעיה: בעיה של למידה לא מונחית (unsupervised learning), ספציפית בעיית אשכול (clustering).

שאלה 13: סולם מדידה

  • סוג הסולם: סולם מנה.

שאלה 14: השפעת whis ב-box plot

  • ההשפעה: הערך whis=5 של boxplot מצמצם את הנתונים החריגים המוצגים בתרשים.

שאלה 15: מדד למרכז נתונים

  • מדד: median הוא המדד המשמש למציאת מרכז נתונים עם צידוד.

שאלה 16: מבנה נתונים

  • המבנה: מילון (Dictionary).

שאלה 17: שפת תכנות

  • השפה: פיתו́n.

שאלה 18: שיטה למיין DataFrame

  • השיטה: sort_values().

שאלה 19: חישוב האחוזון ה-20

  • חישוב: המדידה ה-10 מתוך סדר עולה ממוין.

שאלה 20: ייצוג קורס ב-JSON

  • הייצוג הנכון:
{
  "course_name": "intro2DS",
  "year": 2024,
  "semester": "winter"
}

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

More Like This

Data Science Concepts Quiz
41 questions

Data Science Concepts Quiz

PleasurableGreatWallOfChina avatar
PleasurableGreatWallOfChina
Introduction to Density-Based Clustering
8 questions
מבחן מבוא למדעי הנתונים
20 questions
Data analytics lifecycle, clustering, and K-means
10 questions
Use Quizgecko on...
Browser
Browser