Podcast
Questions and Answers
מהו הדפוס שמתאר מספרים עם ערך עשרוני?
מהו הדפוס שמתאר מספרים עם ערך עשרוני?
כיצד יש להשתמש בתרשימי עוגה?
כיצד יש להשתמש בתרשימי עוגה?
מה נכון לגבי הדפוס r\b0*\d+.\d*\b?
מה נכון לגבי הדפוס r\b0*\d+.\d*\b?
איזה מבין הדפוסים אינו מתאים לתאר מספרים עשרוניים?
איזה מבין הדפוסים אינו מתאים לתאר מספרים עשרוניים?
Signup and view all the answers
מה נכון לגבי השוואת ערכים בתרשים עוגה?
מה נכון לגבי השוואת ערכים בתרשים עוגה?
Signup and view all the answers
איזה אלגוריתם יחשב את האשכולות בצורה הטובה ביותר כאשר K שווה ל-4?
איזה אלגוריתם יחשב את האשכולות בצורה הטובה ביותר כאשר K שווה ל-4?
Signup and view all the answers
מהו המתאם בין המאפיינים X ו-Y בהתאם לתרשימים המצוינים?
מהו המתאם בין המאפיינים X ו-Y בהתאם לתרשימים המצוינים?
Signup and view all the answers
מה מהשלבים הבאים הוא השלב הראשון בעבודתו של מדען הנתונים?
מה מהשלבים הבאים הוא השלב הראשון בעבודתו של מדען הנתונים?
Signup and view all the answers
מה מטרת הביטוי הרגולרי 're.findall(r"\b[A-Z][a-z]*\b", text)'?
מה מטרת הביטוי הרגולרי 're.findall(r"\b[A-Z][a-z]*\b", text)'?
Signup and view all the answers
איזה ביטוי רגולרי מתאים לזיהוי מחרוזת הכוללת מספר שלם ואחריו מספר עשרוני?
איזה ביטוי רגולרי מתאים לזיהוי מחרוזת הכוללת מספר שלם ואחריו מספר עשרוני?
Signup and view all the answers
מה תפקידו של אלגוריתם DBSCAN בזיהוי אשכולות?
מה תפקידו של אלגוריתם DBSCAN בזיהוי אשכולות?
Signup and view all the answers
מה מייצג תהליך ניתוח הנתונים החקרני במדע הנתונים?
מה מייצג תהליך ניתוח הנתונים החקרני במדע הנתונים?
Signup and view all the answers
איזה מהמאפיינים נדרש על מנת לבצע מודל חיזוי מדויק?
איזה מהמאפיינים נדרש על מנת לבצע מודל חיזוי מדויק?
Signup and view all the answers
מה היתרון של אלגוריתם KMeans בתחום חקר הנתונים?
מה היתרון של אלגוריתם KMeans בתחום חקר הנתונים?
Signup and view all the answers
מהו העיקרון שמנחה את מדעי הנתונים בעת איסוף נתונים?
מהו העיקרון שמנחה את מדעי הנתונים בעת איסוף נתונים?
Signup and view all the answers
מהו האלמנט המוודא שהתוצאות במדעי הנתונים הן מדויקות?
מהו האלמנט המוודא שהתוצאות במדעי הנתונים הן מדויקות?
Signup and view all the answers
אתגרי מהות במדעי הנתונים כוללים?
אתגרי מהות במדעי הנתונים כוללים?
Signup and view all the answers
מהו יתרון השימוש בביטויים רגולריים בניתוח נתונים?
מהו יתרון השימוש בביטויים רגולריים בניתוח נתונים?
Signup and view all the answers
מהי השפעת הננופילטות על תהליך ניתוח הנתונים?
מהי השפעת הננופילטות על תהליך ניתוח הנתונים?
Signup and view all the answers
Flashcards
מספר חיובי עם נקודה עשרונית
מספר חיובי עם נקודה עשרונית
מספר שכולל חלק שלם וחלק עשרוני, לדוגמה 1.23.
תרשימי עוגה
תרשימי עוגה
דרך לשדר מידע חזותי על הרכב השלם של קטגוריות שונות.
קוד רגקס מספרים
קוד רגקס מספרים
שימוש ב-Regex למציאת מספרים במסמכים. לדוגמה, r\b[1-9]\d*\s*(?:,|\s)\s*(?:0|[1-9]\d*).\d+
חלק שלם וחלק עשרוני
חלק שלם וחלק עשרוני
Signup and view all the flashcards
קוד Regular Expression
קוד Regular Expression
Signup and view all the flashcards
אשכול (Clustering)
אשכול (Clustering)
Signup and view all the flashcards
אלגוריתם KMeans
אלגוריתם KMeans
Signup and view all the flashcards
אלגוריתם DBSCAN
אלגוריתם DBSCAN
Signup and view all the flashcards
מתאם לינארי
מתאם לינארי
Signup and view all the flashcards
שלב ראשון במדעי הנתונים
שלב ראשון במדעי הנתונים
Signup and view all the flashcards
ביטוי רגולרי
ביטוי רגולרי
Signup and view all the flashcards
re.findall
re.findall
Signup and view all the flashcards
איסוף נתונים
איסוף נתונים
Signup and view all the flashcards
חיפוש באותיות גדולות
חיפוש באותיות גדולות
Signup and view all the flashcards
מספרים שלמים ועשרוניים
מספרים שלמים ועשרוניים
Signup and view all the flashcards
תרשימים
תרשימים
Signup and view all the flashcards
פסילה בשאלות
פסילה בשאלות
Signup and view all the flashcards
מרכזי קבוצה
מרכזי קבוצה
Signup and view all the flashcards
נתונים צפופים
נתונים צפופים
Signup and view all the flashcards
Study Notes
מבחן מבוא למדעי הנתונים - שיטות וכלים
- היקף הבחינה: 20 שאלות, משקל שווה לכל שאלה (5 נקודות).
- משך הבחינה: שעתיים.
- חומר עזר: מחשבון.
- אופן התשובה: יש לענות על כל השאלות, ולהקיף את התשובה הנכונה על גבי דף התשובות. יש לסמן תשובה אחת בלבד לכל שאלה; תשובות שמסומנות ביותר משאלת אחת לא ייבדקו.
- הוראות חשובות: יש להחזיר את דף התשובות יחד עם טופס הבחינה.
- מגבלה בדף התשובות: דף התשובות מיועד ל-6 שאלות, אך בבחינה זו יש עד 4 שאלות לכל היותר. יש לענות במיקום הנכון.
שאלה 1: אשכול (Clustering)
- הנתונים: מבנה נתונים (מאפיין 1 ו- מאפיין 2) להצגת אשכולות.
- האלגוריתם: יש לבחור את האלגוריתם המתאים ביותר לאשכולות:
- KMeans עם K=4
- DBSCAN עם eps=4
- DBSCAN עם eps=5
- KMeans עם K=5
שאלה 2: מתאם בין מאפיינים
- הנתונים: תרשימים (3) של Y ו -X.
- השאלה: יש לזהות את סוגי המתאם (חיובי, שלילי, אפס) בכל תרשים.
שאלה 3: שלב ראשון במדע נתונים
- השאלה: מהו השלב הראשון בתהליך של מדען נתונים?
- התשובה: ניסוח שאלת מחקר.
שאלה 4: ביטוי רגולרי (Regular Expression)
- הביטוי: re.findall(r"\b[A-Z][a-z]*\b", text)
- המטרה: למצוא מילים שמתחילות באותיות גדולות ובאותיות קטנות.
שאלה 5: ביטוי רגולרי (Regular Expression)
- המטרה: זיהוי מחרוזת המכילה מספר שלם ואחריו מספר עשרוני, המופרדים על ידי פסיק או רווח.
- דוגמאות: "23, 0.56" או "4 1.23".
שאלה 6: תרשים עוגה (Pie Chart)
- שימוש נכון: להצגת הרכב עבור מספר קטן של קטגוריות.
שאלה 7: פונקציה ב-Beautiful Soup
- פונקציה:
get_text()
לאחזור תוכן טקסט מאלמנט HTML.
שאלה 8: מאפיין ב-HTML
- המאפיין:
Class
מייצג את המחלקה של אלמנט HTML.
שאלה 9: תרשים פזור (Scatter Plot)
- תיאור: תרשים פזור של X1 ו-X2.
- ההשערה: יש לבחור את ההשערה הסבירה ביותר הקשורה לנתונים, בהתבסס על התרשים הפזור:
- ערכים ייחודיים של X1
- קשר חזק וברור בין X1 ל-X2
- X1 כמושתנה רציף, אולם התפלגות הנקודות מראה כי הוא קטגורי.
- קשר ליניארי בין X1 ל-X2.
שאלה 10: מאפיין DataFrame ב-Pandas
- מאפיין:
shape[1]
מייצג את מספר העמודות ב-DataFrame.
שאלה 11: מילוי ערכים חסרים ב-Pandas
- השאלה: איך למלא ערכים חסרים (NaN) ב-DataFrame.
- הפתרון: שימוש ב-
mode
כדי למלא ערכים חסרים.df['A'].fillna(df['A'].mode()[0], inplace=True)
שאלה 12: סוג בעיה בלימוד מכונה
- הבעיה: הצגת לקוחות בצורה ויזואלית נוחה למצגת.
- סוג הבעיה: בעיה של למידה לא מונחית (unsupervised learning), ספציפית בעיית אשכול (clustering).
שאלה 13: סולם מדידה
- סוג הסולם: סולם מנה.
שאלה 14: השפעת whis ב-box plot
- ההשפעה: הערך
whis=5
שלboxplot
מצמצם את הנתונים החריגים המוצגים בתרשים.
שאלה 15: מדד למרכז נתונים
- מדד:
median
הוא המדד המשמש למציאת מרכז נתונים עם צידוד.
שאלה 16: מבנה נתונים
- המבנה: מילון (Dictionary).
שאלה 17: שפת תכנות
- השפה: פיתו́n.
שאלה 18: שיטה למיין DataFrame
- השיטה:
sort_values()
.
שאלה 19: חישוב האחוזון ה-20
- חישוב: המדידה ה-10 מתוך סדר עולה ממוין.
שאלה 20: ייצוג קורס ב-JSON
- הייצוג הנכון:
{
"course_name": "intro2DS",
"year": 2024,
"semester": "winter"
}
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Description
מבחן זה כולל 20 שאלות הנוגעות לשיטות וכלים במדעי הנתונים. הבחינה בודקת יכולות כמו זיהוי אשכולות ומתאם בין מאפיינים. יש להקיף את התשובות הנכונות בהתאם להנחיות שניתנו.