מבחן מבוא למדעי הנתונים - מועד א'

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

מהי המטרה העיקרית של ניתוח חקרני של נתונים (EDA)?

  • לפתח מודלים מתקדמים של למידת מכונה על סמך הנתונים הקיימים.
  • לקבוע את הקשר הסיבתי בין משתנים שונים באופן חד משמעי.
  • לזהות דפוסים, קשרים ומגמות בנתונים שאינם נראים מיד לעין. (correct)
  • לנקות ולעבד את הנתונים לצורך יצירת ויזואליזציות פשוטות.

איזה מהאלגוריתמים הבאים מתאים ביותר לביצוע אשכול (clustering) של מבנה נתונים מורכב שבו צפיפות הנקודות משתנה, לשם יצירת 4 קבוצות מובחנות?

  • PCA המשמש להפחתת מימדים ואינו מתאים לבעיות אשכול.
  • K-Means עם k=4, מתאים במיוחד למבנים עם גדלים וצפיפות שווים.
  • DBSCAN, המתאים במיוחד לזיהוי צבירים בעלי צפיפות משתנה וצורות שרירותיות. (correct)
  • ניתוח אנומליה, המתמקד בזיהוי נקודות חריגות ולא באשכול כל הנקודות.

מהו ההבדל העיקרי בין סולם סודר (ordinal) לסולם רווח (interval) במדידת נתונים?

  • בשני הסולמות יש משמעות לסדר ומרווחים, אך סולם רווח מאפשר להשוות בין יחסים.
  • בסולם רווח יש משמעות לסדר בלבד, ואילו בסולם סודר יש משמעות גם למרווחים בין הערכים.
  • בסולם סודר יש משמעות לסדר בלבד, ואילו בסולם רווח יש משמעות גם למרווחים בין הערכים. (correct)
  • בסולם סודר ניתן לבצע פעולות חשבוניות, בעוד שבסולם רווח לא ניתן לבצע פעולות חשבוניות.

איזה מהבאים אינו מהווה דוגמה למשתנה קטגוריאלי?

<p>טמפרטורה במעלות צלזיוס. (D)</p> Signup and view all the answers

מהי מטרת הפיצול לנתוני אימון (training), תיקוף (validation) ובדיקה (test) בתהליך בניית מודל למידת מכונה?

<p>גם B וגם C נכונות. (A)</p> Signup and view all the answers

באיזה סוג של בעיית למידת מכונה נשתמש במדד ה־F1?

<p>בעיית סיווג בינארית כאשר קיימת חוסר איזון בנתונים בין המחלקות. (B)</p> Signup and view all the answers

מהו תפקידם של פרמטרי ההיפר (hyperparameters) במודל למידת מכונה?

<p>לקבוע את המבנה ואת התנהגות הלמידה של המודל, אך לא אלו שנלמדים במהלך האימון. (C)</p> Signup and view all the answers

איזו מהפעולות הבאות היא חלק מתהליך של ניקוי נתונים (Data Cleaning)?

<p>החלפת ערכים חסרים בנתונים בערך ממוצע של עמודה. (A)</p> Signup and view all the answers

מהי המשמעות של המושג 'עקומת ROC' בהקשר של מודלים לסיווג בינארי?

<p>עקומה המציגה את היחס בין שיעור החיוביים האמיתיים לשיעור השליליים השגויים, בערכי סף שונים. (A)</p> Signup and view all the answers

איזה מהאלגוריתמים הבאים משמש לרוב להפחתת מימדיות בנתונים?

<p>PCA. (B)</p> Signup and view all the answers

על מה ניתן לחשב שכיח וממוצע?

<p>בסולם רווח בלבד (C)</p> Signup and view all the answers

מה נכון לגבי סולמות מדידה?

<p>בסולם רווח המרווחים יכולים להיות גם ממשיים (A)</p> Signup and view all the answers

איזה סוג מידע מחזיר הביטוי הרגולרי הנתון?

<p>כתובות אימייל (B)</p> Signup and view all the answers

האם ניתן להציג יותר משני משתנים תרשים פיזור?

<p>אפשר להציג עם צבעים וצורות (D)</p> Signup and view all the answers

מהו תרשים קופסה?

<p>גרף הממחיש תפוצה של נתונים (B)</p> Signup and view all the answers

מהן הדרכים בהן ניתן להציג משתנים בתרשים פיזור?

<p>מיקום, צבעים וצורות שונים (C)</p> Signup and view all the answers

מה אומרים המושגים 'רווח' ו'סודר' על שלל מהותם?

<p>הסולמות נבדלים זה מזה לפי סוגי המרווחים (B)</p> Signup and view all the answers

מה הנכון לגבי הכנות בנתוני תצפית בהקשר של תרשים פיזור?

<p>אפשר לייצג מיני נתונים שונים באותו תרשים (C)</p> Signup and view all the answers

איזה פעולות ניתן לבצע בסולם רווח?

<p>חיבור, חיסור, וממוצע (D)</p> Signup and view all the answers

מהי המטרה העיקרית של גרף קופסה (box plot)?

<p>להציג חציון, רבעונים וטווח בין רבעוני (C)</p> Signup and view all the answers

מהו המתאם פירסון?

<p>מדד של קורלציה בין שני נתונים בסולם מנה או סודר (A)</p> Signup and view all the answers

מהו הערך של ה-IQR עבור הנתונים [16, 19, 23, 36, 39, 81, 85, 90]?

<p>49 (C)</p> Signup and view all the answers

איזה מתאם מתאר את הגרף הימני, האמצעי והשמאלי בהתאמה אם הגרף הימני מראה מתאם חיובי?

<p>הגרף האמצעי שלילי והשמאלי אפס (C)</p> Signup and view all the answers

איזו ספרייה בפייתון משמשת לביצוע אלגוריתמים של למידה בלתי מונחית?

<p>Sklearn (B)</p> Signup and view all the answers

כיצד ניתן למלא ערכים חסרים בעמודה בקוד הבא?

<p>באמצעות מצב (B)</p> Signup and view all the answers

מה השימוש העיקרי בספרייה requests בפייתון?

<p>לצורך פניות HTTP או HTTPS (B)</p> Signup and view all the answers

מהי הדרך המועדפת למלא ערכים חסרים בעמודת דאטה בפריימפ?

<p>באמצעות עותק של הערך המופיע הכי הרבה (A)</p> Signup and view all the answers

מהי הדרך הנכונה לטעון קובץ CSV למסגרת נתונים?

<p>read_csv (C)</p> Signup and view all the answers

איזה מדד משמש למדידת פיזור נתונים?

<p>סטיית תקן (D)</p> Signup and view all the answers

איזה מהביטויים הרגולריים הבאים מתאים לזיהוי מחרוזת המכילה מספר שלם (ללא אפס מוביל) ואחריו מספר עשרוני כאשר שני המספרים מופרדים בפסיק או רווח?

<p><code>r'^[1-9]\d*[,\s](0|[1-9]\d*)\.\d+'</code> (C)</p> Signup and view all the answers

בהינתן קבוצת נתונים לא מקושרת, איזה אלגוריתם אשכול יתאים בצורה הטובה ביותר?

<p>אשכול היררכי אגלומינטיבי (A)</p> Signup and view all the answers

איזה מהתרשימים הבאים מתאר מתאם שלילי?

<p>תרשים שבו ערכי X עולים וערכי Y יורדים במגמה כללית (C)</p> Signup and view all the answers

מהי הפעולה הבאה לאחר איסוף הנתונים, בתהליך של מדען נתונים?

<p>ניתוח חקרני של הנתונים (EDA) (A)</p> Signup and view all the answers

מה מטרת השימוש בביטוי הרגולרי \b\w+\@\w+\.\w+\b?

<p>מציאת כתובות דואר אלקטרוני (D)</p> Signup and view all the answers

בהתחשב במערך הנתונים הבא: [3, 8, 2, 5, 10, 12], מה יהיה ה-IQR (טווח בין-רבעוני)?

<p>7 (D)</p> Signup and view all the answers

איזה סוג של משתנה מתאר את רמת השכר של עובד בחברה?

<p>משתנה רציף (C)</p> Signup and view all the answers

איזה אלגוריתם למידה בלתי מונחית מתאים לזיהוי חריגות בנתונים?

<p>Isolation Forest (D)</p> Signup and view all the answers

בטבלת נתונים המכילה עמודה עם ערכים חסרים, איזו פעולה עדיף לבצע?

<p>השלמת ערכים חסרים בצורה מחושבת (A)</p> Signup and view all the answers

איזו מטרה העיקרית של שימוש ב'פנדס' בפייתון?

<p>עיבוד וניתוח נתונים (A)</p> Signup and view all the answers

איזה ביטוי רגולרי מתאים להציג מספרים עשרוניים עם פסיק?

<p>r\d+\s*,\s*\d+ (A)</p> Signup and view all the answers

מהו השימוש הנכון בתרשימי עוגה?

<p>מראים את הרכב השלם של מספר קטגוריות מועטות (D)</p> Signup and view all the answers

איזה חתך מייצג את הכמות המקסימלית של קטגוריות בתרשים עוגה?

<p>1-2 קטגוריות (A)</p> Signup and view all the answers

איזה מהביטויים לא מתאר מספר באותו הפורמט?

<p>5 9.0 (D)</p> Signup and view all the answers

איזה ביטוי רגולרי מציין מספרים שלמים ואחריהם מספר עשרוני?

<p>r\b[1-9]\d*\s*(?:,|\s)\s*(?:0|[1-9]\d*).\d+\b (C)</p> Signup and view all the answers

מה יתרון המרשים של תרשימי עוגה?

<p>הם מתאימים להצגת מידע בהיר בצורה מצומצמת (C)</p> Signup and view all the answers

מהו היתרון של הצגת נתונים בעזרי תרשימי עוגה?

<p>הבנה טובה יותר של יחסי גודל בין חלקים (D)</p> Signup and view all the answers

איזו משיטה היא הדרך היעילה ביותר להשוואת ערכים בתרשימי עוגה?

<p>מדידה של סך הכל (D)</p> Signup and view all the answers

מהי השאלה המרכזית שתרשימי עוגה לא יכולים להשיב עליה?

<p>מהן מגמות נתונים לאורך זמן? (D)</p> Signup and view all the answers

איזה מהביטויים נחשב לשגוי בפורמט מספרים עשרוניים?

<p>1.23 4 (A)</p> Signup and view all the answers

מהי המטרה המרכזית של אשכול (clustering) בנתונים?

<p>לזהות דפוסים וקשרים בנתונים (D)</p> Signup and view all the answers

איזו מהשיטות הבאות מתאימה להציג שכיחות של נתונים רציפים?

<p>היסטוגרמה (D)</p> Signup and view all the answers

איזה מהמרכיבים הבאים לא משמש להצגת קשרים בין משתנים?

<p>תרשים עוגה (A)</p> Signup and view all the answers

מהי שיטת הוויזואליזציה המתאימה להצגת מגמות זמן?

<p>תרשים קווים (C)</p> Signup and view all the answers

איזו מהתשובות הבאות מתארת נכון את השימוש בהיסטוגרמה?

<p>הצגת שכיחות טווח של ערכים רציפים (C)</p> Signup and view all the answers

איזה מתודולוגיה לא מתאימה לניתוח נתונים קטגוריאליים?

<p>תרשים פיזור (B)</p> Signup and view all the answers

מהו היתרון בשימוש בהיסטוגרמה לעומת תרשימי עוגה?

<p>יכולת להצגה של שכיחות ערכים רציפים (A)</p> Signup and view all the answers

מהו השימוש הנכון בהיסטוגרמה?

<p>לשקף את שכיחות ערכים בטווחים (B)</p> Signup and view all the answers

איזה יתרון יש להיסטוגרמה על פני טכניקות אחרות?

<p>אפקטיבית בהצגת שכיחות נתונים במחיצות (C)</p> Signup and view all the answers

מה ניתן לומר על המתאם בין המאפיינים ‪ X1 ו X2‬בגרף שצוין?

<p>ישנו מתאם חיובי בין המאפיינים ‪ X1‬ו‪X2 (A)</p> Signup and view all the answers

מהי משמעות המושג 'נתונים בלתי ניתנים לשינוי' (immutable)?

<p>נתונים אשר לא ניתן לשנותם לאחר יצירתם (C)</p> Signup and view all the answers

מהו השלב הראשון בעבודת מדען הנתונים לאחר ניסוח שאלת המחקר?

<p>איסוף נתונים (B)</p> Signup and view all the answers

איזה סוג מידע יכולים להחזיר הביטויים הרגולריים המוגדרים לעיל?

<p>שמות עם תחיליות (B)</p> Signup and view all the answers

מהו תפקידם של הנתונים במסגרת פייתון?

<p>לשמור נתונים ומבנים שונים (B)</p> Signup and view all the answers

אילו סוגי נתונים ניתן לאחסן בפנדס?

<p>כל הסוגים הנל (B)</p> Signup and view all the answers

איזו מהפעולות הבאות מהווה חלק מתהליך ניקוי נתונים?

<p>מחיקת ערכים כפולים (A)</p> Signup and view all the answers

מה המאפיין של מערכות נתונים ב-Java?

<p>היכולת ליצור אינטגרציה עם שפות אחרות (C)</p> Signup and view all the answers

מהי משמעות המונח 'שאלה תוכניתית' במחקר נתונים?

<p>שאלה הממקדת את המחקר ונתנת כיוון (B)</p> Signup and view all the answers

איזה מבנה נתונים משמש לייצוג טבלה דו-ממדית בספריית pandas?

<p>DataFrame (B)</p> Signup and view all the answers

מהו תהליך Outlier Detection?

<p>זיהוי ערכים החורגים מיתר הערכים במאפיין מסוים (B)</p> Signup and view all the answers

איזה אלגוריתם נחשב לאלגוריתם למידה מפוקחת?

<p>אלגוריתם סיווג החלטה (D)</p> Signup and view all the answers

איזו פקודת pandas משמשת לטעינת נתונים מקובץ CSV?

<p>pd.read_csv() (B)</p> Signup and view all the answers

איזו פקודה מציגה את בצורה הטובה ביותר את מספר השורות והש-columnsלמסגרת נתונים?

<p>df.shape (D)</p> Signup and view all the answers

מהו ערך השכיח?

<p>הערך הנפוץ ביותר בקבוצת נתונים (A)</p> Signup and view all the answers

מהי המטרה של מודול requests בפייתון?

<p>שליחת בקשות HTTP לאתרים (A)</p> Signup and view all the answers

איזה מהמודולים הבאים נפוץ יותר לעבודה עם נתונים בעזרת API?

<p>requests (C)</p> Signup and view all the answers

מהו הפלט של הקוד הבא בפייתון: print([2, False, True])?

<p>[2, False, True] (A)</p> Signup and view all the answers

מהו תפקידו של אלגוריתם N-צמיחה בלמידה לא מונחית?

<p>להפריד בין קבוצות שונות בנתונים (A)</p> Signup and view all the answers

Flashcards

מטרה של ניתוח חקרני של נתונים (EDA)

לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם.

אשכול (Clustering)

תהליך קבוצתי שבו אנחנו מקבצים נתונים לפי דמיון או קרבה.

אלגוריתם DBSCAN

אלגוריתם לאשכול נתונים שמזהה קבוצות על בסיס צפיפות.

אלגוריתם KMeans

אלגוריתם לאשכול, מפריד את הנתונים ל-K קבוצות לפי מרכזים.

Signup and view all the flashcards

סקאלות סודר

סולם דירוג שבו יש משמעות לסדר של הערכים אך לא להפרשים ביניהם.

Signup and view all the flashcards

סקאלות רווח

סולם שבו ההפרשים בין הערכים הם עם משמעות מדויקת.

Signup and view all the flashcards

Anomaly detection

תהליך זיהוי חריגים בנתונים, ברמות שונות.

Signup and view all the flashcards

PCA

שיטה להפחתת ממדיות בנתונים על ידי מציאת כיוונים קריטיים.

Signup and view all the flashcards

למידת מכונה

תהליך שבו מחשבים לומדים לזהות תבניות בנתונים.

Signup and view all the flashcards

שאלות מחקר

שאלות שמנחות את תהליך מחקר הנתונים.

Signup and view all the flashcards

קופסה (box plot)

טכניקת הצגת חציון, רבעונים וטווח בין רבעוני של נתונים.

Signup and view all the flashcards

מתאם פירסון (Pearson)

מספר המראה קשר בין שני נתונים בסולם רווח או מנה.

Signup and view all the flashcards

IQR

המרחק בין הרבעון הראשון לרבעון השלישי, מודד פיזור נתונים.

Signup and view all the flashcards

ספריית sklearn

ספריית פייתון נפוצה לביצוע למידה בלתי מונחית.

Signup and view all the flashcards

מאפיינים ומופעים ב-DataFrame

מאפיינים מיוצגים בעמודות ומופעים בשורות.

Signup and view all the flashcards

vectorizer

אוביקט להמרת טקסט לייצוג וקטורי בשיטת bag of words.

Signup and view all the flashcards

תאים בהיסטוגרמה

הגדלת מספר התאים מפחיתה את גובה העמודות המייצגות כמות דגימות.

Signup and view all the flashcards

requests בספריית פייתון

משמשת לביצוע פניות HTTP או HTTPS לשרתי רשת.

Signup and view all the flashcards

לימוד לא מונחית

סיווג בעיה כבעיה של אשכולות בעבודת מחקר.

Signup and view all the flashcards

מילוי ערכים חסרים

הדרך המועדפת היא שימוש ב-'median' או 'mode' למילוי ערכים חסרים.

Signup and view all the flashcards

סולם סודר

סולם שבו ניתן למדוד מעלות בעזרת חיבור וחיסור.

Signup and view all the flashcards

סולם רווח

סולם שבו ניתן למדוד מעלות בכפל וחלק, עם מרווחים ממשיים.

Signup and view all the flashcards

כתובת אימייל

מחרוזת טקסט המכילה שם ודומיין עם סימן '@'.

Signup and view all the flashcards

תרשים פיזור

גרף דו-מימדי המציג נתונים באמצעות מיקום, צבעים, וצורות.

Signup and view all the flashcards

מרווחים שלמים

פערים בעבודה בסולם סודר שאינם כוללים שברים.

Signup and view all the flashcards

מרווחים ממשיים

פערים אפשריים בסולם רווח שמכילים גם מספרים שברים.

Signup and view all the flashcards

תרשים קופסה

גרף המראה סטטיסטיקות כמו חציון, רבעונים, ומרווחים.

Signup and view all the flashcards

הביטוי הרגולרי

תבנית שמחפשת תוויים מסוימים כמו כתובות אימייל.

Signup and view all the flashcards

משתנים דו-מימדיים

מזהים שהתרשים יכול להציג נתונים לפחות על שני ממדים.

Signup and view all the flashcards

הצגת משתנים

שיטה להראות משתנים שונים בגרפים שונים.

Signup and view all the flashcards

מתאם לינארי

מדד שמראה את הקשר בין משתנים בצורה ישירה.

Signup and view all the flashcards

ניסוח שאלת מחקר

שלב הראשון בעבודתו של מדען הנתונים, שבו מגדירים את המטרה.

Signup and view all the flashcards

מטרת הביטוי הרגולרי

למצוא כל המילים שמתחילות באות גדולה וממשיכות באותיות קטנות.

Signup and view all the flashcards

הדרגתיות באשכולות

המרחק בין נתונים קובע את קרבתם זה לזה.

Signup and view all the flashcards

פיקוח על מתאמים

בחינת קשרים בין שני משתנים לעיתים לעזרה בהבנת הנתונים.

Signup and view all the flashcards

איסוף נתונים

שלב שבו נאספים נתונים לצורך ניתוחם.

Signup and view all the flashcards

עיבוד נתונים

שימוש בטכניקות כדי לשפר את איכות הנתונים לפני ניתוח.

Signup and view all the flashcards

תרשימי עוגה

גראפים למצגת החלקים מתוך כל עבור קטגוריות.

Signup and view all the flashcards

מספרים עשרוניים

מספרים המייצגים ערכים בין שלמים.

Signup and view all the flashcards

רווחים בין מספרים

מרחקים בטקסט שמפרידים בין תווים.

Signup and view all the flashcards

קטגוריות מועטות

מספר קטן של קבוצות בגרף.

Signup and view all the flashcards

חישוב חלקים

למצוא מה חלק מכלל בתרשימים.

Signup and view all the flashcards

בהירות תרשים

כיצד גרף מובן וקל להבנה.

Signup and view all the flashcards

סוגי גרפים

צורות שונות להציג נתונים, כמו עוגה ודיאגרמות.

Signup and view all the flashcards

שימוש בפסיקים

הפרדת חלקים במספרים בעזרת פסיקים.

Signup and view all the flashcards

מבחן על תרשימי עוגה

שאלות שקשורות לשימוש ולתצוגה של תרשימי עוגה.

Signup and view all the flashcards

מבנה נתונים במערך חד מימדי

הטיפוס של מערך חד מימדי בספריית Pandas הוא Series.

Signup and view all the flashcards

Outlier Detection

תהליך זיהוי ערכים חריגים המשמעותיים מיתר הערכים במאפיין מסוים.

Signup and view all the flashcards

למידה לא מונחית

שיטה שבה המחשב לומד ממידע ללא תוויות לשימוש בשיטות כמו אשכול.

Signup and view all the flashcards

DataFrame לכתיבת קובץ CSV

כדי לכתוב DataFrame לקובץ CSV יש להשתמש בפונקציה to_csv.

Signup and view all the flashcards

מודול לייבוא Seaborn

המודול Seaborn ידוע כמודול המיובא כ-sns.

Signup and view all the flashcards

מספר שורות ועמודות ב-DataFrame

הפקודה df.shape מציגה את מספר השורות והעמודות במסגרת נתונים.

Signup and view all the flashcards

האלגוריתם הלא מונחה

אלגוריתם ניתוח רכיבים ראשיים (PCA) הוא אלגוריתם למידה לא מונחית.

Signup and view all the flashcards

מדד להחלפת ערכים חסרים

הערך השכיח משמש להחלפת ערכים חסרים בנתונים קטגוריאליים.

Signup and view all the flashcards

הכנסת נתונים מ-API

המודול requests מיודע לשימוש לצורך הרכשת נתונים בעזרת Web-API.

Signup and view all the flashcards

כלל התשובות הנכונות

כל התשובות נכונות כשמדובר בתחומים של למידה לא מונחית.

Signup and view all the flashcards

קורלציה

מדד המראה את הקשר בין שני משתנים.

Signup and view all the flashcards

קורלציה לינארית שלילית

קשר שבו כאשר משתנה אחד גדל, השני קטן.

Signup and view all the flashcards

קורלציה לינארית חיובית

קשר שבו כאשר משתנה אחד גדל, השני גם גדל.

Signup and view all the flashcards

נתונים חקרניים (EDA)

תהליך לזהות תבניות וקשרים בנתונים.

Signup and view all the flashcards

הרכשת נתונים

השגת מידע לצורך ניתוח.

Signup and view all the flashcards

מבנה נתונים בלתי ניתן לשינוי

מבנה נתונים שלא ניתן לשנותו לאחר יצירתו.

Signup and view all the flashcards

כתובת דוא"ל

מחרוזת טקסט עם שם ודומיין שכוללת '@'.

Signup and view all the flashcards

פייתון ו-java

שפות תכנות שונות שניתן להמיר ביניהן.

Signup and view all the flashcards

אחסון נתונים ב-pandas

אפשר לאחסן מספרים, טקסט, ותאריכים במסגרת נתונים.

Signup and view all the flashcards

בתחום ה-API

אמצעי תקשורת בין תוכניות דרך אינטרנט.

Signup and view all the flashcards

מטרה של היסטוגרמה

שיטה להצגת שכיחות ערכים רציפים באמצעות עמודות.

Signup and view all the flashcards

קשרים בין משתנים

תהליך זיהוי הקשרים והקורלציות שבין נתונים שונים.

Signup and view all the flashcards

ייצוג נתונים קטגוריאליים

שיטה להצגת נתונים בקטגוריות באמצעות חלקי עוגה.

Signup and view all the flashcards

הנחה על מגמות נתונים

תהליך חקר מגמות בעיתיות של נתונים לאורך זמן.

Signup and view all the flashcards

הפחתת ממדיות

תהליך זיהוי דפוסים וקשרים כדי להפחית ממדיות.

Signup and view all the flashcards

חיזוי אירועים

תהליך לחזות אירועים עתידיים בעזרת נתונים קיימים.

Signup and view all the flashcards

נתונים גדולים

תהליך לתרגם נתונים גדולים ולא מסודרים למידע שימושי.

Signup and view all the flashcards

Study Notes

מבחן מועד א' - מבוא למדעי הנתונים

  • תאריך הבחינה: 21/3/24
  • משך הבחינה: שעתיים
  • חומר עזר: מחשבון
  • סוג הבחינה: רב ברירתית
  • הוראות: לסמן את התשובה הנכונה מבין ארבע אפשרויות

שאלות

  • שאלה 1: מהי המטרה של ניתוח חקרני של נתונים (EDA)?

    • לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם.
  • שאלה 2: איזה אלגוריתם יאפשר לאשכל את הנתונים ל-4 קבוצות?

    • K4 עם KMeans
  • שאלה 3: מה ההבדל בין סולם סודר וסולם רווח?

    • בסולם סודר אפשר לחשב שכיח, ובסולם רווח אפשר לחשב שכיח וממוצע. המרווחים בסולם רווח יכולים להיות ממשיים.
  • שאלה 4: אילו מחרוזות יחזיר הביטוי הרגולרי (regular expression)?

    • כתובות אימייל
  • שאלה 5: האם ניתן להציג יותר משני משתנים בתרשים פיזור?

    • כן, ניתן להציג משתנים נוספים באמצעות צורות, צבעים, גדלים וכדומה.
  • שאלה 6: מהו תרשים קופסה (box plot)?

    • טכניקה להצגת החציון, הרבעונים והטווח הבין-רבעוני.
  • שאלה 7: מהו מתאם פירסון?

    • מספר שמצביע על קשר (קורלציה / מתאם) בין שני נתונים בסולם רווח או מנה.
  • שאלה 8: חשבו את ה-IQR של הנתונים הבאים: [16, 19, 23, 36, 39, 81, 85, 90]

    • 62
  • שאלה 9: מה ניתן לומר על המתאם בין המאפיינים X1,X2 בכל תרשים?

    • יש צורך בתיאור הגרפים כדי לענות על השאלה, יש לציין אם המתאם חיובי, שלילי או כמעט אפס.
  • שאלה 10: איזו ספרייה בפייתון משמשת לביצוע אלגוריתמים של למידה בלתי מונחית?

    • SciPy
  • שאלה 11: כיצד נוכל להשיג נתונים מאתר Shein?

    • אם יש API, אפשר להשתמש בו. אחרת, יש להשתמש ב-crawling.
  • שאלה 12: איך מיוצגים מאפיינים ומופעים ב-dataframe?

    • המאפיינים מיוצגים בעמודות והמופעים בשורות.
  • שאלה 13: איזו ספרייה מקובל לייבא כ-pd?

    • Pandas
  • שאלה 14: מה זה vectorizer?

    • אוביקט שמשנה מסמך טקסט ליצוג וקטורי של מילים. (Bag of words)
  • שאלה 15: כיצד משפיעה הגדלת מספר התאים בהיסטוגרמה על ערכי התאים?

    • ככל שמספר התאים גדל, ערכי התאים קטנים יותר.
  • שאלה 16: מה השימוש המרכזי של ספריית requests בפייתון?

    • פניות HTTP/HTTPS לשרתי רשת.
  • שאלה 17: איך תסווגו את הבעיה בסידור לקוחות ב-5 קבוצות?

    • למידה לא מונחית, בעיית אשכול (clustering).
  • שאלה 18: מה הדרך המועדפת למילוי ערבים חסרים?

    • בדרך כלל, median.
  • שאלה 19: כדי לטעון קובץ CSV לתוך מסגרת נתונים (dataframe), תשתמשו בפקודה:

    • read_csv
  • שאלה 20: מבין המדדים הבאים, מהו מדד המשמש למדידת פיזור נתונים?

    • סטיית תקן

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

More Like This

Use Quizgecko on...
Browser
Browser