מבחן מבוא למדעי הנתונים - מועד א'
77 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

מהי המטרה העיקרית של ניתוח חקרני של נתונים (EDA)?

  • לפתח מודלים מתקדמים של למידת מכונה על סמך הנתונים הקיימים.
  • לקבוע את הקשר הסיבתי בין משתנים שונים באופן חד משמעי.
  • לזהות דפוסים, קשרים ומגמות בנתונים שאינם נראים מיד לעין. (correct)
  • לנקות ולעבד את הנתונים לצורך יצירת ויזואליזציות פשוטות.
  • איזה מהאלגוריתמים הבאים מתאים ביותר לביצוע אשכול (clustering) של מבנה נתונים מורכב שבו צפיפות הנקודות משתנה, לשם יצירת 4 קבוצות מובחנות?

  • PCA המשמש להפחתת מימדים ואינו מתאים לבעיות אשכול.
  • K-Means עם k=4, מתאים במיוחד למבנים עם גדלים וצפיפות שווים.
  • DBSCAN, המתאים במיוחד לזיהוי צבירים בעלי צפיפות משתנה וצורות שרירותיות. (correct)
  • ניתוח אנומליה, המתמקד בזיהוי נקודות חריגות ולא באשכול כל הנקודות.
  • מהו ההבדל העיקרי בין סולם סודר (ordinal) לסולם רווח (interval) במדידת נתונים?

  • בשני הסולמות יש משמעות לסדר ומרווחים, אך סולם רווח מאפשר להשוות בין יחסים.
  • בסולם רווח יש משמעות לסדר בלבד, ואילו בסולם סודר יש משמעות גם למרווחים בין הערכים.
  • בסולם סודר יש משמעות לסדר בלבד, ואילו בסולם רווח יש משמעות גם למרווחים בין הערכים. (correct)
  • בסולם סודר ניתן לבצע פעולות חשבוניות, בעוד שבסולם רווח לא ניתן לבצע פעולות חשבוניות.
  • איזה מהבאים אינו מהווה דוגמה למשתנה קטגוריאלי?

    <p>טמפרטורה במעלות צלזיוס. (D)</p> Signup and view all the answers

    מהי מטרת הפיצול לנתוני אימון (training), תיקוף (validation) ובדיקה (test) בתהליך בניית מודל למידת מכונה?

    <p>גם B וגם C נכונות. (A)</p> Signup and view all the answers

    באיזה סוג של בעיית למידת מכונה נשתמש במדד ה־F1?

    <p>בעיית סיווג בינארית כאשר קיימת חוסר איזון בנתונים בין המחלקות. (B)</p> Signup and view all the answers

    מהו תפקידם של פרמטרי ההיפר (hyperparameters) במודל למידת מכונה?

    <p>לקבוע את המבנה ואת התנהגות הלמידה של המודל, אך לא אלו שנלמדים במהלך האימון. (C)</p> Signup and view all the answers

    איזו מהפעולות הבאות היא חלק מתהליך של ניקוי נתונים (Data Cleaning)?

    <p>החלפת ערכים חסרים בנתונים בערך ממוצע של עמודה. (A)</p> Signup and view all the answers

    מהי המשמעות של המושג 'עקומת ROC' בהקשר של מודלים לסיווג בינארי?

    <p>עקומה המציגה את היחס בין שיעור החיוביים האמיתיים לשיעור השליליים השגויים, בערכי סף שונים. (A)</p> Signup and view all the answers

    איזה מהאלגוריתמים הבאים משמש לרוב להפחתת מימדיות בנתונים?

    <p>PCA. (B)</p> Signup and view all the answers

    על מה ניתן לחשב שכיח וממוצע?

    <p>בסולם רווח בלבד (C)</p> Signup and view all the answers

    מה נכון לגבי סולמות מדידה?

    <p>בסולם רווח המרווחים יכולים להיות גם ממשיים (A)</p> Signup and view all the answers

    איזה סוג מידע מחזיר הביטוי הרגולרי הנתון?

    <p>כתובות אימייל (B)</p> Signup and view all the answers

    האם ניתן להציג יותר משני משתנים תרשים פיזור?

    <p>אפשר להציג עם צבעים וצורות (D)</p> Signup and view all the answers

    מהו תרשים קופסה?

    <p>גרף הממחיש תפוצה של נתונים (B)</p> Signup and view all the answers

    מהן הדרכים בהן ניתן להציג משתנים בתרשים פיזור?

    <p>מיקום, צבעים וצורות שונים (C)</p> Signup and view all the answers

    מה אומרים המושגים 'רווח' ו'סודר' על שלל מהותם?

    <p>הסולמות נבדלים זה מזה לפי סוגי המרווחים (B)</p> Signup and view all the answers

    מה הנכון לגבי הכנות בנתוני תצפית בהקשר של תרשים פיזור?

    <p>אפשר לייצג מיני נתונים שונים באותו תרשים (C)</p> Signup and view all the answers

    איזה פעולות ניתן לבצע בסולם רווח?

    <p>חיבור, חיסור, וממוצע (D)</p> Signup and view all the answers

    מהי המטרה העיקרית של גרף קופסה (box plot)?

    <p>להציג חציון, רבעונים וטווח בין רבעוני (C)</p> Signup and view all the answers

    מהו המתאם פירסון?

    <p>מדד של קורלציה בין שני נתונים בסולם מנה או סודר (A)</p> Signup and view all the answers

    מהו הערך של ה-IQR עבור הנתונים [16, 19, 23, 36, 39, 81, 85, 90]?

    <p>49 (C)</p> Signup and view all the answers

    איזה מתאם מתאר את הגרף הימני, האמצעי והשמאלי בהתאמה אם הגרף הימני מראה מתאם חיובי?

    <p>הגרף האמצעי שלילי והשמאלי אפס (C)</p> Signup and view all the answers

    איזו ספרייה בפייתון משמשת לביצוע אלגוריתמים של למידה בלתי מונחית?

    <p>Sklearn (B)</p> Signup and view all the answers

    כיצד ניתן למלא ערכים חסרים בעמודה בקוד הבא?

    <p>באמצעות מצב (B)</p> Signup and view all the answers

    מה השימוש העיקרי בספרייה requests בפייתון?

    <p>לצורך פניות HTTP או HTTPS (B)</p> Signup and view all the answers

    מהי הדרך המועדפת למלא ערכים חסרים בעמודת דאטה בפריימפ?

    <p>באמצעות עותק של הערך המופיע הכי הרבה (A)</p> Signup and view all the answers

    מהי הדרך הנכונה לטעון קובץ CSV למסגרת נתונים?

    <p>read_csv (C)</p> Signup and view all the answers

    איזה מדד משמש למדידת פיזור נתונים?

    <p>סטיית תקן (D)</p> Signup and view all the answers

    איזה מהביטויים הרגולריים הבאים מתאים לזיהוי מחרוזת המכילה מספר שלם (ללא אפס מוביל) ואחריו מספר עשרוני כאשר שני המספרים מופרדים בפסיק או רווח?

    <p><code>r'^[1-9]\d*[,\s](0|[1-9]\d*)\.\d+'</code> (C)</p> Signup and view all the answers

    בהינתן קבוצת נתונים לא מקושרת, איזה אלגוריתם אשכול יתאים בצורה הטובה ביותר?

    <p>אשכול היררכי אגלומינטיבי (A)</p> Signup and view all the answers

    איזה מהתרשימים הבאים מתאר מתאם שלילי?

    <p>תרשים שבו ערכי X עולים וערכי Y יורדים במגמה כללית (C)</p> Signup and view all the answers

    מהי הפעולה הבאה לאחר איסוף הנתונים, בתהליך של מדען נתונים?

    <p>ניתוח חקרני של הנתונים (EDA) (A)</p> Signup and view all the answers

    מה מטרת השימוש בביטוי הרגולרי \b\w+\@\w+\.\w+\b?

    <p>מציאת כתובות דואר אלקטרוני (D)</p> Signup and view all the answers

    בהתחשב במערך הנתונים הבא: [3, 8, 2, 5, 10, 12], מה יהיה ה-IQR (טווח בין-רבעוני)?

    <p>7 (D)</p> Signup and view all the answers

    איזה סוג של משתנה מתאר את רמת השכר של עובד בחברה?

    <p>משתנה רציף (C)</p> Signup and view all the answers

    איזה אלגוריתם למידה בלתי מונחית מתאים לזיהוי חריגות בנתונים?

    <p>Isolation Forest (D)</p> Signup and view all the answers

    בטבלת נתונים המכילה עמודה עם ערכים חסרים, איזו פעולה עדיף לבצע?

    <p>השלמת ערכים חסרים בצורה מחושבת (A)</p> Signup and view all the answers

    איזו מטרה העיקרית של שימוש ב'פנדס' בפייתון?

    <p>עיבוד וניתוח נתונים (A)</p> Signup and view all the answers

    איזה ביטוי רגולרי מתאים להציג מספרים עשרוניים עם פסיק?

    <p>r\d+\s*,\s*\d+ (A)</p> Signup and view all the answers

    מהו השימוש הנכון בתרשימי עוגה?

    <p>מראים את הרכב השלם של מספר קטגוריות מועטות (D)</p> Signup and view all the answers

    איזה חתך מייצג את הכמות המקסימלית של קטגוריות בתרשים עוגה?

    <p>1-2 קטגוריות (A)</p> Signup and view all the answers

    איזה מהביטויים לא מתאר מספר באותו הפורמט?

    <p>5 9.0 (D)</p> Signup and view all the answers

    איזה ביטוי רגולרי מציין מספרים שלמים ואחריהם מספר עשרוני?

    <p>r\b[1-9]\d*\s*(?:,|\s)\s*(?:0|[1-9]\d*).\d+\b (C)</p> Signup and view all the answers

    מה יתרון המרשים של תרשימי עוגה?

    <p>הם מתאימים להצגת מידע בהיר בצורה מצומצמת (C)</p> Signup and view all the answers

    מהו היתרון של הצגת נתונים בעזרי תרשימי עוגה?

    <p>הבנה טובה יותר של יחסי גודל בין חלקים (D)</p> Signup and view all the answers

    איזו משיטה היא הדרך היעילה ביותר להשוואת ערכים בתרשימי עוגה?

    <p>מדידה של סך הכל (D)</p> Signup and view all the answers

    מהי השאלה המרכזית שתרשימי עוגה לא יכולים להשיב עליה?

    <p>מהן מגמות נתונים לאורך זמן? (D)</p> Signup and view all the answers

    איזה מהביטויים נחשב לשגוי בפורמט מספרים עשרוניים?

    <p>1.23 4 (A)</p> Signup and view all the answers

    מהי המטרה המרכזית של אשכול (clustering) בנתונים?

    <p>לזהות דפוסים וקשרים בנתונים (D)</p> Signup and view all the answers

    איזו מהשיטות הבאות מתאימה להציג שכיחות של נתונים רציפים?

    <p>היסטוגרמה (D)</p> Signup and view all the answers

    איזה מהמרכיבים הבאים לא משמש להצגת קשרים בין משתנים?

    <p>תרשים עוגה (A)</p> Signup and view all the answers

    מהי שיטת הוויזואליזציה המתאימה להצגת מגמות זמן?

    <p>תרשים קווים (C)</p> Signup and view all the answers

    איזו מהתשובות הבאות מתארת נכון את השימוש בהיסטוגרמה?

    <p>הצגת שכיחות טווח של ערכים רציפים (C)</p> Signup and view all the answers

    איזה מתודולוגיה לא מתאימה לניתוח נתונים קטגוריאליים?

    <p>תרשים פיזור (B)</p> Signup and view all the answers

    מהו היתרון בשימוש בהיסטוגרמה לעומת תרשימי עוגה?

    <p>יכולת להצגה של שכיחות ערכים רציפים (A)</p> Signup and view all the answers

    מהו השימוש הנכון בהיסטוגרמה?

    <p>לשקף את שכיחות ערכים בטווחים (B)</p> Signup and view all the answers

    איזה יתרון יש להיסטוגרמה על פני טכניקות אחרות?

    <p>אפקטיבית בהצגת שכיחות נתונים במחיצות (C)</p> Signup and view all the answers

    מה ניתן לומר על המתאם בין המאפיינים ‪ X1 ו X2‬בגרף שצוין?

    <p>ישנו מתאם חיובי בין המאפיינים ‪ X1‬ו‪X2 (A)</p> Signup and view all the answers

    מהי משמעות המושג 'נתונים בלתי ניתנים לשינוי' (immutable)?

    <p>נתונים אשר לא ניתן לשנותם לאחר יצירתם (C)</p> Signup and view all the answers

    מהו השלב הראשון בעבודת מדען הנתונים לאחר ניסוח שאלת המחקר?

    <p>איסוף נתונים (B)</p> Signup and view all the answers

    איזה סוג מידע יכולים להחזיר הביטויים הרגולריים המוגדרים לעיל?

    <p>שמות עם תחיליות (B)</p> Signup and view all the answers

    מהו תפקידם של הנתונים במסגרת פייתון?

    <p>לשמור נתונים ומבנים שונים (B)</p> Signup and view all the answers

    אילו סוגי נתונים ניתן לאחסן בפנדס?

    <p>כל הסוגים הנל (B)</p> Signup and view all the answers

    איזו מהפעולות הבאות מהווה חלק מתהליך ניקוי נתונים?

    <p>מחיקת ערכים כפולים (A)</p> Signup and view all the answers

    מה המאפיין של מערכות נתונים ב-Java?

    <p>היכולת ליצור אינטגרציה עם שפות אחרות (C)</p> Signup and view all the answers

    מהי משמעות המונח 'שאלה תוכניתית' במחקר נתונים?

    <p>שאלה הממקדת את המחקר ונתנת כיוון (B)</p> Signup and view all the answers

    איזה מבנה נתונים משמש לייצוג טבלה דו-ממדית בספריית pandas?

    <p>DataFrame (B)</p> Signup and view all the answers

    מהו תהליך Outlier Detection?

    <p>זיהוי ערכים החורגים מיתר הערכים במאפיין מסוים (B)</p> Signup and view all the answers

    איזה אלגוריתם נחשב לאלגוריתם למידה מפוקחת?

    <p>אלגוריתם סיווג החלטה (D)</p> Signup and view all the answers

    איזו פקודת pandas משמשת לטעינת נתונים מקובץ CSV?

    <p>pd.read_csv() (B)</p> Signup and view all the answers

    איזו פקודה מציגה את בצורה הטובה ביותר את מספר השורות והש-columnsלמסגרת נתונים?

    <p>df.shape (D)</p> Signup and view all the answers

    מהו ערך השכיח?

    <p>הערך הנפוץ ביותר בקבוצת נתונים (A)</p> Signup and view all the answers

    מהי המטרה של מודול requests בפייתון?

    <p>שליחת בקשות HTTP לאתרים (A)</p> Signup and view all the answers

    איזה מהמודולים הבאים נפוץ יותר לעבודה עם נתונים בעזרת API?

    <p>requests (C)</p> Signup and view all the answers

    מהו הפלט של הקוד הבא בפייתון: print([2, False, True])?

    <p>[2, False, True] (A)</p> Signup and view all the answers

    מהו תפקידו של אלגוריתם N-צמיחה בלמידה לא מונחית?

    <p>להפריד בין קבוצות שונות בנתונים (A)</p> Signup and view all the answers

    Flashcards

    מטרה של ניתוח חקרני של נתונים (EDA)

    לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם.

    אשכול (Clustering)

    תהליך קבוצתי שבו אנחנו מקבצים נתונים לפי דמיון או קרבה.

    אלגוריתם DBSCAN

    אלגוריתם לאשכול נתונים שמזהה קבוצות על בסיס צפיפות.

    אלגוריתם KMeans

    אלגוריתם לאשכול, מפריד את הנתונים ל-K קבוצות לפי מרכזים.

    Signup and view all the flashcards

    סקאלות סודר

    סולם דירוג שבו יש משמעות לסדר של הערכים אך לא להפרשים ביניהם.

    Signup and view all the flashcards

    סקאלות רווח

    סולם שבו ההפרשים בין הערכים הם עם משמעות מדויקת.

    Signup and view all the flashcards

    Anomaly detection

    תהליך זיהוי חריגים בנתונים, ברמות שונות.

    Signup and view all the flashcards

    PCA

    שיטה להפחתת ממדיות בנתונים על ידי מציאת כיוונים קריטיים.

    Signup and view all the flashcards

    למידת מכונה

    תהליך שבו מחשבים לומדים לזהות תבניות בנתונים.

    Signup and view all the flashcards

    שאלות מחקר

    שאלות שמנחות את תהליך מחקר הנתונים.

    Signup and view all the flashcards

    קופסה (box plot)

    טכניקת הצגת חציון, רבעונים וטווח בין רבעוני של נתונים.

    Signup and view all the flashcards

    מתאם פירסון (Pearson)

    מספר המראה קשר בין שני נתונים בסולם רווח או מנה.

    Signup and view all the flashcards

    IQR

    המרחק בין הרבעון הראשון לרבעון השלישי, מודד פיזור נתונים.

    Signup and view all the flashcards

    ספריית sklearn

    ספריית פייתון נפוצה לביצוע למידה בלתי מונחית.

    Signup and view all the flashcards

    מאפיינים ומופעים ב-DataFrame

    מאפיינים מיוצגים בעמודות ומופעים בשורות.

    Signup and view all the flashcards

    vectorizer

    אוביקט להמרת טקסט לייצוג וקטורי בשיטת bag of words.

    Signup and view all the flashcards

    תאים בהיסטוגרמה

    הגדלת מספר התאים מפחיתה את גובה העמודות המייצגות כמות דגימות.

    Signup and view all the flashcards

    requests בספריית פייתון

    משמשת לביצוע פניות HTTP או HTTPS לשרתי רשת.

    Signup and view all the flashcards

    לימוד לא מונחית

    סיווג בעיה כבעיה של אשכולות בעבודת מחקר.

    Signup and view all the flashcards

    מילוי ערכים חסרים

    הדרך המועדפת היא שימוש ב-'median' או 'mode' למילוי ערכים חסרים.

    Signup and view all the flashcards

    סולם סודר

    סולם שבו ניתן למדוד מעלות בעזרת חיבור וחיסור.

    Signup and view all the flashcards

    סולם רווח

    סולם שבו ניתן למדוד מעלות בכפל וחלק, עם מרווחים ממשיים.

    Signup and view all the flashcards

    כתובת אימייל

    מחרוזת טקסט המכילה שם ודומיין עם סימן '@'.

    Signup and view all the flashcards

    תרשים פיזור

    גרף דו-מימדי המציג נתונים באמצעות מיקום, צבעים, וצורות.

    Signup and view all the flashcards

    מרווחים שלמים

    פערים בעבודה בסולם סודר שאינם כוללים שברים.

    Signup and view all the flashcards

    מרווחים ממשיים

    פערים אפשריים בסולם רווח שמכילים גם מספרים שברים.

    Signup and view all the flashcards

    תרשים קופסה

    גרף המראה סטטיסטיקות כמו חציון, רבעונים, ומרווחים.

    Signup and view all the flashcards

    הביטוי הרגולרי

    תבנית שמחפשת תוויים מסוימים כמו כתובות אימייל.

    Signup and view all the flashcards

    משתנים דו-מימדיים

    מזהים שהתרשים יכול להציג נתונים לפחות על שני ממדים.

    Signup and view all the flashcards

    הצגת משתנים

    שיטה להראות משתנים שונים בגרפים שונים.

    Signup and view all the flashcards

    מתאם לינארי

    מדד שמראה את הקשר בין משתנים בצורה ישירה.

    Signup and view all the flashcards

    ניסוח שאלת מחקר

    שלב הראשון בעבודתו של מדען הנתונים, שבו מגדירים את המטרה.

    Signup and view all the flashcards

    מטרת הביטוי הרגולרי

    למצוא כל המילים שמתחילות באות גדולה וממשיכות באותיות קטנות.

    Signup and view all the flashcards

    הדרגתיות באשכולות

    המרחק בין נתונים קובע את קרבתם זה לזה.

    Signup and view all the flashcards

    פיקוח על מתאמים

    בחינת קשרים בין שני משתנים לעיתים לעזרה בהבנת הנתונים.

    Signup and view all the flashcards

    איסוף נתונים

    שלב שבו נאספים נתונים לצורך ניתוחם.

    Signup and view all the flashcards

    עיבוד נתונים

    שימוש בטכניקות כדי לשפר את איכות הנתונים לפני ניתוח.

    Signup and view all the flashcards

    תרשימי עוגה

    גראפים למצגת החלקים מתוך כל עבור קטגוריות.

    Signup and view all the flashcards

    מספרים עשרוניים

    מספרים המייצגים ערכים בין שלמים.

    Signup and view all the flashcards

    רווחים בין מספרים

    מרחקים בטקסט שמפרידים בין תווים.

    Signup and view all the flashcards

    קטגוריות מועטות

    מספר קטן של קבוצות בגרף.

    Signup and view all the flashcards

    חישוב חלקים

    למצוא מה חלק מכלל בתרשימים.

    Signup and view all the flashcards

    בהירות תרשים

    כיצד גרף מובן וקל להבנה.

    Signup and view all the flashcards

    סוגי גרפים

    צורות שונות להציג נתונים, כמו עוגה ודיאגרמות.

    Signup and view all the flashcards

    שימוש בפסיקים

    הפרדת חלקים במספרים בעזרת פסיקים.

    Signup and view all the flashcards

    מבחן על תרשימי עוגה

    שאלות שקשורות לשימוש ולתצוגה של תרשימי עוגה.

    Signup and view all the flashcards

    מבנה נתונים במערך חד מימדי

    הטיפוס של מערך חד מימדי בספריית Pandas הוא Series.

    Signup and view all the flashcards

    Outlier Detection

    תהליך זיהוי ערכים חריגים המשמעותיים מיתר הערכים במאפיין מסוים.

    Signup and view all the flashcards

    למידה לא מונחית

    שיטה שבה המחשב לומד ממידע ללא תוויות לשימוש בשיטות כמו אשכול.

    Signup and view all the flashcards

    DataFrame לכתיבת קובץ CSV

    כדי לכתוב DataFrame לקובץ CSV יש להשתמש בפונקציה to_csv.

    Signup and view all the flashcards

    מודול לייבוא Seaborn

    המודול Seaborn ידוע כמודול המיובא כ-sns.

    Signup and view all the flashcards

    מספר שורות ועמודות ב-DataFrame

    הפקודה df.shape מציגה את מספר השורות והעמודות במסגרת נתונים.

    Signup and view all the flashcards

    האלגוריתם הלא מונחה

    אלגוריתם ניתוח רכיבים ראשיים (PCA) הוא אלגוריתם למידה לא מונחית.

    Signup and view all the flashcards

    מדד להחלפת ערכים חסרים

    הערך השכיח משמש להחלפת ערכים חסרים בנתונים קטגוריאליים.

    Signup and view all the flashcards

    הכנסת נתונים מ-API

    המודול requests מיודע לשימוש לצורך הרכשת נתונים בעזרת Web-API.

    Signup and view all the flashcards

    כלל התשובות הנכונות

    כל התשובות נכונות כשמדובר בתחומים של למידה לא מונחית.

    Signup and view all the flashcards

    קורלציה

    מדד המראה את הקשר בין שני משתנים.

    Signup and view all the flashcards

    קורלציה לינארית שלילית

    קשר שבו כאשר משתנה אחד גדל, השני קטן.

    Signup and view all the flashcards

    קורלציה לינארית חיובית

    קשר שבו כאשר משתנה אחד גדל, השני גם גדל.

    Signup and view all the flashcards

    נתונים חקרניים (EDA)

    תהליך לזהות תבניות וקשרים בנתונים.

    Signup and view all the flashcards

    הרכשת נתונים

    השגת מידע לצורך ניתוח.

    Signup and view all the flashcards

    מבנה נתונים בלתי ניתן לשינוי

    מבנה נתונים שלא ניתן לשנותו לאחר יצירתו.

    Signup and view all the flashcards

    כתובת דוא"ל

    מחרוזת טקסט עם שם ודומיין שכוללת '@'.

    Signup and view all the flashcards

    פייתון ו-java

    שפות תכנות שונות שניתן להמיר ביניהן.

    Signup and view all the flashcards

    אחסון נתונים ב-pandas

    אפשר לאחסן מספרים, טקסט, ותאריכים במסגרת נתונים.

    Signup and view all the flashcards

    בתחום ה-API

    אמצעי תקשורת בין תוכניות דרך אינטרנט.

    Signup and view all the flashcards

    מטרה של היסטוגרמה

    שיטה להצגת שכיחות ערכים רציפים באמצעות עמודות.

    Signup and view all the flashcards

    קשרים בין משתנים

    תהליך זיהוי הקשרים והקורלציות שבין נתונים שונים.

    Signup and view all the flashcards

    ייצוג נתונים קטגוריאליים

    שיטה להצגת נתונים בקטגוריות באמצעות חלקי עוגה.

    Signup and view all the flashcards

    הנחה על מגמות נתונים

    תהליך חקר מגמות בעיתיות של נתונים לאורך זמן.

    Signup and view all the flashcards

    הפחתת ממדיות

    תהליך זיהוי דפוסים וקשרים כדי להפחית ממדיות.

    Signup and view all the flashcards

    חיזוי אירועים

    תהליך לחזות אירועים עתידיים בעזרת נתונים קיימים.

    Signup and view all the flashcards

    נתונים גדולים

    תהליך לתרגם נתונים גדולים ולא מסודרים למידע שימושי.

    Signup and view all the flashcards

    Study Notes

    מבחן מועד א' - מבוא למדעי הנתונים

    • תאריך הבחינה: 21/3/24
    • משך הבחינה: שעתיים
    • חומר עזר: מחשבון
    • סוג הבחינה: רב ברירתית
    • הוראות: לסמן את התשובה הנכונה מבין ארבע אפשרויות

    שאלות

    • שאלה 1: מהי המטרה של ניתוח חקרני של נתונים (EDA)?

      • לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם.
    • שאלה 2: איזה אלגוריתם יאפשר לאשכל את הנתונים ל-4 קבוצות?

      • K4 עם KMeans
    • שאלה 3: מה ההבדל בין סולם סודר וסולם רווח?

      • בסולם סודר אפשר לחשב שכיח, ובסולם רווח אפשר לחשב שכיח וממוצע. המרווחים בסולם רווח יכולים להיות ממשיים.
    • שאלה 4: אילו מחרוזות יחזיר הביטוי הרגולרי (regular expression)?

      • כתובות אימייל
    • שאלה 5: האם ניתן להציג יותר משני משתנים בתרשים פיזור?

      • כן, ניתן להציג משתנים נוספים באמצעות צורות, צבעים, גדלים וכדומה.
    • שאלה 6: מהו תרשים קופסה (box plot)?

      • טכניקה להצגת החציון, הרבעונים והטווח הבין-רבעוני.
    • שאלה 7: מהו מתאם פירסון?

      • מספר שמצביע על קשר (קורלציה / מתאם) בין שני נתונים בסולם רווח או מנה.
    • שאלה 8: חשבו את ה-IQR של הנתונים הבאים: [16, 19, 23, 36, 39, 81, 85, 90]

      • 62
    • שאלה 9: מה ניתן לומר על המתאם בין המאפיינים X1,X2 בכל תרשים?

      • יש צורך בתיאור הגרפים כדי לענות על השאלה, יש לציין אם המתאם חיובי, שלילי או כמעט אפס.
    • שאלה 10: איזו ספרייה בפייתון משמשת לביצוע אלגוריתמים של למידה בלתי מונחית?

      • SciPy
    • שאלה 11: כיצד נוכל להשיג נתונים מאתר Shein?

      • אם יש API, אפשר להשתמש בו. אחרת, יש להשתמש ב-crawling.
    • שאלה 12: איך מיוצגים מאפיינים ומופעים ב-dataframe?

      • המאפיינים מיוצגים בעמודות והמופעים בשורות.
    • שאלה 13: איזו ספרייה מקובל לייבא כ-pd?

      • Pandas
    • שאלה 14: מה זה vectorizer?

      • אוביקט שמשנה מסמך טקסט ליצוג וקטורי של מילים. (Bag of words)
    • שאלה 15: כיצד משפיעה הגדלת מספר התאים בהיסטוגרמה על ערכי התאים?

      • ככל שמספר התאים גדל, ערכי התאים קטנים יותר.
    • שאלה 16: מה השימוש המרכזי של ספריית requests בפייתון?

      • פניות HTTP/HTTPS לשרתי רשת.
    • שאלה 17: איך תסווגו את הבעיה בסידור לקוחות ב-5 קבוצות?

      • למידה לא מונחית, בעיית אשכול (clustering).
    • שאלה 18: מה הדרך המועדפת למילוי ערבים חסרים?

      • בדרך כלל, median.
    • שאלה 19: כדי לטעון קובץ CSV לתוך מסגרת נתונים (dataframe), תשתמשו בפקודה:

      • read_csv
    • שאלה 20: מבין המדדים הבאים, מהו מדד המשמש למדידת פיזור נתונים?

      • סטיית תקן

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    מבחן זה כולל שאלות רבות ברירתיות בתחום מדעי הנתונים. הוא מתמקד בנושאים כמו ניתוח חקרני של נתונים, אלגוריתמים של קלסטרינג, וסטטיסטיקה תיאורית. הכנה למבחן תסייע בהבנת מושגים חשובים וביישומים מעשיים בניתוח נתונים.

    More Like This

    Use Quizgecko on...
    Browser
    Browser