Python Programming Quiz on Web Data Handling

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

איזו שיטה תוכל להחזיר את תוכן הדף כטקסט פשוט, ללא סימוני HTML? (בחר/י את התשובה הנכונה)

  • response.content()
  • response.html()
  • response.data()
  • response.text (correct)

איזו פקודה נועדה לקבל את כל הנתונים שהועברו בפוסט, כולל קבצים שהועברו? (בחר/י את התשובה הנכונה)

  • response.content()
  • response.data() (correct)
  • response.html()
  • response.text

איזו פקודה מציגה את התוכן של הדף עם כל סימוני ה-HTML? (בחר/י את התשובה הנכונה)

  • response.data()
  • response.html() (correct)
  • response.content()
  • response.text

באיזו פקודה ניתן להשתמש כדי לקבל את תוכן הדף עם אפשרות לטיפול בסימוני HTML? (בחר/י את התשובה הנכונה)

<p>response.content() (A)</p> Signup and view all the answers

איזו מהעצות הבאות נכונה בנוגע לקבלת תוכן הדף? (בחר/י את התשובה הנכונה)

<p>לשימוש ב-response.content() תמיד מומלץ להיעזר ב-response.text() (A)</p> Signup and view all the answers

באיזו מהפקודות הבאות ניתן להשתמש כדי לקבל רק את שדה ה-header של הדף? (בחר/י את התשובה הנכונה)

<p>response.headers() (B)</p> Signup and view all the answers

אם ברצונך לקבל את תוכן הדף, מה טיפ חשוב לזכור? (בחר/י את התשובה הנכונה)

<p>לשלב response.content() עם response.text() כדי לקבל תוצאה אחידה (C)</p> Signup and view all the answers

איזו פקודה תוכל להחזיר את תוכן הדף בצורה המלאה, כולל כל סימוני HTML? (בחר/י את התשובה הנכונה)

<p>response.html() (B)</p> Signup and view all the answers

איזו פקודה תעזור לך להבין את מבנה הדף? (בחר/י את התשובה הנכונה)

<p>response.html() (C)</p> Signup and view all the answers

איזו משפט נכון לגבי מודל KMeans?

<p>KMeans הוא מודל למידה לא מונחית, המשמש ליצירת קבוצות נתונים דומות. (B)</p> Signup and view all the answers

באיזו תת ספרייה ב-Python ניתן להציג גרף בעזרת פונקציה plt.legend()?

<p>matplotlib.pyplot (D)</p> Signup and view all the answers

איזו תת ספרייה ב-Python משמשת לעבודה עם טבלאות נתונים?

<p>pandas (B)</p> Signup and view all the answers

איזו מהשיטות הבאות תתאים למילוי תא ריק ב-DataFrame בעזרת הממוצע של העמודה?

<p>df.replace(np.nan, df.mean(), inplace=True) (B)</p> Signup and view all the answers

איזו מהפונקציות הבאות בטבלה df יכולה להסיר שורות בעלות ערכים חסרים?

<p>df.dropna(subset=['A', 'B', 'C'], inplace=True) (A)</p> Signup and view all the answers

מהי הדוגמה הנכונה כיצד להפעיל מודל KMeans ב-Python?

<p>from sklearn.cluster import KMeans model = KMeans(n_clusters=5) model.fit(df) (A)</p> Signup and view all the answers

איזו מהשיטות הבאות תתאים למציאת הממוצע של כל עמודה בטבלה df?

<p>df.mean() (B)</p> Signup and view all the answers

איזו מהטענות הבאות לגבי מודל SVM נכונה?

<p><code>SVM</code> הוא מודל למידה מונחית, המשמש למציאת גבול אופטימלי להפרדה בין קבוצות נתונים. (C)</p> Signup and view all the answers

מהו ההבדל העיקרי בין מודל KMeans ל- SVM?

<p><code>KMeans</code> משמש ליצירת קבוצות נתונים דומות, בעוד <code>SVM</code> משמש למציאת גבול אופטימלי להפרדה בין קבוצות נתונים. (B)</p> Signup and view all the answers

מהי מטרת קוד הפיתון הראשון (שמתחיל ב-df[df['column1'] > ...)?

<p>מציאת ערכים חריגים (Outliers) באמצעות זיהוי ערכי קצה (C)</p> Signup and view all the answers

מהו המשתנה 'q1' שמיוצר בקוד הפיתון? (שמתחיל ב-q1 = ...)

<p>הקוורטיל הראשון של העמודה 'column1' (C)</p> Signup and view all the answers

מהי מטרת קוד הפיתון השני (שמתחיל ב-df[(df['column1'] < ...)?

<p>זיהוי ערכים חריגים (Outliers) באמצעות IQR (טווח בין-קוורטילי) (C)</p> Signup and view all the answers

מדוע נעשה שימוש בשתי טכניקות שונות לזיהוי ערכים חריגים בקוד (אחת מבוססת על סטיית תקן והשנייה על IQR)?

<p>הטכניקות מבוססות על פרמטרים שונים, ולכן עשויות לזהות ערכים חריגים שונים (D)</p> Signup and view all the answers

מהי המשמעות של הפעולה (df['column1'] < q1 - 1.5 * iqr) | (df['column1'] > q3 + 1.5 * iqr) בקוד הפיתון השני?

<p>בודק אם ערך בעמודה 'column1' הוא ערך קיצוני (Outlier) לפי IQR (A)</p> Signup and view all the answers

באיזו צורה ניתן להשתמש בפונקציית pd.DataFrame.isnull() ב-Python כדי לבדוק אם יש ערכים חסרים (NaN) בעמודה column1 ב-DataFrame שנקרא df?

<p><code>df['column1'].isnull()</code> (D)</p> Signup and view all the answers

עבור DataFrame שנקרא df , מהי הדרך הנכונה להשתמש בפונקציה df.fillna() כדי למלא את כל הערכים החסרים (NaN) ב-DataFrame באפס?

<p><code>df.fillna(0)</code> (A), <code>df = df.fillna(0)</code> (B), <code>df.fillna(value=0)</code> (C)</p> Signup and view all the answers

כיצד ניתן ליצור DataFrame חדש מ-DataFrame קיים, df, שיהיה אוסף של כל השורות בהם df['A'] אינו חסר (NaN)?

<p><code>new_df = df[df['A'].notnull()]</code> (B), <code>new_df = df.dropna(subset=['A'])</code> (C)</p> Signup and view all the answers

מה תציג הפקודה הבאה? ```python print(df.loc[df['A'] > 10, 'B'].sum())

<p>סכום הערכים בעמודה 'B' בכל השורות שבהן <code>df['A']</code> גדול מ-10 (B)</p> Signup and view all the answers

מהי הדרך הנכונה לקרוא לפונקציה שתאפשר לנו לחשב את הממוצע של כל שורה ב-DataFrame?

<p><code>df.mean(axis=1)</code> (A)</p> Signup and view all the answers

מהי דרך נכונה לבדוק האם יש ערכים חסרים (NaN) ב-DataFrame שנקרא df?

<p><code>df.isnull().any().any()</code> (B), <code>df.isnull().any()</code> (C)</p> Signup and view all the answers

מהו ההבדל המרכזי בין .loc ל-.iloc ב-DataFrame?

<p><code>.loc</code> משתמש בשמות שורות ועמודות , בעוד <code>.iloc</code> משתמש במיקומי השורות והעמודות. (B)</p> Signup and view all the answers

מהי צורת הפקודה הנכונה לבחור את 3 השורות הראשונות ב-DataFrame שנקרא df?

<p><code>df.head(3)</code> (B), <code>df.iloc[:3]</code> (C)</p> Signup and view all the answers

מה הפקודה הנכונה להצגת 5 השורות הראשונות של ה-DataFrame?

<p><code>print(df.head(5))</code> (C)</p> Signup and view all the answers

איזה מהביטויים הרגולריים הבאים ימצא כל מחרוזת שמכילה לפחות שלושה ספרות רצופות?

<p><code>r'\d{3,}'</code> (C)</p> Signup and view all the answers

חוקר מנסה להבין את הקשר בין תכונות שונות של מכוניות למחיר המכירה שלהן. הוא משתמש בנתונים של מאות מכוניות הכוללים את שנת הייצור, נפח המנוע, מספר הדלתות, סוג הדלק, האם המכונית היא ידנית או אוטומטית, ומחיר המכירה. איזה מהתרשימים הבאים יהיו הכי שימושיים לחוקר כדי להציג את הקשרים האלה?

<p>גרף Scatter matrix (תרשים פיזור מרובה) (D)</p> Signup and view all the answers

חברה משיקה אפליקציה חדשה, והם רוצים לבדוק את ההשפעה של פרסום ברשתות החברתיות על מספר ההורדות של האפליקציה. הם משיקים קמפיין פרסום ברשתות חברתיות למשך שבוע. מהי הטיית אישור במקרה זה?

<p>הטיית אישור תתרחש אם החברה תעקוב רק אחר מספר ההורדות מהפרסום ברשתות חברתיות, ותתעלם מהורדות דרך מקורות אחרים (D)</p> Signup and view all the answers

מה נכון לומר לגבי סולם מנה?

<p>בסולם מנה יש נקודת אפס מוחלטת שמשמעותה היעדר התכונה הנמדדת (D)</p> Signup and view all the answers

מהי הסיבה העיקרית שבגללה אלגוריתמים רבים בלמידה עמוקה נכשלים?

<p>אלגוריתמים רבים בלמידה עמוקה נכשלים בשל אי-הבנה של המודל וארכיטקטורת רשת עצבית (B)</p> Signup and view all the answers

איזה מהטכניקות הבאות משמשת עבור ניהול נתוני עתק?

<p>מִשְׁלָב (batching) (A)</p> Signup and view all the answers

איזה מהסיבות הבאות אינה מובילה להטיית בדיעבד ?

<p>שימוש במידע חיצוני שאינו קשור לבעיה (B)</p> Signup and view all the answers

איזה מבין המבנים הבאים מתאים ביותר לאחסון סדרה של ערכים ייחודיים, ללא סדר מסוים?

<p>קבוצה (A)</p> Signup and view all the answers

איזה מבין המבנים הבאים אינו מאפשר שינוי של הערכים? (לא ניתן לשנות את התוכן אחרי יצירת המבנה)

<p>טפל (C)</p> Signup and view all the answers

איזה מבין המבנים הבאים משמש לאחסון ערכים עם מפתח ייחודי?

<p>מילון (A)</p> Signup and view all the answers

איזה מבין המבנים הבאים ניתן להשתמש כדי לאחסן רשימה של ערכים הניתנים לשינוי?

<p>רשימה (B)</p> Signup and view all the answers

מהו הסמל המתאים לתאום לכל תו בודד (למעט שורת סיום), בתוך ההסבר על המבנים הנתונים?

<p><strong>.</strong> (C)</p> Signup and view all the answers

מהו תפקיד הפונקציה tail() ב-DataFrame?

<p>מציגה את חמש השורות האחרונות של DataFrame (C)</p> Signup and view all the answers

מהו טווח הערכים של קורלציית פירסון?

<p>-1 עד 1 (D)</p> Signup and view all the answers

איזו מהטענות הבאות לגבי tail() נכונה?

<p>הפונקציה <code>tail()</code> יכולה להציג כל מספר רצוי של שורות (B)</p> Signup and view all the answers

איזה נתונים מתאימים לחישוב קורלציית פירסון?

<p>שני משתנים רציפים (A)</p> Signup and view all the answers

מהו היתרון של tail() בהשוואה להצגת כל ה-DataFrame ?

<p><code>tail()</code> מאפשרת למקד בניתוח של חלק מסוים של הנתונים (C)</p> Signup and view all the answers

מהו יתרון בולט של פורמט CSV?

<p>נתמך על ידי מרבית המערכות (A)</p> Signup and view all the answers

איזו מהעובדות הבאות תכונה מינורית לגבי פורמט CSV?

<p>אינו קריא באופן אינטואיטיבי (A)</p> Signup and view all the answers

מהי אחת מהחסרונות של פורמט CSV?

<p>נתונים מיוצגים ברמה של שכבה אחת (B)</p> Signup and view all the answers

איזו מילה מתארת את הקושי בהבנת פורמט CSV?

<p>לא קריא (C)</p> Signup and view all the answers

מהו יתרון נוסף של פורמט CSV מעבר לייבוא נתונים?

<p>מאפשר ייצוא כמויות גדולות של נתונים (D)</p> Signup and view all the answers

מהי מטרת קורלציית ספירמן?

<p>למדוד את הקשר המונוטוני בין שני משתנים (A)</p> Signup and view all the answers

באיזה טווח נעים ערכי קורלציית ספירמן?

<p>-1 ל-1 (B)</p> Signup and view all the answers

מה מהבאים לא נכון לגבי קורלציית ספירמן?

<p>היא משתמשת בערכים המקוריים של הנתונים (A)</p> Signup and view all the answers

מה ההבדל העיקרי בין קורלציית ספירמן לקורלציה רגילה?

<p>קורלציית ספירמן מתמקדת בדירוגים, בעוד קורלציה רגילה מתמקדת בערכים עצמם (A)</p> Signup and view all the answers

כיצד ניתן לבצע קורלציית ספירמן בין שני משתנים?

<p>באמצעות חישוב דירוגים של המשתנים (D)</p> Signup and view all the answers

מהי מטרת ניתוח חקרני של נתונים )‪(EDA‬?

<p>לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם. (C)</p> Signup and view all the answers

אתם מנסים לבצע אשכול )‪ (clustering‬של מבנה נתונים שנראה כך (ככה יצא ‪):‬‬

איזה אלגוריתם יאפשר לאשכל את הנתונים ל‪ 4‬קבוצות‪ ,‬כך שיתקבלו ‪ 2‬קבוצות עבור
                       העיניים‪ ,‬קבוצה עבור הפה וקבוצה עבור העיגול החיצוני?

<p>‪ KMeans.‬עם ‪K=4‬‬ (B)</p> Signup and view all the answers

מה מהבאים נכון לגבי ההבדל בין סולם סודר )‪ (ordinal‬וסולם רווח)‪?

<p>בסולם רווח יש משמעות ליחס בין ערכים סמוכים‪ ,‬ובסולם סודר אין משמעות ליחס זה. (A)</p> Signup and view all the answers

מהו היתרון של פורמט CSV ?

<p>פורמט CSV הוא פופולרי ותומך בו תוכנת גיליון אלקטרוני רבים. (A), פורמט CSV קל ופשוט לקריאה ולכתיבה הן על ידי בני אדם והן על ידי תוכנות. (C), פורמט CSV תומך במגוון רחב של סוגי נתונים. (D)</p> Signup and view all the answers

מהו הסמל המתאים לתאום לכל תו בודד (למעט שורת סיום) בתוך ההסבר על מבנים נתונים?

<p><code>\.</code> (C)</p> Signup and view all the answers

?

<p>, , . (C)</p> Signup and view all the answers

R'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}$' ? ( )

<pre><code> -*[0-9]* , . (C), '[email protected]' . (D) </code></pre> Signup and view all the answers

מהו תפקיד "הקופסה" בתרשים Box Plot?

<p>הקופסה מייצגת את הטווח בין הרבעון הראשון לרבעון השלישי, וחציון הנתונים מצוי בתוך הקופסה (A)</p> Signup and view all the answers

מה ההבדל בין תרשים Box Plot לתרשים היסטוגרמה?

<p>תרשים Box Plot מציג את חלוקת הנתונים בדרך גרפית, היסטוגרמה מציגה את התדירות של כל ערך. (C)</p> Signup and view all the answers

מהו IQR ? (טווח בין רבעוני)

<p>המרחק בין הרבעון הראשון לרבעון השלישי, הוא מייצג את 50% המרכזיים של הנתונים (B)</p> Signup and view all the answers

מה מתאר מתאם פירסון ?

<p>מתאם פירסון מצביע על קשר לינארי בין שני נתונים בסולם רווח או סולם מנה (D)</p> Signup and view all the answers

מהו הערך של IQR לנתונים [16,19,23,36,39,81,85,90] ?

<p>49 (C)</p> Signup and view all the answers

מהו מתאם לינארי חיובי בגרף?

<p>כאשר הנתונים מראה עלייה נוחה בהיקף ההפרש בין הערכים (A), כאשר הנתונים מראה עלייה נוחה בהיקף ההפרש בין הערכים (D)</p> Signup and view all the answers

מהו היתרון העיקרי של Sklearn בניתוח נתונים?

<p>ממשק ידידותי לשימוש במודלים של למידת מכונה (A)</p> Signup and view all the answers

מה מתאר Vectorizer בפילוסופיה של "תיק מילים" (Bag of Words)?

<p>יצירת וקטור שהוא ייצוג מספרי של הופעות המילים במסמך (A)</p> Signup and view all the answers

מה המשמעות של הגדלת מספר ה תאים בהיסטוגרמה ?

<p>הגדלת מספר ה תאים בהיסטוגרמה מייעלת את ראיית התפלגות הנתונים בהצגה הגרפית (C)</p> Signup and view all the answers

באיזו ספרייה ב פייתון ניתן ל "שלוף" נתונים מאתר ?

<p>requests (D)</p> Signup and view all the answers

על איזו בעיה ה משימה של סידור ה לקוחות לפי קבוצות שונות לפי ה דמיון ביניהם מעידה?

<p>למידה לא מונחית (Unsupervised Learning) והיא מוגדרת כבעיית אשכול (Clustering) (D)</p> Signup and view all the answers

אילו מ ה ספריות בפייתון משמשות ל "עבודה" עם טבלאות נתונים ?

<p>Pandas and Numpy (A)</p> Signup and view all the answers

באילו אלגוריתמים ניתן להשתמש כדי לבצע אשכול של מבנה נתונים עם 4 אשכולות? (בחר/י את כל האפשרויות הנכונות)

<p>אלגוריתם DBSCAN עם eps=4 (C), אלגוריתם KMeans עם K=4 (D)</p> Signup and view all the answers

איזה מהתרשימים הבאים מציג מתאם חיובי בין Y ו-X?

<p>הגרף האמצעי (C)</p> Signup and view all the answers

מהו השלב הראשון בעבודתו של מדען נתונים?

<p>ניסוח שאלת מחקר (A)</p> Signup and view all the answers

מהו תפקידו של הביטוי הרגולרי re.findall(r"\b[A-Z][a-z]*\b", text)?

<p>למצוא כל המילים שמתחילות באות גדולה וממשיכות באותיות קטנות, בודדות משאר הטקסט (D)</p> Signup and view all the answers

איזה מהביטויים הרגולריים הבאים מתאים לזיהוי 123,4.5 או 345 6.78?

<p>\d+\s*,?\s*\d+.?\d* (D)</p> Signup and view all the answers

מבין האלגוריתמים הבאים, מי מתאים ביותר לאשכול של נתונים ללא מבנה ברור, כשטווח הערכים וסוגי הנתונים שונים?

<p>DBSCAN (B)</p> Signup and view all the answers

איזה מהאלגוריתמים הבאים מתחשב במרחק בין נקודות לבין הקבוצה אליה הן שייכות?

<p>Hierarchical Clustering (C)</p> Signup and view all the answers

מהו החיסרון העיקרי של אלגוריתם KMeans?

<p>הוא דורש ידע מקדים על מספר האשכולות (D)</p> Signup and view all the answers

לשתי נקודות נתונים (X,Y) יש מתאם לינארי שלילי. מה פירוש הדבר?

<p>כאשר X גדל, Y קטן באופן לינארי (A)</p> Signup and view all the answers

איזה מהביטויים הבאים מתאים לזיהוי מחרוזת שמכילה מספר שלם ואחריו מקף ואחריו מספר שלם?

<p>\d+\s*-\s*\d* (A)</p> Signup and view all the answers

איזה מהמשפטים הללו נכון לגבי תרשימי עוגה?

<p>יש להשתמש בתרשימי עוגה כדי להציג את הרכב השלם עבור מספר קטגוריות מועטות. (D)</p> Signup and view all the answers

מהו היתרון של תרשים עוגה בהשוואה לתרשימים אחרים?

<p>תרשימי עוגה מאפשרים הבנה קלה של חלקים מתוך הכל. (C)</p> Signup and view all the answers

איזה מבין המבנים הבאים ניתן להשתמש בו להעברת נתונים כמותיים?

<p>תרשים עמודות (A)</p> Signup and view all the answers

מה המידע העיקרי שתרשים עוגה מספק?

<p>חלוקה לחלקים מתוך הנתון הכולל. (C)</p> Signup and view all the answers

אילו נתונים לא מומלץ להציג בתרשימי עוגה?

<p>נתונים עם הרבה קטגוריות. (D)</p> Signup and view all the answers

איזה מהביטויים הרגולריים הבאים מתאים להצגת מספרים עם ערך עשרוני?

<p>r\b0*\d+.\d*\b (A)</p> Signup and view all the answers

אילו מבנים מתאימים לאחסון רשימה של ערכים הניתנים לשינוי?

<p>רשימה (D)</p> Signup and view all the answers

מה התפקיד של הפונקציה tail() ב-DataFrame?

<p>למצוא את השורות האחרונות ב-DataFrame. (C)</p> Signup and view all the answers

מהי מטרת הצגת תרשימי עוגה?

<p>להשוואת נתונים מסוימים בצורה קלילה. (B)</p> Signup and view all the answers

איזה מבנה נתונים ב-pandas מתאים ביותר לייצוג מערך חד-מימדי?

<p>Series (D)</p> Signup and view all the answers

מהי מטרת תהליך זיהוי ערכים חריגים (Outlier Detection)?

<p>זיהוי ערכי קצה (extreme values) במאפיין מסוים (feature) שיכולים להשפיע על ניתוח הנתונים (B)</p> Signup and view all the answers

איזה מהאפשרויות הבאות אינו תחום יישום של למידה לא מונחית (unsupervised learning)?

<p>סיווג תמונות (image classification) (D)</p> Signup and view all the answers

מהו הפלט שיודפס לאחר ריצת הקוד הבא בפייתון?

string = 'Hello world'
print(len(string), string.startswith('H'), string.endswith('world'))

<p>11 True True (B)</p> Signup and view all the answers

איזה מהאלגוריתמים הבאים אינו אלגוריתם למידה לא מונחית (unsupervised learning)?

<p>אלגוריתם רגרסיה לוגיסטית (logistic regression) (C)</p> Signup and view all the answers

איזו פקודה ב-pandas משמשת להצגת מספר השורות והעמודות במסגרת נתונים?

<p>df.shape (D)</p> Signup and view all the answers

מהי המטרה העיקרית של אלגוריתמי אשכולות (Clustering)?

<p>חלוקת מערכת נתונים לקבוצות על סמך דמיון (similarity) בין הפריטים (A)</p> Signup and view all the answers

איזה מהמודולים הבאים משמש כנראה לצורך הרכשת נתונים בעזרת Web-API?

<p>המודול requests (C)</p> Signup and view all the answers

איזה מהמדדים הבאים משמש להחלפת ערכים חסרים בנתונים קטגוריאליים?

<p>הערך השכיח (D)</p> Signup and view all the answers

איזו פונקציה ב-Python משמשת לכתיבת DataFrame לקובץ CSV?

<p>to_csv (A)</p> Signup and view all the answers

מהי המטרה העיקרית של שימוש בטכניקת אשכולות (clustering) בנתונים?

<p>לזהות דפוסים וקשרים בנתונים (B)</p> Signup and view all the answers

אילו משפטים נכונים לגבי קורלציה לינארית בין שני משתנים?

<p>קורלציה לינארית של 0 מציינת שאין קשר לינארי בין שני משתנים. (A), קורלציה לינארית שלילית מציינת קשר חזק בין שני משתנים, כאשר ערכי משתנה אחד יורדים עם עליית ערכי המשתנה השני. (B), קורלציה לינארית חיובית מציינת קשר חזק בין שני משתנים, כאשר ערכי משתנה אחד עולים עם עליית ערכי המשתנה השני. (C), קורלציה לינארית יכולה להיות בין -1 ל-1, כאשר 1 מציין קשר לינארי חיובי מושלם ו- -1 מציין קשר לינארי שלילי מושלם. (D)</p> Signup and view all the answers

מה אפשר לומר על הגרף המוצג בנוגע למתאם בין המאפיינים X1 ו-X2?

<p>קיים מתאם לינארי שלילי חזק בין X1 ל-X2. (D)</p> Signup and view all the answers

מהי המטרה של ניתוח חקרני של נתונים (EDA)?

<p>לזהות תבניות וקשרים בנתונים לפני בניית מודלים של למידה מכונה. (A)</p> Signup and view all the answers

מהו השלב השני בעבודת מדען נתונים, לאחר ניסוח שאלת המח研究?

<p>איסוף נתונים. (A)</p> Signup and view all the answers

איזה משפט נכון לגבי פורמט הנתונים JSON?

<p>JSON מתאים לאחסון נתונים מסוגים שונים כמו טקסט, מספרים ותאריכים. (C), JSON הוא פורמט נתונים היררכי, הדומה למילון. (D)</p> Signup and view all the answers

מהי המשמעות של הפונקציה tail() ב-DataFrame?

<p>הפונקציה מציגה את 5 השורות האחרונות של ה-DataFrame. (B)</p> Signup and view all the answers

איזה סוג של נתונים מתאים ביותר לחישוב קורלציית פירסון?

<p>נתונים רציפים (D)</p> Signup and view all the answers

מהי מטרת PCA (ניתוח רכיבים עיקריים)?

<p>להפחית ממדיות של נתונים (A), לזהות דפוסים וקשרים בנתונים (B)</p> Signup and view all the answers

מה ההבדל העיקרי בין האופרטור ** לאופרטור // ?

<p>הפלט של האופרטור // הוא מספר שלם, לעומת זאת הפלט של ** אינו בהכרח מספר שלם (C)</p> Signup and view all the answers

מה ההבדל העיקרי בין מתאם (קורלציה) לסיבתיות (causation)?

<p>מתאם מודד את חוזק הקשר, קשר סיבתי מרמז על קשר של סיבה ותוצאה (A)</p> Signup and view all the answers

כיצד משפיעה הגדלת מספר התאים (bins) בהיסטוגרמה על ערכי התאים?

<p>ערכי התאים יקטנו (B)</p> Signup and view all the answers

איזה מהביטויים הרגולריים הבאים יתאים למחרוזת "123456789"? בחר את האפשרות שבה הביטוי הרגולרי ימצא את המחרוזת, ותוכל להחזיר גם מחרוזות שאינן רצף ספרות:

<p>יכול להחזיר &quot;aaa123456789&quot;, אבל לא יכול להחזיר &quot;123456789abcdef&quot; (D)</p> Signup and view all the answers

מהו השלב השלישי בעבודת מדען הנתונים?

<p>טיפול בנתונים (B)</p> Signup and view all the answers

מהו ההבדל העיקרי בין סולם סדר (ordinal) וסולם רווח (interval)?

<p>בסולם רווח המרווחים בין הערכים שווים, בסולם סדר לא בהכרח (C)</p> Signup and view all the answers

בלמידת מכונה, מהו ההבדל העיקרי בין למידה מפוקחת (supervised learning) ללמידה לא מפוקחת (unsupervised learning)?

<p>למידה מפוקחת כוללת נתונים שסומנו עם ערך מסוים ו/סווגו, בעוד שנתוני למידה לא מפוקחת אינם מסווגים ולא סומנו (A)</p> Signup and view all the answers

איזה מהאיברים הבאים מתואר כמאפיין בעמודות והמופיע בשורות?

<p>מאפיין בעמודות, מופיע בשורות (C)</p> Signup and view all the answers

איזו מהבעיות הבאות מתאימה ללמידה לא מונחית (Unsupervised Learning)?

<p>מיון תמונות לחיות מחמד שונות (C)</p> Signup and view all the answers

מהו התפקיד העיקרי של הפונקציה head() ב-DataFrame?

<p>מציג את השורות הראשונות של ה-DataFrame (A)</p> Signup and view all the answers

איזו מהאפשרויות הבאות מתארת נכון את הקשר בין קורלציית פירסון לבין הגרף של התלות הליניארית?

<p>קורלציית פירסון מתארת את עוצמת הקשר הליניארי בין שני משתנים (D)</p> Signup and view all the answers

איזו מהטענות הבאות נכונה לגבי קורלציית פירסון?

<p>קורלציית פירסון יכולה להיות שלילית, חיובית או אפס, וערכה מראה את עוצמת הקשר בין שני משתנים (A)</p> Signup and view all the answers

איזו מהאפשרויות הבאות עונה על השאלה "מהו טווח הערכים של קורלציית פירסון?"

<p>בין -1 ל-1 (B)</p> Signup and view all the answers

איזו מהטענות הבאות אינה נכונה לגבי tail()?

<p><code>tail()</code> תמיד מציגה את 5 השורות הראשונות של ה- DataFrame (D)</p> Signup and view all the answers

מה נכון לומר לגבי tail() בהשוואה להצגת כל ה- DataFrame?

<p><code>tail()</code> מציגה רק חלק מה- DataFrame, מה שעלול להוביל להבדלים בתוצאות בניתוח הנתונים (A)</p> Signup and view all the answers

איזו מהטענות הבאות לא נכונה לגבי tail()?

<p>ניתן להשתמש ב-<code>tail()</code> כדי לשנות את ה- DataFrame המקורי (A)</p> Signup and view all the answers

איזו מהאפשרויות הבאות מתארת נכון את הקשר בין קורלציית פירסון לבין הגרף של ה- DataFrame?

<p>קורלציית פירסון מתארת את עוצמת הקשר הלינארי בין שני משתנים (B)</p> Signup and view all the answers

איזה מתוך הנתונים הבאים מתאים לחישוב קורלציית פירסון?

<p>נתונים כמותיים רציף (כגון גובה) (D)</p> Signup and view all the answers

מהו תפקיד מבנה הנתונים ‪?dictionary‬‬

<p>מבנה שמאפשר גישה נוחה לנתונים באמצעות מפתח ייחודי (A)</p> Signup and view all the answers

איזו מבין האפשרויות תואמת את האופן שבו מיוצגים מאפיינים (features) ומופעים (instances) ב ‪ DataFrame-‬ של ‪?pandas‬‬

<p>מאפיינים מיוצגים כעמודות ומופעים מיוצגים כשורות (C)</p> Signup and view all the answers

איזו מהאפשרויות אינה מתארת תכונה של מבנה נתונים ‪?dictionary‬‬

<p>סדר הערכים קבוע ובלתי משתנה (C)</p> Signup and view all the answers

איזו מהאפשרויות מתארת נכון את הקשר בין ‪dictionary‬‬ לבין ‪?pandas‬‬

<p>ניתן להשתמש ב ‪dictionary‬‬ כדי ליצור עמודות חדשות ב ‪DataFrame‬‬ (B)</p> Signup and view all the answers

איזו מהפעולות הבאות אינה מתאפשרת במבנה נתונים ‪?dictionary‬‬

<p>הכנסת סדר מוגדר לערכים (B)</p> Signup and view all the answers

איזו מהאפשרויות מתארת נכון את ‪?numpy‬‬

<p>ספרייה שמתמחה בעיבוד נתונים מספריים (C)</p> Signup and view all the answers

איזו מהאפשרויות מתארת נכון את התכונות של מבנה נתונים ‪?DataFrame‬‬

<p>מבנה מסודר בעל שורות ועמודות, דומה לטבלה (B)</p> Signup and view all the answers

מהו תפקיד של ‪?Pandas‬‬

<p>ספריית תכנות מיועדת לניתוח ועיבוד נתונים (A)</p> Signup and view all the answers

איזו מהאפשרויות מתארת בצורה נכונה את הקשר שבין ‪DataFrame‬‬ ל ‪?Series‬‬

<p>‪DataFrame‬‬ יכול להכיל מספר ‪Series‬‬ כעמודות שלו (B)</p> Signup and view all the answers

איזו מהאפשרויות מתארת בצורה נכונה את היחס בין ‪dictionary‬‬ ל ‪?Series‬‬

<p>ניתן להשתמש ב ‪dictionary‬‬ כדי ליצור ‪Series‬‬ חדש (D)</p> Signup and view all the answers

מהי דוגמה ללמידה לא מונחית )‪(unsupervised learning‬?

<p>אשכול לקוחות (D)</p> Signup and view all the answers

איזה מהאלגוריתמים הבאים הוא לא אלגוריתם למידה לא מונחית )‪(unsupervised learning‬?

<p>אלגוריתם רגרסיה לינארית (C)</p> Signup and view all the answers

כמה סוגי נתונים ניתן להציג תרשים פיזור )‪(scatterplot‬ דו-מימדי?

<p>רק ‪ 2‬סוגי נתונים (B)</p> Signup and view all the answers

כיצד מחשבים את הממוצע של מערך נתונים?

<p>סיכום כל הערכים וחלוקה במספר הערכים (B)</p> Signup and view all the answers

איזו פקודה תמיר ‪ json‬למבנה נתונים של ‪: dictionary‬?

<p>הפקודה ‪loads‬‬ (B)</p> Signup and view all the answers

מהי המטרה העיקרית של אלגוריתם ניתוח רכיבים ראשיים )‪(PCA‬?

<p>להקטין את מימד הנתונים ללא אובדן מידע significat (A), להתמקד במאפיינים הדומיננטיים בנתונים (C)</p> Signup and view all the answers

בסטטיסטיקה, מהי התפלגות נורמלית?

<p>התפלגות סימטרית, עם רוב הערכים סביב הממוצע (B)</p> Signup and view all the answers

כיצד יש לנהוג במקרה בו ישנם ערכים חסרים במאפיין מספרי?

<p>כל התשובות נכונות בתנאים מסוימים. (A)</p> Signup and view all the answers

בסטטיסטיקה, מה מטרת המדידה של סטיית התקן?

<p>תיאור התפשטות או פיזור הנתונים (A)</p> Signup and view all the answers

איזו משווה רלציונית נכונה לגבי סטיית התקן?

<p>סטיית התקן גדולה יותר פירושה יש פזורה בנתונים. (B)</p> Signup and view all the answers

Flashcards

למידה מונחית

למידה שבה יש משימות ותויות לתוצרי הלמידה.

למידה בלתי מונחית

למידה שבה אין מסמכים או תיווך מהמאמן.

SCALE רווח

סולם שבו המרווחים הם שלמים ואפשר לחשב ממוצע אלגברי.

SCALE מנה

סולם שבו המרווחים יכולים להיות רציונליים ומאפשרים לחשב ממוצע הנדסי.

Signup and view all the flashcards

Z-Score

מדד שמייצג את מספר סטיות התקן מהממוצע.

Signup and view all the flashcards

DataFrame

מבנה נתונים דו מימדי ב-Pandas לאחסן נתונים מבניים.

Signup and view all the flashcards

find_all

פקודה להחזיר רשימה של כל התגיות בתעודת HTML המתאימות לקריטריון.

Signup and view all the flashcards

response.content()

פקודת קוד שמשמשת לקבלת תוכן התשובה.

Signup and view all the flashcards

response.text

פקודה נוספת שמחזירה את התוכן כמחרוזת טקסט.

Signup and view all the flashcards

response.html()

שיטה שקוראת תוכן HTML מתוך התשובה.

Signup and view all the flashcards

response.data()

שיטה שמתארת נתונים, אך לא בהקשר זה.

Signup and view all the flashcards

תוכן תשובה

המידע המוחזר מהבקשה לרשת.

Signup and view all the flashcards

שימושים ב-response

איך משתמשים בפונקציות לקבלת תשובות?

Signup and view all the flashcards

מתי להשתמש ב-response.text

להשתמש כשצריך טקסט פשוט מהתשובה.

Signup and view all the flashcards

חשיבות response.html()

לקרוא תוכן HTML ולהציג אותו.

Signup and view all the flashcards

תשובות לבקשות רשת

מה שקורה כששולחים בקשה ולאן לפנות?

Signup and view all the flashcards

ייבוא matplotlib

ייבוא סטנדרטי של ספריית matplotlib.pyplot בכדי ליצור גרפים.

Signup and view all the flashcards

הוספת מקרא לגרף

שיטה להוספת מקרא לעלות גרפים באמצעות plt.legend().

Signup and view all the flashcards

מילוי ערכים חסרים

שיטה להחליף ערכים חסרים עם ממוצע העמודה ב-DataFrame בעזרת df.fillna().

Signup and view all the flashcards

מודל למידה לא מונחית

KMeans הוא מודל למידה לא מונחית שמבצע קיבוץ של נתונים.

Signup and view all the flashcards

ספרייה ללמידה מונחית

scikit-learn היא ספרייה פופולרית בלמידה מונחית בפייתון.

Signup and view all the flashcards

אלגוריתם למידה מונחית

SVM (Support Vector Machine) הוא אלגוריתם ללמידה מונחית למיון נתונים.

Signup and view all the flashcards

ייבוא KMeans מ-scikit-learn

ייבוא KMeans באמצעות from sklearn.cluster import KMeans.

Signup and view all the flashcards

DataFrame ב-pandas

DataFrame הוא מבנה נתונים בפייתון שמאחסן נתונים בטבלה.

Signup and view all the flashcards

np.nan

np.nan מייצג ערך חסר ב-numpy וב-pandas.

Signup and view all the flashcards

df.fillna()

שיטה בפנדס להחלפת ערכים חסרים עם ערכים ממוצעים.

Signup and view all the flashcards

ממוצע פלוס שלוש סטיות תקן

ערך עובר את הממוצע בתוספת שלוש סטיות תקן.

Signup and view all the flashcards

שיטת זיהוי חריגים

תהליך המפנה נתונים שמחוץ לטווח הנורמלי.

Signup and view all the flashcards

רבעון ראשון (Q1)

ערך שמתחתיו 25% מהנתונים. משתמשים לחישוב IQR.

Signup and view all the flashcards

רבעון שלישי (Q3)

ערך שחוצה 75% מהנתונים כלפי פנימה. חשוב לזיהוי חריגים.

Signup and view all the flashcards

טווח אינטרקווארטילי (IQR)

הפרש בין Q3 ל-Q1, משמש לתיאור פיזור הנתונים.

Signup and view all the flashcards

פקודת loc

פקודה ב-Pandas כדי לגשת ולשנות ערכים ב-DataFrame.

Signup and view all the flashcards

ממוצע של עמודה

סכום כל הערכים בעמודה חלקי מספר הערכים.

Signup and view all the flashcards

ערכים ריקים (NaN)

ערכים חסרים ב-DataFrame שמצביעים על חוסר נתון.

Signup and view all the flashcards

ממוצע בעמודה B

הערך הקבוע המתקבל כשחושבים את ממוצע עמודה B.

Signup and view all the flashcards

שגיאה בפקודת loc

שגיאה יכולה להתרחש כשמנסים לגשת לערכים לא חוקיים בעמודה.

Signup and view all the flashcards

Outliers (חריגים)

ערכים ב-DataFrame שמקבילים לערכים קיצוניים מהשאר.

Signup and view all the flashcards

טווח בין רבעוני (IQR)

ההפרש בין הרבעון הראשון לשלישי, המזהה את התפוצה של הנתונים.

Signup and view all the flashcards

בוצעה שינוי בעמודה B

ההפרש כשהערכים הריקים בעמודה B משתנים לממוצע.

Signup and view all the flashcards

שורות עם NaN

שורות ב-DataFrame שמחזיקות ערכים ריקים בעמודה A.

Signup and view all the flashcards

שימוש בשיטה IQR

שיטה לזיהוי חריגים על ידי חישוב הטווח בין הרבעונים.

Signup and view all the flashcards

tail()

מציגה את חמש השורות האחרונות של ה-DataFrame.

Signup and view all the flashcards

קורלציית פירסון

מודדת את עוצמת והכיוון של הקשר הלינארי בין שני משתנים רציפים, עם ערך בין -1 ל-1.

Signup and view all the flashcards

ערך 1 בקורלציה

ערך של 1 מציין קשר חיובי ולינארי מוחלט בין שני משתנים.

Signup and view all the flashcards

ערך -1 בקורלציה

ערך של -1 מציין קשר שלילי ולינארי מוחלט בין שני משתנים.

Signup and view all the flashcards

ערך 0 בקורלציה

ערך של 0 מציין שאין קשר לינארי בין המשתנים.

Signup and view all the flashcards

קורלציית ספירמן

מודדת קשר מונוטוני בין שני משתנים באמצעות דירוגים.

Signup and view all the flashcards

מינימום קורלציה

הערך הנמוך ביותר בקורלציית ספירמן אפשרי הוא -1.

Signup and view all the flashcards

מקסימום קורלציה

הערך הגבוה ביותר בקורלציית ספירמן אפשרי הוא 1.

Signup and view all the flashcards

דירוגים בנתונים

שיטת מדידה שבאה במקום ערכים מקוריים לקורלציה.

Signup and view all the flashcards

תכונת מדידה מונוטונית

קורלציית ספירמן מתמקדת במונוטוניות ולא בצורת הקשר.

Signup and view all the flashcards

פורמט CSV

פורמט טקסט קל שיכול לייבא ולייצא נתונים רבים.

Signup and view all the flashcards

יתרונות CSV

מאפשר ייבוא וייצוא כמויות נתונים גדולות, נתמך על ידי רוב המערכות.

Signup and view all the flashcards

חסרונות CSV

לא קריא, נתונים ברמה אחת ולא היררכיים.

Signup and view all the flashcards

ייצוא נתונים

תהליך של העברת נתונים מחוץ למערכת לפורמט אחר.

Signup and view all the flashcards

ייבוא נתונים

תהליך של הכנסת נתונים ממקור חיצוני למערכת.

Signup and view all the flashcards

טפל (tuple)

מאחסן סדרה של ערכים שאינה ניתנת לשינוי.

Signup and view all the flashcards

רשימה (list)

מאחסן סדרה של ערכים הניתנים לשינוי.

Signup and view all the flashcards

קבוצה (set)

מאחסן סדרה של ערכים ייחודיים ללא סדר מסוים.

Signup and view all the flashcards

. (נקודה)

מתאם לכל תו בודד פרט לשורת סיום.

Signup and view all the flashcards

סוגי מבני נתונים

טפל, רשימה וקבוצה הם מבני נתונים מרכזיים בפייתון.

Signup and view all the flashcards

ניתוח חקרני של נתונים (EDA)

הליך לזיהוי תבניות וקשרים בנתונים.

Signup and view all the flashcards

אשכול (Clustering)

תהליך חלוקת נתונים לקבוצות על בסיס דמיון.

Signup and view all the flashcards

אלגוריתם KMeans

שיטה לחלק נתונים לקבוצות על פי קיבוץ נושאים.

Signup and view all the flashcards

DBSCAN

אלגוריתם לקיבוץ נתונים המבוסס על צפיפות.

Signup and view all the flashcards

סולם סודר (Ordinal Scale)

סולם שמודד ערכים בסדר מסוים אך לא מרווחים מדודים.

Signup and view all the flashcards

סולם רווח (Interval Scale)

סולם שבו המרווחים הם מדודים אך אין אפס מוחלט.

Signup and view all the flashcards

חקר נתונים

תהליך גנרי של חקירה וניתוח נתונים לקבלת תובנות.

Signup and view all the flashcards

זיהוי חריגים

תהליך זיהוי נתונים שאינם תואמים למגמות הכלליות.

Signup and view all the flashcards

תבניות בנתונים

מבנים חוזרים או קישורים בתוך נתוני המידע.

Signup and view all the flashcards

סולם סודר

סולם מדידה שבו ניתן לחבר ולחסר אך לא לחשב ממוצע.

Signup and view all the flashcards

סולם רווח

סולם מדידה שבו ניתן לבצע חיבור, חיסור, כפול וחלק, וכולל ממוצע.

Signup and view all the flashcards

תרשים פיזור

גרף דו-מימדי שמציג משתנה על ציר X ומדד על ציר Y.

Signup and view all the flashcards

כתובת אימייל

מחרוזת המתארת כתובת אלקטרונית בפורמט סטנדרטי.

Signup and view all the flashcards

מודלים במידול נתונים

שיטות ליצירת קשרים בין מספר תכונות או משתנים.

Signup and view all the flashcards

ותק המינים

ההפרש בין המידע הנאסף למידע שניתן בשדה.

Signup and view all the flashcards

שיטות הזיהוי של חריגים

תהליכים המפנים נתונים שמחוץ לתחום הנורמלי.

Signup and view all the flashcards

שיטות לצבירת נתונים

שיטות להשגת מספר ייצוגים צורניים של נתונים.

Signup and view all the flashcards

רגולציה של קלט

השיטה שבו אנו מתאימים נתונים לפי כללים או פורמטים מסוימים.

Signup and view all the flashcards

קופסה (box plot)

תרשים המציג חציון, רבעונים וטווח בין רבעוני של נתונים.

Signup and view all the flashcards

מתאם פירסון

מספר שמצביע על קשר לינארי בין שני נתונים.

Signup and view all the flashcards

features ומופעים ב-DataFrame

מאפיינים מיוצגים בעמודות והמופעים בשורות.

Signup and view all the flashcards

ספריית requests

משמשת לפניות HTTP/HTTPS לשרתי רשת.

Signup and view all the flashcards

vectorizer

אובייקט ממיר טקסט לוקטורים בשיטת bag of words.

Signup and view all the flashcards

אלגוריתלמידה לא מונחית

KMeans הוא אלגוריתם לקיבוץ נתונים ללא תוויות.

Signup and view all the flashcards

היסטוגרמה

תצוגת נתונים המחולקת לתאים המייצגים כמות דגימות.

Signup and view all the flashcards

חסרי ערכים (NaN)

נתונים חסרים ב-DataFrame, מציינים חוסר מידע.

Signup and view all the flashcards

תרשים עוגה

תרשים הממחיש את הרכב השלם בעבור קטגוריות מועטות.

Signup and view all the flashcards

שימוש בראשי פירוש ב-r'

פרמטר רגולרי לביטוי רגולרי שיכול להחזיר משתנים.

Signup and view all the flashcards

d+

ביטוי רגולרי לחיפוש אחר מספרים שלמים.

Signup and view all the flashcards

0*\d+.?

ביטוי רגולרי לחיפוש מספרים עשרוניים או שלמים.

Signup and view all the flashcards

Pie Chart

גרף שמציג יחסים בין חלקים

Signup and view all the flashcards

צפיפות ב-DBSCAN

חישוב של מספר נקודות בסביבת נקודה עם רדיוס מסוים.

Signup and view all the flashcards

ניסוח שאלת מחקר

השלב הראשון בשלבי עבודתו של מדען הנתונים.

Signup and view all the flashcards

correlation (מתאם)

מודד את עוצמת והכיוון של הקשר הלינארי בין שני משתנים.

Signup and view all the flashcards

תהליך זיהוי חריגים

תהליך המפנה נתונים שמחוץ לטווח הנורמלי.

Signup and view all the flashcards

זיהוי דפוסים

תהליך למציאת תבניות וקשרים בנתונים.

Signup and view all the flashcards

הפחתת ממדיות

תהליך לצמצום מספר המשתנים בנתונים.

Signup and view all the flashcards

חזוי אירועים

תהליך של גילוי מה שעשוי לקרות בעתיד מתוך נתונים.

Signup and view all the flashcards

קורלציה

מודדת את עוצמת והכיוון של הקשר הלינארי בין שני משתנים.

Signup and view all the flashcards

בקשות רשת

מה שמתרחש כששולחים בקשה למידע מרשת.

Signup and view all the flashcards

מבנה נתונים בספריית pandas

מערך חד מימדי בספריית pandas נקרא Series.

Signup and view all the flashcards

Zיהוי ערכים חריגים

Outlier Detection הוא תהליך זיהוי ערכים החורגים באופן משמעותי.

Signup and view all the flashcards

שימושים בלמידה לא מונחית

עיבוד תמונה, עיבוד שפה טבעית וביולוגיה חישובית הם תחומים של למידה לא מונחית.

Signup and view all the flashcards

פקודת pandas להצגת נתונים

הפקודה df.shape מציגה את מספר השורות והעמודות במסגרת נתונים.

Signup and view all the flashcards

המודול מקובל לייבוא

המודול seaborn מיובא בדרך כלל כ-sns.

Signup and view all the flashcards

פקודת כתיבה ל-CSV

כדי לכתוב DataFrame לקובץ CSV יש להשתמש בפקודה to_csv.

Signup and view all the flashcards

מדד להחלפת ערכים חסרים

הערך השכיח מושלם להחלפת ערכים חסרים בנתונים קטגוריאליים.

Signup and view all the flashcards

מודולים ל-web-API

המודול requests נחשב מאוד לשימוש לצורך הרכשת נתונים.

Signup and view all the flashcards

למידה לא מונחית קלאסית

אלגוריתם ניתוח רכיבים ראשיים (PCA) הוא חלק מקטגוריית למידה לא מונחית.

Signup and view all the flashcards

מודל לניהול נתונים

תהליך חקירה וניתוח נתונים נקרא חקר נתונים.

Signup and view all the flashcards

קורלציה לינארית שלילית

קשר שבו כשערכים של משתנה אחד גדלים, ערכי המשתנה השני קטנים.

Signup and view all the flashcards

קורלציה לינארית חיובית

קשר שבו כשערכים של משתנה אחד גדלים, גם ערכי המשתנה השני גדלים.

Signup and view all the flashcards

קורלציה לינארית חיובית חזקה

קשר חזק שבו ערכים של משתנה אחד משתנים באופן תואם לערכים של המשתנה השני.

Signup and view all the flashcards

שרת Web API

ממשק המאפשר לבצע שאילתות ולהחזיר תוכן בצורה מסודרת.

Signup and view all the flashcards

כתובת דוא"ל

מחרוזת מהווה כתובת אלקטרונית בפורמט ספציפי.

Signup and view all the flashcards

מבנה נתונים בלתי ניתן לשינוי (immutable)

נתונים שלא ניתן לערוך או לשנות לאחר יצירתם.

Signup and view all the flashcards

רכישת נתונים

השלב בעבודה שאחרי ניסוח שאלת המחקר, בו אוספים נתונים רלוונטיים.

Signup and view all the flashcards

כתובת URL פשוטה

מחרוזת המצביעה על מיקום משאב באינטרנט.

Signup and view all the flashcards

מאפיינים בעמודות

מאפיינים הם תכנים המיוצגים בעמודות ב-DataFrame.

Signup and view all the flashcards

מופעים בשורות

מופעים הם רשומות המסודרות בשורות ב-DataFrame.

Signup and view all the flashcards

שני סוגים של נתונים

נתונים יכולים להיות מאופיינים בעמודות או מופעים בשורות.

Signup and view all the flashcards

למידה לא מונחית

למידה שבה אין תיוגים או הנחיות מראש לתוצרים.

Signup and view all the flashcards

KMeans

אלגוריתם לקיבוץ נתונים ללא תוויות, באמצעות למידה לא מונחית.

Signup and view all the flashcards

מבנה נתונים dictionary

מבנה נתונים המאגד זוגות של מפתחות וערכים.

Signup and view all the flashcards

קורלציה (מתאם)

מודד את עוצמת והכיוון של הקשר הלינארי בין שני משתנים.

Signup and view all the flashcards

חציון

ערך המפריד בין חצי עליון וחצי תחתון במערך נתונים ממוינים.

Signup and view all the flashcards

סטיית תקן

מדד המתאר את התפשטות או פיזור הנתונים סביב הממוצע.

Signup and view all the flashcards

נתונים חסרים (NaN)

ערכים חסרים ב-DataFrame, מצביעים על חוסר מידע.

Signup and view all the flashcards

עיבוד נתונים חסרים

תהליך שבו אנו מטפלים ערכים חסרים בנתונים על מנת לשפר את המודל.

Signup and view all the flashcards

חלוקה לקבוצות

תהליך חלוקת נתונים לאשכולות על בסיס תכונות משותפות.

Signup and view all the flashcards

שיטה Z-Score

מדד המייצג את מספר הסטיות התקן ממוצע עבור ערך נתון.

Signup and view all the flashcards

מתאם

מדד המראה עד כמה שני משתנים תלויים זה בזה.

Signup and view all the flashcards

למידה מפוקחת

למידה הכוללת נתונים שסומנו ונדחו למטרות מסוימות.

Signup and view all the flashcards

למידה לא מפוקחת

למידה שבה הנתונים אינם מסווגים או מסומנים.

Signup and view all the flashcards

Study Notes

מבחן לדוגמה - מבוא למדעי הנתונים

  • קורס: מבוא למדעי הנתונים
  • סמסטר: חורף תשפ"ה
  • תאריך הבחינה: 21/3/24
  • מרצים: ד"ר יהונתן שלר, אינג' עידן טוביס
  • משך הבחינה: שעתיים
  • חומר עזר: מחשבון
  • סוג הבחינה: רב ברירתית
  • הוראות: לסמן את התשובה הנכונה ביותר מבין ארבע אפשרויות.
  • נושאים: למידה מונחית, למידה בלתי מונחית, סיווג, רגרסיה, סולם רווח, סולם מנה, ביטויים רגולריים, תרשים כינור, Z-Score, הטיית אישור, סטיית תקן, חישוב IQR, אחוזונים, קלאסטרינג (clustering), הורדת מימדים (Dimension reduction), קוד HTTP, עמודות, שורות, NumPy, Pandas, Matplotlib, SciPy, Sklearn, requests, beautiful soup, selenium, JSON, CSV, Bag of Words, Vectorizer, DataFrames, Series, Outliers, קלאסטרינג היררכי (hierarchical clustering), DBSCAN, Box Plot, Kernel Density Plot, Scatter Plot, EDA, ויזואליזציה, סולם סדר, היסטוגרמה, עוגה (Pie Chart), רגרסיה ליניארית, חציון (Median), שכיח (Mode), שונות (Variance), زנבות (Tails), רבעון (Quartile), exploration, קובץ CSV, CSV, קובץ JSON, חריגים, IQR, אחוזונים, שלבי ניתוח נתונים, הרכשת נתונים, KMeans, DBSCAN, outliers.

שאלות בחינה

  • שאלה 1: מטרת ניתוח חקרני של נתונים (EDA): לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם.
  • שאלה 2: אלגוריתם לאישכול נתונים: KMeans עם K=4.
  • שאלה 3: הבדל בין סולם סדר וסולם רווח: בסולם סדר המרווחים אינם בהכרח שווים, ובסולם רווח המרווחים הם שווים.
  • שאלה 4: תוצאות ביטוי רגולרי: r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$' מחזיר כתובות אימייל.
  • שאלה 5: האם ניתן להציג יותר משני משתנים בתרשים פיזור: כן, ניתן להציג עד שלושה משתנים באמצעות צבע, גודל, צורה וסמל.
  • שאלה 6: מהו תרשים קופסה (box plot): טכניקה להצגת החציון, הרבעונים והטווח הבין רבעוני (IQR).
  • שאלה 7: מהו מתאם פירסון: מספר המציג את עוצמת הקשר הליניארי בין שני נתונים (סולם רווח או מנה).
  • שאלה 8: חישוב IQR: לא צוין בנתונים אלה.
  • שאלה 9: סוג המתאם בתרשים פיזור: לא צוין בנתונים אלה.
  • שאלה 10: ספריית למידה בלתי מונחית: scikit-learn.
  • שאלה 11: רכישת נתונים מאתר Shein: יש לבדוק קודם אם יש API, ואם לא, לבצע crawling (גלישה אוטומטית).
  • שאלה 12: סוג בעיה במדעי נתונים: אשכול (clustering).
  • שאלה 13: סולם לציון קורס: סולם מנה.
  • שאלה 14: השפעה של whis=5 ב-boxplot: מראה פחות נתונים חריגים (outliers).
  • שאלה 15: מדד למיקום בהתפלגות עם צידוד: חציון (median).
  • שאלה 16: מבנה נתונים לזוגות מפתח-ערך: מילון (dictionary).
  • שאלה 17: מטרת ניתוח חקרני: זיהוי תבניות וקשרים בנתונים.
  • שאלה 18: שלב שני בעבודה של מדען נתונים: הרכשת נתונים.
  • שאלה 19: סוגי נתונים ב-DataFrame: מספרים, טקסטים, תאריכים.
  • שאלה 20: מבנה נתונים בלתי משתנה: טאפל (tuple).

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

More Like This

Mastering Microsoft Excel
5 questions

Mastering Microsoft Excel

ConvincingCitrine avatar
ConvincingCitrine
Web-based Data Management Systems Quiz
18 questions
Formularios HTML
5 questions

Formularios HTML

PraiseworthyAgate avatar
PraiseworthyAgate
Use Quizgecko on...
Browser
Browser