Python Programming Quiz on Web Data Handling
154 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

איזו שיטה תוכל להחזיר את תוכן הדף כטקסט פשוט, ללא סימוני HTML? (בחר/י את התשובה הנכונה)

  • response.content()
  • response.html()
  • response.data()
  • response.text (correct)
  • איזו פקודה נועדה לקבל את כל הנתונים שהועברו בפוסט, כולל קבצים שהועברו? (בחר/י את התשובה הנכונה)

  • response.content()
  • response.data() (correct)
  • response.html()
  • response.text
  • איזו פקודה מציגה את התוכן של הדף עם כל סימוני ה-HTML? (בחר/י את התשובה הנכונה)

  • response.data()
  • response.html() (correct)
  • response.content()
  • response.text
  • באיזו פקודה ניתן להשתמש כדי לקבל את תוכן הדף עם אפשרות לטיפול בסימוני HTML? (בחר/י את התשובה הנכונה)

    <p>response.content() (A)</p> Signup and view all the answers

    איזו מהעצות הבאות נכונה בנוגע לקבלת תוכן הדף? (בחר/י את התשובה הנכונה)

    <p>לשימוש ב-response.content() תמיד מומלץ להיעזר ב-response.text() (A)</p> Signup and view all the answers

    באיזו מהפקודות הבאות ניתן להשתמש כדי לקבל רק את שדה ה-header של הדף? (בחר/י את התשובה הנכונה)

    <p>response.headers() (B)</p> Signup and view all the answers

    אם ברצונך לקבל את תוכן הדף, מה טיפ חשוב לזכור? (בחר/י את התשובה הנכונה)

    <p>לשלב response.content() עם response.text() כדי לקבל תוצאה אחידה (C)</p> Signup and view all the answers

    איזו פקודה תוכל להחזיר את תוכן הדף בצורה המלאה, כולל כל סימוני HTML? (בחר/י את התשובה הנכונה)

    <p>response.html() (B)</p> Signup and view all the answers

    איזו פקודה תעזור לך להבין את מבנה הדף? (בחר/י את התשובה הנכונה)

    <p>response.html() (C)</p> Signup and view all the answers

    איזו משפט נכון לגבי מודל KMeans?

    <p>KMeans הוא מודל למידה לא מונחית, המשמש ליצירת קבוצות נתונים דומות. (B)</p> Signup and view all the answers

    באיזו תת ספרייה ב-Python ניתן להציג גרף בעזרת פונקציה plt.legend()?

    <p>matplotlib.pyplot (D)</p> Signup and view all the answers

    איזו תת ספרייה ב-Python משמשת לעבודה עם טבלאות נתונים?

    <p>pandas (B)</p> Signup and view all the answers

    איזו מהשיטות הבאות תתאים למילוי תא ריק ב-DataFrame בעזרת הממוצע של העמודה?

    <p>df.replace(np.nan, df.mean(), inplace=True) (B)</p> Signup and view all the answers

    איזו מהפונקציות הבאות בטבלה df יכולה להסיר שורות בעלות ערכים חסרים?

    <p>df.dropna(subset=['A', 'B', 'C'], inplace=True) (A)</p> Signup and view all the answers

    מהי הדוגמה הנכונה כיצד להפעיל מודל KMeans ב-Python?

    <p>from sklearn.cluster import KMeans model = KMeans(n_clusters=5) model.fit(df) (A)</p> Signup and view all the answers

    איזו מהשיטות הבאות תתאים למציאת הממוצע של כל עמודה בטבלה df?

    <p>df.mean() (B)</p> Signup and view all the answers

    איזו מהטענות הבאות לגבי מודל SVM נכונה?

    <p><code>SVM</code> הוא מודל למידה מונחית, המשמש למציאת גבול אופטימלי להפרדה בין קבוצות נתונים. (C)</p> Signup and view all the answers

    מהו ההבדל העיקרי בין מודל KMeans ל- SVM?

    <p><code>KMeans</code> משמש ליצירת קבוצות נתונים דומות, בעוד <code>SVM</code> משמש למציאת גבול אופטימלי להפרדה בין קבוצות נתונים. (B)</p> Signup and view all the answers

    מהי מטרת קוד הפיתון הראשון (שמתחיל ב-df[df['column1'] > ...)?

    <p>מציאת ערכים חריגים (Outliers) באמצעות זיהוי ערכי קצה (C)</p> Signup and view all the answers

    מהו המשתנה 'q1' שמיוצר בקוד הפיתון? (שמתחיל ב-q1 = ...)

    <p>הקוורטיל הראשון של העמודה 'column1' (C)</p> Signup and view all the answers

    מהי מטרת קוד הפיתון השני (שמתחיל ב-df[(df['column1'] < ...)?

    <p>זיהוי ערכים חריגים (Outliers) באמצעות IQR (טווח בין-קוורטילי) (C)</p> Signup and view all the answers

    מדוע נעשה שימוש בשתי טכניקות שונות לזיהוי ערכים חריגים בקוד (אחת מבוססת על סטיית תקן והשנייה על IQR)?

    <p>הטכניקות מבוססות על פרמטרים שונים, ולכן עשויות לזהות ערכים חריגים שונים (D)</p> Signup and view all the answers

    מהי המשמעות של הפעולה (df['column1'] < q1 - 1.5 * iqr) | (df['column1'] > q3 + 1.5 * iqr) בקוד הפיתון השני?

    <p>בודק אם ערך בעמודה 'column1' הוא ערך קיצוני (Outlier) לפי IQR (A)</p> Signup and view all the answers

    באיזו צורה ניתן להשתמש בפונקציית pd.DataFrame.isnull() ב-Python כדי לבדוק אם יש ערכים חסרים (NaN) בעמודה column1 ב-DataFrame שנקרא df?

    <p><code>df['column1'].isnull()</code> (D)</p> Signup and view all the answers

    עבור DataFrame שנקרא df , מהי הדרך הנכונה להשתמש בפונקציה df.fillna() כדי למלא את כל הערכים החסרים (NaN) ב-DataFrame באפס?

    <p><code>df.fillna(0)</code> (A), <code>df = df.fillna(0)</code> (B), <code>df.fillna(value=0)</code> (C)</p> Signup and view all the answers

    כיצד ניתן ליצור DataFrame חדש מ-DataFrame קיים, df, שיהיה אוסף של כל השורות בהם df['A'] אינו חסר (NaN)?

    <p><code>new_df = df[df['A'].notnull()]</code> (B), <code>new_df = df.dropna(subset=['A'])</code> (C)</p> Signup and view all the answers

    מה תציג הפקודה הבאה? ```python print(df.loc[df['A'] > 10, 'B'].sum())

    <p>סכום הערכים בעמודה 'B' בכל השורות שבהן <code>df['A']</code> גדול מ-10 (B)</p> Signup and view all the answers

    מהי הדרך הנכונה לקרוא לפונקציה שתאפשר לנו לחשב את הממוצע של כל שורה ב-DataFrame?

    <p><code>df.mean(axis=1)</code> (A)</p> Signup and view all the answers

    מהי דרך נכונה לבדוק האם יש ערכים חסרים (NaN) ב-DataFrame שנקרא df?

    <p><code>df.isnull().any().any()</code> (B), <code>df.isnull().any()</code> (C)</p> Signup and view all the answers

    מהו ההבדל המרכזי בין .loc ל-.iloc ב-DataFrame?

    <p><code>.loc</code> משתמש בשמות שורות ועמודות , בעוד <code>.iloc</code> משתמש במיקומי השורות והעמודות. (B)</p> Signup and view all the answers

    מהי צורת הפקודה הנכונה לבחור את 3 השורות הראשונות ב-DataFrame שנקרא df?

    <p><code>df.head(3)</code> (B), <code>df.iloc[:3]</code> (C)</p> Signup and view all the answers

    מה הפקודה הנכונה להצגת 5 השורות הראשונות של ה-DataFrame?

    <p><code>print(df.head(5))</code> (C)</p> Signup and view all the answers

    איזה מהביטויים הרגולריים הבאים ימצא כל מחרוזת שמכילה לפחות שלושה ספרות רצופות?

    <p><code>r'\d{3,}'</code> (C)</p> Signup and view all the answers

    חוקר מנסה להבין את הקשר בין תכונות שונות של מכוניות למחיר המכירה שלהן. הוא משתמש בנתונים של מאות מכוניות הכוללים את שנת הייצור, נפח המנוע, מספר הדלתות, סוג הדלק, האם המכונית היא ידנית או אוטומטית, ומחיר המכירה. איזה מהתרשימים הבאים יהיו הכי שימושיים לחוקר כדי להציג את הקשרים האלה?

    <p>גרף Scatter matrix (תרשים פיזור מרובה) (D)</p> Signup and view all the answers

    חברה משיקה אפליקציה חדשה, והם רוצים לבדוק את ההשפעה של פרסום ברשתות החברתיות על מספר ההורדות של האפליקציה. הם משיקים קמפיין פרסום ברשתות חברתיות למשך שבוע. מהי הטיית אישור במקרה זה?

    <p>הטיית אישור תתרחש אם החברה תעקוב רק אחר מספר ההורדות מהפרסום ברשתות חברתיות, ותתעלם מהורדות דרך מקורות אחרים (D)</p> Signup and view all the answers

    מה נכון לומר לגבי סולם מנה?

    <p>בסולם מנה יש נקודת אפס מוחלטת שמשמעותה היעדר התכונה הנמדדת (D)</p> Signup and view all the answers

    מהי הסיבה העיקרית שבגללה אלגוריתמים רבים בלמידה עמוקה נכשלים?

    <p>אלגוריתמים רבים בלמידה עמוקה נכשלים בשל אי-הבנה של המודל וארכיטקטורת רשת עצבית (B)</p> Signup and view all the answers

    איזה מהטכניקות הבאות משמשת עבור ניהול נתוני עתק?

    <p>מִשְׁלָב (batching) (A)</p> Signup and view all the answers

    איזה מהסיבות הבאות אינה מובילה להטיית בדיעבד ?

    <p>שימוש במידע חיצוני שאינו קשור לבעיה (B)</p> Signup and view all the answers

    איזה מבין המבנים הבאים מתאים ביותר לאחסון סדרה של ערכים ייחודיים, ללא סדר מסוים?

    <p>קבוצה (A)</p> Signup and view all the answers

    איזה מבין המבנים הבאים אינו מאפשר שינוי של הערכים? (לא ניתן לשנות את התוכן אחרי יצירת המבנה)

    <p>טפל (C)</p> Signup and view all the answers

    איזה מבין המבנים הבאים משמש לאחסון ערכים עם מפתח ייחודי?

    <p>מילון (A)</p> Signup and view all the answers

    איזה מבין המבנים הבאים ניתן להשתמש כדי לאחסן רשימה של ערכים הניתנים לשינוי?

    <p>רשימה (B)</p> Signup and view all the answers

    מהו הסמל המתאים לתאום לכל תו בודד (למעט שורת סיום), בתוך ההסבר על המבנים הנתונים?

    <p><strong>.</strong> (C)</p> Signup and view all the answers

    מהו תפקיד הפונקציה tail() ב-DataFrame?

    <p>מציגה את חמש השורות האחרונות של DataFrame (C)</p> Signup and view all the answers

    מהו טווח הערכים של קורלציית פירסון?

    <p>-1 עד 1 (D)</p> Signup and view all the answers

    איזו מהטענות הבאות לגבי tail() נכונה?

    <p>הפונקציה <code>tail()</code> יכולה להציג כל מספר רצוי של שורות (B)</p> Signup and view all the answers

    איזה נתונים מתאימים לחישוב קורלציית פירסון?

    <p>שני משתנים רציפים (A)</p> Signup and view all the answers

    מהו היתרון של tail() בהשוואה להצגת כל ה-DataFrame ?

    <p><code>tail()</code> מאפשרת למקד בניתוח של חלק מסוים של הנתונים (C)</p> Signup and view all the answers

    מהו יתרון בולט של פורמט CSV?

    <p>נתמך על ידי מרבית המערכות (A)</p> Signup and view all the answers

    איזו מהעובדות הבאות תכונה מינורית לגבי פורמט CSV?

    <p>אינו קריא באופן אינטואיטיבי (A)</p> Signup and view all the answers

    מהי אחת מהחסרונות של פורמט CSV?

    <p>נתונים מיוצגים ברמה של שכבה אחת (B)</p> Signup and view all the answers

    איזו מילה מתארת את הקושי בהבנת פורמט CSV?

    <p>לא קריא (C)</p> Signup and view all the answers

    מהו יתרון נוסף של פורמט CSV מעבר לייבוא נתונים?

    <p>מאפשר ייצוא כמויות גדולות של נתונים (D)</p> Signup and view all the answers

    מהי מטרת קורלציית ספירמן?

    <p>למדוד את הקשר המונוטוני בין שני משתנים (A)</p> Signup and view all the answers

    באיזה טווח נעים ערכי קורלציית ספירמן?

    <p>-1 ל-1 (B)</p> Signup and view all the answers

    מה מהבאים לא נכון לגבי קורלציית ספירמן?

    <p>היא משתמשת בערכים המקוריים של הנתונים (A)</p> Signup and view all the answers

    מה ההבדל העיקרי בין קורלציית ספירמן לקורלציה רגילה?

    <p>קורלציית ספירמן מתמקדת בדירוגים, בעוד קורלציה רגילה מתמקדת בערכים עצמם (A)</p> Signup and view all the answers

    כיצד ניתן לבצע קורלציית ספירמן בין שני משתנים?

    <p>באמצעות חישוב דירוגים של המשתנים (D)</p> Signup and view all the answers

    מהי מטרת ניתוח חקרני של נתונים )‪(EDA‬?

    <p>לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם. (C)</p> Signup and view all the answers

    אתם מנסים לבצע אשכול )‪ (clustering‬של מבנה נתונים שנראה כך (ככה יצא ‪):‬‬

    איזה אלגוריתם יאפשר לאשכל את הנתונים ל‪ 4‬קבוצות‪ ,‬כך שיתקבלו ‪ 2‬קבוצות עבור
                           העיניים‪ ,‬קבוצה עבור הפה וקבוצה עבור העיגול החיצוני?
    

    <p>‪ KMeans.‬עם ‪K=4‬‬ (B)</p> Signup and view all the answers

    מה מהבאים נכון לגבי ההבדל בין סולם סודר )‪ (ordinal‬וסולם רווח)‪?

    <p>בסולם רווח יש משמעות ליחס בין ערכים סמוכים‪ ,‬ובסולם סודר אין משמעות ליחס זה. (A)</p> Signup and view all the answers

    מהו היתרון של פורמט CSV ?

    <p>פורמט CSV הוא פופולרי ותומך בו תוכנת גיליון אלקטרוני רבים. (A), פורמט CSV קל ופשוט לקריאה ולכתיבה הן על ידי בני אדם והן על ידי תוכנות. (C), פורמט CSV תומך במגוון רחב של סוגי נתונים. (D)</p> Signup and view all the answers

    מהו הסמל המתאים לתאום לכל תו בודד (למעט שורת סיום) בתוך ההסבר על מבנים נתונים?

    <p><code>\.</code> (C)</p> Signup and view all the answers

    ?

    <p>, , . (C)</p> Signup and view all the answers

    R'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}$' ? ( )

    <pre><code> -*[0-9]* , . (C), '[email protected]' . (D) </code></pre> Signup and view all the answers

    מהו תפקיד "הקופסה" בתרשים Box Plot?

    <p>הקופסה מייצגת את הטווח בין הרבעון הראשון לרבעון השלישי, וחציון הנתונים מצוי בתוך הקופסה (A)</p> Signup and view all the answers

    מה ההבדל בין תרשים Box Plot לתרשים היסטוגרמה?

    <p>תרשים Box Plot מציג את חלוקת הנתונים בדרך גרפית, היסטוגרמה מציגה את התדירות של כל ערך. (C)</p> Signup and view all the answers

    מהו IQR ? (טווח בין רבעוני)

    <p>המרחק בין הרבעון הראשון לרבעון השלישי, הוא מייצג את 50% המרכזיים של הנתונים (B)</p> Signup and view all the answers

    מה מתאר מתאם פירסון ?

    <p>מתאם פירסון מצביע על קשר לינארי בין שני נתונים בסולם רווח או סולם מנה (D)</p> Signup and view all the answers

    מהו הערך של IQR לנתונים [16,19,23,36,39,81,85,90] ?

    <p>49 (C)</p> Signup and view all the answers

    מהו מתאם לינארי חיובי בגרף?

    <p>כאשר הנתונים מראה עלייה נוחה בהיקף ההפרש בין הערכים (A), כאשר הנתונים מראה עלייה נוחה בהיקף ההפרש בין הערכים (D)</p> Signup and view all the answers

    מהו היתרון העיקרי של Sklearn בניתוח נתונים?

    <p>ממשק ידידותי לשימוש במודלים של למידת מכונה (A)</p> Signup and view all the answers

    מה מתאר Vectorizer בפילוסופיה של "תיק מילים" (Bag of Words)?

    <p>יצירת וקטור שהוא ייצוג מספרי של הופעות המילים במסמך (A)</p> Signup and view all the answers

    מה המשמעות של הגדלת מספר ה תאים בהיסטוגרמה ?

    <p>הגדלת מספר ה תאים בהיסטוגרמה מייעלת את ראיית התפלגות הנתונים בהצגה הגרפית (C)</p> Signup and view all the answers

    באיזו ספרייה ב פייתון ניתן ל "שלוף" נתונים מאתר ?

    <p>requests (D)</p> Signup and view all the answers

    על איזו בעיה ה משימה של סידור ה לקוחות לפי קבוצות שונות לפי ה דמיון ביניהם מעידה?

    <p>למידה לא מונחית (Unsupervised Learning) והיא מוגדרת כבעיית אשכול (Clustering) (D)</p> Signup and view all the answers

    אילו מ ה ספריות בפייתון משמשות ל "עבודה" עם טבלאות נתונים ?

    <p>Pandas and Numpy (A)</p> Signup and view all the answers

    באילו אלגוריתמים ניתן להשתמש כדי לבצע אשכול של מבנה נתונים עם 4 אשכולות? (בחר/י את כל האפשרויות הנכונות)

    <p>אלגוריתם DBSCAN עם eps=4 (C), אלגוריתם KMeans עם K=4 (D)</p> Signup and view all the answers

    איזה מהתרשימים הבאים מציג מתאם חיובי בין Y ו-X?

    <p>הגרף האמצעי (C)</p> Signup and view all the answers

    מהו השלב הראשון בעבודתו של מדען נתונים?

    <p>ניסוח שאלת מחקר (A)</p> Signup and view all the answers

    מהו תפקידו של הביטוי הרגולרי re.findall(r"\b[A-Z][a-z]*\b", text)?

    <p>למצוא כל המילים שמתחילות באות גדולה וממשיכות באותיות קטנות, בודדות משאר הטקסט (D)</p> Signup and view all the answers

    איזה מהביטויים הרגולריים הבאים מתאים לזיהוי 123,4.5 או 345 6.78?

    <p>\d+\s*,?\s*\d+.?\d* (D)</p> Signup and view all the answers

    מבין האלגוריתמים הבאים, מי מתאים ביותר לאשכול של נתונים ללא מבנה ברור, כשטווח הערכים וסוגי הנתונים שונים?

    <p>DBSCAN (B)</p> Signup and view all the answers

    איזה מהאלגוריתמים הבאים מתחשב במרחק בין נקודות לבין הקבוצה אליה הן שייכות?

    <p>Hierarchical Clustering (C)</p> Signup and view all the answers

    מהו החיסרון העיקרי של אלגוריתם KMeans?

    <p>הוא דורש ידע מקדים על מספר האשכולות (D)</p> Signup and view all the answers

    לשתי נקודות נתונים (X,Y) יש מתאם לינארי שלילי. מה פירוש הדבר?

    <p>כאשר X גדל, Y קטן באופן לינארי (A)</p> Signup and view all the answers

    איזה מהביטויים הבאים מתאים לזיהוי מחרוזת שמכילה מספר שלם ואחריו מקף ואחריו מספר שלם?

    <p>\d+\s*-\s*\d* (A)</p> Signup and view all the answers

    איזה מהמשפטים הללו נכון לגבי תרשימי עוגה?

    <p>יש להשתמש בתרשימי עוגה כדי להציג את הרכב השלם עבור מספר קטגוריות מועטות. (D)</p> Signup and view all the answers

    מהו היתרון של תרשים עוגה בהשוואה לתרשימים אחרים?

    <p>תרשימי עוגה מאפשרים הבנה קלה של חלקים מתוך הכל. (C)</p> Signup and view all the answers

    איזה מבין המבנים הבאים ניתן להשתמש בו להעברת נתונים כמותיים?

    <p>תרשים עמודות (A)</p> Signup and view all the answers

    מה המידע העיקרי שתרשים עוגה מספק?

    <p>חלוקה לחלקים מתוך הנתון הכולל. (C)</p> Signup and view all the answers

    אילו נתונים לא מומלץ להציג בתרשימי עוגה?

    <p>נתונים עם הרבה קטגוריות. (D)</p> Signup and view all the answers

    איזה מהביטויים הרגולריים הבאים מתאים להצגת מספרים עם ערך עשרוני?

    <p>r\b0*\d+.\d*\b (A)</p> Signup and view all the answers

    אילו מבנים מתאימים לאחסון רשימה של ערכים הניתנים לשינוי?

    <p>רשימה (D)</p> Signup and view all the answers

    מה התפקיד של הפונקציה tail() ב-DataFrame?

    <p>למצוא את השורות האחרונות ב-DataFrame. (C)</p> Signup and view all the answers

    מהי מטרת הצגת תרשימי עוגה?

    <p>להשוואת נתונים מסוימים בצורה קלילה. (B)</p> Signup and view all the answers

    איזה מבנה נתונים ב-pandas מתאים ביותר לייצוג מערך חד-מימדי?

    <p>Series (D)</p> Signup and view all the answers

    מהי מטרת תהליך זיהוי ערכים חריגים (Outlier Detection)?

    <p>זיהוי ערכי קצה (extreme values) במאפיין מסוים (feature) שיכולים להשפיע על ניתוח הנתונים (B)</p> Signup and view all the answers

    איזה מהאפשרויות הבאות אינו תחום יישום של למידה לא מונחית (unsupervised learning)?

    <p>סיווג תמונות (image classification) (D)</p> Signup and view all the answers

    מהו הפלט שיודפס לאחר ריצת הקוד הבא בפייתון?

    string = 'Hello world'
    print(len(string), string.startswith('H'), string.endswith('world'))
    

    <p>11 True True (B)</p> Signup and view all the answers

    איזה מהאלגוריתמים הבאים אינו אלגוריתם למידה לא מונחית (unsupervised learning)?

    <p>אלגוריתם רגרסיה לוגיסטית (logistic regression) (C)</p> Signup and view all the answers

    איזו פקודה ב-pandas משמשת להצגת מספר השורות והעמודות במסגרת נתונים?

    <p>df.shape (D)</p> Signup and view all the answers

    מהי המטרה העיקרית של אלגוריתמי אשכולות (Clustering)?

    <p>חלוקת מערכת נתונים לקבוצות על סמך דמיון (similarity) בין הפריטים (A)</p> Signup and view all the answers

    איזה מהמודולים הבאים משמש כנראה לצורך הרכשת נתונים בעזרת Web-API?

    <p>המודול requests (C)</p> Signup and view all the answers

    איזה מהמדדים הבאים משמש להחלפת ערכים חסרים בנתונים קטגוריאליים?

    <p>הערך השכיח (D)</p> Signup and view all the answers

    איזו פונקציה ב-Python משמשת לכתיבת DataFrame לקובץ CSV?

    <p>to_csv (A)</p> Signup and view all the answers

    מהי המטרה העיקרית של שימוש בטכניקת אשכולות (clustering) בנתונים?

    <p>לזהות דפוסים וקשרים בנתונים (B)</p> Signup and view all the answers

    אילו משפטים נכונים לגבי קורלציה לינארית בין שני משתנים?

    <p>קורלציה לינארית של 0 מציינת שאין קשר לינארי בין שני משתנים. (A), קורלציה לינארית שלילית מציינת קשר חזק בין שני משתנים, כאשר ערכי משתנה אחד יורדים עם עליית ערכי המשתנה השני. (B), קורלציה לינארית חיובית מציינת קשר חזק בין שני משתנים, כאשר ערכי משתנה אחד עולים עם עליית ערכי המשתנה השני. (C), קורלציה לינארית יכולה להיות בין -1 ל-1, כאשר 1 מציין קשר לינארי חיובי מושלם ו- -1 מציין קשר לינארי שלילי מושלם. (D)</p> Signup and view all the answers

    מה אפשר לומר על הגרף המוצג בנוגע למתאם בין המאפיינים X1 ו-X2?

    <p>קיים מתאם לינארי שלילי חזק בין X1 ל-X2. (D)</p> Signup and view all the answers

    מהי המטרה של ניתוח חקרני של נתונים (EDA)?

    <p>לזהות תבניות וקשרים בנתונים לפני בניית מודלים של למידה מכונה. (A)</p> Signup and view all the answers

    מהו השלב השני בעבודת מדען נתונים, לאחר ניסוח שאלת המח研究?

    <p>איסוף נתונים. (A)</p> Signup and view all the answers

    איזה משפט נכון לגבי פורמט הנתונים JSON?

    <p>JSON מתאים לאחסון נתונים מסוגים שונים כמו טקסט, מספרים ותאריכים. (C), JSON הוא פורמט נתונים היררכי, הדומה למילון. (D)</p> Signup and view all the answers

    מהי המשמעות של הפונקציה tail() ב-DataFrame?

    <p>הפונקציה מציגה את 5 השורות האחרונות של ה-DataFrame. (B)</p> Signup and view all the answers

    איזה סוג של נתונים מתאים ביותר לחישוב קורלציית פירסון?

    <p>נתונים רציפים (D)</p> Signup and view all the answers

    מהי מטרת PCA (ניתוח רכיבים עיקריים)?

    <p>להפחית ממדיות של נתונים (A), לזהות דפוסים וקשרים בנתונים (B)</p> Signup and view all the answers

    מה ההבדל העיקרי בין האופרטור ** לאופרטור // ?

    <p>הפלט של האופרטור // הוא מספר שלם, לעומת זאת הפלט של ** אינו בהכרח מספר שלם (C)</p> Signup and view all the answers

    מה ההבדל העיקרי בין מתאם (קורלציה) לסיבתיות (causation)?

    <p>מתאם מודד את חוזק הקשר, קשר סיבתי מרמז על קשר של סיבה ותוצאה (A)</p> Signup and view all the answers

    כיצד משפיעה הגדלת מספר התאים (bins) בהיסטוגרמה על ערכי התאים?

    <p>ערכי התאים יקטנו (B)</p> Signup and view all the answers

    איזה מהביטויים הרגולריים הבאים יתאים למחרוזת "123456789"? בחר את האפשרות שבה הביטוי הרגולרי ימצא את המחרוזת, ותוכל להחזיר גם מחרוזות שאינן רצף ספרות:

    <p>יכול להחזיר &quot;aaa123456789&quot;, אבל לא יכול להחזיר &quot;123456789abcdef&quot; (D)</p> Signup and view all the answers

    מהו השלב השלישי בעבודת מדען הנתונים?

    <p>טיפול בנתונים (B)</p> Signup and view all the answers

    מהו ההבדל העיקרי בין סולם סדר (ordinal) וסולם רווח (interval)?

    <p>בסולם רווח המרווחים בין הערכים שווים, בסולם סדר לא בהכרח (C)</p> Signup and view all the answers

    בלמידת מכונה, מהו ההבדל העיקרי בין למידה מפוקחת (supervised learning) ללמידה לא מפוקחת (unsupervised learning)?

    <p>למידה מפוקחת כוללת נתונים שסומנו עם ערך מסוים ו/סווגו, בעוד שנתוני למידה לא מפוקחת אינם מסווגים ולא סומנו (A)</p> Signup and view all the answers

    איזה מהאיברים הבאים מתואר כמאפיין בעמודות והמופיע בשורות?

    <p>מאפיין בעמודות, מופיע בשורות (C)</p> Signup and view all the answers

    איזו מהבעיות הבאות מתאימה ללמידה לא מונחית (Unsupervised Learning)?

    <p>מיון תמונות לחיות מחמד שונות (C)</p> Signup and view all the answers

    מהו התפקיד העיקרי של הפונקציה head() ב-DataFrame?

    <p>מציג את השורות הראשונות של ה-DataFrame (A)</p> Signup and view all the answers

    איזו מהאפשרויות הבאות מתארת נכון את הקשר בין קורלציית פירסון לבין הגרף של התלות הליניארית?

    <p>קורלציית פירסון מתארת את עוצמת הקשר הליניארי בין שני משתנים (D)</p> Signup and view all the answers

    איזו מהטענות הבאות נכונה לגבי קורלציית פירסון?

    <p>קורלציית פירסון יכולה להיות שלילית, חיובית או אפס, וערכה מראה את עוצמת הקשר בין שני משתנים (A)</p> Signup and view all the answers

    איזו מהאפשרויות הבאות עונה על השאלה "מהו טווח הערכים של קורלציית פירסון?"

    <p>בין -1 ל-1 (B)</p> Signup and view all the answers

    איזו מהטענות הבאות אינה נכונה לגבי tail()?

    <p><code>tail()</code> תמיד מציגה את 5 השורות הראשונות של ה- DataFrame (D)</p> Signup and view all the answers

    מה נכון לומר לגבי tail() בהשוואה להצגת כל ה- DataFrame?

    <p><code>tail()</code> מציגה רק חלק מה- DataFrame, מה שעלול להוביל להבדלים בתוצאות בניתוח הנתונים (A)</p> Signup and view all the answers

    איזו מהטענות הבאות לא נכונה לגבי tail()?

    <p>ניתן להשתמש ב-<code>tail()</code> כדי לשנות את ה- DataFrame המקורי (A)</p> Signup and view all the answers

    איזו מהאפשרויות הבאות מתארת נכון את הקשר בין קורלציית פירסון לבין הגרף של ה- DataFrame?

    <p>קורלציית פירסון מתארת את עוצמת הקשר הלינארי בין שני משתנים (B)</p> Signup and view all the answers

    איזה מתוך הנתונים הבאים מתאים לחישוב קורלציית פירסון?

    <p>נתונים כמותיים רציף (כגון גובה) (D)</p> Signup and view all the answers

    מהו תפקיד מבנה הנתונים ‪?dictionary‬‬

    <p>מבנה שמאפשר גישה נוחה לנתונים באמצעות מפתח ייחודי (A)</p> Signup and view all the answers

    איזו מבין האפשרויות תואמת את האופן שבו מיוצגים מאפיינים (features) ומופעים (instances) ב ‪ DataFrame-‬ של ‪?pandas‬‬

    <p>מאפיינים מיוצגים כעמודות ומופעים מיוצגים כשורות (C)</p> Signup and view all the answers

    איזו מהאפשרויות אינה מתארת תכונה של מבנה נתונים ‪?dictionary‬‬

    <p>סדר הערכים קבוע ובלתי משתנה (C)</p> Signup and view all the answers

    איזו מהאפשרויות מתארת נכון את הקשר בין ‪dictionary‬‬ לבין ‪?pandas‬‬

    <p>ניתן להשתמש ב ‪dictionary‬‬ כדי ליצור עמודות חדשות ב ‪DataFrame‬‬ (B)</p> Signup and view all the answers

    איזו מהפעולות הבאות אינה מתאפשרת במבנה נתונים ‪?dictionary‬‬

    <p>הכנסת סדר מוגדר לערכים (B)</p> Signup and view all the answers

    איזו מהאפשרויות מתארת נכון את ‪?numpy‬‬

    <p>ספרייה שמתמחה בעיבוד נתונים מספריים (C)</p> Signup and view all the answers

    איזו מהאפשרויות מתארת נכון את התכונות של מבנה נתונים ‪?DataFrame‬‬

    <p>מבנה מסודר בעל שורות ועמודות, דומה לטבלה (B)</p> Signup and view all the answers

    מהו תפקיד של ‪?Pandas‬‬

    <p>ספריית תכנות מיועדת לניתוח ועיבוד נתונים (A)</p> Signup and view all the answers

    איזו מהאפשרויות מתארת בצורה נכונה את הקשר שבין ‪DataFrame‬‬ ל ‪?Series‬‬

    <p>‪DataFrame‬‬ יכול להכיל מספר ‪Series‬‬ כעמודות שלו (B)</p> Signup and view all the answers

    איזו מהאפשרויות מתארת בצורה נכונה את היחס בין ‪dictionary‬‬ ל ‪?Series‬‬

    <p>ניתן להשתמש ב ‪dictionary‬‬ כדי ליצור ‪Series‬‬ חדש (D)</p> Signup and view all the answers

    מהי דוגמה ללמידה לא מונחית )‪(unsupervised learning‬?

    <p>אשכול לקוחות (D)</p> Signup and view all the answers

    איזה מהאלגוריתמים הבאים הוא לא אלגוריתם למידה לא מונחית )‪(unsupervised learning‬?

    <p>אלגוריתם רגרסיה לינארית (C)</p> Signup and view all the answers

    כמה סוגי נתונים ניתן להציג תרשים פיזור )‪(scatterplot‬ דו-מימדי?

    <p>רק ‪ 2‬סוגי נתונים (B)</p> Signup and view all the answers

    כיצד מחשבים את הממוצע של מערך נתונים?

    <p>סיכום כל הערכים וחלוקה במספר הערכים (B)</p> Signup and view all the answers

    איזו פקודה תמיר ‪ json‬למבנה נתונים של ‪: dictionary‬?

    <p>הפקודה ‪loads‬‬ (B)</p> Signup and view all the answers

    מהי המטרה העיקרית של אלגוריתם ניתוח רכיבים ראשיים )‪(PCA‬?

    <p>להקטין את מימד הנתונים ללא אובדן מידע significat (A), להתמקד במאפיינים הדומיננטיים בנתונים (C)</p> Signup and view all the answers

    בסטטיסטיקה, מהי התפלגות נורמלית?

    <p>התפלגות סימטרית, עם רוב הערכים סביב הממוצע (B)</p> Signup and view all the answers

    כיצד יש לנהוג במקרה בו ישנם ערכים חסרים במאפיין מספרי?

    <p>כל התשובות נכונות בתנאים מסוימים. (A)</p> Signup and view all the answers

    בסטטיסטיקה, מה מטרת המדידה של סטיית התקן?

    <p>תיאור התפשטות או פיזור הנתונים (A)</p> Signup and view all the answers

    איזו משווה רלציונית נכונה לגבי סטיית התקן?

    <p>סטיית התקן גדולה יותר פירושה יש פזורה בנתונים. (B)</p> Signup and view all the answers

    Flashcards

    למידה מונחית

    למידה שבה יש משימות ותויות לתוצרי הלמידה.

    למידה בלתי מונחית

    למידה שבה אין מסמכים או תיווך מהמאמן.

    SCALE רווח

    סולם שבו המרווחים הם שלמים ואפשר לחשב ממוצע אלגברי.

    SCALE מנה

    סולם שבו המרווחים יכולים להיות רציונליים ומאפשרים לחשב ממוצע הנדסי.

    Signup and view all the flashcards

    Z-Score

    מדד שמייצג את מספר סטיות התקן מהממוצע.

    Signup and view all the flashcards

    DataFrame

    מבנה נתונים דו מימדי ב-Pandas לאחסן נתונים מבניים.

    Signup and view all the flashcards

    find_all

    פקודה להחזיר רשימה של כל התגיות בתעודת HTML המתאימות לקריטריון.

    Signup and view all the flashcards

    response.content()

    פקודת קוד שמשמשת לקבלת תוכן התשובה.

    Signup and view all the flashcards

    response.text

    פקודה נוספת שמחזירה את התוכן כמחרוזת טקסט.

    Signup and view all the flashcards

    response.html()

    שיטה שקוראת תוכן HTML מתוך התשובה.

    Signup and view all the flashcards

    response.data()

    שיטה שמתארת נתונים, אך לא בהקשר זה.

    Signup and view all the flashcards

    תוכן תשובה

    המידע המוחזר מהבקשה לרשת.

    Signup and view all the flashcards

    שימושים ב-response

    איך משתמשים בפונקציות לקבלת תשובות?

    Signup and view all the flashcards

    מתי להשתמש ב-response.text

    להשתמש כשצריך טקסט פשוט מהתשובה.

    Signup and view all the flashcards

    חשיבות response.html()

    לקרוא תוכן HTML ולהציג אותו.

    Signup and view all the flashcards

    תשובות לבקשות רשת

    מה שקורה כששולחים בקשה ולאן לפנות?

    Signup and view all the flashcards

    ייבוא matplotlib

    ייבוא סטנדרטי של ספריית matplotlib.pyplot בכדי ליצור גרפים.

    Signup and view all the flashcards

    הוספת מקרא לגרף

    שיטה להוספת מקרא לעלות גרפים באמצעות plt.legend().

    Signup and view all the flashcards

    מילוי ערכים חסרים

    שיטה להחליף ערכים חסרים עם ממוצע העמודה ב-DataFrame בעזרת df.fillna().

    Signup and view all the flashcards

    מודל למידה לא מונחית

    KMeans הוא מודל למידה לא מונחית שמבצע קיבוץ של נתונים.

    Signup and view all the flashcards

    ספרייה ללמידה מונחית

    scikit-learn היא ספרייה פופולרית בלמידה מונחית בפייתון.

    Signup and view all the flashcards

    אלגוריתם למידה מונחית

    SVM (Support Vector Machine) הוא אלגוריתם ללמידה מונחית למיון נתונים.

    Signup and view all the flashcards

    ייבוא KMeans מ-scikit-learn

    ייבוא KMeans באמצעות from sklearn.cluster import KMeans.

    Signup and view all the flashcards

    DataFrame ב-pandas

    DataFrame הוא מבנה נתונים בפייתון שמאחסן נתונים בטבלה.

    Signup and view all the flashcards

    np.nan

    np.nan מייצג ערך חסר ב-numpy וב-pandas.

    Signup and view all the flashcards

    df.fillna()

    שיטה בפנדס להחלפת ערכים חסרים עם ערכים ממוצעים.

    Signup and view all the flashcards

    ממוצע פלוס שלוש סטיות תקן

    ערך עובר את הממוצע בתוספת שלוש סטיות תקן.

    Signup and view all the flashcards

    שיטת זיהוי חריגים

    תהליך המפנה נתונים שמחוץ לטווח הנורמלי.

    Signup and view all the flashcards

    רבעון ראשון (Q1)

    ערך שמתחתיו 25% מהנתונים. משתמשים לחישוב IQR.

    Signup and view all the flashcards

    רבעון שלישי (Q3)

    ערך שחוצה 75% מהנתונים כלפי פנימה. חשוב לזיהוי חריגים.

    Signup and view all the flashcards

    טווח אינטרקווארטילי (IQR)

    הפרש בין Q3 ל-Q1, משמש לתיאור פיזור הנתונים.

    Signup and view all the flashcards

    פקודת loc

    פקודה ב-Pandas כדי לגשת ולשנות ערכים ב-DataFrame.

    Signup and view all the flashcards

    ממוצע של עמודה

    סכום כל הערכים בעמודה חלקי מספר הערכים.

    Signup and view all the flashcards

    ערכים ריקים (NaN)

    ערכים חסרים ב-DataFrame שמצביעים על חוסר נתון.

    Signup and view all the flashcards

    ממוצע בעמודה B

    הערך הקבוע המתקבל כשחושבים את ממוצע עמודה B.

    Signup and view all the flashcards

    שגיאה בפקודת loc

    שגיאה יכולה להתרחש כשמנסים לגשת לערכים לא חוקיים בעמודה.

    Signup and view all the flashcards

    Outliers (חריגים)

    ערכים ב-DataFrame שמקבילים לערכים קיצוניים מהשאר.

    Signup and view all the flashcards

    טווח בין רבעוני (IQR)

    ההפרש בין הרבעון הראשון לשלישי, המזהה את התפוצה של הנתונים.

    Signup and view all the flashcards

    בוצעה שינוי בעמודה B

    ההפרש כשהערכים הריקים בעמודה B משתנים לממוצע.

    Signup and view all the flashcards

    שורות עם NaN

    שורות ב-DataFrame שמחזיקות ערכים ריקים בעמודה A.

    Signup and view all the flashcards

    שימוש בשיטה IQR

    שיטה לזיהוי חריגים על ידי חישוב הטווח בין הרבעונים.

    Signup and view all the flashcards

    tail()

    מציגה את חמש השורות האחרונות של ה-DataFrame.

    Signup and view all the flashcards

    קורלציית פירסון

    מודדת את עוצמת והכיוון של הקשר הלינארי בין שני משתנים רציפים, עם ערך בין -1 ל-1.

    Signup and view all the flashcards

    ערך 1 בקורלציה

    ערך של 1 מציין קשר חיובי ולינארי מוחלט בין שני משתנים.

    Signup and view all the flashcards

    ערך -1 בקורלציה

    ערך של -1 מציין קשר שלילי ולינארי מוחלט בין שני משתנים.

    Signup and view all the flashcards

    ערך 0 בקורלציה

    ערך של 0 מציין שאין קשר לינארי בין המשתנים.

    Signup and view all the flashcards

    קורלציית ספירמן

    מודדת קשר מונוטוני בין שני משתנים באמצעות דירוגים.

    Signup and view all the flashcards

    מינימום קורלציה

    הערך הנמוך ביותר בקורלציית ספירמן אפשרי הוא -1.

    Signup and view all the flashcards

    מקסימום קורלציה

    הערך הגבוה ביותר בקורלציית ספירמן אפשרי הוא 1.

    Signup and view all the flashcards

    דירוגים בנתונים

    שיטת מדידה שבאה במקום ערכים מקוריים לקורלציה.

    Signup and view all the flashcards

    תכונת מדידה מונוטונית

    קורלציית ספירמן מתמקדת במונוטוניות ולא בצורת הקשר.

    Signup and view all the flashcards

    פורמט CSV

    פורמט טקסט קל שיכול לייבא ולייצא נתונים רבים.

    Signup and view all the flashcards

    יתרונות CSV

    מאפשר ייבוא וייצוא כמויות נתונים גדולות, נתמך על ידי רוב המערכות.

    Signup and view all the flashcards

    חסרונות CSV

    לא קריא, נתונים ברמה אחת ולא היררכיים.

    Signup and view all the flashcards

    ייצוא נתונים

    תהליך של העברת נתונים מחוץ למערכת לפורמט אחר.

    Signup and view all the flashcards

    ייבוא נתונים

    תהליך של הכנסת נתונים ממקור חיצוני למערכת.

    Signup and view all the flashcards

    טפל (tuple)

    מאחסן סדרה של ערכים שאינה ניתנת לשינוי.

    Signup and view all the flashcards

    רשימה (list)

    מאחסן סדרה של ערכים הניתנים לשינוי.

    Signup and view all the flashcards

    קבוצה (set)

    מאחסן סדרה של ערכים ייחודיים ללא סדר מסוים.

    Signup and view all the flashcards

    . (נקודה)

    מתאם לכל תו בודד פרט לשורת סיום.

    Signup and view all the flashcards

    סוגי מבני נתונים

    טפל, רשימה וקבוצה הם מבני נתונים מרכזיים בפייתון.

    Signup and view all the flashcards

    ניתוח חקרני של נתונים (EDA)

    הליך לזיהוי תבניות וקשרים בנתונים.

    Signup and view all the flashcards

    אשכול (Clustering)

    תהליך חלוקת נתונים לקבוצות על בסיס דמיון.

    Signup and view all the flashcards

    אלגוריתם KMeans

    שיטה לחלק נתונים לקבוצות על פי קיבוץ נושאים.

    Signup and view all the flashcards

    DBSCAN

    אלגוריתם לקיבוץ נתונים המבוסס על צפיפות.

    Signup and view all the flashcards

    סולם סודר (Ordinal Scale)

    סולם שמודד ערכים בסדר מסוים אך לא מרווחים מדודים.

    Signup and view all the flashcards

    סולם רווח (Interval Scale)

    סולם שבו המרווחים הם מדודים אך אין אפס מוחלט.

    Signup and view all the flashcards

    חקר נתונים

    תהליך גנרי של חקירה וניתוח נתונים לקבלת תובנות.

    Signup and view all the flashcards

    זיהוי חריגים

    תהליך זיהוי נתונים שאינם תואמים למגמות הכלליות.

    Signup and view all the flashcards

    תבניות בנתונים

    מבנים חוזרים או קישורים בתוך נתוני המידע.

    Signup and view all the flashcards

    סולם סודר

    סולם מדידה שבו ניתן לחבר ולחסר אך לא לחשב ממוצע.

    Signup and view all the flashcards

    סולם רווח

    סולם מדידה שבו ניתן לבצע חיבור, חיסור, כפול וחלק, וכולל ממוצע.

    Signup and view all the flashcards

    תרשים פיזור

    גרף דו-מימדי שמציג משתנה על ציר X ומדד על ציר Y.

    Signup and view all the flashcards

    כתובת אימייל

    מחרוזת המתארת כתובת אלקטרונית בפורמט סטנדרטי.

    Signup and view all the flashcards

    מודלים במידול נתונים

    שיטות ליצירת קשרים בין מספר תכונות או משתנים.

    Signup and view all the flashcards

    ותק המינים

    ההפרש בין המידע הנאסף למידע שניתן בשדה.

    Signup and view all the flashcards

    שיטות הזיהוי של חריגים

    תהליכים המפנים נתונים שמחוץ לתחום הנורמלי.

    Signup and view all the flashcards

    שיטות לצבירת נתונים

    שיטות להשגת מספר ייצוגים צורניים של נתונים.

    Signup and view all the flashcards

    רגולציה של קלט

    השיטה שבו אנו מתאימים נתונים לפי כללים או פורמטים מסוימים.

    Signup and view all the flashcards

    קופסה (box plot)

    תרשים המציג חציון, רבעונים וטווח בין רבעוני של נתונים.

    Signup and view all the flashcards

    מתאם פירסון

    מספר שמצביע על קשר לינארי בין שני נתונים.

    Signup and view all the flashcards

    features ומופעים ב-DataFrame

    מאפיינים מיוצגים בעמודות והמופעים בשורות.

    Signup and view all the flashcards

    ספריית requests

    משמשת לפניות HTTP/HTTPS לשרתי רשת.

    Signup and view all the flashcards

    vectorizer

    אובייקט ממיר טקסט לוקטורים בשיטת bag of words.

    Signup and view all the flashcards

    אלגוריתלמידה לא מונחית

    KMeans הוא אלגוריתם לקיבוץ נתונים ללא תוויות.

    Signup and view all the flashcards

    היסטוגרמה

    תצוגת נתונים המחולקת לתאים המייצגים כמות דגימות.

    Signup and view all the flashcards

    חסרי ערכים (NaN)

    נתונים חסרים ב-DataFrame, מציינים חוסר מידע.

    Signup and view all the flashcards

    תרשים עוגה

    תרשים הממחיש את הרכב השלם בעבור קטגוריות מועטות.

    Signup and view all the flashcards

    שימוש בראשי פירוש ב-r'

    פרמטר רגולרי לביטוי רגולרי שיכול להחזיר משתנים.

    Signup and view all the flashcards

    d+

    ביטוי רגולרי לחיפוש אחר מספרים שלמים.

    Signup and view all the flashcards

    0*\d+.?

    ביטוי רגולרי לחיפוש מספרים עשרוניים או שלמים.

    Signup and view all the flashcards

    Pie Chart

    גרף שמציג יחסים בין חלקים

    Signup and view all the flashcards

    צפיפות ב-DBSCAN

    חישוב של מספר נקודות בסביבת נקודה עם רדיוס מסוים.

    Signup and view all the flashcards

    ניסוח שאלת מחקר

    השלב הראשון בשלבי עבודתו של מדען הנתונים.

    Signup and view all the flashcards

    correlation (מתאם)

    מודד את עוצמת והכיוון של הקשר הלינארי בין שני משתנים.

    Signup and view all the flashcards

    תהליך זיהוי חריגים

    תהליך המפנה נתונים שמחוץ לטווח הנורמלי.

    Signup and view all the flashcards

    זיהוי דפוסים

    תהליך למציאת תבניות וקשרים בנתונים.

    Signup and view all the flashcards

    הפחתת ממדיות

    תהליך לצמצום מספר המשתנים בנתונים.

    Signup and view all the flashcards

    חזוי אירועים

    תהליך של גילוי מה שעשוי לקרות בעתיד מתוך נתונים.

    Signup and view all the flashcards

    קורלציה

    מודדת את עוצמת והכיוון של הקשר הלינארי בין שני משתנים.

    Signup and view all the flashcards

    בקשות רשת

    מה שמתרחש כששולחים בקשה למידע מרשת.

    Signup and view all the flashcards

    מבנה נתונים בספריית pandas

    מערך חד מימדי בספריית pandas נקרא Series.

    Signup and view all the flashcards

    Zיהוי ערכים חריגים

    Outlier Detection הוא תהליך זיהוי ערכים החורגים באופן משמעותי.

    Signup and view all the flashcards

    שימושים בלמידה לא מונחית

    עיבוד תמונה, עיבוד שפה טבעית וביולוגיה חישובית הם תחומים של למידה לא מונחית.

    Signup and view all the flashcards

    פקודת pandas להצגת נתונים

    הפקודה df.shape מציגה את מספר השורות והעמודות במסגרת נתונים.

    Signup and view all the flashcards

    המודול מקובל לייבוא

    המודול seaborn מיובא בדרך כלל כ-sns.

    Signup and view all the flashcards

    פקודת כתיבה ל-CSV

    כדי לכתוב DataFrame לקובץ CSV יש להשתמש בפקודה to_csv.

    Signup and view all the flashcards

    מדד להחלפת ערכים חסרים

    הערך השכיח מושלם להחלפת ערכים חסרים בנתונים קטגוריאליים.

    Signup and view all the flashcards

    מודולים ל-web-API

    המודול requests נחשב מאוד לשימוש לצורך הרכשת נתונים.

    Signup and view all the flashcards

    למידה לא מונחית קלאסית

    אלגוריתם ניתוח רכיבים ראשיים (PCA) הוא חלק מקטגוריית למידה לא מונחית.

    Signup and view all the flashcards

    מודל לניהול נתונים

    תהליך חקירה וניתוח נתונים נקרא חקר נתונים.

    Signup and view all the flashcards

    קורלציה לינארית שלילית

    קשר שבו כשערכים של משתנה אחד גדלים, ערכי המשתנה השני קטנים.

    Signup and view all the flashcards

    קורלציה לינארית חיובית

    קשר שבו כשערכים של משתנה אחד גדלים, גם ערכי המשתנה השני גדלים.

    Signup and view all the flashcards

    קורלציה לינארית חיובית חזקה

    קשר חזק שבו ערכים של משתנה אחד משתנים באופן תואם לערכים של המשתנה השני.

    Signup and view all the flashcards

    שרת Web API

    ממשק המאפשר לבצע שאילתות ולהחזיר תוכן בצורה מסודרת.

    Signup and view all the flashcards

    כתובת דוא"ל

    מחרוזת מהווה כתובת אלקטרונית בפורמט ספציפי.

    Signup and view all the flashcards

    מבנה נתונים בלתי ניתן לשינוי (immutable)

    נתונים שלא ניתן לערוך או לשנות לאחר יצירתם.

    Signup and view all the flashcards

    רכישת נתונים

    השלב בעבודה שאחרי ניסוח שאלת המחקר, בו אוספים נתונים רלוונטיים.

    Signup and view all the flashcards

    כתובת URL פשוטה

    מחרוזת המצביעה על מיקום משאב באינטרנט.

    Signup and view all the flashcards

    מאפיינים בעמודות

    מאפיינים הם תכנים המיוצגים בעמודות ב-DataFrame.

    Signup and view all the flashcards

    מופעים בשורות

    מופעים הם רשומות המסודרות בשורות ב-DataFrame.

    Signup and view all the flashcards

    שני סוגים של נתונים

    נתונים יכולים להיות מאופיינים בעמודות או מופעים בשורות.

    Signup and view all the flashcards

    למידה לא מונחית

    למידה שבה אין תיוגים או הנחיות מראש לתוצרים.

    Signup and view all the flashcards

    KMeans

    אלגוריתם לקיבוץ נתונים ללא תוויות, באמצעות למידה לא מונחית.

    Signup and view all the flashcards

    מבנה נתונים dictionary

    מבנה נתונים המאגד זוגות של מפתחות וערכים.

    Signup and view all the flashcards

    קורלציה (מתאם)

    מודד את עוצמת והכיוון של הקשר הלינארי בין שני משתנים.

    Signup and view all the flashcards

    חציון

    ערך המפריד בין חצי עליון וחצי תחתון במערך נתונים ממוינים.

    Signup and view all the flashcards

    סטיית תקן

    מדד המתאר את התפשטות או פיזור הנתונים סביב הממוצע.

    Signup and view all the flashcards

    נתונים חסרים (NaN)

    ערכים חסרים ב-DataFrame, מצביעים על חוסר מידע.

    Signup and view all the flashcards

    עיבוד נתונים חסרים

    תהליך שבו אנו מטפלים ערכים חסרים בנתונים על מנת לשפר את המודל.

    Signup and view all the flashcards

    חלוקה לקבוצות

    תהליך חלוקת נתונים לאשכולות על בסיס תכונות משותפות.

    Signup and view all the flashcards

    שיטה Z-Score

    מדד המייצג את מספר הסטיות התקן ממוצע עבור ערך נתון.

    Signup and view all the flashcards

    מתאם

    מדד המראה עד כמה שני משתנים תלויים זה בזה.

    Signup and view all the flashcards

    למידה מפוקחת

    למידה הכוללת נתונים שסומנו ונדחו למטרות מסוימות.

    Signup and view all the flashcards

    למידה לא מפוקחת

    למידה שבה הנתונים אינם מסווגים או מסומנים.

    Signup and view all the flashcards

    Study Notes

    מבחן לדוגמה - מבוא למדעי הנתונים

    • קורס: מבוא למדעי הנתונים
    • סמסטר: חורף תשפ"ה
    • תאריך הבחינה: 21/3/24
    • מרצים: ד"ר יהונתן שלר, אינג' עידן טוביס
    • משך הבחינה: שעתיים
    • חומר עזר: מחשבון
    • סוג הבחינה: רב ברירתית
    • הוראות: לסמן את התשובה הנכונה ביותר מבין ארבע אפשרויות.
    • נושאים: למידה מונחית, למידה בלתי מונחית, סיווג, רגרסיה, סולם רווח, סולם מנה, ביטויים רגולריים, תרשים כינור, Z-Score, הטיית אישור, סטיית תקן, חישוב IQR, אחוזונים, קלאסטרינג (clustering), הורדת מימדים (Dimension reduction), קוד HTTP, עמודות, שורות, NumPy, Pandas, Matplotlib, SciPy, Sklearn, requests, beautiful soup, selenium, JSON, CSV, Bag of Words, Vectorizer, DataFrames, Series, Outliers, קלאסטרינג היררכי (hierarchical clustering), DBSCAN, Box Plot, Kernel Density Plot, Scatter Plot, EDA, ויזואליזציה, סולם סדר, היסטוגרמה, עוגה (Pie Chart), רגרסיה ליניארית, חציון (Median), שכיח (Mode), שונות (Variance), زנבות (Tails), רבעון (Quartile), exploration, קובץ CSV, CSV, קובץ JSON, חריגים, IQR, אחוזונים, שלבי ניתוח נתונים, הרכשת נתונים, KMeans, DBSCAN, outliers.

    שאלות בחינה

    • שאלה 1: מטרת ניתוח חקרני של נתונים (EDA): לזהות תבניות וקשרים בנתונים שאינם בהכרח מובנים מאליהם.
    • שאלה 2: אלגוריתם לאישכול נתונים: KMeans עם K=4.
    • שאלה 3: הבדל בין סולם סדר וסולם רווח: בסולם סדר המרווחים אינם בהכרח שווים, ובסולם רווח המרווחים הם שווים.
    • שאלה 4: תוצאות ביטוי רגולרי: r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$' מחזיר כתובות אימייל.
    • שאלה 5: האם ניתן להציג יותר משני משתנים בתרשים פיזור: כן, ניתן להציג עד שלושה משתנים באמצעות צבע, גודל, צורה וסמל.
    • שאלה 6: מהו תרשים קופסה (box plot): טכניקה להצגת החציון, הרבעונים והטווח הבין רבעוני (IQR).
    • שאלה 7: מהו מתאם פירסון: מספר המציג את עוצמת הקשר הליניארי בין שני נתונים (סולם רווח או מנה).
    • שאלה 8: חישוב IQR: לא צוין בנתונים אלה.
    • שאלה 9: סוג המתאם בתרשים פיזור: לא צוין בנתונים אלה.
    • שאלה 10: ספריית למידה בלתי מונחית: scikit-learn.
    • שאלה 11: רכישת נתונים מאתר Shein: יש לבדוק קודם אם יש API, ואם לא, לבצע crawling (גלישה אוטומטית).
    • שאלה 12: סוג בעיה במדעי נתונים: אשכול (clustering).
    • שאלה 13: סולם לציון קורס: סולם מנה.
    • שאלה 14: השפעה של whis=5 ב-boxplot: מראה פחות נתונים חריגים (outliers).
    • שאלה 15: מדד למיקום בהתפלגות עם צידוד: חציון (median).
    • שאלה 16: מבנה נתונים לזוגות מפתח-ערך: מילון (dictionary).
    • שאלה 17: מטרת ניתוח חקרני: זיהוי תבניות וקשרים בנתונים.
    • שאלה 18: שלב שני בעבודה של מדען נתונים: הרכשת נתונים.
    • שאלה 19: סוגי נתונים ב-DataFrame: מספרים, טקסטים, תאריכים.
    • שאלה 20: מבנה נתונים בלתי משתנה: טאפל (tuple).

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    הבחן את הידע שלך בשיטות עבודה עם נתוני אינטרנט בפייתון. השאלות יכללו פקודות לקבלת תוכן דף, טיפול בסימוני HTML ומודלים לניתוח נתונים. האם אתה מוכן לאתגר את עצמך ולהוכיח את המיומנויות שלך?

    More Like This

    Mastering Microsoft Excel
    5 questions

    Mastering Microsoft Excel

    ConvincingCitrine avatar
    ConvincingCitrine
    Formularios HTML
    5 questions

    Formularios HTML

    PraiseworthyAgate avatar
    PraiseworthyAgate
    Use Quizgecko on...
    Browser
    Browser