כריית נתונים - אשכול ביקורות
5 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

מהו אחד מהנושאים שנדונו בסמינר בנושא כריית נתונים?

  • סוגי אלגוריתמים
  • תוכנית לימודים
  • שיטות לימוד
  • מודלים (correct)
  • איזו מהשיטות משמשת להערכת איכות הנתונים?

  • הדרכות לעובדים
  • אסטרטגיות פרסום
  • שיטות חיזוי פשוטות
  • SSE (Sum of Squared Errors) (correct)
  • מהו אחד מהפרמטרים שנקבעים במהלך תהליך המודל?

  • תצוגה גרפית
  • רמות גיוס
  • בעיות רגולציה
  • פונקציית מרחק (correct)
  • מהו אחד מהסקור המאפשר הערכת המודל?

    <p>Calinski-Harabasz Index</p> Signup and view all the answers

    מהו האלגוריתם שנבחר בתהליך כריית הנתונים?

    <p>לימוד מונחה</p> Signup and view all the answers

    Study Notes

    כריית נתונים - אשכול ביקורות

    • נושא: אשכול ביקורות
    • מגיש: סהר יעקב
    • מס' קבוצה: 10
    • תאריך הגשה: 28.2.2025
    • מטרת הסמינר: כריית נתונים
    • מטרת העבודה: ניתוח ביקורות משתמשים
    • קבצי הגשה: מצגת 1, מצגת 2, עבודה סמינריונית, קוד ונתונים
    • כלי: KMeans Clustering (אשכולות)
    • נתונים: ביקורות משתמשים בפורמט טקסטואלי, אלפי רשומות
    • מטרות עסקיות: שיפור חוויית הלקוח, זיהוי בעיות במוצרים, הצעות מותאמות אישית, שיפור תהליכי העסק
    • מודלים: KMeans, LDA (Latent Dirichlet Allocation), Decision Trees
    • פונקציית מרחק: מרחק אוקלידי
    • דרכי אסיפת נתונים: ממאגרי נתונים קיימים, כגון Kaggle
    • פורמט קבצי נתונים: CSV
    • הערכת איכות הנתונים: בדיקה וניפוי של ערכים חסרים בדירוגים ובטקסט.
    • הערכת המודל: חישוב אחוז שגיאה, מדדים כמו Silhouette Score ו-SSE (Sum of Squared Errors), Davies--Bouldin Index, Calinski-Harabasz Index.
    • כלי עזר: ספריות פייתון כמו scikit-learn, numpy
    • הצגת תוצאות: גרפים ויזואליים (כגון Elbow Method), קובץ CSV
    • הטמעת המודל: שילוב המודל במערכת ניהול הביקורות של הארגון, ממשק משתמש להצגת תוצאות.
    • דרישות הגשה: קובץ ZIP הכולל מצגות, עבודה סמינריונית, קבצי נתונים, וקוד.

    תוכן עניינים

    • מבוא
    • התחום ממנו הגיעה הבעיה
    • תיאור הבעיה מבחינה עסקית
    • תיאור הבעיה במונחים עסקיים
    • תיאור המצב הקיים בעסק
    • המטרות העסקיות
    • בינה מלאכותית
    • תיאור הבעיה במונחים של כריית נתונים/בינה מלאכותית
    • הפלטים של המערכת
    • הנתונים
    • תיאור מפורט של דרכי אסיפת הנתונים
    • הערכת איכות הנתונים
    • מודלים
    • תיאור האלגוריתם שנבחר
    • סיבת הבחירה באלגוריתם זה
    • קביעת הפרמטרים של המודל
    • קביעת/תיאור פונקציית מרחק
    • מימוש האלגוריתם
    • הערכת המודל (Silhouette Score, SSE, Davies-Bouldin Index, Calinski-Harabasz Index)
    • תצוגה ויזואלית של ההערכה (גרף Elbow Method)
    • תיקונים במודל המוצע
    • כיצד ניתן להטמיע את המודל במערכת האמיתית של הארגון

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    סמינר זה מתרכז בכריית נתונים וניהול ביקורות משתמשים. במהלך העבודה נשתמש במודלים שונים כמו KMeans ו-LDA כדי לנתח נתונים ולאתר בעיות במוצרים. כמו כן, נבצע הערכות על איכות הנתונים ונציג תוצאות בצורה ויזואלית.

    More Like This

    Use Quizgecko on...
    Browser
    Browser