Podcast
Questions and Answers
מהו אחד מהנושאים שנדונו בסמינר בנושא כריית נתונים?
מהו אחד מהנושאים שנדונו בסמינר בנושא כריית נתונים?
איזו מהשיטות משמשת להערכת איכות הנתונים?
איזו מהשיטות משמשת להערכת איכות הנתונים?
מהו אחד מהפרמטרים שנקבעים במהלך תהליך המודל?
מהו אחד מהפרמטרים שנקבעים במהלך תהליך המודל?
מהו אחד מהסקור המאפשר הערכת המודל?
מהו אחד מהסקור המאפשר הערכת המודל?
Signup and view all the answers
מהו האלגוריתם שנבחר בתהליך כריית הנתונים?
מהו האלגוריתם שנבחר בתהליך כריית הנתונים?
Signup and view all the answers
Study Notes
כריית נתונים - אשכול ביקורות
- נושא: אשכול ביקורות
- מגיש: סהר יעקב
- מס' קבוצה: 10
- תאריך הגשה: 28.2.2025
- מטרת הסמינר: כריית נתונים
- מטרת העבודה: ניתוח ביקורות משתמשים
- קבצי הגשה: מצגת 1, מצגת 2, עבודה סמינריונית, קוד ונתונים
- כלי: KMeans Clustering (אשכולות)
- נתונים: ביקורות משתמשים בפורמט טקסטואלי, אלפי רשומות
- מטרות עסקיות: שיפור חוויית הלקוח, זיהוי בעיות במוצרים, הצעות מותאמות אישית, שיפור תהליכי העסק
- מודלים: KMeans, LDA (Latent Dirichlet Allocation), Decision Trees
- פונקציית מרחק: מרחק אוקלידי
- דרכי אסיפת נתונים: ממאגרי נתונים קיימים, כגון Kaggle
- פורמט קבצי נתונים: CSV
- הערכת איכות הנתונים: בדיקה וניפוי של ערכים חסרים בדירוגים ובטקסט.
- הערכת המודל: חישוב אחוז שגיאה, מדדים כמו Silhouette Score ו-SSE (Sum of Squared Errors), Davies--Bouldin Index, Calinski-Harabasz Index.
- כלי עזר: ספריות פייתון כמו scikit-learn, numpy
- הצגת תוצאות: גרפים ויזואליים (כגון Elbow Method), קובץ CSV
- הטמעת המודל: שילוב המודל במערכת ניהול הביקורות של הארגון, ממשק משתמש להצגת תוצאות.
- דרישות הגשה: קובץ ZIP הכולל מצגות, עבודה סמינריונית, קבצי נתונים, וקוד.
תוכן עניינים
- מבוא
- התחום ממנו הגיעה הבעיה
- תיאור הבעיה מבחינה עסקית
- תיאור הבעיה במונחים עסקיים
- תיאור המצב הקיים בעסק
- המטרות העסקיות
- בינה מלאכותית
- תיאור הבעיה במונחים של כריית נתונים/בינה מלאכותית
- הפלטים של המערכת
- הנתונים
- תיאור מפורט של דרכי אסיפת הנתונים
- הערכת איכות הנתונים
- מודלים
- תיאור האלגוריתם שנבחר
- סיבת הבחירה באלגוריתם זה
- קביעת הפרמטרים של המודל
- קביעת/תיאור פונקציית מרחק
- מימוש האלגוריתם
- הערכת המודל (Silhouette Score, SSE, Davies-Bouldin Index, Calinski-Harabasz Index)
- תצוגה ויזואלית של ההערכה (גרף Elbow Method)
- תיקונים במודל המוצע
- כיצד ניתן להטמיע את המודל במערכת האמיתית של הארגון
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
סמינר זה מתרכז בכריית נתונים וניהול ביקורות משתמשים. במהלך העבודה נשתמש במודלים שונים כמו KMeans ו-LDA כדי לנתח נתונים ולאתר בעיות במוצרים. כמו כן, נבצע הערכות על איכות הנתונים ונציג תוצאות בצורה ויזואלית.