معالجة البيانات الأولية

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

ما هو مثال على البيانات المفقودة بشكل متعمد؟

  • تاريخ الميلاد غير موجود لدى الأشخاص المعنيين
  • تكرار تواريخ الميلاد بشكل عشوائي
  • تاريخ الميلاد 01/01 لكل الأشخاص (correct)
  • تاريخ الميلاد 03/07/2010 للجميع

ما هو التناقض الذي قد يظهر من خلال السجلات المكررة؟

  • تنسيق تواريخ الميلاد بشكل غير صحيح
  • عدم وجود تواريخ ميلاد
  • تاريخ الميلاد وتقييم الشخص نفسه
  • تناقض في تكرار الأعمار (correct)

ما العنصر الذي لا يعتبر جزءاً من التقييم المذكور؟

  • تاريخ الميلاد
  • التقييم 1, 2, 3
  • تاريخ التأسيس (correct)
  • العمر

ما الذي يمثل البيانات المفقودة بشكل غير متعمد؟

<p>عدم إدخال تاريخ الميلاد لأحد الأفراد (C)</p> Signup and view all the answers

ما هو الهدف من إنشاء سجلات مكررة؟

<p>تضليل البيانات المتاحة (B)</p> Signup and view all the answers

ما هو المعنى الذي يمكن استخدامه لتعريف ثابت عالمي؟

<p>غير معروف (D)</p> Signup and view all the answers

أي من هذه الخيارات يمثل نهجًا أذكى في معالجة عينة البيانات؟

<p>استخدام متوسط السمة لجميع العينات المنتمية لنفس الفئة (B)</p> Signup and view all the answers

ما هي الطريقة لتحديد عناصر البيانات الغير مصنفة؟

<p>إضافة فئة جديدة (C)</p> Signup and view all the answers

ما هو الاستخدام المناسب لمعدل السمة عند التعامل مع عينات بيانات متعددة؟

<p>استخدام متوسط السمة لجميع العينات المنتمية لنفس الفئة (D)</p> Signup and view all the answers

ماذا يعني استخدام 'متوسط السمة' في تحليل البيانات؟

<p>تطبيق متوسط السمة للعينات المنتمية لنفس الفئة (A)</p> Signup and view all the answers

ما هي القاعدة التي تتعلق بتجنب التكرار في البيانات؟

<p>قاعدة التفرد (A)</p> Signup and view all the answers

أي من الخيارات التالية غير متعلق بأدوات تنظيف البيانات؟

<p>إنشاء قواعد بيانات جديدة (A)</p> Signup and view all the answers

ما هي الطريقة التي يمكنك من خلالها تحسين جودة البيانات؟

<p>تنظيف البيانات باستخدام المعرفة البسيطة عن المجال (A)</p> Signup and view all the answers

ما الذي يساعد في اكتشاف الأخطاء وتصحيحها أثناء تنظيف البيانات؟

<p>التحقق من الأكواد البريدية (D)</p> Signup and view all the answers

أي من الخيارات التالية يمكن أن يكون جزءاً من عملية تنظيف البيانات؟

<p>استخدام أدوات تجارية (A)</p> Signup and view all the answers

ما هو المعنى الأساسي لمفهوم معالجة البيانات؟

<p>الخطوات اللازمة لجعل البيانات أكثر ملاءمة للتحليل (B)</p> Signup and view all the answers

أي من العوامل التالية يعتبر مفتاحاً لتحديد موثوقية البيانات؟

<p>مدى موثوقية البيانات (A)</p> Signup and view all the answers

ما الذي تشير إليه مصطلحات سهولة التفسير في سياق البيانات؟

<p>مدى سهولة تفسير البيانات (D)</p> Signup and view all the answers

كيف تؤثر معالجة البيانات على تحليل البيانات الاستكشافي؟

<p>تحسن جودة البيانات وتزيد من موثوقيتها (A)</p> Signup and view all the answers

أي من العوامل التالية ليست جزءًا من مفهوم معالجة البيانات؟

<p>تجميع البيانات من مصادر غير موثوقة (D)</p> Signup and view all the answers

ما الذي يعنيه مصطلح 'غير مكتمل' في سياق البيانات؟

<p>نقص في قيم السمات أو فقدان سمات مهمة (D)</p> Signup and view all the answers

أي من الخيارات التالية يعتبر مثالاً على بيانات غير مكتملة؟

<p>الوظيفة = '' (B)</p> Signup and view all the answers

ما الذي يمكن أن يؤدي إليه وجود بيانات مجمعة فقط في السجلات؟

<p>عدم القدرة على تحليل الحالات الفردية بدقة (B)</p> Signup and view all the answers

ما الذي يدل عليه وجود قيمة فارغة مثل 'وظيفة = ''' في مجموعة بيانات؟

<p>وجود نقص في البيانات المتعلقة بالوظيفة (D)</p> Signup and view all the answers

لماذا تعتبر البيانات التي تحتوي فقط على معلومات مجمعة غير مثالية؟

<p>لأنها تعيق الفهم الشامل للظواهر المعقدة (C)</p> Signup and view all the answers

Flashcards are hidden until you start studying

Study Notes

ما هي معالجة البيانات الأولية؟

  • خطوات تجعل البيانات أكثر ملاءمة لتحليل البيانات الاستكشافي وتعلم الآلة.
  • تتضمن معالجة البيانات الأولية 5 مراحل:
    • النظافة: إزالة الأخطاء والضوضاء والمعلومات غير المتسقة
    • التحويل: تحويل البيانات إلى تنسيق مناسب للتحليل
    • التقليل: تقليل حجم البيانات
    • التكامل: دمج بيانات متعددة
    • الاختيار: اختيار الميزات ذات الصلة

البيانات غير المكتملة

  • بيانات تفتقر إلى قيم السمات أو بعض السمات المهمة أو تحتوي فقط على بيانات مجمعة.
  • مثال: الوظيفة = "" (بيانات مفقودة).

البيانات غير المتسقة

  • توجد أخطاء في البيانات، مثل البيانات المكررة أو القيم غير المتسقة.
  • مثال: العمر = "42"، تاريخ الميلاد = 03/07/2010 (تناقض بين السجلات المكررة).

البيانات غير مناسبة

  • 데이터의 형식이 분석에 적합하지 않은 경우.
  • 데이터를 적합한 분석 단위로 변환해야 합니다.
  • 예: "A, B, C"로 평가되었던 데이터가 "1, 2, 3"으로 변경된 경우.

البيانات ذات القصد

  • مثال: يتم إخفاء البيانات المفقودة عن عمد
  • مثال: يتم تعيين 1 يناير كتاريخ ميلاد لجميع الأشخاص

حل مشكلة البيانات غير المكتملة

  • إضافة قيمة افتراضية
    • استخدام ثابت عالمي
    • مثال: "غير معروف"، أو إضافة فئة جديدة
    • استخدام متوسط السمة
    • مثال: "ترجمة: استخدام متوسط السمة
    • استخدام متوسط السمة لجميع العينات التي تنتمي إلى نفس الفئة (نهج أكثر ذكاء)
  • تفاعلات البيانات
  • تتبع قاعدة التفرد، قاعدة التتابع، وقاعدة القيم الفارغة.
  • باستخدام أدوات تجارية

تنظيف البيانات

  • إزالة البيانات غير الدقيقة أو المتكررة أو الخاطئة من البيانات.
  • يستخدم معرفة المجال البسيطة لمساعدة في الكشف عن الأخطاء وإجراء التصحيحات

بيانات محددة

  • إزالة البيانات غير ذات الصلة بالتحليل.
  • مثال: إزالة العمود "العنوان" عند تحليل بيانات العملاء.

تحويل البيانات

  • تحويل البيانات إلى تنسيق مناسب للتحليل
  • مثال: تحويل البيانات النصية إلى بيانات عددية.

جمع البيانات

  • جمع بيانات متعددة من مصادر مختلفة
  • مثال: جمع بيانات المبيعات بيانات العملاء.

اختيار البيانات

  • اختيار الخصائص المناسبة
  • مثال: اختيار "العمر" و "الدخل" عند تحليل العملاء.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Data Cleaning (DS) - PDF

More Like This

Use Quizgecko on...
Browser
Browser