معالجة البيانات الأولية
25 Questions
6 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

ما هو مثال على البيانات المفقودة بشكل متعمد؟

  • تاريخ الميلاد غير موجود لدى الأشخاص المعنيين
  • تكرار تواريخ الميلاد بشكل عشوائي
  • تاريخ الميلاد 01/01 لكل الأشخاص (correct)
  • تاريخ الميلاد 03/07/2010 للجميع
  • ما هو التناقض الذي قد يظهر من خلال السجلات المكررة؟

  • تنسيق تواريخ الميلاد بشكل غير صحيح
  • عدم وجود تواريخ ميلاد
  • تاريخ الميلاد وتقييم الشخص نفسه
  • تناقض في تكرار الأعمار (correct)
  • ما العنصر الذي لا يعتبر جزءاً من التقييم المذكور؟

  • تاريخ الميلاد
  • التقييم 1, 2, 3
  • تاريخ التأسيس (correct)
  • العمر
  • ما الذي يمثل البيانات المفقودة بشكل غير متعمد؟

    <p>عدم إدخال تاريخ الميلاد لأحد الأفراد</p> Signup and view all the answers

    ما هو الهدف من إنشاء سجلات مكررة؟

    <p>تضليل البيانات المتاحة</p> Signup and view all the answers

    ما هو المعنى الذي يمكن استخدامه لتعريف ثابت عالمي؟

    <p>غير معروف</p> Signup and view all the answers

    أي من هذه الخيارات يمثل نهجًا أذكى في معالجة عينة البيانات؟

    <p>استخدام متوسط السمة لجميع العينات المنتمية لنفس الفئة</p> Signup and view all the answers

    ما هي الطريقة لتحديد عناصر البيانات الغير مصنفة؟

    <p>إضافة فئة جديدة</p> Signup and view all the answers

    ما هو الاستخدام المناسب لمعدل السمة عند التعامل مع عينات بيانات متعددة؟

    <p>استخدام متوسط السمة لجميع العينات المنتمية لنفس الفئة</p> Signup and view all the answers

    ماذا يعني استخدام 'متوسط السمة' في تحليل البيانات؟

    <p>تطبيق متوسط السمة للعينات المنتمية لنفس الفئة</p> Signup and view all the answers

    ما هي القاعدة التي تتعلق بتجنب التكرار في البيانات؟

    <p>قاعدة التفرد</p> Signup and view all the answers

    أي من الخيارات التالية غير متعلق بأدوات تنظيف البيانات؟

    <p>إنشاء قواعد بيانات جديدة</p> Signup and view all the answers

    ما هي الطريقة التي يمكنك من خلالها تحسين جودة البيانات؟

    <p>تنظيف البيانات باستخدام المعرفة البسيطة عن المجال</p> Signup and view all the answers

    ما الذي يساعد في اكتشاف الأخطاء وتصحيحها أثناء تنظيف البيانات؟

    <p>التحقق من الأكواد البريدية</p> Signup and view all the answers

    أي من الخيارات التالية يمكن أن يكون جزءاً من عملية تنظيف البيانات؟

    <p>استخدام أدوات تجارية</p> Signup and view all the answers

    ما هو المعنى الأساسي لمفهوم معالجة البيانات؟

    <p>الخطوات اللازمة لجعل البيانات أكثر ملاءمة للتحليل</p> Signup and view all the answers

    أي من العوامل التالية يعتبر مفتاحاً لتحديد موثوقية البيانات؟

    <p>مدى موثوقية البيانات</p> Signup and view all the answers

    ما الذي تشير إليه مصطلحات سهولة التفسير في سياق البيانات؟

    <p>مدى سهولة تفسير البيانات</p> Signup and view all the answers

    كيف تؤثر معالجة البيانات على تحليل البيانات الاستكشافي؟

    <p>تحسن جودة البيانات وتزيد من موثوقيتها</p> Signup and view all the answers

    أي من العوامل التالية ليست جزءًا من مفهوم معالجة البيانات؟

    <p>تجميع البيانات من مصادر غير موثوقة</p> Signup and view all the answers

    ما الذي يعنيه مصطلح 'غير مكتمل' في سياق البيانات؟

    <p>نقص في قيم السمات أو فقدان سمات مهمة</p> Signup and view all the answers

    أي من الخيارات التالية يعتبر مثالاً على بيانات غير مكتملة؟

    <p>الوظيفة = ''</p> Signup and view all the answers

    ما الذي يمكن أن يؤدي إليه وجود بيانات مجمعة فقط في السجلات؟

    <p>عدم القدرة على تحليل الحالات الفردية بدقة</p> Signup and view all the answers

    ما الذي يدل عليه وجود قيمة فارغة مثل 'وظيفة = ''' في مجموعة بيانات؟

    <p>وجود نقص في البيانات المتعلقة بالوظيفة</p> Signup and view all the answers

    لماذا تعتبر البيانات التي تحتوي فقط على معلومات مجمعة غير مثالية؟

    <p>لأنها تعيق الفهم الشامل للظواهر المعقدة</p> Signup and view all the answers

    Study Notes

    ما هي معالجة البيانات الأولية؟

    • خطوات تجعل البيانات أكثر ملاءمة لتحليل البيانات الاستكشافي وتعلم الآلة.
    • تتضمن معالجة البيانات الأولية 5 مراحل:
      • النظافة: إزالة الأخطاء والضوضاء والمعلومات غير المتسقة
      • التحويل: تحويل البيانات إلى تنسيق مناسب للتحليل
      • التقليل: تقليل حجم البيانات
      • التكامل: دمج بيانات متعددة
      • الاختيار: اختيار الميزات ذات الصلة

    البيانات غير المكتملة

    • بيانات تفتقر إلى قيم السمات أو بعض السمات المهمة أو تحتوي فقط على بيانات مجمعة.
    • مثال: الوظيفة = "" (بيانات مفقودة).

    البيانات غير المتسقة

    • توجد أخطاء في البيانات، مثل البيانات المكررة أو القيم غير المتسقة.
    • مثال: العمر = "42"، تاريخ الميلاد = 03/07/2010 (تناقض بين السجلات المكررة).

    البيانات غير مناسبة

    • 데이터의 형식이 분석에 적합하지 않은 경우.
    • 데이터를 적합한 분석 단위로 변환해야 합니다.
    • 예: "A, B, C"로 평가되었던 데이터가 "1, 2, 3"으로 변경된 경우.

    البيانات ذات القصد

    • مثال: يتم إخفاء البيانات المفقودة عن عمد
    • مثال: يتم تعيين 1 يناير كتاريخ ميلاد لجميع الأشخاص

    حل مشكلة البيانات غير المكتملة

    • إضافة قيمة افتراضية
      • استخدام ثابت عالمي
      • مثال: "غير معروف"، أو إضافة فئة جديدة
      • استخدام متوسط السمة
      • مثال: "ترجمة: استخدام متوسط السمة
      • استخدام متوسط السمة لجميع العينات التي تنتمي إلى نفس الفئة (نهج أكثر ذكاء)
    • تفاعلات البيانات
    • تتبع قاعدة التفرد، قاعدة التتابع، وقاعدة القيم الفارغة.
    • باستخدام أدوات تجارية

    تنظيف البيانات

    • إزالة البيانات غير الدقيقة أو المتكررة أو الخاطئة من البيانات.
    • يستخدم معرفة المجال البسيطة لمساعدة في الكشف عن الأخطاء وإجراء التصحيحات

    بيانات محددة

    • إزالة البيانات غير ذات الصلة بالتحليل.
    • مثال: إزالة العمود "العنوان" عند تحليل بيانات العملاء.

    تحويل البيانات

    • تحويل البيانات إلى تنسيق مناسب للتحليل
    • مثال: تحويل البيانات النصية إلى بيانات عددية.

    جمع البيانات

    • جمع بيانات متعددة من مصادر مختلفة
    • مثال: جمع بيانات المبيعات بيانات العملاء.

    اختيار البيانات

    • اختيار الخصائص المناسبة
    • مثال: اختيار "العمر" و "الدخل" عند تحليل العملاء.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Data Cleaning (DS) - PDF

    Description

    يتناول هذا الاختبار خطوات معالجة البيانات الأولية التي تجعل البيانات أكثر ملاءمة للتحليل، بما في ذلك النظافة والتحويل والتقليل والتكامل والاختيار. كما يركز على أنواع البيانات مثل البيانات غير المكتملة وغير المتسقة، وأهمية إعداد البيانات بشكل صحيح قبل التحليل.

    More Like This

    Use Quizgecko on...
    Browser
    Browser