تحليل وتمثيل البيانات - CH02 - U01

Summary

This document provides an overview of data analysis tools and data representation using the pandas library, including a detailed description of the Series data structure. It's designed for undergraduate students at King Faisal University.

Full Transcript

‫تحليل وتمثيل البيانات‬ ‫الفصل الثان‬ ‫مراجعة مكتبة ‪pandas‬‬ ‫(الوحدة التعليمية األوىل)‬ ‫‪2‬‬ ‫موضوعات الوحدة التعليمية‬ ‫ نظرة عامة ‪.pandas‬‬ ‫ هياكل البيانات ف ‪.pandas‬‬ ‫ هياكل بيانات ‪.Series‬‬...

‫تحليل وتمثيل البيانات‬ ‫الفصل الثان‬ ‫مراجعة مكتبة ‪pandas‬‬ ‫(الوحدة التعليمية األوىل)‬ ‫‪2‬‬ ‫موضوعات الوحدة التعليمية‬ ‫ نظرة عامة ‪.pandas‬‬ ‫ هياكل البيانات ف ‪.pandas‬‬ ‫ هياكل بيانات ‪.Series‬‬ ‫‪3‬‬ ‫نواتج التعلم‬ ‫ً‬ ‫عزيزي الطالب بنهاية هذه الوحدة ستكون قادرا عىل أن‪:‬‬ ‫ر‬ ‫ُ‬ ‫ِ‬ ‫▪ تنش ‪ Series‬بأكث من طريقة‪.‬‬ ‫▪ تعرض قيم ‪ Series‬والتعامل معها‪.‬‬ ‫▪ تتعرف عىل العنارص الت لها قيم والت ليس لها قيم‪.‬‬ ‫أكث من ‪.Series‬‬‫▪ ُتجري العمليات بي ر‬ ‫‪4‬‬ ‫نظرة عامة عىل ‪pandas‬‬ ‫ً‬ ‫رسيعا‬ ‫تحتوي عىل هياكل البيانات وأدوات معالجة البيانات المصممة لجعل تنظيف البيانات وتحليلها‬ ‫◼‬ ‫ا‬ ‫وسهل ف البايثون‪.‬‬ ‫ويمكن استدعائها كما يىل‪:‬‬ ‫◼‬ ‫‪Scikit-‬‬ ‫‪NumPy‬‬ ‫‪learn‬‬ ‫كما ترتبط مع العديد من المكتبات األخرى ف البايثون‬ ‫◼‬ ‫‪Pandas‬‬ ‫‪Statsmodels‬‬ ‫‪SciPy‬‬ ‫‪Matplotlib‬‬ ‫‪5‬‬ ‫هياكل البيانات ف ‪pandas‬‬ ‫تحتوي ‪ pandas‬عىل اثني من هياكل البيانات وهما‪:‬‬ ‫‪ :Series‬هو كائن يشبه المصفوفة أحادية البعد يحتوي عىل سلسلة من القيم (من أنواع مشابهة ألنواع‬ ‫◼‬ ‫‪ )NumPy‬وفهرس مرتبط بها‪.‬‬ ‫ا‬ ‫‪ :DataFram‬يمثل جدول (أو مصفوفة ثنائية البعد) للبيانات ويحتوي عىل مجموعة مرتبة من األعمدة‪،‬‬ ‫◼‬ ‫يمكن أن يكون كل منها من نوع مختلف (رقم‪ ،‬أو سلسلة‪ ،‬أو منطق‪ ،‬وما إىل ذلك)‪.‬‬ ‫عىل سبيل المثال‪:‬‬ ‫ ‬ ‫‪DataFrame‬‬ ‫‪Series‬‬ ‫‪6‬‬ ‫هياكل بيانات ‪Series‬‬ ‫ِ‬ ‫إنشاء ال ‪ Series‬بفهرس تلقان‪:‬‬ ‫يمكن انشاء ‪ pandas' series‬من خالل‪:‬‬ ‫◼‬ ‫ِ‬ ‫تلقان ويكون ال ‪ series‬كالتاىل‪:‬‬ ‫وف هذه الحالة يتم انشاء الفهرس بشكل‬ ‫◼‬ ‫ملحوظة‪ :‬عند استخدام ‪ Ipython‬أو ‪ Jupyter notebook‬يكق كتابة االسم وضغط زر االدخال‬ ‫ ‬ ‫لعرض البيانات‪.‬‬ ‫‪7‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫عرض القيم والفهرس الخاص بال ‪:Series‬‬ ‫يمكن التعرف عىل القيم الخاصة بال ‪ Series‬كالتاىل‪:‬‬ ‫◼‬ ‫وكذلك يمكن الحصول عىل الفهرس الخاص بها كالتاىل‪:‬‬ ‫◼‬ ‫‪8‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫إنشاء ‪ Series‬بفهرس مخصص‪:‬‬ ‫ويمكن إنشاء ‪ Series‬بفهرس مخصص من خالل تحديد ‪ index‬أثناء بناء ال ‪ Series‬كالتاىل‪:‬‬ ‫◼‬ ‫ويكون شكل ال ‪ Series‬عند طباعتها‪.‬‬ ‫◼‬ ‫‪9‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫إنشاء ‪ Series‬باستخدام قاموس‪:‬‬ ‫كما يمكن أيضا انشاء ال ‪ Series‬عن طريق استخدام قاموس كالتاىل‪:‬‬ ‫◼‬ ‫وف هذه الحالة‪ ،‬يتم استخدام المفاتيح الخاصة بالقاموس كفهرس ل ‪.Series‬‬ ‫◼‬ ‫‪10‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫التعامل مع عنارص ال ‪:Series‬‬ ‫وللحصول عىل عنرص (عنارص) داخل ال ‪ ،Series‬نقوم باستخدام الفهرس (الفهارس) الخاصة بها كالتاىل‪:‬‬ ‫◼‬ ‫‪11‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫إجراء العمليات عىل عنارص ال ‪:Series‬‬ ‫ويمكننا إجراء العمليات عىل ال ‪ Series‬بنفس الطريقة الخاصة بال ‪ NumPy‬وتطبق عىل القيم الخاصة بال‬ ‫◼‬ ‫‪ Series‬كالتاىل‪:‬‬ ‫اسثجاع العنارص‬ ‫أكث من ‪0‬‬ ‫ذات القيم ر‬ ‫رصب جميع القيم * ‪2‬‬ ‫‪12‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫التعرف عىل العنارص الت ليس لها بيانات (‪:)null‬‬ ‫يمكن التعرف عىل العنارص الت ليس لها بيانات (‪ )null‬كما يىل ‪:‬‬ ‫◼‬ ‫التعرف عىل العنارص الت لها قيم‬ ‫التعرف عىل العنارص )‪(null‬‬ ‫‪Series‬‬ ‫تشث ‪ True‬اىل أن هذا العنرص يحقق الشط‪.‬‬ ‫ ‬ ‫‪13‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫إجراء العمليات بي ر‬ ‫أكث من ‪:Series‬‬ ‫ِ‬ ‫تلقان‪.‬ولذلك أي فهرس غث‬ ‫أكث من ‪ Series‬تقوم بعمل توافق بي الفهارس بشكل‬ ‫عند إجراء العمليات عىل ر‬ ‫◼‬ ‫موجود ف إحدى ال ‪ Series‬تكون قيمة العملية عليه ‪.NaN‬كما بالمثال التاىل‪:‬‬ ‫‪14‬‬ ‫تقييم ذان‬ ‫‪ -1‬عند طباعة ‪ Series‬فانه يتم إظهار‪:‬‬ ‫ب‪ -‬القيم والفهارس‪.‬‬ ‫أ‪ -‬القيم فقط‪.‬‬ ‫د‪ -‬ال شء‪.‬‬ ‫ج‪ -‬الفهارس فقط‪.‬‬ ‫‪ -2‬إذا قمت بتعريف ‪ Series‬كالتاىل‪:‬‬ ‫)]‪S = pd.Series([1, 2, 3, 4‬‬ ‫يكون ناتج ]‪ S[1‬هو‪:‬‬ ‫ب‪2 -‬‬ ‫أ‪1 -‬‬ ‫د‪4 -‬‬ ‫ج‪0 -‬‬ ‫‪15‬‬ ‫تابع‪ :‬تقييم ذان‬ ‫‪ -3‬تستخدم دالة ‪ notnull‬ل‪:‬‬ ‫أ‪ -‬التعرف عىل العنارص الت لها قيمة‪.‬‬ ‫ب‪ -‬التعرف عىل العنارص الت ليس لها قيمة‪.‬‬ ‫ج‪ -‬حذف قيم العنارص‪.‬‬ ‫د‪ -‬حذف الفهارس الخاصة بالعنارص‪.‬‬ ‫‪16‬‬

Use Quizgecko on...
Browser
Browser