تحليل وتمثيل البيانات - CH02 - U01(1) PDF

Summary

This document is a study guide on data analysis and representation, specifically focusing on the Pandas library in Python. It covers topics such as creating and manipulating Series and DataFrames, basic operations, and the use of Jupyter Notebooks.

Full Transcript

‫تحليل وتمثيل البيانات‬ ‫الفصل الثان‬ ‫مراجعة مكتبة ‪pandas‬‬ ‫(الوحدة التعليمية األوىل)‬ ‫‪2‬‬ ‫موضوعات الوحدة التعليمية‬ ‫ نظرة عامة ‪.pandas‬‬ ‫ هياكل البيانات ف ‪.pandas‬‬ ‫ هياكل بيانات ‪.Series‬‬...

‫تحليل وتمثيل البيانات‬ ‫الفصل الثان‬ ‫مراجعة مكتبة ‪pandas‬‬ ‫(الوحدة التعليمية األوىل)‬ ‫‪2‬‬ ‫موضوعات الوحدة التعليمية‬ ‫ نظرة عامة ‪.pandas‬‬ ‫ هياكل البيانات ف ‪.pandas‬‬ ‫ هياكل بيانات ‪.Series‬‬ ‫‪3‬‬ ‫نواتج التعلم‬ ‫ً‬ ‫عزيزي الطالب بنهاية هذه الوحدة ستكون قادرا عىل أن‪:‬‬ ‫ر‬ ‫ُ‬ ‫ِ‬ ‫▪ تنش ‪ Series‬بأكث من طريقة‪.‬‬ ‫▪ تعرض قيم ‪ Series‬والتعامل معها‪.‬‬ ‫▪ تتعرف عىل العنارص الت لها قيم والت ليس لها قيم‪.‬‬ ‫أكث من ‪.Series‬‬‫▪ ُتجري العمليات بي ر‬ ‫‪4‬‬ ‫نظرة عامة عىل ‪pandas‬‬ ‫ً‬ ‫رسيعا‬ ‫تحتوي عىل هياكل البيانات وأدوات معالجة البيانات المصممة لجعل تنظيف البيانات وتحليلها‬ ‫◼‬ ‫ا‬ ‫وسهل ف البايثون‪.‬‬ ‫ويمكن استدعائها كما يىل‪:‬‬ ‫◼‬ ‫‪Scikit-‬‬ ‫‪NumPy‬‬ ‫‪learn‬‬ ‫كما ترتبط مع العديد من المكتبات األخرى ف البايثون‬ ‫◼‬ ‫‪Pandas‬‬ ‫‪Statsmodels‬‬ ‫‪SciPy‬‬ ‫‪Matplotlib‬‬ ‫‪5‬‬ ‫هياكل البيانات ف ‪pandas‬‬ ‫تحتوي ‪ pandas‬عىل اثني من هياكل البيانات وهما‪:‬‬ ‫‪ :Series‬هو كائن يشبه المصفوفة أحادية البعد يحتوي عىل سلسلة من القيم (من أنواع مشابهة ألنواع‬ ‫◼‬ ‫‪ )NumPy‬وفهرس مرتبط بها‪.‬‬ ‫ا‬ ‫‪ :DataFram‬يمثل جدول (أو مصفوفة ثنائية البعد) للبيانات ويحتوي عىل مجموعة مرتبة من األعمدة‪،‬‬ ‫◼‬ ‫يمكن أن يكون كل منها من نوع مختلف (رقم‪ ،‬أو سلسلة‪ ،‬أو منطق‪ ،‬وما إىل ذلك)‪.‬‬ ‫عىل سبيل المثال‪:‬‬ ‫ ‬ ‫‪DataFrame‬‬ ‫‪Series‬‬ ‫‪6‬‬ ‫هياكل بيانات ‪Series‬‬ ‫ِ‬ ‫إنشاء ال ‪ Series‬بفهرس تلقان‪:‬‬ ‫يمكن انشاء ‪ pandas' series‬من خالل‪:‬‬ ‫◼‬ ‫ِ‬ ‫تلقان ويكون ال ‪ series‬كالتاىل‪:‬‬ ‫وف هذه الحالة يتم انشاء الفهرس بشكل‬ ‫◼‬ ‫ملحوظة‪ :‬عند استخدام ‪ Ipython‬أو ‪ Jupyter notebook‬يكق كتابة االسم وضغط زر االدخال‬ ‫ ‬ ‫لعرض البيانات‪.‬‬ ‫‪7‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫عرض القيم والفهرس الخاص بال ‪:Series‬‬ ‫يمكن التعرف عىل القيم الخاصة بال ‪ Series‬كالتاىل‪:‬‬ ‫◼‬ ‫وكذلك يمكن الحصول عىل الفهرس الخاص بها كالتاىل‪:‬‬ ‫◼‬ ‫‪8‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫إنشاء ‪ Series‬بفهرس مخصص‪:‬‬ ‫ويمكن إنشاء ‪ Series‬بفهرس مخصص من خالل تحديد ‪ index‬أثناء بناء ال ‪ Series‬كالتاىل‪:‬‬ ‫◼‬ ‫ويكون شكل ال ‪ Series‬عند طباعتها‪.‬‬ ‫◼‬ ‫‪9‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫إنشاء ‪ Series‬باستخدام قاموس‪:‬‬ ‫كما يمكن أيضا انشاء ال ‪ Series‬عن طريق استخدام قاموس كالتاىل‪:‬‬ ‫◼‬ ‫وف هذه الحالة‪ ،‬يتم استخدام المفاتيح الخاصة بالقاموس كفهرس ل ‪.Series‬‬ ‫◼‬ ‫‪10‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫التعامل مع عنارص ال ‪:Series‬‬ ‫وللحصول عىل عنرص (عنارص) داخل ال ‪ ،Series‬نقوم باستخدام الفهرس (الفهارس) الخاصة بها كالتاىل‪:‬‬ ‫◼‬ ‫‪11‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫إجراء العمليات عىل عنارص ال ‪:Series‬‬ ‫ويمكننا إجراء العمليات عىل ال ‪ Series‬بنفس الطريقة الخاصة بال ‪ NumPy‬وتطبق عىل القيم الخاصة بال‬ ‫◼‬ ‫‪ Series‬كالتاىل‪:‬‬ ‫اسثجاع العنارص‬ ‫أكث من ‪0‬‬ ‫ذات القيم ر‬ ‫رصب جميع القيم * ‪2‬‬ ‫‪12‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫التعرف عىل العنارص الت ليس لها بيانات (‪:)null‬‬ ‫يمكن التعرف عىل العنارص الت ليس لها بيانات (‪ )null‬كما يىل ‪:‬‬ ‫◼‬ ‫التعرف عىل العنارص الت لها قيم‬ ‫التعرف عىل العنارص )‪(null‬‬ ‫‪Series‬‬ ‫تشث ‪ True‬اىل أن هذا العنرص يحقق الشط‪.‬‬ ‫ ‬ ‫‪13‬‬ ‫تابع‪ :‬هياكل بيانات ‪Series‬‬ ‫إجراء العمليات بي ر‬ ‫أكث من ‪:Series‬‬ ‫ِ‬ ‫تلقان‪.‬ولذلك أي فهرس غث‬ ‫أكث من ‪ Series‬تقوم بعمل توافق بي الفهارس بشكل‬ ‫عند إجراء العمليات عىل ر‬ ‫◼‬ ‫موجود ف إحدى ال ‪ Series‬تكون قيمة العملية عليه ‪.NaN‬كما بالمثال التاىل‪:‬‬ ‫‪14‬‬ ‫تقييم ذان‬ ‫‪ -1‬عند طباعة ‪ Series‬فانه يتم إظهار‪:‬‬ ‫ب‪ -‬القيم والفهارس‪.‬‬ ‫أ‪ -‬القيم فقط‪.‬‬ ‫د‪ -‬ال شء‪.‬‬ ‫ج‪ -‬الفهارس فقط‪.‬‬ ‫‪ -2‬إذا قمت بتعريف ‪ Series‬كالتاىل‪:‬‬ ‫)]‪S = pd.Series([1, 2, 3, 4‬‬ ‫يكون ناتج ]‪ S[1‬هو‪:‬‬ ‫ب‪2 -‬‬ ‫أ‪1 -‬‬ ‫د‪4 -‬‬ ‫ج‪0 -‬‬ ‫‪15‬‬ ‫تابع‪ :‬تقييم ذان‬ ‫‪ -3‬تستخدم دالة ‪ notnull‬ل‪:‬‬ ‫أ‪ -‬التعرف عىل العنارص الت لها قيمة‪.‬‬ ‫ب‪ -‬التعرف عىل العنارص الت ليس لها قيمة‪.‬‬ ‫ج‪ -‬حذف قيم العنارص‪.‬‬ ‫د‪ -‬حذف الفهارس الخاصة بالعنارص‪.‬‬ ‫‪16‬‬

Use Quizgecko on...
Browser
Browser