Session 3: Big Data - Past Paper (Arabic)

Summary

This document is a past paper on Big Data, specifically tailored for third-year computer science students. It covers concepts such as data analytics lifecycle, key roles in a successful analytic project, and methods of defining an analytic problem.

Full Transcript

‫علوم الحاسب‬ ‫الفرقة الثالثة‬ ‫البيانات الضخمة‬ ‫‪Big Data‬‬ Q1. What is Data Analytics Lifecycle? Analytics Lifecycle is a structured process that guides data analysts, scientists, and decision-makers through a series of steps to analyze and interpret data, from the initial...

‫علوم الحاسب‬ ‫الفرقة الثالثة‬ ‫البيانات الضخمة‬ ‫‪Big Data‬‬ Q1. What is Data Analytics Lifecycle? Analytics Lifecycle is a structured process that guides data analysts, scientists, and decision-makers through a series of steps to analyze and interpret data, from the initial problem framing to delivering actionable insights. ‫عب سلسلة من الخطوات‬ ‫محلل البيانات والعلماء وصناع القرار ر‬ ‫ي‬ ‫ه عملية منظمة ترشد‬ ‫ي‬.‫وحت تقديم رؤى قابلة للتنفيذ‬ ً ،‫وتفسبها‬ ‫بدءا من صياغة المشكلة األولية ى‬ ‫ر‬ ‫لتحليل البيانات‬ Q2. What are the Key Roles for a Successful Analytic Project? Role Description Someone who benefits from the end results and can consult and advise project team. Business User ‫ى‬ ‫ األعمال هو الشخص الذي يستفيد من النتائج النهائية ويمكنه‬:‫النهائ‬ ‫المستخدم‬ ‫التشاور وتقديم المشورة لفريق ر‬.‫المشوع‬ The person responsible for the genesis of the project provides the funding and will gauge the degree of value Project from the final outputs of the working team. Sponsor ‫ الشخص المسؤول عن نشأة ر‬:‫المشوع‬ ‫ وسيقوم بعمل‬،‫ يوفر التمويل‬،‫المشوع‬ ‫ممول ر‬.‫قياس للمخرجات النهائية لفريق العمل‬ Ensure key objectives are met on time and of the Project expected quality. Manager ‫مدير ر‬ ‫ التأكد من تحقيق األهداف الرئيسية يف الوقت المحدد وبالجودة‬:‫المشوع‬.‫المتوقعة‬ Business domain expertise with deep understanding of Business the data, KPIs (Key Performance Indicators) and key Intelligence metrics. Analyst ‫ر‬ ‫ومؤشات األداء‬ ‫خبة يف مجال األعمال مع فهم عميق للبيانات‬‫ ر‬:‫محلل االعمال‬.‫الرئيسية والمقاييس الرئيسية‬ 1 DataBase Deep technical skills to assist with tuning SQL queries for data management, extraction and support data Data Engineer ingest to analytic sandbox. ‫ إلدارة‬SQL ‫ مهارات تقنية عميقة للمساعدة يف ضبط استعالمات‬:‫مهندس البيانات‬.‫البيانات واستخراجها ودعم استيعاب البيانات يف بيئة تحليلية‬ Provisions and configures database environment to Database support the analytical needs of the working team. Administrator (DBA) ‫ يقوم بإعداد وتكوين بيئة قاعدة البيانات لدعم االحتياجات‬:‫مسئول قاعدة البيانات‬ ‫التحليلية لفريق العمل‬ Provide subject matter expertise for analytical techniques, data modeling, applying valid analytical techniques to given business problems and ensuring Data Scientist overall analytical objectives are met. ‫الخبة يف مجال التقنيات التحليلية ونمذجة البيانات وتطبيق‬ ‫ ر‬:‫عالم بيانات‬ ‫توفب ر‬ ‫التقنيات التحليلية الصالحة عل مشاكل األعمال المعينة وضمان تحقيق األهداف‬ ‫التحليلية الشاملة‬ Q3. What are the main stages of the Data Analytics Lifecycle? 2 DataBase Q4. What is the main purpose of discovery phase? Determine amount of domain knowledge. Determine the general analytic problem. Have there been previous attempts to solve this problem. If so, why did they fail? Why are we trying again? At this phase we must define:  Available technology.  Available data.  People for the working team.  Assess scope of time for the project in calendar. Q5. What do we mean by framing the analytics problem? Framing is the process of stating the analytics problem to be solved. Identify key stakeholders. ‫تحديد اصحاب المصلحة الرئيسي‬ What is the goal? ‫تحديد االهداف‬ What are the criteria for success?‫ما ىه معايي النجاح‬ What is the failure criterion?‫ماىه معايي الفشل‬ We can use RACI (Responsible Accountable Consulted Informed) The RACI matrix is a tool used to clarify roles and responsibilities within a project. ‫المشوع‬ ‫أداة تستخدم لتوضيح األدوار ضمن ر‬ Even if you are “given” an analytic problem you should work with clients to clarify and frame the problem [True]. 3 DataBase Q6. What are the Sponsor Interview Tips? 1) Prepare for the interview – draft your questions. ‫ صياغة األسئلة‬- ‫االستعداد للمقابلة‬ 2) Use open-ended questions, don’t ask leading questions. ‫ ال تطرح أسئلة موجهة‬،‫استخدام األسئلة المفتوحة‬ 3) Don’t fill every silence – give them time to think ‫ال تمأل كل صمت – امنحهم الوقت للتفكي‬ 4) Let them express their ideas, don’t put words in their mouth ‫ ال تضع الكلمات يف أفواههم‬،‫يعيون عن أفكارهم‬ ‫دعهم ر‬ 5) Ask clarifying questions, ask why – is that correct? Am I on target? Is there anything else? ‫شء آخر؟‬‫ر‬ ‫ واسأل لماذا – هل هذا صحيح؟ هل أنا عىل صواب؟ هل هناك أي ي‬،‫اطرح أسئلة توضيحية‬ 6) Repeat it back to make sure you hear it correctly. ‫كرر مره أخرى للتأكد من أنك سمعته بشكل صحيح‬ 7) Don’t express your opinions. ‫تعي عن آرائك‬ ‫ال ر‬ 8) Be mindful of your body language and theirs – use eye contact. ً ‫منتبها للغة جسدك ولغة جسدهم – استخدم التواصل البرصي‬ ‫كن‬ 9) Minimize distractions. ‫قلل من عوامل التشتيت‬ 10) Document what you heard and review it back with the sponsor. ِّ ‫اع‬ ‫وثق ما سمعته وراجعه مرة أخرى مع الر ي‬ 4 DataBase Interview Questions: 1) What is the business problem you’re trying to solve? ‫الت تحاول حلها؟‬ ‫ىه مشكلة العمل ي‬ ‫ما ي‬ 2) What is your desired outcome? ‫ىه النتيجة المرجوة؟‬ ‫ما ي‬ 3) Will the focus of the problem change if the following dimensions change: ‫هل سيتغي تركي المشكلة إذا تغيت األبعاد التالية‬: a. Time b. People c. Risk d. Resources e. Size and attributes of Data 4) What data sources? ‫ما مصادر البيانات ؟‬ 5) What industry issues may impact on the analysis? ‫الت قد تؤثر عىل التحليل؟‬ ‫ىه مشكالت الصناعة ي‬ ‫ما ي‬ 6) What timelines are you up against? ‫الت تواجهها؟‬ ‫ىه الجداول الزمنية ي‬ ‫ما ي‬ 7) Who could provide insight into the project? Consulted? ‫من يمكنه تقديم نظرة ثاقبة ر‬ ‫للمشوع؟ هل تمت استشارته؟‬ 8) Who has final say on the project? ‫من له الكلمة األخية ف ر‬ ‫المشوع؟‬ ‫ي‬ 5 DataBase

Use Quizgecko on...
Browser
Browser