Big Data Sesión 1 UNI-MIA PDF
Document Details
Uploaded by Deleted User
Universidad Nacional de Ingeniería
2024
Deyvis Laura
Tags
Summary
Presentación de la sesión 1 de Big Data para la maestría en Inteligencia Artificial en la Universidad Nacional de Ingeniería, Perú, 2024. El profesor es Deyvis Laura. La sesión cubre temas de introducción a Big Data, sus aplicaciones, tipos de datos, y ejemplos de IA. También incluye las consideraciones para la clase como herramientas necesarias, puntualidad y ambiente adecuado para el aprendizaje.
Full Transcript
Maestría en Inteligencia Artificial Curso: Big Data Docente: Deyvis Laura Sesión N1: Big Data 2024 Let’s break the Ice ¿Lo que quieren ser según donde viven? ¡Hola! Soy Deyvis Estudios Trayectoria...
Maestría en Inteligencia Artificial Curso: Big Data Docente: Deyvis Laura Sesión N1: Big Data 2024 Let’s break the Ice ¿Lo que quieren ser según donde viven? ¡Hola! Soy Deyvis Estudios Trayectoria Actualidad Ingeniero de sistemas Founder y Universidad Gerente de Data & AI Nacional de Ingenieria MBA con Foco en Business Analytics Visítanos en: www.nextlevelplay.pe Universidad Del Pacifico Asociado en … Data Monetization Strategy M.I.T Conociéndonos Nos presentamos 1. Nombre, País – Ciudad 2. ¿Dónde trabajo actualmente o en qué me desempeño profesionalmente? 3. ¿Qué conozco sobre este curso? 4. Expectativa del curso 5. Anécdota con datos Max (2 min) por participante Trivia … "Para 2025, se estima que el 75% de las empresas incorporarán la inteligencia artificial en sus operaciones, impulsando la innovación y eficiencia operativa en todas las industrias.“ (Fuente: Gartner) Trivia … "Para 2025, se estima que el 75% de las empresas incorporarán la inteligencia artificial en sus operaciones, impulsando la innovación y eficiencia operativa en todas las industrias.“ (Fuente: Gartner) Trivia ¿Cuál vale más? "El valor total del mercado de los Datos llegará a $103 mil millones para 2027" (Statista) vs los 278 mil millones del oro The analytics way Gartner “Analytics Maturity model” Como el uso del Big Data hace la diferencia en las empresas Recomendación de Reinvención de la Generación y Modelos de productos (BigData) industria del recomendación de retención (BigData) a partir de transporte a partir contenidos de estudiantes conocimiento de sus de entender la data (BigData) lograron (95%), ayuda a clientes (30% de sus (+100 millones de un 93% de retención mejorar ranking de ventas) usuarios) y la de suscriptores. la universidad, la optimización de reputación y sus Rutas y estados financieros Precios(BigData) 10 Ejemplos de IA (Inteligencia Artificial) Que utilizamos en nuestra vida cotidiana y tal vez no lo sabemos. The analytics way business perspective Bill schmarzo “The big data MBA” ¿Data Driven o Value Driven? “El valor de los datos está determinado por cómo se usan para crear nuevas fuentes de valor (value-driven). Para explotar el potencial económico de los datos, la alta dirección debe dejar de pensar en acumular data a pensar como puede generar valor con esa información para impulsando la optimización de los procesos, el crecimiento el ventas, el conocimiento del cliente y la generación de nuevos potenciales negocios” Schmarzo, Bill. The Economics of Data, Analytics, and Digital Transformation: The theorems, laws, and empowerments to guide your organization’s digital transformation (pp. 34-35). Packt Publishing. Edición de Kindle. Introducción Unidades del curso 01 02 03 04 FUNDAMENTOS DE BIG DATA ARQUITECTURA Y GESTIÓN, VISUALIZACIÓN Y APLICACIONES Y Y TECNOLOGÍAS PROCESAMIENTO DE DATOS SEGURIDAD DE DATOS TENDENCIAS FUTURAS DE BIG Introduce los conceptos Explora las diferencias entre Aborda la gobernanza, DATA básicos de Big Data, arquitecturas tradicionales y seguridad y visualización de Analiza aplicaciones de Big Data incluyendo su importancia en modernas en entornos Big datos, destacando estrategias en sectores clave y tendencias la sociedad y las industrias. Se Data, abordando para garantizar la calidad y emergentes como la inteligencia abordan las herramientas procesamiento batch y en protección de la información en artificial y machine learning, clave como Hadoop y Spark, tiempo real, y estructuras de proyectos de Big Data. preparando a los estudiantes además de una introducción a almacenamiento como Data para el futuro tecnológico. las bases de datos NoSQL. Warehouses y Data Lakes. ¿Como vamos a trabajar? Consideraciones de clase Puntualidad Herramientas necesarias Asegúrate de estar en la plataforma Asegúrate de conectarte de una PC o 5 minutos antes de que comience la Laptop para que puedas participar clase Evaluamos para que mejores Ambiente de Aprendizaje Encuentra un lugar tranquilo y libre Producto Académico Código Peso Instrumento de de distracciones para participar en Evaluación Examen Parcial EP 1 la clase. Examen Final EF 1 Trabajos Integrados; durante Participación todo el curso, Usando la plataforma. Rubricas, Lista de Participación activa de los Cotejo Cámara encendida estudiantes. TI 2 Desarrollo de trabajos Micrófono en silencio. grupales. Participación Activa y respeto por Trabajos integradores. Investigaciones la opinión de los participantes Foros *Trabajo Final grupal o Individual 2 Unidad 1 - Fundamentos de Big Data y tecnologías Esta unidad introduce los conceptos esenciales de Big Data, comenzando con una exploración de los fundamentos y la importancia de Big Data en la sociedad y las industrias. Se analizan las diferentes fuentes y tipos de datos y se Data discute la relevancia de las tecnologías y herramientas fundamentales como Hadoop y Spark. La unidad concluye con una introducción a las bases de datos NoSQL, destacando sus diferencias y aplicaciones en comparación con los sistemas tradicionales de bases de datos. 2 Sesión 1 y 2 0. Introducción al Curso 1. ¿Qué es Big Data? 2. Las V´s del Big Data 3. Aplicaciones de Big Data y compañías Data Driven 4. Mitos y Realidades 5. Tipos de Datos en el ecosistema de Big Data 6. Big Data Hadoop Spark 7. Casos Big Data – Foro y Clase 18 1. ¿Qué es Big Data? 3 4 ¿Qué son los datos? DATA EMPRESA DATA INTERNET SAP ERP 4 petabytes de datos 300 millones de CRM son creados en participantes diarios LMS (Canvas) facebook durante pandemia Sistemas de RRHH Data creada en 1 día 500+ hrs de Sistemas HUELLAS de IT, OT y O RASTROS HUELLAS Para el 2025,OseRASTROS estima que seDEJADOS POR creará diariamente video se suben Digitales DEJADOS POR SISTEMAS PERSONAS en el mundo 464 exabytes o 464 000 000 GB cada minuto Data Financiera, Data Estudio de Mercado Data de Competencia 65 billones de 100 millones de fotos y Data de RRSS mensajes son videos son compartidos Data de Apps enviados en en Instagram. whatsapp 6 Cómo usan los datos es lo que diferencia a las empresas 464 Exabytes 2013 2017 2025 Fuente: McKinsey & Company 7 Transformación Digital y Big Data Analytics ¿Qué es Big Data? Es cualquier conjunto de datos que, por su cantidad, complejidad y continuo crecimiento, no pueden ser analizados por medios tradicionales o convencionales. Tambien se refiere a las nuevas tecnologías que hacen posible el almacenamiento y procesamiento de estos datos. En muchas regiones, se utiliza el término como un sinónimo de Analytics, la capacidad de extraer valor de los datos. Definición informal: “Big Data es cualquier conjunto de datos que no cabe en un archivo Excel”. 18 7. Casos Big Data - Foro 35 Caso: Big Data Para la próxima clase, busque un caso de éxito de Big Data. En el foro correspondiente del Aula Virtual, redacte un resumen del caso (entre 100 y 500 palabras). Considere los siguientes aspectos: 1. ¿Cuál era el problema o necesidad que se resolvió? 2. ¿Por qué se considera un caso de Big Data? 3. ¿Cuál es el valor generado? Luego de haber completado su redacción, haga comentarios sobre dos casos de sus compañeros. Puede ser: agregando información, haciendo preguntas, resaltando algún otro aspecto del caso, etc. 36 Caso: Big Data – Ejemplo 1 Amazon se ha convertido en el retailglobal más grande del planeta, en base al uso eficiente de la información como un activo clave. Los datos han sido tan importantes para Amazon, que incluso ha incursionado en el mundo de los servicios cloudpara ofrecer capacidades de Big Data a muchas otras empresas. ¿Cuál era el problema o necesidad que se resolvió? A través de los algoritmos de recomendación y del análisis de comentarios y feedbackde los productos han logrado posicionarse como la empresa líder en consumo. ¿Por qué se considera un caso de Big Data? Porque los datos que reúne vienen continuamente de muchísimas fuentes dispares y además existe la necesidad de integrar información de navegación en el sitio, transacciones, comentarios, opiniones, calificaciones, reclamos, promociones, ofertas, datos de los procesos de compra, pagos, etc. ¿Cuál es el valor generado? El 35% de las ventas anuales de Amazon provienen de la recomendaciones de productos. El costo de almacenamiento y distribución es mínimo, debido a la automatización y robotización. 37 Caso: Big Data – Ejemplo 2 Netflix ha revolucionado el entretenimiento a una escala sin precedentes. Ha crecido tanto que tuvo que crear sus propios data center para no depender de la disponibilidad de otras nubes. ¿Cuál era el problema o necesidad que se resolvió? Netflix es el campeón en algoritmos de recomendación. Utilizan muchas técnicas, considerando la similaridad entre series o películas, también consideran los géneros y otros criterios de afinidad y popularidad para armar sus recetas de recomendaciones. ¿Por qué se considera un caso de Big Data? Porque el volumen de información que se procesa para generar las recomendaciones es gigantesco, además porque todo el tiempo se están actualizando las estadísticas de visualizaciones y los rankings de cada programa. Además, realizan complejos experimentos de A/B testingpara testear continuamente sus recomendaciones. ¿Cuál es el valor generado? La tasa de retención de usuarios en Netflix es muy alta, 93% anual. Netflix se ha posicionado también como una de las más importantes productoras de películas y series. Libros recomendados Utilizar los datos para Identificar oportunidades e impactar en los resultados de negocio. Big Data MBA Video Educational Series Big Data MBA Video Educational Series Gracias