Introducción a la Ciencia de Datos - vFinal PDF
Document Details
Uploaded by ProblemFreeDulcimer177
Universidad Nacional de La Matanza
Ing. Lorena R. Matteo
Tags
Summary
Este documento ofrece una introducción a la Ciencia de Datos, incluyendo temas como la historia de la ciencia de datos, su relación con la inteligencia de negocios, sus conceptos básicos, y las aplicaciones prácticas. También se abordan las tendencias actuales y el ciclo de vida de un proyecto de ciencia de datos. Además, se discuten las técnicas y herramientas clave empleadas en el área, junto con los beneficios y retos éticos que enfrenta.
Full Transcript
Introducción a la Ciencia de Datos Webinar Abierto a la Comunidad 35 años UNLaM Licenciatura en Gestión de Tecnología Escuela de Formación Continua Docente: Ing. Lorena R. Matteo [email protected] Cátedra Inteligencia de Negocios @unlamo...
Introducción a la Ciencia de Datos Webinar Abierto a la Comunidad 35 años UNLaM Licenciatura en Gestión de Tecnología Escuela de Formación Continua Docente: Ing. Lorena R. Matteo [email protected] Cátedra Inteligencia de Negocios @unlamoficial @efc.unlam preencoded.png Agenda - Introducción a la Ciencia de Datos (CD) - Historia y Evolución - Inteligencia de Negocios (BI) - Importancia de los Datos - Conceptos Básicos: Datos, Información y Conocimiento - Fuentes de Datos y Big Data - Tendencias en BI y CD - Ciclo de Vida de un Proyecto de CD - Aplicaciones Prácticas - Técnicas y Herramientas Clave - Beneficios y Retos Éticos - Conclusiones - Actividad Interactiva & Preguntas preencoded.png ¿Qué es la Ciencia de Datos? La ciencia de datos es un campo interdisciplinario que combina estadística, matemáticas, aprendizaje de máquina y tecnología de la información para extraer conocimientos e información valiosa a partir de grandes conjuntos de datos. Es una herramienta poderosa que permite tomar mejores decisiones y generar soluciones innovadoras. preencoded.png Breve historia de la Ciencia de Datos 1 Orígenes Los inicios de la ciencia de datos se remontan a la década de 1950, con el desarrollo de las primeras computadoras y el interés en el procesamiento de datos. 2 Análisis de Datos En los 70s y 80s, se expandió el uso de técnicas estadísticas y herramientas de procesamiento de datos para extraer conocimiento de grandes conjuntos de datos. 3 Auge del Big Data La explosión de datos en la era digital, junto con el avance de la computación y el almacenamiento, impulsaron el crecimiento de la ciencia de datos en la década de 2000. preencoded.png ¿Qué es la Inteligencia de Negocios? Definición Herramientas Objetivos La inteligencia de negocios se Incluye técnicas como informes, Ayuda a las organizaciones a refiere al uso estratégico de datos paneles de control, análisis de identificar tendencias, detectar para informar la toma de datos y visualizaciones que oportunidades y riesgos, y decisiones y mejorar el rendimiento permiten a las empresas desarrollar estrategias más organizacional. comprender mejor su negocio. efectivas. preencoded.png La Importancia de los Datos en el Mundo Actual 1 Transformación Digital 2 Toma de Decisiones 3 Innovación y Desarrollo Informada Los datos son el combustible El análisis de datos impulsa la que impulsa la transformación Los datos permiten tomar creación de nuevos productos, digital en todos los sectores. decisiones más acertadas y servicios y modelos de fundamentadas en hechos. negocio. preencoded.png Conceptos Básicos: Datos, Información, Conocimiento y Decisión Datos Información Conocimiento conjuntos de valores, hechos o se obtiene al contextualizar, surge al interpretar, comprender y características que se pueden categorizar y sintetizar los datos aplicar la información para resolver medir, recopilar y analizar. para darles significado. problemas y tomar decisiones. Localidades La localidad de San Justo está en el En la provincia de Mendoza hubo Partidos/Departamentos partido de La Matanza en la provincia más ventas de la rama de actividad X Provincias de Bs.As que el año pasado. Ramas de actividad Franjas Horarias Las ventas de la rama de actividad En la zona del NOA hay menos X del año 2023 fueron de $ 700.000 empresas que el año pasado de la rama de actividad Y Decisión Hacer propaganda del producto Z en la zona de CABA Ver políticas de promoción en NOA preencoded.png Fuentes de Datos: Estructurados, Semi, No Estructurados, Big Data Datos Estructurados Datos Semi y No Estructurados Datos organizados en formatos Datos sin un formato predefinido. predefinidos, como bases de Semi: como texto. No datos relacionales o hojas de estructurado: como imágenes, cálculo. audio y video, provenientes de diversas fuentes. Big Data Grandes volúmenes de datos que superan la capacidad de los sistemas de procesamiento tradicionales. preencoded.png Tendencias en Inteligencia de Negocios Computación en la Aprendizaje Análisis en Tiempo Real Visualización de Datos Nube Automático Almacenamiento y Algoritmos que aprenden y Toma de decisiones Representación gráfica de procesamiento de datos a mejoran a partir de los basada en datos en tiempo datos para una mejor gran escala en la nube. datos. real. comprensión. preencoded.png Relación Inteligencia de Negocios y Ciencia de Datos Inteligencia de Negocios Analiza datos históricos se enfoca en el análisis descriptivo y la visualización de datos históricos Ciencia de Datos Predice a futuro mediante técnicas avanzadas como el aprendizaje automático hace predicciones y descubre patrones ocultos. preencoded.png Ciclo de Vida de un Proyecto de Ciencia de Datos Recopilación y Preparación 1 Identificar, adquirir y limpiar los datos relevantes para el proyecto. 2 Exploración y Análisis Entender las características y patrones de los datos mediante visualizaciones y estadísticas. Modelado y Entrenamiento 3 Desarrollar y entrenar modelos de aprendizaje automático para resolver el problema. 4 Evaluación y Mejora Validar el desempeño de los modelos y refinarlos iterativamente. Implementación y Seguimiento 5 Desplegar los modelos en producción y monitorizar su rendimiento. preencoded.png Aplicaciones prácticas de la Ciencia de Datos Recomendaciones Detección de fraude personalizadas Modelos que identifican Sistemas que sugieren transacciones sospechosas o productos, servicios o contenido actividades inusuales para basado en preferencias y prevenir fraudes. comportamiento del usuario. Análisis de riesgos Optimización de procesos Herramientas que evalúan y Técnicas que ayudan a mejorar predicen riesgos en sectores la eficiencia y reducir costos en como finanzas, salud o seguros. operaciones empresariales. preencoded.png Técnicas de Aprendizaje Automático AS Aprendizaje Supervisado ANS Aprendizaje no supervisado Utiliza datos etiquetados. Busca patrones no evidentes Aprenden a predecir a simple vista, como resultados basándose en agrupaciones y asociaciones. ejemplos previos. AP Aprendizaje profundo Efectivo en tareas complejas, usando redes neuronales para reconocer imágenes y lenguaje natural. preencoded.png Tareas de Aprendizaje Automático AS Regresión AS Clasificación Modela la relación entre Asigna observaciones a variables para predecir categorías o clases valores numéricos. predefinidas. ANS Agrupamiento AP Redes Neuronales Identifica patrones y Arquitecturas inspiradas grupos naturales dentro en el cerebro humano de los datos. para el aprendizaje y la predicción. preencoded.png Herramientas y tecnologías utilizadas Almacenamiento Lenguajes Bases de datos relacionales y Python, R, SQL, y bibliotecas NoSQL, data lakes y data especializadas como TensorFlow warehouses. y Scikit-learn. Visualización Infraestructura Herramientas como Power BI, Plataformas en la nube, Tableau y D3.js para crear servidores, clusters de dashboards y gráficos. procesamiento y GPU. preencoded.png Roles en Ciencia de Datos Científico de Datos Experto en estadística, aprendizaje automático y resolución de problemas complejos. Ingeniero de Datos Responsable de la arquitectura, recopilación y preparación de los datos. Analista de Negocios Traduce los requisitos de negocio en problemas y soluciones de ciencia de datos. preencoded.png Beneficios y Aplicaciones de la Ciencia de Datos 1 Toma de Decisiones 2 Automatización de Basada en Datos Procesos Permite respaldar Los modelos predictivos decisiones estratégicas pueden automatizar con evidencia y análisis tareas repetitivas y cuantitativo. optimizar procesos. 3 Innovación y Eficiencia 4 Ventaja Competitiva Genera nuevos Obtener conocimiento conocimientos y mejoras valioso a partir de datos en la eficiencia operativa puede generar una de las organizaciones. ventaja diferencial. preencoded.png Cómo Empezar en la Ciencia de Datos 1 Aprendizaje Continuo 2 Proyectos Prácticos Desarrollar proyectos Mantenerse actualizado personales para aplicar con los últimos avances y los conocimientos tendencias en ciencia de adquiridos. datos. 3 Redes y Comunidades Participar en grupos y eventos para conectar con otros profesionales y entusiastas. preencoded.png Retos y consideraciones éticas 1 Privacidad y 2 Sesgos y Transparencia Seguridad Proteger la información Es importante identificar personal y evitar el uso y mitigar los sesgos en los indebido de los datos es modelos de IA para crucial. asegurar resultados justos. 3 Impacto Social La aplicación de la ciencia de datos debe considerar las implicaciones éticas y el bienestar de las personas. preencoded.png Conclusiones La Ciencia de Datos es un campo en constante evolución que combina estadísticas, programación y conocimiento del dominio para extraer valor de los datos. Su relación con la Inteligencia de Negocios la convierte en una herramienta poderosa para la toma de decisiones en diversas industrias. A medida que avanzamos hacia un futuro impulsado por datos, la comprensión de estos conceptos se vuelve esencial. preencoded.png Actividad de Saberes Adquiridos y ¿Preguntas? Únete en www.kahoot.it o con la app de Kahoot! PIN de juego: ¡Muchas gracias! preencoded.png