BIG DATA para estudio y exámen
89 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

¿En qué se diferencia principalmente IBM SPSS Statistics de otros programas de análisis estadístico?

  • Su interfaz de usuario intuitiva que facilita el aprendizaje rápido para principiantes.
  • La manipulación y edición sencilla de los datos recogidos, además de su amplia compatibilidad con formatos de datos. (correct)
  • Su capacidad para predecir los precios de las acciones en tiempo real con alta precisión.
  • Su licencia académica de fácil obtención y sus potentes herramientas de visualización de datos.

¿Cuál de las siguientes opciones describe una ventaja única de RapidMiner para un principiante en análisis predictivo?

  • Su habilidad avanzada para realizar análisis de series temporales y modelado predictivo complejo.
  • Su modelo de precios basado en el uso, que reduce los costos iniciales para proyectos pequeños.
  • Su interfaz de usuario intuitiva que facilita el aprendizaje rápido de los pasos básicos. (correct)
  • Su capacidad para integrarse directamente con modelos de datos ERP y CRM complejos.

¿Cuál es una característica distintiva de Amazon Machine Learning en comparación con otras herramientas de análisis predictivo?

  • Posee una interfaz personalizable que se adapta a las necesidades específicas de cada usuario.
  • Ofrece la mayor variedad de algoritmos de aprendizaje automático pre-construidos.
  • Presenta un modelo de precios basado en el uso, eliminando tarifas mensuales fijas. (correct)
  • Permite la integración directa con sistemas de Big Data sin necesidad de programación adicional.

¿Cómo ha impactado la conectividad constante de las personas, facilitada por los teléfonos móviles, en la recopilación y el uso de datos?

<p>Ha posibilitado la monitorización de la ubicación y la última interacción del cliente, permitiendo servicios personalizados. (D)</p> Signup and view all the answers

¿De qué manera el análisis predictivo puede aprovechar la información obtenida a través de la conectividad móvil de los usuarios?

<p>Para mejorar la precisión en la segmentación de clientes y la personalización de ofertas basadas en la ubicación e historial de interacciones. (C)</p> Signup and view all the answers

¿Cuál de las siguientes NO es una característica definitoria de un modelo determinista en el análisis predictivo de datos?

<p>Se utiliza para calcular distribuciones de probabilidad de resultados potenciales. (D)</p> Signup and view all the answers

¿Qué tipo de modelo matemático se basa en variables aleatorias para predecir una distribución de probabilidad de resultados potenciales?

<p>Modelo estocástico. (B)</p> Signup and view all the answers

¿Cuál de los siguientes métodos se utiliza comúnmente en finanzas para simular un modelo estocástico?

<p>Método Monte Carlo. (C)</p> Signup and view all the answers

¿Cuál de los siguientes componentes del análisis de series de tiempo representa las fluctuaciones recurrentes que ocurren dentro de un año?

<p>Temporalidad. (A)</p> Signup and view all the answers

En el contexto del análisis predictivo, ¿qué representan los 'residuales' en un modelo de series de tiempo?

<p>Componentes impredecibles e inexplicables. (B)</p> Signup and view all the answers

¿Cuál es el propósito principal de utilizar modelos predictivos para la predicción de la carga energética?

<p>Gestionar las cargas en la red eléctrica. (D)</p> Signup and view all the answers

¿Cuál de las siguientes estrategias es MENOS efectiva para mitigar la escasez de habilidades en la implementación de Big Data?

<p>Ignorar las posibles carencias de habilidades y esperar a que los empleados se adapten. (A)</p> Signup and view all the answers

¿Qué beneficio principal obtienen los operadores de la red eléctrica al convertir grandes cantidades de datos en conocimiento a través del análisis predictivo?

<p>Mayor capacidad para la toma de decisiones. (A)</p> Signup and view all the answers

¿Qué enfoque organizativo facilita de manera MÁS efectiva el intercambio de conocimientos y la gestión de las comunicaciones en proyectos de Big Data?

<p>Un enfoque basado en un centro de excelencia para compartir conocimientos. (D)</p> Signup and view all the answers

¿Cómo impacta la capacidad de analizar los datos casi en tiempo real en el contexto del Big Data a las empresas según el texto?

<p>Permite anticipar las tendencias del mercado y ajustar las estrategias empresariales de manera proactiva, mejorando la toma de decisiones. (B)</p> Signup and view all the answers

¿Cuál es la principal ventaja de alinear datos estructurados y no estructurados en el contexto de Big Data?

<p>Permite obtener una visión más completa y profunda de la información. (D)</p> Signup and view all the answers

¿Cuál de las siguientes opciones describe mejor la relación entre tendencias y ciclos en el análisis de series de tiempo?

<p>Los ciclos representan movimientos dentro de una tendencia a largo plazo. (B)</p> Signup and view all the answers

¿Cuál es la implicación de tener más de 55 mil millones de dispositivos conectados a Internet para el Big Data en el futuro, según la consultora Gartner?

<p>El volumen de datos contenidos en Big Data crecerá exponencialmente, lo que requerirá soluciones más robustas para su gestión y análisis. (D)</p> Signup and view all the answers

¿Cuál es la implicación de que un componente en un análisis de series de tiempo sea clasificado como 'residual'?

<p>No puede ser explicado por los patrones identificados. (C)</p> Signup and view all the answers

¿De qué manera la personalización en la atención al cliente, facilitada por el análisis de Big Data, contribuye al éxito de las empresas según el texto?

<p>Aumenta el volumen de ventas al dirigir las ofertas de forma más directa y efectiva, satisfaciendo las necesidades específicas de cada cliente. (B)</p> Signup and view all the answers

¿Cuál de las siguientes preguntas es MENOS relevante para determinar si una iniciativa de Big Data está alineada con los objetivos empresariales?

<p>¿Cuál es el tamaño total de los conjuntos de datos que estamos recopilando? (C)</p> Signup and view all the answers

Si una empresa está buscando predecir la demanda de un producto basándose en datos históricos de ventas y factores económicos, ¿qué tipo de modelo sería más apropiado utilizar?

<p>Un modelo estocástico que considera la incertidumbre de los factores económicos. (A)</p> Signup and view all the answers

¿Qué implicación tiene normalizar el enfoque hacia el Big Data dentro de una organización?

<p>Permite gestionar los costos y aprovechar los recursos de manera más eficiente. (C)</p> Signup and view all the answers

¿Por qué el Big Data se considera una ventaja competitiva considerable para las empresas hoy en día?

<p>Porque permite comprender mejor a los clientes, optimizar los procesos y anticipar las tendencias del mercado, mejorando la toma de decisiones. (B)</p> Signup and view all the answers

¿Por qué es crucial evaluar las necesidades de habilidades de forma temprana y frecuente al implementar soluciones de Big Data?

<p>Para asegurar que la organización cuenta con el talento necesario para aprovechar al máximo la inversión en Big Data y mitigar posibles carencias. (B)</p> Signup and view all the answers

¿Qué rol juegan las relaciones interpersonales de los clientes en el análisis de Big Data y cómo benefician a las empresas, según lo expuesto?

<p>El análisis de las relaciones interpersonales permite conocer más a fondo al propio cliente y aumentar el número de clientes potenciales, generando conocimiento de valor para el negocio. (D)</p> Signup and view all the answers

¿Por qué se afirma que el Big Data es una respuesta a las necesidades del mercado actual?

<p>Porque ofrece soluciones tecnológicas para satisfacer requerimientos impulsados por los avances, como la personalización y el análisis en tiempo real. (A)</p> Signup and view all the answers

¿Cómo puede contribuir un enfoque basado en un centro de excelencia a incrementar las capacidades de Big Data en una organización?

<p>Centralizando el conocimiento, supervisando el control y gestionando las comunicaciones de proyectos de forma sistemática y estructurada. (A)</p> Signup and view all the answers

¿En qué se diferencia el concepto original de las '3 V's' del Big Data con la evolución actual a las '5 V's'?

<p>La diferencia radica en que las '3 V's' se centraban en la velocidad, volumen y variedad de los datos, mientras que las '5 V's' incorporan además el valor y la veracidad de la información. (C)</p> Signup and view all the answers

Además de la alineación con objetivos empresariales bien definidos, ¿qué otro elemento es crucial para asegurar la constancia en la financiación e inversión en proyectos de Big Data?

<p>Un marcado contexto empresarial que justifique las inversiones en habilidades, organización o infraestructura. (A)</p> Signup and view all the answers

¿Cuál es el riesgo principal de analizar el Big Data de forma aislada, sin considerar la alineación entre datos estructurados y no estructurados?

<p>Se pierde la oportunidad de obtener una comprensión más profunda y completa de la información disponible. (C)</p> Signup and view all the answers

¿Cuál de las siguientes opciones representa un objetivo clave al integrar el big data de baja densidad con los datos estructurados existentes en una empresa?

<p>Enriquecer los resúmenes maestros y analíticos con puntos de datos más relevantes para mejorar las conclusiones. (C)</p> Signup and view all the answers

¿Qué rol juega la gestión de recursos en una solución de Big Data, especialmente en el contexto de la experimentación y producción?

<p>Garantiza el control de todo el flujo de datos, incluyendo procesamiento previo y posterior, integración y modelado analítico. (C)</p> Signup and view all the answers

¿Por qué es fundamental una estrategia bien definida de aprovisionamiento y seguridad en la nube (pública y privada) al implementar soluciones de Big Data?

<p>Para respaldar los requisitos cambiantes de experimentación y ejecución de tareas de producción. (D)</p> Signup and view all the answers

¿Cuál es la diferencia fundamental entre Big Data y Data Mining según el texto?

<p>Big Data se centra en la gestión de grandes volúmenes de datos, mientras que el Data Mining se enfoca en analizar esos volúmenes. (C)</p> Signup and view all the answers

En el contexto de Big Data, ¿qué implica 'alinear con el modelo operativo en la nube'?

<p>Asegurar que los usuarios y procesos tengan acceso a una amplia variedad de recursos para experimentación y producción. (D)</p> Signup and view all the answers

¿Cuál de las siguientes NO es una capacidad de análisis típicamente asociada con Big Data?

<p>Estadísticas descriptivas básicas (A)</p> Signup and view all the answers

Si una empresa busca mejorar su comprensión del cliente, ¿cuál sería una aplicación efectiva de los modelos analíticos de Big Data?

<p>Relacionar distintos tipos y fuentes de datos para realizar asociaciones y hallazgos significativos sobre el comportamiento del cliente. (C)</p> Signup and view all the answers

¿Qué implicación tiene el uso de 'entornos de pruebas (sandboxes) analíticos on-demand' en una solución de Big Data?

<p>Agiliza la experimentación y el desarrollo de modelos analíticos sin afectar los sistemas de producción. (B)</p> Signup and view all the answers

En el contexto de Big Data, ¿qué significa que los modelos y procesos analíticos pueden ser 'tanto humanos como automáticos'?

<p>Que se pueden utilizar tanto métodos tradicionales de análisis manual como técnicas automatizadas de machine learning. (A)</p> Signup and view all the answers

¿Cómo contribuye el Big Data a las capacidades existentes de inteligencia empresarial (BI), plataformas de almacenamiento de datos y arquitecturas de información de una organización?

<p>Actuando como una extensión integral, añadiendo la capacidad de analizar datos más amplios y diversos. (B)</p> Signup and view all the answers

¿Cuál es el principal objetivo de este proyecto en relación con Big Data?

<p>Justificar el creciente interés en Big Data a partir de sus conceptos básicos y analizar el mercado actual. (D)</p> Signup and view all the answers

¿Cuál es el enfoque principal del estudio dentro del mercado de Big Data?

<p>El framework Hadoop, aunque también considera otras soluciones como NoSQL y soluciones Cloud. (C)</p> Signup and view all the answers

¿Qué tipo de solución open source se utiliza en la parte práctica del proyecto?

<p>Cloudera CDH. (B)</p> Signup and view all the answers

¿Cuál es el objetivo del caso de uso implementado en el proyecto?

<p>Capturar menciones en redes sociales sobre un producto o empresa para analizar opiniones. (D)</p> Signup and view all the answers

¿Qué se pretende conocer al buscar los patrones más repetidos en los comentarios capturados de las redes sociales?

<p>El sentimiento general de la gente hacia un producto o empresa. (B)</p> Signup and view all the answers

¿Cuál de las siguientes opciones describe mejor la relación entre Hadoop y Cloudera CDH?

<p>Cloudera CDH es una distribución de Hadoop. (D)</p> Signup and view all the answers

¿Cómo contribuye el análisis de Big Data, según lo aplicado en el caso de uso, a las empresas?

<p>Comprendiendo mejor la percepción del cliente sobre sus productos o servicios. (C)</p> Signup and view all the answers

¿Cuál es el primer paso clave mencionado en el proyecto para introducir al lector en el mundo del Big Data?

<p>Explicar detalladamente el significado del concepto Big Data y a qué tipo de problemas se dirige. (D)</p> Signup and view all the answers

¿Cuál de los siguientes objetivos representa un enfoque práctico al implementar Big Data, según el texto?

<p>Implementar un caso de uso real utilizando una solución Hadoop de código abierto como Cloudera CDH. (B)</p> Signup and view all the answers

¿Cuál de las siguientes describe mejor la relación entre las redes sociales y Big Data en el contexto del caso de uso implementado?

<p>Las redes sociales son una fuente valiosa de datos para Big Data, permitiendo capturar opiniones y patrones sobre productos o empresas. (D)</p> Signup and view all the answers

¿Qué tipo de conocimiento se busca obtener al analizar los patrones más repetidos en los comentarios de redes sociales capturados en el caso de uso?

<p>Conocimiento sobre las opiniones de la gente acerca de un producto o empresa. (D)</p> Signup and view all the answers

¿Cuál de las siguientes opciones describe mejor el rol de Hadoop en el contexto de las soluciones Big Data, según el documento?

<p>Hadoop es un framework para el desarrollo de soluciones Big Data, aunque existen otras soluciones importantes como bases de datos NoSQL y soluciones en Cloud. (B)</p> Signup and view all the answers

¿Por qué las empresas consideran que Big Data representa una ventaja competitiva?

<p>Porque permite obtener información valiosa para conocer las opiniones de los clientes y mejorar sus productos. (B)</p> Signup and view all the answers

¿Cuál es el enfoque principal del proyecto en relación con el concepto Big Data?

<p>Estudiar el estado actual del mercado Big Data, analizando la arquitectura de los sistemas y comparando las soluciones existentes. (A)</p> Signup and view all the answers

¿Qué se pretende lograr al realizar pruebas sobre la solución Cloudera CDH?

<p>Ganar conocimiento técnico sobre las diferentes herramientas que componen el ecosistema Hadoop. (A)</p> Signup and view all the answers

¿Qué tipo de datos se capturan en el caso de uso implementado para el análisis de Big Data?

<p>Menciones que se hacen en las redes sociales sobre un producto o empresa determinado. (B)</p> Signup and view all the answers

¿Cuál de las siguientes opciones describe mejor la función principal del framework Hadoop en el desarrollo de aplicaciones distribuidas, según el texto?

<p>Simplifica la implementación de aplicaciones distribuidas mediante funcionalidades predefinidas. (B)</p> Signup and view all the answers

En el contexto del proyecto descrito, ¿qué implicación tiene el uso del modelo de programación MapReduce para el análisis de ficheros de log?

<p>Permite el procesamiento paralelo de grandes volúmenes de datos, mejorando el rendimiento y reduciendo el tiempo de ejecución. (B)</p> Signup and view all the answers

¿Por qué se decidió finalmente implementar un data warehouse con Hive en lugar de utilizar bases de datos NoSQL para el caso de uso de análisis de la imagen de un producto en redes sociales?

<p>Hive permitía realizar consultas interactivas SQL de forma distribuida, lo cual era crucial para el análisis. (D)</p> Signup and view all the answers

¿Cómo contribuye el particionamiento de tablas en un data warehouse implementado con Hive a la gestión del proyecto?

<p>Mejora el rendimiento de las consultas más frecuentes al optimizar el acceso a los datos. (C)</p> Signup and view all the answers

¿Cómo ha afectado la diversificación de cuentas bancarias de los clientes en la capacidad de los bancos para ofrecer promociones personalizadas?

<p>Ha complicado la identificación de clientes, al dispersarse la información en múltiples entidades. (B)</p> Signup and view all the answers

¿Cuál es el principal desafío al utilizar el análisis del comportamiento individual en lugar de perfiles para la detección de fraude?

<p>El requerimiento de grandes conjuntos de datos y procesamiento rápido. (A)</p> Signup and view all the answers

En el contexto de la implementación descrita, ¿cuál es la ventaja principal de utilizar bases de datos relacionales Impala en conjunto con el data warehouse de Hive?

<p>Impala posibilita la consulta interactiva y distribuida de los datos almacenados, complementando las capacidades de Hive. (C)</p> Signup and view all the answers

¿De qué manera específica la implementación de aplicaciones distribuidas para el análisis de ficheros de log, tratamiento de texto, búsqueda de patrones y consultas interactivas SQL contribuye a la competencia técnica CES1.1 (construcción de un sistema complejo distribuido)?

<p>Valida la capacidad del sistema distribuido para ejecutar diversos tipos de aplicaciones, demostrando su versatilidad y robustez. (D)</p> Signup and view all the answers

¿De qué manera el Big Data mejora los sistemas de detección de fraude en comparación con los métodos tradicionales?

<p>Facilita la construcción de modelos de predicción más complejos, mejorando la detección. (B)</p> Signup and view all the answers

¿Cuál de los siguientes enunciados describe mejor el rol de la competencia técnica CES3.2 (Diseñar y gestionar un almacén de datos) en el caso de uso 'Imagen de un Producto a través de las Redes Sociales'?

<p>Proporciona la capacidad de diseñar, implementar y mantener un <em>data warehouse</em> para el almacenamiento y consulta eficiente de los datos recopilados. (D)</p> Signup and view all the answers

¿Cómo contribuye el análisis de Big Data en tiempo real a la reducción del riesgo financiero?

<p>Ayuda a entender y anticipar las tendencias del mercado para minimizar pérdidas. (C)</p> Signup and view all the answers

¿Qué desafío principal se aborda al implementar aplicaciones distribuidas sobre un sistema que utiliza el modelo de programación MapReduce y consultas SQL interactivas?

<p>La optimización del rendimiento y la reducción del tiempo de ejecución al aprovechar todos los nodos del clúster. (D)</p> Signup and view all the answers

¿Cuál es una aplicación clave del análisis de ficheros de registro (logs) facilitado por Big Data?

<p>Identificar rápidamente las causas de fallos en los sistemas. (A)</p> Signup and view all the answers

En el contexto del análisis de perfiles de clientes, ¿cómo pueden las entidades financieras equilibrar la necesidad de datos con la creciente preocupación por la privacidad?

<p>Adoptar técnicas de anonimización y agregación de datos para proteger la privacidad individual. (A)</p> Signup and view all the answers

¿Cuál es el impacto de la velocidad de procesamiento en la detección de fraude con Big Data?

<p>Permite detectar fraudes en tiempo real, minimizando las pérdidas. (D)</p> Signup and view all the answers

¿Cómo pueden las empresas equilibrar el uso de modelos predictivos complejos con la interpretabilidad de los resultados al aplicar Big Data para la reducción de riesgos?

<p>Adoptar técnicas de visualización y explicación de modelos para facilitar la interpretación. (A)</p> Signup and view all the answers

¿Cómo facilita Big Data la resolución de problemas en entornos distribuidos complejos, como los de las entidades financieras?

<p>Analiza grandes volúmenes de ficheros de registro en tiempo razonable, identificando la causa de los fallos. (D)</p> Signup and view all the answers

¿Qué desafío presenta el procesamiento de datos provenientes de sensores, como los de un avión Boeing o el CERN, y cómo Big Data aborda este desafío?

<p>El volumen masivo de información generada en tiempo real; Big Data permite el procesamiento y análisis oportuno de estos datos. (D)</p> Signup and view all the answers

¿Cuál es la importancia de analizar los datos de sentimiento más allá de simplemente identificar si un cliente tiene una opinión positiva o negativa?

<p>Ayuda a comprender las razones detrás de las opiniones de los clientes, vinculando sentimientos con acciones específicas como promociones o cambios de precios. (B)</p> Signup and view all the answers

¿De qué manera el análisis de sentimiento, aplicado a datos internos y externos, beneficia a las empresas más allá de conocer la opinión general sobre sus productos?

<p>Revela las razones subyacentes detrás de las opiniones, permitiendo identificar áreas de mejora y las preferencias de los clientes. (D)</p> Signup and view all the answers

¿Cómo contribuye el uso de Big Data en el análisis de 'streaming' de ficheros de registro a la gestión de sistemas en tiempo real?

<p>Facilita la monitorización en tiempo real del estado del sistema, permitiendo la detección temprana de incidencias y la prevención de interrupciones. (B)</p> Signup and view all the answers

¿Cuál es el desafío fundamental al analizar el sentimiento del cliente a partir de datos de redes sociales y cómo se puede abordar este desafío?

<p>La dificultad para determinar las razones detrás de las opiniones expresadas; se aborda complementando con estudios de promociones, precios y marketing. (B)</p> Signup and view all the answers

¿Por qué es esencial para las empresas complementar el análisis de sentimiento con estudios de promociones, cambios de precios y marketing?

<p>Para identificar las causas que coinciden temporalmente con las tendencias de opinión, ofreciendo un contexto para las emociones expresadas. (A)</p> Signup and view all the answers

¿Cómo se utilizan los sistemas Big Data en la predicción de desastres naturales, como terremotos, y cuál es la fuente principal de datos para este análisis?

<p>Analizando datos provenientes de sensores desplegados en áreas de riesgo. (C)</p> Signup and view all the answers

¿Cómo puede el análisis del lenguaje en las interacciones de servicio al cliente, como llamadas telefónicas grabadas, beneficiar a una empresa?

<p>Clasificando el nivel de satisfacción o insatisfacción del cliente, permitiendo identificar áreas problemáticas específicas. (D)</p> Signup and view all the answers

¿Cuál es el impacto más significativo de utilizar Big Data en campañas de marketing dirigidas?

<p>Reducir los costos al enfocar las campañas en segmentos de la población más propensos a convertir, optimizando el gasto publicitario. (D)</p> Signup and view all the answers

¿Qué tipo de información se puede obtener del análisis de los ficheros de registro de un servidor web (clickstream)?

<p>Información sobre cómo los usuarios interactúan con la página web, incluyendo las secciones más y menos visitadas. (C)</p> Signup and view all the answers

¿Cómo puede un sistema de análisis de Big Data optimizar una página web basándose en la información del clickstream?

<p>Identificando y corrigiendo problemas de accesibilidad y usabilidad, facilitando la navegación y el acceso a la información. (C)</p> Signup and view all the answers

¿Qué característica distingue a los datos recolectados en un entorno Big Data en comparación con los sistemas tradicionales?

<p>Suelen ser muy grandes y de formato no estructurado, requiriendo técnicas de análisis especializadas. (B)</p> Signup and view all the answers

¿Qué tipo de datos, comúnmente recolectados para Big Data, se caracterizan por su alta velocidad de flujo?

<p>Datos provenientes de sensores y dispositivos IoT. (D)</p> Signup and view all the answers

¿Cuál es el factor más importante a considerar al recolectar datos para un sistema de análisis de Big Data?

<p>Asegurarse de que cumplen con las leyes de protección de datos y puedan aportar valor a la empresa. (A)</p> Signup and view all the answers

¿Cómo contribuye un sistema de análisis de Big Data a la optimización de las operaciones de una empresa?

<p>Transformando grandes volúmenes de datos no estructurados en información útil que permite tomar decisiones más informadas. (C)</p> Signup and view all the answers

Flashcards

Escalabilidad Elástica en la Nube

Capacidad de ajustar recursos IT (como clústeres) de forma rápida y flexible según la demanda, ideal para pruebas de datos.

¿Qué es Big Data?

Esencial para mejorar la gestión empresarial, permitiendo análisis profundos de grandes cantidades de datos generados a alta velocidad.

Crecimiento de Dispositivos Conectados

En 2022, se esperan más de 55 mil millones de dispositivos conectados, lo que implica un crecimiento exponencial del volumen de datos en Big Data.

Importancia de Big Data

Radica en su impacto en la industria, los negocios y la sociedad, ofreciendo una ventaja competitiva significativa.

Signup and view all the flashcards

Personalización del Cliente

Los clientes desean un trato personalizado, lo que requiere detectar sus gustos para aumentar las ventas y dirigir mejor los productos.

Signup and view all the flashcards

Las 5 V's de Big Data

Velocidad, variedad, volumen, valor y veracidad.

Signup and view all the flashcards

Análisis en Tiempo Real

La exigencia de análisis en tiempo real, impulsada por la velocidad, variedad y volumen de los datos.

Signup and view all the flashcards

Alinear Big Data y Objetivos

Alinear las inversiones en big data con objetivos empresariales específicos para garantizar la financiación y el valor del proyecto.

Signup and view all the flashcards

Evaluar Habilidades en Big Data

Evaluar las necesidades de habilidades de big data de forma temprana y frecuente para abordar posibles carencias.

Signup and view all the flashcards

Centro de Excelencia para Big Data

Utilizar un centro de excelencia para compartir conocimientos, supervisar el control y gestionar las comunicaciones de proyectos de big data.

Signup and view all the flashcards

Integración de Datos Estructurados y No Estructurados

El mayor valor reside en analizar datos estructurados y no estructurados de forma integrada, no aislada.

Signup and view all the flashcards

Filtrado de Registros Web

Entender cómo filtrar los registros web para comprender el comportamiento del comercio electrónico.

Signup and view all the flashcards

Análisis de Sentimiento

Extraer el sentimiento de las redes sociales y de las interacciones de atención al cliente.

Signup and view all the flashcards

Correlación Estadística en Datos

Entender los métodos de correlación estadística y su relevancia para los datos de clientes, productos, fabricación e ingeniería.

Signup and view all the flashcards

Mitigar la Escasez de Habilidades

Mitigar la escasez de habilidades se logra incorporando consideraciones de big data en el programa de administración de TI.

Signup and view all the flashcards

Normalizar Enfoque Big Data

Normalizar el enfoque de big data permite gestionar los costos y aprovechar los recursos de manera eficiente

Signup and view all the flashcards

Análisis Predictivo

Uso de herramientas y software para predecir resultados futuros basados en datos.

Signup and view all the flashcards

IBM SPSS Statistics

Software de análisis estadístico sencillo para editar y manipular datos, con amplias capacidades de importación/exportación.

Signup and view all the flashcards

RapidMiner

Herramienta de data mining con interfaz intuitiva, ideal para principiantes, con capacidad para importar de diversas fuentes y licencia académica fácil de obtener.

Signup and view all the flashcards

Amazon Machine Learning

Herramienta para predecir precios de acciones, intuitiva y de bajo costo, con pago por uso.

Signup and view all the flashcards

Conectividad del Cliente

La capacidad de detectar la última interacción de un cliente y dónde ocurrió, gracias a la conectividad móvil y la geolocalización.

Signup and view all the flashcards

¿Qué son las tendencias?

Patrones a largo plazo en datos.

Signup and view all the flashcards

¿Qué reflejan los ciclos?

Movimientos de alza y baja dentro de una tendencia.

Signup and view all the flashcards

¿Qué es la temporalidad?

Fluctuación recurrente durante un año.

Signup and view all the flashcards

¿Qué son los residuales?

Componentes impredecibles e inexplicables en los datos.

Signup and view all the flashcards

¿Qué es la predicción?

Proceso para predecir resultados futuros basándose en datos históricos.

Signup and view all the flashcards

¿Qué es un modelo determinístico?

Modelo donde la relación entre entradas y resultados está definida de manera concluyente.

Signup and view all the flashcards

¿Qué es un modelo estocástico?

Modelo donde las entradas son variables aleatorias y el resultado es una distribución de probabilidad.

Signup and view all the flashcards

¿Qué es el método Monte Carlo?

Método utilizado para simular modelos estocásticos, útil en finanzas.

Signup and view all the flashcards

¿Predicción de carga energética?

Predecir la demanda de energía para gestionar la red eléctrica.

Signup and view all the flashcards

Integración de Big Data

Integrar big data (baja densidad) con datos estructurados para obtener perspectivas empresariales más valiosas.

Signup and view all the flashcards

Big Data como Extensión

Extensión integral de las capacidades existentes de inteligencia empresarial, plataforma de almacenamiento y arquitectura de información.

Signup and view all the flashcards

Capacidades de Análisis de Big Data

Estadísticas, análisis especiales, semántica, detección interactiva y visualización.

Signup and view all the flashcards

Uso de Modelos Analíticos

Relacionar distintos tipos y fuentes de datos para realizar asociaciones y hallazgos significativos.

Signup and view all the flashcards

Acceso a Recursos en Big Data

Los usuarios y procesos de big data requieren acceso a una amplia variedad de recursos de experimentación reiterativa y ejecución de tareas de producción.

Signup and view all the flashcards

¿Qué incluye una solución de Big Data?

Incluye transacciones, datos principales, datos de referencia y datos resumidos.

Signup and view all the flashcards

Importancia de la Gestión de Recursos

La gestión de recursos es fundamental para garantizar el control de todo el flujo de datos.

Signup and view all the flashcards

Estrategia de Aprovisionamiento y Seguridad

Estrategia bien definida de aprovisionamiento y seguridad en la nube pública y privada.

Signup and view all the flashcards

¿Qué es Data Mining?

Analiza los grandes volúmenes de datos.

Signup and view all the flashcards

¿Qué estudia el proyecto?

Analiza la situación actual del mercado de Big Data, su arquitectura y soluciones.

Signup and view all the flashcards

¿Qué es Hadoop?

Framework open source utilizado para desarrollar soluciones Big Data.

Signup and view all the flashcards

¿Qué son las bases de datos NoSQL?

Bases de datos que ofrecen flexibilidad y escalabilidad.

Signup and view all the flashcards

¿Qué son soluciones escalables en Cloud?

Soluciones que se adaptan al crecimiento de datos en la nube.

Signup and view all the flashcards

¿Qué es Cloudera CDH?

Distribución de Hadoop, popular para pruebas y desarrollo.

Signup and view all the flashcards

¿Qué caso de uso se implementó?

Caso de uso para capturar menciones de productos en redes sociales.

Signup and view all the flashcards

¿Cuál es el objetivo del análisis de redes sociales?

Identificar patrones comunes en comentarios sobre una empresa o producto.

Signup and view all the flashcards

Objetivo inicial del proyecto Big Data

Introducción al mundo Big Data, explicando detalladamente su significado y a qué problemas se dirige.

Signup and view all the flashcards

Análisis del mercado Big Data

Estudiar la arquitectura de sistemas Big Data y comparar las soluciones existentes.

Signup and view all the flashcards

Soluciones escalables en la nube

Soluciones que pueden escalar sus recursos según la demanda.

Signup and view all the flashcards

Caso de uso Big Data

Capturar menciones en redes sociales para analizar opiniones sobre productos o empresas.

Signup and view all the flashcards

¿Qué es un sistema distribuido?

Sistema complejo que reparte tareas entre varios nodos para aumentar el rendimiento y reducir el tiempo de ejecución.

Signup and view all the flashcards

¿Qué es MapReduce?

Modelo de programación para procesamiento paralelo de grandes conjuntos de datos en un clúster.

Signup and view all the flashcards

¿Qué es SQL en Big Data?

Permite realizar consultas interactivas sobre grandes conjuntos de datos usando SQL.

Signup and view all the flashcards

¿Qué implica el diseño de bases de datos?

Proceso de especificar, diseñar, implementar y evaluar bases de datos.

Signup and view all the flashcards

¿Qué es un Data Warehouse?

Base de datos optimizada para el análisis y reporting de grandes volúmenes de datos.

Signup and view all the flashcards

¿Qué es Hive?

Herramienta de Hadoop para el diseño e implementación de data warehouses.

Signup and view all the flashcards

¿Qué es Impala?

Base de datos relacional distribuida para realizar consultas interactivas de forma rápida.

Signup and view all the flashcards

Marketing Dirigido

Enfocar campañas de marketing al grupo de personas más receptivo.

Signup and view all the flashcards

Clickstream

Información sobre los clicks que hace un usuario en una web.

Signup and view all the flashcards

Registro Web

Registro de interacciones entre usuario y web en un archivo.

Signup and view all the flashcards

Arquitectura en Capas

Estructura de un sistema de análisis de Big Data.

Signup and view all the flashcards

Recolección de Datos

Obtención de datos que cumplen la ley y aportan valor.

Signup and view all the flashcards

Datos No Estructurados

Datos grandes y sin formato específico.

Signup and view all the flashcards

Fuentes de Datos Big Data

Redes sociales, logs, sensores, textos, audio o video.

Signup and view all the flashcards

Clientes Multibanco

Los clientes abren cuentas en varios bancos para obtener las mejores ofertas, reduciendo la información que cada banco tiene individualmente.

Signup and view all the flashcards

Fuentes de Datos Diversas

Los bancos buscan información de clientes en diversas fuentes (redes sociales, llamadas, etc.) para mejorar la toma de decisiones y personalizar ofertas.

Signup and view all the flashcards

Detección de Fraude Basada en Perfiles

Enfoque de detección de fraude que se basa en características generales de grupos, en lugar del análisis individual de cada transacción.

Signup and view all the flashcards

Análisis Individual de Transacciones

Analizar el comportamiento individual para detectar fraudes, aunque requiere mayor capacidad de procesamiento.

Signup and view all the flashcards

Big Data en Predicción de Fraude

El uso de Big Data permite construir modelos de predicción más complejos y precisos para la detección de fraudes.

Signup and view all the flashcards

Reducción de Riesgo con Big Data

Análisis de tendencias de mercado en tiempo real para reducir riesgos en decisiones financieras.

Signup and view all the flashcards

Análisis de Ficheros de Registro (Logs)

Procesamiento de registros para identificar rápidamente fallos y problemas en sistemas.

Signup and view all the flashcards

Conocimiento del Sistema con Big Data

Big Data permite a las empresas ganar mejores conocimientos de cómo funcionan sus sistemas, por ejemplo, gracias al procesamiento de ficheros de registro se puede determinar de forma rápida cuando y porqué ha fallado un sistema.

Signup and view all the flashcards

Análisis de fallos con Big Data

¿Qué ventaja ofrece Big Data en entornos financieros complejos?

Signup and view all the flashcards

¿Qué hace el análisis de registros?

Analiza ficheros de registro para identificar la causa de fallos en transacciones y componentes del sistema.

Signup and view all the flashcards

Streaming de ficheros de registro

Permite monitorizar en tiempo real la salud del sistema y prevenir cortes del servicio.

Signup and view all the flashcards

¿Qué es el análisis de sentimiento?

Es el proceso de extraer opiniones y actitudes de los clientes sobre un producto o servicio.

Signup and view all the flashcards

¿Qué revela el análisis de sentimiento?

Identificar qué les gusta, qué no les gusta y qué novedades desean.

Signup and view all the flashcards

¿Cómo mejorar el análisis de sentimiento?

Combinar análisis de sentimiento con estudios de promociones, precios y marketing para identificar causas.

Signup and view all the flashcards

Sensores y Big Data

Los sensores generan grandes volúmenes de datos que Big Data puede procesar en tiempo real para diversas aplicaciones.

Signup and view all the flashcards

¿Para qué se usan los sensores?

Captura y procesa datos de sensores para predecir eventos como terremotos y prevenir cortes de servicio.

Signup and view all the flashcards

Study Notes

Introducción a Big Data

  • Big Data permite agilizar procesos empresariales, ofreciendo nuevas ventajas competitivas.
  • Se necesita paralelizar los procesos de análisis para poder obtener los resultados lo más rápido posible debido a la naturaleza y la complejidad de los datos.
  • NoSQL y cloud han tomado interés en Big Data

Las Cinco V de Big Datq

  • El volumen de datos es tan grande que se necesita sistemas para los datos almacenados así como modelos de programación distribuídos con el fin de de procesarlos.

Tipología del Dato

  • Los datos tiene que soportan varías dimensiones, como la fecha en la que se escribe una etiqueta(hastag)

¿Qué es un Datawarehouse?

  • Permite mejorar el conocimiento y la inteligencia de generación del negocio.

Beneficios de un Datawarehouse (DWH)

  • El data warehouse tiene que que soportar las consulta, fecha, repetición de los tweets
  • Los sistemas deben ser capaces de construir la arquitectura de softward.
  • La información se centra en un marco de Hadoo.

MapReduce

  • Tras la fase MAP la clave del sistema es la de combinación y mezcla, el componente del que depende de sistema de funcion de que el componente del diagrama.
  • Un nodo másten tiene todos los aspectos de codificación de necesarios.

Herramientas del ecosistema Hadoop

  • Hive, Mahout, Oozie, Impala son tipos de herramientas las cuales facilitan las pruebas y la implementación

Hadoop...

  • Implementaciones como Hive, Impala permiten la flexibilidad de los elementos distribuidos.

Arquitecturas

  • Utilizar una guia de buenas prácticas al utilizar Hadoop.
  • Las herramientas de los datos analítcos depende a menudo de las herramientas BI.

Arquitectura de la Ingeniería

  • Los sistema de gestión de datos relaciones tiene la capacidad y tolerancia a falleos.

Amazon EMR (Elastic MapReduce)

  • Los servicios de Amazon son usados muy a menudo a la hora de escalar datos.

Técnicas

  • Metodologias como CRISPRDM se encargan de los siguientes pasos
  • Entendimiento del negocio, entender lo datos, preparación de datos, Modelamiento,Evaluación e Implementación

Análsis

  • Utilizar datos inalterados en los cuales existen diversos tipos de data.
  • Analisis debe estar predefinido para el algoritmo

Implementacíón de Caso de Uso (Análisis de Redes Sociales)

  • Los test de usabilidad no fueron dividió de forma exclusiva, por el echo que la experiencia que pueda presentar varias opiniñnes.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Curso Big Data v1 PDF

Description

Tema del Big DATA trabajados y elaborados

More Like This

The Big Data Basics Quiz
5 questions
Big Data and Statistics Concepts Quiz
16 questions
Introduction to Big Data
16 questions

Introduction to Big Data

EnthralledSard7619 avatar
EnthralledSard7619
CRM and Big Data Overview
77 questions

CRM and Big Data Overview

WorldFamousLogic8685 avatar
WorldFamousLogic8685
Use Quizgecko on...
Browser
Browser