Reglas de Asociación en Minería de Datos
48 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

¿Cuál es el soporte de la transacción t1 = {p1, p2}?

  • 0.4
  • 0.5
  • 0.2
  • 0.6 (correct)
  • ¿Cuál de los siguientes subconjuntos tuvo una frecuencia de 4 y no se poda?

  • {cubreboca, gel antibacterial, guantes}
  • {algodón, cubreboca, Gel antibacterial}
  • {alcohol, cubreboca}
  • {cubreboca, Gel antibacterial} (correct)
  • La confianza de la transacción t2 = {p2, p3} es igual a 0.33.

    True

    El soporte el conjunto {alcohol, cubreboca, Gel antibacterial} es igual a 4.

    <p>False</p> Signup and view all the answers

    ¿Qué condiciones deben satisfacer las reglas de asociación fuertes?

    <p>soporte mínimo y confianza mínima</p> Signup and view all the answers

    ¿Qué representa una confianza del 60% en t1?

    <p>El 60% de los clientes que compraron el ítem p1 también compraron el ítem p2.</p> Signup and view all the answers

    ¿Qué método busca descubrir asociaciones entre los atributos en minería de datos?

    <p>Análisis de la canasta de mercado</p> Signup and view all the answers

    El soporte de la transacción t3 = {p3, p4} es __________.

    <p>0.0</p> Signup and view all the answers

    La confianza (A  B) se calcula como P(B|A) = support_count(A ⋂ B) / ________.

    <p>support_count(A)</p> Signup and view all the answers

    El soporte es el cociente resultante de la división de A/n.

    <p>False</p> Signup and view all the answers

    Relaciona cada subconjunto con su frecuencia correspondiente:

    <p>{alcohol, cubreboca} = 4 {cubreboca, Gel antibacterial} = 4 {gel antibacterial, guantes} = 1 {algodón, cubreboca} = 2</p> Signup and view all the answers

    Empareja cada transacción con su respectivo soporte:

    <p>t1 = 0.6 t2 = 0.2 t3 = 0.0</p> Signup and view all the answers

    ¿Cuál de las siguientes afirmaciones es correcta sobre el soporte?

    <p>El soporte se calcula como la cantidad de veces que aparece un ítem en las transacciones.</p> Signup and view all the answers

    ¿Cuál es la principal finalidad de las reglas de asociación en minería de datos?

    <p>Cuantificar la relación entre dos o más atributos.</p> Signup and view all the answers

    ¿Qué subconjunto se poda?

    <p>{cubreboca, gel antibacterial, guantes}</p> Signup and view all the answers

    El __________ es el conjunto de todos los ítems que se analizan en minería de datos.

    <p>conjunto propio</p> Signup and view all the answers

    El soporte es una medida que solo se utiliza para ítems individuales.

    <p>False</p> Signup and view all the answers

    El soporte de {algodón, Gel antibacterial} es 2.

    <p>True</p> Signup and view all the answers

    ¿Qué valor de soporte está asociado a la transacción t2 = {p2, p3}?

    <p>0.2</p> Signup and view all the answers

    ¿Cuál es el mínimo soporte definido en el análisis?

    <p>2</p> Signup and view all the answers

    Relaciona los conceptos de minería de datos con su significado:

    <p>Algoritmo a priori = Genera reglas de asociación considerando la relación entre elementos Soporte = Cociente de la división de B/n Confianza = Probabilidad de que A implique B Reglas de asociación = Descripción de la relación entre atributos</p> Signup and view all the answers

    ¿Cuál de las siguientes afirmaciones describe mejor el análisis de afinidad?

    <p>Análisis de patrones que se presentan juntos.</p> Signup and view all the answers

    ¿Cómo se llama el algoritmo básico para encontrar conjuntos de elementos frecuentes?

    <p>Algoritmo A priori</p> Signup and view all the answers

    Las reglas de asociación se generan en un solo proceso.

    <p>False</p> Signup and view all the answers

    Las reglas de asociación se expresan en la forma 'Si A entonces B'.

    <p>True</p> Signup and view all the answers

    ¿Qué condición debe cumplir un conjunto de elementos para ser considerado fuerte?

    <p>Satisfacer un umbral de soporte mínimo y un umbral de confianza mínima.</p> Signup and view all the answers

    ¿Qué se entiende por 'análisis de canasta de mercado' en minería de datos?

    <p>Método para descubrir asociaciones entre ítems en las transacciones.</p> Signup and view all the answers

    ¿Qué significa el apoyo en el contexto de la minería de datos?

    <p>La proporción de transacciones donde ocurre un elemento</p> Signup and view all the answers

    El paso de ______ se utiliza para generar un conjunto candidato de k-itemsets.

    <p>join</p> Signup and view all the answers

    Asocia cada término con su definición:

    <p>min_sup = Umbral mínimo de soporte min_conf = Umbral mínimo de confianza itemset = Conjunto de elementos que pueden ser frecuentes k-itemset = Itemset que contiene k ítems</p> Signup and view all the answers

    La confianza se calcula como el número de transacciones que contienen ambos elementos dividido por el número de transacciones que contienen solo el primer elemento.

    <p>True</p> Signup and view all the answers

    ¿Cuál es la propiedad a priori del algoritmo A priori?

    <p>Si un conjunto de elementos no es frecuente, ningún superconjunto de este será frecuente.</p> Signup and view all the answers

    Menciona uno de los conjuntos de elementos frecuentes finales.

    <p>alcohol, cubreboca, Gel antibacterial</p> Signup and view all the answers

    La regla {algodón, cubreboca} implica que _________.

    <p>Gel antibacterial</p> Signup and view all the answers

    El paso de poda asegura que todos los k-itemsets en Ck son frecuentes.

    <p>False</p> Signup and view all the answers

    Empareja las reglas con su respectiva confianza:

    <p>{cubreboca, Gel antibacterial} ⇒ algodón = 50% {algodón, Gel antibacterial} ⇒ cubreboca = 100% {algodón, cubreboca} ⇒ Gel antibacterial = 100% Gel antibacterial ⇒ {algodón, cubreboca} = 33%</p> Signup and view all the answers

    ¿Qué se utiliza para crear el conjunto de elementos Lk?

    <p>Lk-1</p> Signup and view all the answers

    ¿Cuál es el umbral mínimo de confianza mencionado en el contenido?

    <p>50%</p> Signup and view all the answers

    ¿Qué regla se queda con una confianza del 100%?

    <p>{algodón, Gel antibacterial} ⇒ cubreboca</p> Signup and view all the answers

    Todos los elementos frecuentes tienen la misma confianza en las reglas generadas.

    <p>False</p> Signup and view all the answers

    ¿Las reglas de asociación son un tipo de aprendizaje supervisado o no supervisado?

    <p>Ambos tipos</p> Signup and view all the answers

    Las variables objetivo están siempre presentes en el aprendizaje no supervisado.

    <p>False</p> Signup and view all the answers

    Menciona un ejemplo de minería de datos sin supervisión.

    <p>Agrupamiento (cluster)</p> Signup and view all the answers

    En el análisis de la canasta de la compra, se estudia qué artículos se ______ juntos.

    <p>compran</p> Signup and view all the answers

    ¿Qué papel puede desempeñar una variable específica en un conjunto de datos estructurado?

    <p>Puede ser antecedente o consecuente</p> Signup and view all the answers

    Las reglas de asociación solo son útiles para clasificar preferencias de voto en datos demográficos.

    <p>False</p> Signup and view all the answers

    ¿Qué representan las posibles antecedentes en un conjunto de datos sobre preferencias de voto?

    <p>Información demográfica</p> Signup and view all the answers

    Asocia cada término con su descripción correcta:

    <p>Aprendizaje supervisado = Identificación de variable objetivo Aprendizaje no supervisado = Búsqueda de patrones sin variable objetivo Agrupamiento = Método de minería sin supervisión Reglas de asociación = Usadas en análisis de la canasta de compras</p> Signup and view all the answers

    Study Notes

    Reglas de Asociación en Minería de Datos

    • Análisis de afinidad: El análisis de afinidad identifica características o elementos que "van juntos". Se utiliza para descubrir asociaciones entre atributos en conjuntos de datos. Estos métodos son conocidos como análisis de la canasta de mercado.

    • Reglas de asociación: Las reglas de asociación expresan relaciones entre dos o más atributos (variables) a través de la siguiente forma: "Si antecedente, entonces consecuente", considerando medidas de soporte y confianza.

    • Soporte (support): Representa el porcentaje de transacciones que contienen un conjunto específico de elementos (itemset). Es una medida de la frecuencia de ocurrencia de un itemset.

    • Confianza (confidence): Indica el porcentaje de transacciones que contienen un determinado itemset posterior (consecuente) dado que ya contienen el itemset anterior, una medida de la probabilidad condicionada.

    Algoritmos de Minería de Datos

    • Algoritmo Apriori: Un algoritmo fundamental en minería de datos usado para descubrir reglas de asociación. El algoritmo Apriori considera la relación entre los elementos para generar reglas, reduciendo el espacio de análisis a un tamaño manejable.

    • Soporte o Apoyo (Support): Conjunto de todos los ítems que se analizan. Ejemplo: Suponga que existe una regla que relaciona dos ítems (A, B), A→B. El soporte sería el cociente del número de transacciones que contienen los ítems A y B sobre el número total de transacciones consideradas.

    • Confianza (Confidence): Es el cociente del resultado de dividir B/A. Conjunto de ítems del conjunto I en una transacción. Ejemplo: Suponga que hay 1000 transacciones, 200 de las notas compraron pañales, y de las 200, 50 además compraron cerveza. Soporte: 50/1000 = 5%, Confianza = 50/200 = 25%.

    • Conjunto de Ítems (Itemset): Conjunto de ítems en una transacción. Conjunto de ítems k (k-itemset): Conjunto que contiene k elementos. Ejemplo: El conjunto de ítems {A, B, C} es un 3-itemset.

    • Frecuencia del Conjunto de Ítems (Itemset frequency): El número de transacciones que contienen un itemset específico en un conjunto de datos en particular.

    • Conjunto de elementos frecuentes (Frequent itemset): Itemset que ocurre un determinado número de veces en el dataset.

    • Reglas fuertes (Strong rules) / Reglas estrictas : Son las que cumplen o superan ciertos criterios mínimos de soporte o apoyo y confianza definidos.

    Representación de Datos

    • Formato de datos transaccionales: Dos campos: Número de transacción, y el valor (el artículo).

    • Formato de datos tabular: Cada registro representa una transacción. Usa 1 ó 0 para indicar si un artículo está o no en la transacción.

    PASO 1, 2 y 3 de la Minería de Datos

    • Generación de Conjuntos de Elementos Frecuentes (PASO 1): Se generan conjuntos de elementos (ítems) frecuentes a partir de un umbral mínimo de soporte.
    • Generación de Reglas de Asociación Fuertes (PASO 2): A partir de los conjuntos frecuentes, se generan las reglas de asociación que cumplen con un umbral mínimo de confianza.
    • Evaluación de Reglas (PASO 3): Se evalúan las reglas desarrolladas para determinar su utilidad y significado, considerando el contexto de los datos explorados. Una métrica clave a considerar es el lift, que mide la utilidad relativa de una regla.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Description

    Este cuestionario explora las reglas de asociación en minería de datos, centrándose en el análisis de afinidad y los algoritmos relevantes. Aprenderás sobre conceptos clave como soporte y confianza, y cómo se aplican en la identificación de patrones en conjuntos de datos. Ideal para estudiantes y profesionales interesados en la minería de datos.

    More Like This

    Use Quizgecko on...
    Browser
    Browser