Repaso para el examen de Inteligencia Artificial
57 Questions
9 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

¿Qué tipo de modelo es BERT?

  • LLM multimodales
  • LLM específicos
  • LLM de solo texto
  • LLM preentrenados (correct)
  • ¿Qué es el modelo GPT en el contexto de los Transformers?

  • Un modelo que no utiliza corpus de texto
  • Un modelo que no realiza Fine Tuning
  • Un modelo desarrollado por Amazon
  • Un modelo desarrollado por OpenAI (correct)
  • ¿Qué es el aprendizaje auto supervisado en los Transformers?

  • Un aprendizaje que no utiliza datos de entrada
  • Un aprendizaje sin supervisión (correct)
  • Un aprendizaje con supervisión externa
  • Un aprendizaje con etiquetas en los datos de entrada
  • ¿Qué es el Output Embeddings en una red neuronal transformer?

    <p>Una capa que convierte las palabras en vectores</p> Signup and view all the answers

    ¿Qué es el Positional Encoding en una red neuronal transformer?

    <p>Una forma de codificar la posición de las palabras en una secuencia</p> Signup and view all the answers

    ¿Qué es el Fine Tuning en las redes neuronales?

    <p>Una técnica para ajustar finamente las capas de la red</p> Signup and view all the answers

    ¿Qué aspecto es fundamental en el desarrollo de los LLM?

    <p>Los datos</p> Signup and view all the answers

    Si se discretiza por rango (binning) el atributo nota_final del dataset de estudiantes.csv en 8 porciones. ¿Cuál es el intervalo para el rango 7?

    <p>[12.5 - 15]</p> Signup and view all the answers

    ¿Cuáles de las afirmaciones son correctas con respecto a la discretización por rango (Binning)?

    <p>El rango del atributo es variable para mantener un equilibrio de frecuencia</p> Signup and view all the answers

    La discretización se trata de:

    <p>Convertir un valor numérico en valores discretos</p> Signup and view all the answers

    Las operaciones de transformación de atributos implican las operaciones de:

    <p>Discretización, numerización y normalización</p> Signup and view all the answers

    Considerando el siguiente dataset. Si la partición es de 2 secciones (folds), ¿Qué caso de particionamiento (sampling type) se está utilizando?

    <p>linear sampling</p> Signup and view all the answers

    Se tiene 1000 registros en el dataset y se ha configurado la validación cruzada con 10 folds. ¿Cuál es la afirmación correcta?

    <p>Se particiona a 900 registros para entrenamiento y 100 para testeo. Esto se repite con diferentes registros otras ocho veces más.</p> Signup and view all the answers

    La validación cruzada o cross-validation es una técnica utilizada para evaluar los resultados de la aplicación de un algoritmo y ______

    <p>garantizar que son independientes de la partición entre datos de entrenamiento y prueba</p> Signup and view all the answers

    ¿Qué afirmación es correcta con respecto al peso de los atributos?

    <p>Medir el peso de los atributos con respecto a su atributo de identificación, permite seleccionar los atributos más determinantes y así mejorar la predicción del modelo</p> Signup and view all the answers

    Algunos algoritmos, como _____________________ pueden dar lugar a minimizar funciones de coste altamente no convexas, pudiendo quedar los métodos utilizados para resolverlas en un óptimo local

    <p>Regresión logística</p> Signup and view all the answers

    Las técnicas de ensamblado permiten combinar varios modelos para dar lugar a un _______

    <p>meta-algoritmo</p> Signup and view all the answers

    Existen tres razones principales por las cuales combinar distintos modelos en un ensamblado. ¿Cuáles son?

    <p>Computacionales</p> Signup and view all the answers

    ¿Qué representa la siguiente gráfica?

    <p>La aplicación de un algoritmo supervisado</p> Signup and view all the answers

    La regresión lineal es:

    <p>Una técnica de análisis de datos que predice el valor de datos desconocidos mediante el uso de otro valor de datos relacionado y conocido</p> Signup and view all the answers

    La metodología tradicional para proyectos de desarrollo en IA o DM es:

    <p>CRISP DM</p> Signup and view all the answers

    La siguiente gráfica representa una regresión _______________

    A. logistica correcta B. churuda C. cosenoidal D. lineal E. senoidal

    <p>lineal</p> Signup and view all the answers

    ¿Cuál es el concepto que se apega a las actividades realizadas en la clase anterior?

    <p>La IA consiste en intentar que los ordenadores piensen y actúen como los humanos</p> Signup and view all the answers

    ¿Cuál es el valor de la métrica de precisión del modelo? (expresado con uso de decimales)

    <p>60%</p> Signup and view all the answers

    Un hiperplano representa una clasificación de ejemplos en dos espacios __________

    <p>Dimensionales</p> Signup and view all the answers

    Cuál es la afirmación correcta con respecto a este dataset

    <p>Es un dataset que contiene columnas para aplicar algoritmos de tipo no-supervisado</p> Signup and view all the answers

    ¿El siguiente ejemplo es?

    <p>Regresión lineal</p> Signup and view all the answers

    El aprendizaje __________ utiliza conjuntos de datos etiquetados

    <p>Supervisado</p> Signup and view all the answers

    ¿Cuál es la equivalencia formal de la lectura de uno de los nodos del árbol?

    <p>Si el Ambiente = lluvioso y Viento = No entonces Jugar = Si</p> Signup and view all the answers

    Cuál es la fórmula para obtener el accuracy de un modelo?

    <p>CORRECTO</p> Signup and view all the answers

    Cuál es la regla adecuada para los siguientes esquema?

    <p>Si Astigmatismo = SI y Miopia &lt;= 6 entonces Operar = SI</p> Signup and view all the answers

    Considerando el siguiente dataset, y el modelo. Cuál es el valor de determinación de la clase QUEMADO=SI?

    <p>80%</p> Signup and view all the answers

    Qué características son verdaderas con respecto a los árboles de decisión?

    <p>Es un modelo de predicción determinístico.</p> Signup and view all the answers

    Cuáles son las medidas de dispersión?

    <p>Varianza</p> Signup and view all the answers

    Cuál es el rango medio?

    <p>70</p> Signup and view all the answers

    ¿Cuál es la afirmación correcta sobre la diferencia entre K-medoids y K-means?

    <p>La diferencia es que, en K-medoids, cada cluster está representado por su centroide, mientras que en K-means cada cluster está representado por una observación presente en el cluster (medoid), que se corresponde con el promedio de todas las observaciones del cluster pero con ninguna en particular</p> Signup and view all the answers

    ¿Qué distancia entre dos puntos no es en línea recta?

    <p>Chebysev</p> Signup and view all the answers

    ¿Cuál no es un análisis de cluster?

    <p>Resultados de una consulta con SQL</p> Signup and view all the answers

    La siguiente gráfica tiene índice silhouette con varios intentos de clusters. ¿Cuál es la afirmación correcta?

    <p>La configuración con K en 2 y 4 son las mejores opciones</p> Signup and view all the answers

    A qué tipo de cluster pertenece la siguiente gráfica?

    <p>k-medoids</p> Signup and view all the answers

    Qué defecto tiene el siguiente cluster?

    <p>El punto centroide no representa al cluster</p> Signup and view all the answers

    Cuál es la afirmación correcta con respecto al SSE?

    <p>Un buen clustering con un K superior puede tener un SSE menor que un clustering pobre con un K más pequeño</p> Signup and view all the answers

    Cómo cataloga este clustering?

    <p>sub-óptimo</p> Signup and view all the answers

    Cuál es la afirmación correcta con respecto al algoritmo k-means?

    <p>El algoritmo inicializa con K centroides generados aleatoriamente e iterativamente calcula la pertenencia de los patrones a cada grupo en base a la distancia al centroide. Luego, se ajusta el centroide moviéndolo a uno de los datos</p> Signup and view all the answers

    A qué tipo de cluster pertenece una división de los objetos de dato en subconjuntos disjuntos (clusters) tal que cada objeto de datos está en exactamente un subconjunto?

    <p>Particional</p> Signup and view all the answers

    Al modificar epsilon a 1 y minimal point a 1, la gráfica presenta una organización particular. ¿Qué parámetro hace falta modificar y a cuánto para que se formen uno o dos clusters más?

    <p>Modificar epsilon a 0.8</p> Signup and view all the answers

    Cuál es la afirmación correcta con respecto al análisis de cluster?

    <p>La agrupación no es adecuada pueden formarse otros grupos aunque hayan algunos puntos con ruido</p> Signup and view all the answers

    La medida más común para calcular la distancia de cada punto a su centroide es ____ para cada punto.

    <p>suma de errores al cuadrado</p> Signup and view all the answers

    Dadas dos dimensiones, ¿qué técnica es más adecuada para clusterizar?

    <p>aglomerativo</p> Signup and view all the answers

    El cálculo de pesos de la figura, ¿qué fórmula representa para su clasificación en el dataset?

    <p>Diametro * 7.60 + Color * -1.26 + 0.33</p> Signup and view all the answers

    Dado el dataset: Se desea construir un perceptrón que haga una predicción si la persona corre o no una competencia, considerando los atributos antes descritos. Si los pesos de cada atributo se establecen de la siguiente forma: (Dinero=0.5, Tiempo=1, Clima=1) Considerando que no se normalizaran los valores. Cuál sería el valor de neta para el caso de Juan?

    <p>12.5</p> Signup and view all the answers

    Las Redes Neuronales Artificiales buscan emular el comportamiento _________

    <p>del cerebro humano</p> Signup and view all the answers

    ¿Qué nos indica la derivada de una función en un punto?

    <p>La pendiente de la función en ese punto</p> Signup and view all the answers

    ¿Qué parámetro adicional se necesita añadir al algoritmo para completarlo?

    <p>Ratio de aprendizaje</p> Signup and view all the answers

    ¿Qué tipo de estructura de capas se utiliza en la red neuronal mencionada en el video?

    <p>Dos capas ocultas y una capa de salida</p> Signup and view all the answers

    ¿Qué sucede si el ratio de aprendizaje es muy elevado en un algoritmo de optimización?

    <p>El punto es incapaz de converger en un mínimo costo</p> Signup and view all the answers

    ¿Cuántos puntos mínimos podemos encontrar en una función no convexa?

    <p>Múltiples puntos mínimos</p> Signup and view all the answers

    Study Notes

    Introducción a Inteligencia Artificial

    • La inteligencia artificial (IA) se refiere a la creación de máquinas análogas que imitan los procesos de inteligencia humana.
    • La IA consiste en intentar que los ordenadores piensen y actúen como los humanos.

    Regresión Lineal

    • La regresión lineal es una técnica de análisis de datos que predice el valor de datos conocidos mediante el uso de técnicas de inteligencia artificial.
    • La regresión lineal utiliza un valor de datos relacionado y conocido para calcular el valor de datos desconocidos.

    Aprendizaje Supervisado

    • El aprendizaje supervisado utiliza conjuntos de datos etiquetados para entrenar al modelo.
    • El aprendizaje supervisado permite que el modelo aprenda de los datos y mejore su precisión.

    Medidas de Dispersión

    • Las medidas de dispersión incluyen:
      • Varianza
      • Desviación estándar
      • Rango
      • Cuartiles
      • Rango intercuartílico

    Medidas de Tendencia Central

    • Las medidas de tendencia central incluyen:
      • Media
      • Mediana
      • Moda

    Transformación de Datos

    • La transformación de datos implica operaciones como:
      • Discretización de atributos numéricos
      • Numerización de atributos nominales
      • Normalización de atributos
      • Eliminación de valores fuera de rango

    Manejo de Valores Faltantes

    • Los valores faltantes se manejan mediante:
      • Filtrar el registro o ejemplo
      • Llenar el atributo manualmente
      • Utilizar un valor especíco
      • Utilizar la mediana o la media

    Validación Cruzada

    • La validación cruzada es una técnica utilizada para evaluar los resultados de la aplicación de un algoritmo.
    • La validación cruzada implica dividir el conjunto de datos en folds y entrenar y probar el modelo en cada fold.

    Ensamblado

    • El ensamblado permite combinar varios modelos para dar lugar a un modelo más preciso.
    • El ensamblado se utiliza para reducir la varianza y el bias.

    Árbol de Decisión

    • Un árbol de decisión es un modelo de predicción determinístico.
    • Un árbol de decisión se construye a partir de la identificación sucesiva de los atributos más relevantes.### Árboles de Decisión
    • Un árbol de decisión tiene una profundidad de 20 niveles, si se aumentan todas las variables del dataset y no están en el árbol de decisión, el nivel de accuracy disminuye.
    • El árbol mejora si se elimina la variable raíz o si se reduce la máxima profundidad a 10.

    Análisis de Cluster

    • Un buen análisis de cluster debe maximizar la distancia intracluster y minimizar la distancia intercluster.
    • El coeficiente de Silueta es una métrica para evaluar la calidad del agrupamiento obtenido con algoritmos de clustering.
    • El objetivo de Silueta es identificar cuál es el número óptimo de agrupamientos.

    K-means y K-medoids

    • La diferencia entre K-means y K-medoids es que en K-means cada cluster está representado por su centroide, mientras que en K-medoids cada cluster está representado por una observación presente en el cluster (medoid).
    • El algoritmo K-means inicializa con K centroides generados aleatoriamente y calcula la pertenencia de los patrones a cada grupo en base a la distancia.

    Distancia entre Puntos

    • La distancia entre dos puntos no es siempre una distancia en línea recta.
    • Existen diferentes tipos de distancia, como Euclidiana, Manhattan y Chebysev.

    Tipos de Cluster

    • El tipo de cluster depende del algoritmo utilizado, como K-means, DBScan, Expectation-Maximization, K-medoids, entre otros.
    • Un buen clustering es aquel que tiene una baja suma de errores al cuadrado (SSE) y una buena separación entre clusters.

    Análisis de Redes Neuronales

    • Las redes neuronales artificiales buscan emular el comportamiento del cerebro humano.
    • Un perceptrón es un tipo de red neuronal que hace una predicción basada en los atributos de entrada.
    • La entrada neta se describe por la fórmula: entrada neta = suma de las señales de entrada multiplicadas por los pesos.

    Regresión Lineal

    • La estrategia básica para entrenar un modelo de regresión lineal es plantearlo de forma matemática y buscar una fórmula mediante el método de mínimos cuadrados.
    • La derivada de una función en un punto indica la pendiente de la función en ese punto.

    Otros Conceptos

    • La normalización de datos es importante en análisis de cluster y redes neuronales para evitar que algunos atributos dominen sobre otros.
    • La matriz de confusión es una herramienta para evaluar la precisión de un modelo de machine learning.
    • La función de activación de una neurona puede ser sigmoide, ReLU, Tanh, entre otras.### Redes Neuronales
    • En una red neuronal, cada neurona puede representar un número entre 0 y 9.
    • La capa oculta es una parte fundamental en la arquitectura de una red neuronal.
    • La capa de entrada es responsable de recibir las entradas de la red neuronal.
    • La neurona más iluminada en la capa de salida de una red neuronal entrenada para reconocer dígitos representa el número que la imagen representa.

    Bias y Activación

    • El BIAS en una neurona de una red neuronal representa el umbral de activación de la neurona.
    • La función de activación se utiliza para empujar la suma pesada en un rango entre 0 y 1.
    • La función sigmoid es comúnmente utilizada para empujar la suma pesada en un rango entre 0 y 1.

    Perceptrón

    • Un perceptrón es una red neuronal que se utiliza para reconocer patrones complejos en imágenes.
    • La salida de un perceptrón se obtiene mediante la aplicación de la función de activación a la suma pesada de las entradas.
    • El valor de neta se obtiene mediante la aplicación de la función de activación a la suma pesada de las entradas.

    Soporte y Confianza

    • El soporte en un conjunto de datos representa la frecuencia de aparición de un item en el conjunto de datos.
    • La confianza se obtiene mediante la aplicación de la fórmula conf({producto1}->{producto2}) = supp({producto1,producto2}) / supp({producto2}).
    • El soporte y la confianza se utilizan comúnmente en el algoritmo A-Priori para encontrar patrones frecuentes en un conjunto de datos.

    Large Language Models (LLM)

    • Los LLM son modelos de lenguaje que se entrenan con enormes cantidades de datos.
    • Los LLM se utilizan comúnmente para generar texto, traducir idiomas y responder preguntas.
    • El tipo de red neuronal transformer es comúnmente utilizado en los LLM para aprender contexto y significado.

    Redes Neuronales Transformer

    • Las redes neuronales transformer se utilizan comúnmente en los LLM para aprender contexto y significado.
    • El mecanismo de atención en una red neuronal transformer se utiliza para crear y dar fuerza a las relaciones entre palabras.
    • El embedding de palabras en una red neuronal transformer se utiliza para representar una palabra como un vector de números.

    Fine Tuning

    • El fine tuning en los LLM es el proceso de adaptar un modelo preentrenado a una tarea específica utilizando un conjunto de datos más pequeño.
    • El fine tuning se utiliza comúnmente para mejorar el rendimiento de un modelo en una tarea específica.
    • El fine tuning es una técnica para ajustar finamente las capas de la red.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Repaso para el examen de IA.pdf

    Description

    Este cuestionario prueba tus conocimientos en inteligencia artificial, incluyendo algoritmos y técnicas de aprendizaje automático.

    More Like This

    Use Quizgecko on...
    Browser
    Browser