Repaso para el examen de Inteligencia Artificial

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

¿Qué tipo de modelo es BERT?

LLM multimodales
LLM específicos
LLM de solo texto
LLM preentrenados (correct)

¿Qué es el modelo GPT en el contexto de los Transformers?

Un modelo que no utiliza corpus de texto
Un modelo que no realiza Fine Tuning
Un modelo desarrollado por Amazon
Un modelo desarrollado por OpenAI (correct)

¿Qué es el aprendizaje auto supervisado en los Transformers?

Un aprendizaje que no utiliza datos de entrada
Un aprendizaje sin supervisión (correct)
Un aprendizaje con supervisión externa
Un aprendizaje con etiquetas en los datos de entrada

¿Qué es el Output Embeddings en una red neuronal transformer?

Una capa que convierte las palabras en vectores (A) Signup and view all the answers

¿Qué es el Positional Encoding en una red neuronal transformer?

Una forma de codificar la posición de las palabras en una secuencia (A) Signup and view all the answers

¿Qué es el Fine Tuning en las redes neuronales?

Una técnica para ajustar finamente las capas de la red (B) Signup and view all the answers

¿Qué aspecto es fundamental en el desarrollo de los LLM?

Los datos (C) Signup and view all the answers

Si se discretiza por rango (binning) el atributo nota_final del dataset de estudiantes.csv en 8 porciones. ¿Cuál es el intervalo para el rango 7?

[12.5 - 15] (E) Signup and view all the answers

¿Cuáles de las afirmaciones son correctas con respecto a la discretización por rango (Binning)?

El rango del atributo es variable para mantener un equilibrio de frecuencia (B), El rango del atributo es igual en todas las secciones (C), Para la división por rango se considera cero y el valor máximo (D), La cantidad de k partes son iguales (A) Signup and view all the answers

La discretización se trata de:

Convertir un valor numérico en valores discretos (D) Signup and view all the answers

Las operaciones de transformación de atributos implican las operaciones de:

Discretización, numerización y normalización (E) Signup and view all the answers

Considerando el siguiente dataset. Si la partición es de 2 secciones (folds), ¿Qué caso de particionamiento (sampling type) se está utilizando?

linear sampling (A), stratified sampling (E) Signup and view all the answers

Se tiene 1000 registros en el dataset y se ha configurado la validación cruzada con 10 folds. ¿Cuál es la afirmación correcta?

Se particiona a 900 registros para entrenamiento y 100 para testeo. Esto se repite con diferentes registros otras ocho veces más. (C), Se particiona a 100 registros para entrenamiento y 900 para testeo. Esto se repite con diferentes registros otras nueve veces más. (F), Se particiona a 900 registros para entrenamiento y 100 para testeo. Esto se repite con diferentes registros otras nueve veces más. (B) Signup and view all the answers

La validación cruzada o cross-validation es una técnica utilizada para evaluar los resultados de la aplicación de un algoritmo y ______

garantizar que son independientes de la partición entre datos de entrenamiento y prueba (B) Signup and view all the answers

¿Qué afirmación es correcta con respecto al peso de los atributos?

Medir el peso de los atributos con respecto a su atributo de identificación, permite seleccionar los atributos más determinantes y así mejorar la predicción del modelo (A), Medir el peso de los atributos con respecto a su atributo etiqueta, permite seleccionar los atributos más determinantes y así mejorar la predicción del modelo (C) Signup and view all the answers

Algunos algoritmos, como _____________________ pueden dar lugar a minimizar funciones de coste altamente no convexas, pudiendo quedar los métodos utilizados para resolverlas en un óptimo local

Regresión logística (D), Redes neuronales (C) Signup and view all the answers

Las técnicas de ensamblado permiten combinar varios modelos para dar lugar a un _______

meta-algoritmo (B) Signup and view all the answers

Existen tres razones principales por las cuales combinar distintos modelos en un ensamblado. ¿Cuáles son?

Computacionales (C), Estadísticas (D), Representacionales (E) Signup and view all the answers

¿Qué representa la siguiente gráfica?

La aplicación de un algoritmo supervisado (D), La aplicación de un algoritmo no supervisado (B) Signup and view all the answers

La regresión lineal es:

Una técnica de análisis de datos que predice el valor de datos desconocidos mediante el uso de otro valor de datos relacionado y conocido (A) Signup and view all the answers

La metodología tradicional para proyectos de desarrollo en IA o DM es:

CRISP DM (C) Signup and view all the answers

La siguiente gráfica representa una regresión _______________

A. logistica correcta B. churuda C. cosenoidal D. lineal E. senoidal

lineal Signup and view all the answers

¿Cuál es el concepto que se apega a las actividades realizadas en la clase anterior?

La IA consiste en intentar que los ordenadores piensen y actúen como los humanos (D) Signup and view all the answers

¿Cuál es el valor de la métrica de precisión del modelo? (expresado con uso de decimales)

60% Signup and view all the answers

Un hiperplano representa una clasificación de ejemplos en dos espacios __________

Dimensionales (D) Signup and view all the answers

Cuál es la afirmación correcta con respecto a este dataset

Es un dataset que contiene columnas para aplicar algoritmos de tipo no-supervisado (D) Signup and view all the answers

¿El siguiente ejemplo es?

Regresión lineal (A) Signup and view all the answers

El aprendizaje __________ utiliza conjuntos de datos etiquetados

Supervisado (B) Signup and view all the answers

¿Cuál es la equivalencia formal de la lectura de uno de los nodos del árbol?

Si el Ambiente = lluvioso y Viento = No entonces Jugar = Si (B), Si el Ambiente = Nublado y Viento = No entonces Jugar = Si (D) Signup and view all the answers

Cuál es la fórmula para obtener el accuracy de un modelo?

CORRECTO Signup and view all the answers

Cuál es la regla adecuada para los siguientes esquema?

Si Astigmatismo = SI y Miopia <= 6 entonces Operar = SI (D) Signup and view all the answers

Considerando el siguiente dataset, y el modelo. Cuál es el valor de determinación de la clase QUEMADO=SI?

80% (A) Signup and view all the answers

Qué características son verdaderas con respecto a los árboles de decisión?

Es un modelo de predicción determinístico. (A), Por su forma jerárquica, permite visualizar la organización de los atributos. (B), Se construye a partir de la identificación sucesiva de los atributos más relevantes (D) Signup and view all the answers

Cuáles son las medidas de dispersión?

Varianza (A), Rango (E), Desviación estándar (H), Cuartiles (I), Rango Intercuartil (D) Signup and view all the answers

Cuál es el rango medio?

70 Signup and view all the answers

¿Cuál es la afirmación correcta sobre la diferencia entre K-medoids y K-means?

La diferencia es que, en K-medoids, cada cluster está representado por su centroide, mientras que en K-means cada cluster está representado por una observación presente en el cluster (medoid), que se corresponde con el promedio de todas las observaciones del cluster pero con ninguna en particular (B) Signup and view all the answers

¿Qué distancia entre dos puntos no es en línea recta?

Chebysev (A) Signup and view all the answers

¿Cuál no es un análisis de cluster?

Resultados de una consulta con SQL (B), Clasificación supervisada (E), Dividir a los estudiantes agrupados por sexo (F) Signup and view all the answers

La siguiente gráfica tiene índice silhouette con varios intentos de clusters. ¿Cuál es la afirmación correcta?

La configuración con K en 2 y 4 son las mejores opciones (D) Signup and view all the answers

A qué tipo de cluster pertenece la siguiente gráfica?

k-medoids (C) Signup and view all the answers

Qué defecto tiene el siguiente cluster?

El punto centroide no representa al cluster (A) Signup and view all the answers

Cuál es la afirmación correcta con respecto al SSE?

Un buen clustering con un K superior puede tener un SSE menor que un clustering pobre con un K más pequeño (A), Un buen clustering con un K más pequeño puede tener un SSE menor que un clustering pobre con un K superior (C) Signup and view all the answers

Cómo cataloga este clustering?

sub-óptimo (A) Signup and view all the answers

Cuál es la afirmación correcta con respecto al algoritmo k-means?

El algoritmo inicializa con K centroides generados aleatoriamente e iterativamente calcula la pertenencia de los patrones a cada grupo en base a la distancia al centroide. Luego, se ajusta el centroide moviéndolo a uno de los datos (B) Signup and view all the answers

A qué tipo de cluster pertenece una división de los objetos de dato en subconjuntos disjuntos (clusters) tal que cada objeto de datos está en exactamente un subconjunto?

Particional (A) Signup and view all the answers

Al modificar epsilon a 1 y minimal point a 1, la gráfica presenta una organización particular. ¿Qué parámetro hace falta modificar y a cuánto para que se formen uno o dos clusters más?

Modificar epsilon a 0.8 (F) Signup and view all the answers

Cuál es la afirmación correcta con respecto al análisis de cluster?

La agrupación no es adecuada pueden formarse otros grupos aunque hayan algunos puntos con ruido (C), La agrupación no es adecuada pueden formarse otros grupos (D) Signup and view all the answers

La medida más común para calcular la distancia de cada punto a su centroide es ____ para cada punto.

suma de errores al cuadrado (C) Signup and view all the answers

Dadas dos dimensiones, ¿qué técnica es más adecuada para clusterizar?

aglomerativo (D) Signup and view all the answers

El cálculo de pesos de la figura, ¿qué fórmula representa para su clasificación en el dataset?

Diametro * 7.60 + Color * -1.26 + 0.33 (C) Signup and view all the answers

Dado el dataset: Se desea construir un perceptrón que haga una predicción si la persona corre o no una competencia, considerando los atributos antes descritos. Si los pesos de cada atributo se establecen de la siguiente forma: (Dinero=0.5, Tiempo=1, Clima=1) Considerando que no se normalizaran los valores. Cuál sería el valor de neta para el caso de Juan?

12.5 Signup and view all the answers

Las Redes Neuronales Artificiales buscan emular el comportamiento _________

del cerebro humano (D) Signup and view all the answers

¿Qué nos indica la derivada de una función en un punto?

La pendiente de la función en ese punto (A) Signup and view all the answers

¿Qué parámetro adicional se necesita añadir al algoritmo para completarlo?

Ratio de aprendizaje (A) Signup and view all the answers

¿Qué tipo de estructura de capas se utiliza en la red neuronal mencionada en el video?

Dos capas ocultas y una capa de salida (E) Signup and view all the answers

¿Qué sucede si el ratio de aprendizaje es muy elevado en un algoritmo de optimización?

El punto es incapaz de converger en un mínimo costo (C) Signup and view all the answers

¿Cuántos puntos mínimos podemos encontrar en una función no convexa?

Múltiples puntos mínimos (C) Signup and view all the answers

Study Notes

Introducción a Inteligencia Artificial

La inteligencia artificial (IA) se refiere a la creación de máquinas análogas que imitan los procesos de inteligencia humana.
La IA consiste en intentar que los ordenadores piensen y actúen como los humanos.

Regresión Lineal

La regresión lineal es una técnica de análisis de datos que predice el valor de datos conocidos mediante el uso de técnicas de inteligencia artificial.
La regresión lineal utiliza un valor de datos relacionado y conocido para calcular el valor de datos desconocidos.

Aprendizaje Supervisado

El aprendizaje supervisado utiliza conjuntos de datos etiquetados para entrenar al modelo.
El aprendizaje supervisado permite que el modelo aprenda de los datos y mejore su precisión.

Medidas de Dispersión

Las medidas de dispersión incluyen:
- Varianza
- Desviación estándar
- Rango
- Cuartiles
- Rango intercuartílico

Medidas de Tendencia Central

Las medidas de tendencia central incluyen:
- Media
- Mediana
- Moda

Transformación de Datos

La transformación de datos implica operaciones como:
- Discretización de atributos numéricos
- Numerización de atributos nominales
- Normalización de atributos
- Eliminación de valores fuera de rango

Manejo de Valores Faltantes

Los valores faltantes se manejan mediante:
- Filtrar el registro o ejemplo
- Llenar el atributo manualmente
- Utilizar un valor especíco
- Utilizar la mediana o la media

Validación Cruzada

La validación cruzada es una técnica utilizada para evaluar los resultados de la aplicación de un algoritmo.
La validación cruzada implica dividir el conjunto de datos en folds y entrenar y probar el modelo en cada fold.

Ensamblado

El ensamblado permite combinar varios modelos para dar lugar a un modelo más preciso.
El ensamblado se utiliza para reducir la varianza y el bias.

Árbol de Decisión

Un árbol de decisión es un modelo de predicción determinístico.
Un árbol de decisión se construye a partir de la identificación sucesiva de los atributos más relevantes.### Árboles de Decisión
Un árbol de decisión tiene una profundidad de 20 niveles, si se aumentan todas las variables del dataset y no están en el árbol de decisión, el nivel de accuracy disminuye.
El árbol mejora si se elimina la variable raíz o si se reduce la máxima profundidad a 10.

Análisis de Cluster

Un buen análisis de cluster debe maximizar la distancia intracluster y minimizar la distancia intercluster.
El coeficiente de Silueta es una métrica para evaluar la calidad del agrupamiento obtenido con algoritmos de clustering.
El objetivo de Silueta es identificar cuál es el número óptimo de agrupamientos.

K-means y K-medoids

La diferencia entre K-means y K-medoids es que en K-means cada cluster está representado por su centroide, mientras que en K-medoids cada cluster está representado por una observación presente en el cluster (medoid).
El algoritmo K-means inicializa con K centroides generados aleatoriamente y calcula la pertenencia de los patrones a cada grupo en base a la distancia.

Distancia entre Puntos

La distancia entre dos puntos no es siempre una distancia en línea recta.
Existen diferentes tipos de distancia, como Euclidiana, Manhattan y Chebysev.

Tipos de Cluster

El tipo de cluster depende del algoritmo utilizado, como K-means, DBScan, Expectation-Maximization, K-medoids, entre otros.
Un buen clustering es aquel que tiene una baja suma de errores al cuadrado (SSE) y una buena separación entre clusters.

Análisis de Redes Neuronales

Las redes neuronales artificiales buscan emular el comportamiento del cerebro humano.
Un perceptrón es un tipo de red neuronal que hace una predicción basada en los atributos de entrada.
La entrada neta se describe por la fórmula: entrada neta = suma de las señales de entrada multiplicadas por los pesos.

Regresión Lineal

La estrategia básica para entrenar un modelo de regresión lineal es plantearlo de forma matemática y buscar una fórmula mediante el método de mínimos cuadrados.
La derivada de una función en un punto indica la pendiente de la función en ese punto.

Otros Conceptos

La normalización de datos es importante en análisis de cluster y redes neuronales para evitar que algunos atributos dominen sobre otros.
La matriz de confusión es una herramienta para evaluar la precisión de un modelo de machine learning.
La función de activación de una neurona puede ser sigmoide, ReLU, Tanh, entre otras.### Redes Neuronales
En una red neuronal, cada neurona puede representar un número entre 0 y 9.
La capa oculta es una parte fundamental en la arquitectura de una red neuronal.
La capa de entrada es responsable de recibir las entradas de la red neuronal.
La neurona más iluminada en la capa de salida de una red neuronal entrenada para reconocer dígitos representa el número que la imagen representa.

Bias y Activación

El BIAS en una neurona de una red neuronal representa el umbral de activación de la neurona.
La función de activación se utiliza para empujar la suma pesada en un rango entre 0 y 1.
La función sigmoid es comúnmente utilizada para empujar la suma pesada en un rango entre 0 y 1.

Perceptrón

Un perceptrón es una red neuronal que se utiliza para reconocer patrones complejos en imágenes.
La salida de un perceptrón se obtiene mediante la aplicación de la función de activación a la suma pesada de las entradas.
El valor de neta se obtiene mediante la aplicación de la función de activación a la suma pesada de las entradas.

Soporte y Confianza

El soporte en un conjunto de datos representa la frecuencia de aparición de un item en el conjunto de datos.
La confianza se obtiene mediante la aplicación de la fórmula conf({producto1}->{producto2}) = supp({producto1,producto2}) / supp({producto2}).
El soporte y la confianza se utilizan comúnmente en el algoritmo A-Priori para encontrar patrones frecuentes en un conjunto de datos.

Large Language Models (LLM)

Los LLM son modelos de lenguaje que se entrenan con enormes cantidades de datos.
Los LLM se utilizan comúnmente para generar texto, traducir idiomas y responder preguntas.
El tipo de red neuronal transformer es comúnmente utilizado en los LLM para aprender contexto y significado.

Redes Neuronales Transformer

Las redes neuronales transformer se utilizan comúnmente en los LLM para aprender contexto y significado.
El mecanismo de atención en una red neuronal transformer se utiliza para crear y dar fuerza a las relaciones entre palabras.
El embedding de palabras en una red neuronal transformer se utiliza para representar una palabra como un vector de números.

Fine Tuning

El fine tuning en los LLM es el proceso de adaptar un modelo preentrenado a una tarea específica utilizando un conjunto de datos más pequeño.
El fine tuning se utiliza comúnmente para mejorar el rendimiento de un modelo en una tarea específica.
El fine tuning es una técnica para ajustar finamente las capas de la red.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Description

Este cuestionario prueba tus conocimientos en inteligencia artificial, incluyendo algoritmos y técnicas de aprendizaje automático.

Repaso para el examen de Inteligencia Artificial

Choose a study mode

Podcast

Questions and Answers

¿Qué tipo de modelo es BERT?

¿Qué es el modelo GPT en el contexto de los Transformers?

¿Qué es el aprendizaje auto supervisado en los Transformers?

¿Qué es el Output Embeddings en una red neuronal transformer?

¿Qué es el Positional Encoding en una red neuronal transformer?

¿Qué es el Fine Tuning en las redes neuronales?

¿Qué aspecto es fundamental en el desarrollo de los LLM?

Si se discretiza por rango (binning) el atributo nota_final del dataset de estudiantes.csv en 8 porciones. ¿Cuál es el intervalo para el rango 7?

¿Cuáles de las afirmaciones son correctas con respecto a la discretización por rango (Binning)?

La discretización se trata de:

Las operaciones de transformación de atributos implican las operaciones de:

Considerando el siguiente dataset. Si la partición es de 2 secciones (folds), ¿Qué caso de particionamiento (sampling type) se está utilizando?

Se tiene 1000 registros en el dataset y se ha configurado la validación cruzada con 10 folds. ¿Cuál es la afirmación correcta?

La validación cruzada o cross-validation es una técnica utilizada para evaluar los resultados de la aplicación de un algoritmo y ______

¿Qué afirmación es correcta con respecto al peso de los atributos?

Algunos algoritmos, como _____________________ pueden dar lugar a minimizar funciones de coste altamente no convexas, pudiendo quedar los métodos utilizados para resolverlas en un óptimo local

Las técnicas de ensamblado permiten combinar varios modelos para dar lugar a un _______

Existen tres razones principales por las cuales combinar distintos modelos en un ensamblado. ¿Cuáles son?

¿Qué representa la siguiente gráfica?

La regresión lineal es:

La metodología tradicional para proyectos de desarrollo en IA o DM es:

La siguiente gráfica representa una regresión _______________ A. logistica correcta B. churuda C. cosenoidal D. lineal E. senoidal

¿Cuál es el concepto que se apega a las actividades realizadas en la clase anterior?

¿Cuál es el valor de la métrica de precisión del modelo? (expresado con uso de decimales)

Un hiperplano representa una clasificación de ejemplos en dos espacios __________

Cuál es la afirmación correcta con respecto a este dataset

¿El siguiente ejemplo es?

El aprendizaje __________ utiliza conjuntos de datos etiquetados

¿Cuál es la equivalencia formal de la lectura de uno de los nodos del árbol?

Cuál es la fórmula para obtener el accuracy de un modelo?

Cuál es la regla adecuada para los siguientes esquema?

Considerando el siguiente dataset, y el modelo. Cuál es el valor de determinación de la clase QUEMADO=SI?

Qué características son verdaderas con respecto a los árboles de decisión?

Cuáles son las medidas de dispersión?

Cuál es el rango medio?

¿Cuál es la afirmación correcta sobre la diferencia entre K-medoids y K-means?

¿Qué distancia entre dos puntos no es en línea recta?

¿Cuál no es un análisis de cluster?

La siguiente gráfica tiene índice silhouette con varios intentos de clusters. ¿Cuál es la afirmación correcta?

A qué tipo de cluster pertenece la siguiente gráfica?

Qué defecto tiene el siguiente cluster?

Cuál es la afirmación correcta con respecto al SSE?

Cómo cataloga este clustering?

Cuál es la afirmación correcta con respecto al algoritmo k-means?

A qué tipo de cluster pertenece una división de los objetos de dato en subconjuntos disjuntos (clusters) tal que cada objeto de datos está en exactamente un subconjunto?

Al modificar epsilon a 1 y minimal point a 1, la gráfica presenta una organización particular. ¿Qué parámetro hace falta modificar y a cuánto para que se formen uno o dos clusters más?

Cuál es la afirmación correcta con respecto al análisis de cluster?

La medida más común para calcular la distancia de cada punto a su centroide es ____ para cada punto.

Dadas dos dimensiones, ¿qué técnica es más adecuada para clusterizar?

El cálculo de pesos de la figura, ¿qué fórmula representa para su clasificación en el dataset?

Las Redes Neuronales Artificiales buscan emular el comportamiento _________

¿Qué nos indica la derivada de una función en un punto?

¿Qué parámetro adicional se necesita añadir al algoritmo para completarlo?

¿Qué tipo de estructura de capas se utiliza en la red neuronal mencionada en el video?

¿Qué sucede si el ratio de aprendizaje es muy elevado en un algoritmo de optimización?

¿Cuántos puntos mínimos podemos encontrar en una función no convexa?

Study Notes

Introducción a Inteligencia Artificial

Regresión Lineal

Aprendizaje Supervisado

Medidas de Dispersión

Medidas de Tendencia Central

Transformación de Datos

Manejo de Valores Faltantes

Validación Cruzada

Ensamblado

Árbol de Decisión

Análisis de Cluster

K-means y K-medoids

Distancia entre Puntos

Tipos de Cluster

Análisis de Redes Neuronales

Regresión Lineal

Otros Conceptos

Bias y Activación

Perceptrón

La siguiente gráfica representa una regresión _______________

A. logistica correcta B. churuda C. cosenoidal D. lineal E. senoidal