Podcast
Questions and Answers
¿Qué tipo de modelo es BERT?
¿Qué tipo de modelo es BERT?
- LLM multimodales
- LLM específicos
- LLM de solo texto
- LLM preentrenados (correct)
¿Qué es el modelo GPT en el contexto de los Transformers?
¿Qué es el modelo GPT en el contexto de los Transformers?
- Un modelo que no utiliza corpus de texto
- Un modelo que no realiza Fine Tuning
- Un modelo desarrollado por Amazon
- Un modelo desarrollado por OpenAI (correct)
¿Qué es el aprendizaje auto supervisado en los Transformers?
¿Qué es el aprendizaje auto supervisado en los Transformers?
- Un aprendizaje que no utiliza datos de entrada
- Un aprendizaje sin supervisión (correct)
- Un aprendizaje con supervisión externa
- Un aprendizaje con etiquetas en los datos de entrada
¿Qué es el Output Embeddings en una red neuronal transformer?
¿Qué es el Output Embeddings en una red neuronal transformer?
¿Qué es el Positional Encoding en una red neuronal transformer?
¿Qué es el Positional Encoding en una red neuronal transformer?
¿Qué es el Fine Tuning en las redes neuronales?
¿Qué es el Fine Tuning en las redes neuronales?
¿Qué aspecto es fundamental en el desarrollo de los LLM?
¿Qué aspecto es fundamental en el desarrollo de los LLM?
Si se discretiza por rango (binning) el atributo nota_final del dataset de estudiantes.csv en 8 porciones. ¿Cuál es el intervalo para el rango 7?
Si se discretiza por rango (binning) el atributo nota_final del dataset de estudiantes.csv en 8 porciones. ¿Cuál es el intervalo para el rango 7?
¿Cuáles de las afirmaciones son correctas con respecto a la discretización por rango (Binning)?
¿Cuáles de las afirmaciones son correctas con respecto a la discretización por rango (Binning)?
La discretización se trata de:
La discretización se trata de:
Las operaciones de transformación de atributos implican las operaciones de:
Las operaciones de transformación de atributos implican las operaciones de:
Considerando el siguiente dataset. Si la partición es de 2 secciones (folds), ¿Qué caso de particionamiento (sampling type) se está utilizando?
Considerando el siguiente dataset. Si la partición es de 2 secciones (folds), ¿Qué caso de particionamiento (sampling type) se está utilizando?
Se tiene 1000 registros en el dataset y se ha configurado la validación cruzada con 10 folds. ¿Cuál es la afirmación correcta?
Se tiene 1000 registros en el dataset y se ha configurado la validación cruzada con 10 folds. ¿Cuál es la afirmación correcta?
La validación cruzada o cross-validation es una técnica utilizada para evaluar los resultados de la aplicación de un algoritmo y ______
La validación cruzada o cross-validation es una técnica utilizada para evaluar los resultados de la aplicación de un algoritmo y ______
¿Qué afirmación es correcta con respecto al peso de los atributos?
¿Qué afirmación es correcta con respecto al peso de los atributos?
Algunos algoritmos, como _____________________ pueden dar lugar a minimizar funciones de coste altamente no convexas, pudiendo quedar los métodos utilizados para resolverlas en un óptimo local
Algunos algoritmos, como _____________________ pueden dar lugar a minimizar funciones de coste altamente no convexas, pudiendo quedar los métodos utilizados para resolverlas en un óptimo local
Las técnicas de ensamblado permiten combinar varios modelos para dar lugar a un _______
Las técnicas de ensamblado permiten combinar varios modelos para dar lugar a un _______
Existen tres razones principales por las cuales combinar distintos modelos en un ensamblado. ¿Cuáles son?
Existen tres razones principales por las cuales combinar distintos modelos en un ensamblado. ¿Cuáles son?
¿Qué representa la siguiente gráfica?
¿Qué representa la siguiente gráfica?
La regresión lineal es:
La regresión lineal es:
La metodología tradicional para proyectos de desarrollo en IA o DM es:
La metodología tradicional para proyectos de desarrollo en IA o DM es:
La siguiente gráfica representa una regresión _______________
A. logistica correcta
B. churuda
C. cosenoidal
D. lineal
E. senoidal
La siguiente gráfica representa una regresión _______________
A. logistica correcta B. churuda C. cosenoidal D. lineal E. senoidal
¿Cuál es el concepto que se apega a las actividades realizadas en la clase anterior?
¿Cuál es el concepto que se apega a las actividades realizadas en la clase anterior?
¿Cuál es el valor de la métrica de precisión del modelo? (expresado con uso de decimales)
¿Cuál es el valor de la métrica de precisión del modelo? (expresado con uso de decimales)
Un hiperplano representa una clasificación de ejemplos en dos espacios __________
Un hiperplano representa una clasificación de ejemplos en dos espacios __________
Cuál es la afirmación correcta con respecto a este dataset
Cuál es la afirmación correcta con respecto a este dataset
¿El siguiente ejemplo es?
¿El siguiente ejemplo es?
El aprendizaje __________ utiliza conjuntos de datos etiquetados
El aprendizaje __________ utiliza conjuntos de datos etiquetados
¿Cuál es la equivalencia formal de la lectura de uno de los nodos del árbol?
¿Cuál es la equivalencia formal de la lectura de uno de los nodos del árbol?
Cuál es la fórmula para obtener el accuracy de un modelo?
Cuál es la fórmula para obtener el accuracy de un modelo?
Cuál es la regla adecuada para los siguientes esquema?
Cuál es la regla adecuada para los siguientes esquema?
Considerando el siguiente dataset, y el modelo. Cuál es el valor de determinación de la clase QUEMADO=SI?
Considerando el siguiente dataset, y el modelo. Cuál es el valor de determinación de la clase QUEMADO=SI?
Qué características son verdaderas con respecto a los árboles de decisión?
Qué características son verdaderas con respecto a los árboles de decisión?
Cuáles son las medidas de dispersión?
Cuáles son las medidas de dispersión?
Cuál es el rango medio?
Cuál es el rango medio?
¿Cuál es la afirmación correcta sobre la diferencia entre K-medoids y K-means?
¿Cuál es la afirmación correcta sobre la diferencia entre K-medoids y K-means?
¿Qué distancia entre dos puntos no es en línea recta?
¿Qué distancia entre dos puntos no es en línea recta?
¿Cuál no es un análisis de cluster?
¿Cuál no es un análisis de cluster?
La siguiente gráfica tiene índice silhouette con varios intentos de clusters. ¿Cuál es la afirmación correcta?
La siguiente gráfica tiene índice silhouette con varios intentos de clusters. ¿Cuál es la afirmación correcta?
A qué tipo de cluster pertenece la siguiente gráfica?
A qué tipo de cluster pertenece la siguiente gráfica?
Qué defecto tiene el siguiente cluster?
Qué defecto tiene el siguiente cluster?
Cuál es la afirmación correcta con respecto al SSE?
Cuál es la afirmación correcta con respecto al SSE?
Cómo cataloga este clustering?
Cómo cataloga este clustering?
Cuál es la afirmación correcta con respecto al algoritmo k-means?
Cuál es la afirmación correcta con respecto al algoritmo k-means?
A qué tipo de cluster pertenece una división de los objetos de dato en subconjuntos disjuntos (clusters) tal que cada objeto de datos está en exactamente un subconjunto?
A qué tipo de cluster pertenece una división de los objetos de dato en subconjuntos disjuntos (clusters) tal que cada objeto de datos está en exactamente un subconjunto?
Al modificar epsilon a 1 y minimal point a 1, la gráfica presenta una organización particular. ¿Qué parámetro hace falta modificar y a cuánto para que se formen uno o dos clusters más?
Al modificar epsilon a 1 y minimal point a 1, la gráfica presenta una organización particular. ¿Qué parámetro hace falta modificar y a cuánto para que se formen uno o dos clusters más?
Cuál es la afirmación correcta con respecto al análisis de cluster?
Cuál es la afirmación correcta con respecto al análisis de cluster?
La medida más común para calcular la distancia de cada punto a su centroide es ____ para cada punto.
La medida más común para calcular la distancia de cada punto a su centroide es ____ para cada punto.
Dadas dos dimensiones, ¿qué técnica es más adecuada para clusterizar?
Dadas dos dimensiones, ¿qué técnica es más adecuada para clusterizar?
El cálculo de pesos de la figura, ¿qué fórmula representa para su clasificación en el dataset?
El cálculo de pesos de la figura, ¿qué fórmula representa para su clasificación en el dataset?
Dado el dataset:
Se desea construir un perceptrón que haga una predicción si la
persona corre o no una competencia, considerando los atributos antes
descritos.
Si los pesos de cada atributo se establecen de la siguiente forma:
(Dinero=0.5, Tiempo=1, Clima=1)
Considerando que no se normalizaran los valores. Cuál sería el valor de
neta para el caso de Juan?
Dado el dataset: Se desea construir un perceptrón que haga una predicción si la persona corre o no una competencia, considerando los atributos antes descritos. Si los pesos de cada atributo se establecen de la siguiente forma: (Dinero=0.5, Tiempo=1, Clima=1) Considerando que no se normalizaran los valores. Cuál sería el valor de neta para el caso de Juan?
Las Redes Neuronales Artificiales buscan emular el comportamiento _________
Las Redes Neuronales Artificiales buscan emular el comportamiento _________
¿Qué nos indica la derivada de una función en un punto?
¿Qué nos indica la derivada de una función en un punto?
¿Qué parámetro adicional se necesita añadir al algoritmo para completarlo?
¿Qué parámetro adicional se necesita añadir al algoritmo para completarlo?
¿Qué tipo de estructura de capas se utiliza en la red neuronal mencionada en el video?
¿Qué tipo de estructura de capas se utiliza en la red neuronal mencionada en el video?
¿Qué sucede si el ratio de aprendizaje es muy elevado en un algoritmo de optimización?
¿Qué sucede si el ratio de aprendizaje es muy elevado en un algoritmo de optimización?
¿Cuántos puntos mínimos podemos encontrar en una función no convexa?
¿Cuántos puntos mínimos podemos encontrar en una función no convexa?
Study Notes
Introducción a Inteligencia Artificial
- La inteligencia artificial (IA) se refiere a la creación de máquinas análogas que imitan los procesos de inteligencia humana.
- La IA consiste en intentar que los ordenadores piensen y actúen como los humanos.
Regresión Lineal
- La regresión lineal es una técnica de análisis de datos que predice el valor de datos conocidos mediante el uso de técnicas de inteligencia artificial.
- La regresión lineal utiliza un valor de datos relacionado y conocido para calcular el valor de datos desconocidos.
Aprendizaje Supervisado
- El aprendizaje supervisado utiliza conjuntos de datos etiquetados para entrenar al modelo.
- El aprendizaje supervisado permite que el modelo aprenda de los datos y mejore su precisión.
Medidas de Dispersión
- Las medidas de dispersión incluyen:
- Varianza
- Desviación estándar
- Rango
- Cuartiles
- Rango intercuartílico
Medidas de Tendencia Central
- Las medidas de tendencia central incluyen:
- Media
- Mediana
- Moda
Transformación de Datos
- La transformación de datos implica operaciones como:
- Discretización de atributos numéricos
- Numerización de atributos nominales
- Normalización de atributos
- Eliminación de valores fuera de rango
Manejo de Valores Faltantes
- Los valores faltantes se manejan mediante:
- Filtrar el registro o ejemplo
- Llenar el atributo manualmente
- Utilizar un valor especíco
- Utilizar la mediana o la media
Validación Cruzada
- La validación cruzada es una técnica utilizada para evaluar los resultados de la aplicación de un algoritmo.
- La validación cruzada implica dividir el conjunto de datos en folds y entrenar y probar el modelo en cada fold.
Ensamblado
- El ensamblado permite combinar varios modelos para dar lugar a un modelo más preciso.
- El ensamblado se utiliza para reducir la varianza y el bias.
Árbol de Decisión
- Un árbol de decisión es un modelo de predicción determinístico.
- Un árbol de decisión se construye a partir de la identificación sucesiva de los atributos más relevantes.### Árboles de Decisión
- Un árbol de decisión tiene una profundidad de 20 niveles, si se aumentan todas las variables del dataset y no están en el árbol de decisión, el nivel de accuracy disminuye.
- El árbol mejora si se elimina la variable raíz o si se reduce la máxima profundidad a 10.
Análisis de Cluster
- Un buen análisis de cluster debe maximizar la distancia intracluster y minimizar la distancia intercluster.
- El coeficiente de Silueta es una métrica para evaluar la calidad del agrupamiento obtenido con algoritmos de clustering.
- El objetivo de Silueta es identificar cuál es el número óptimo de agrupamientos.
K-means y K-medoids
- La diferencia entre K-means y K-medoids es que en K-means cada cluster está representado por su centroide, mientras que en K-medoids cada cluster está representado por una observación presente en el cluster (medoid).
- El algoritmo K-means inicializa con K centroides generados aleatoriamente y calcula la pertenencia de los patrones a cada grupo en base a la distancia.
Distancia entre Puntos
- La distancia entre dos puntos no es siempre una distancia en línea recta.
- Existen diferentes tipos de distancia, como Euclidiana, Manhattan y Chebysev.
Tipos de Cluster
- El tipo de cluster depende del algoritmo utilizado, como K-means, DBScan, Expectation-Maximization, K-medoids, entre otros.
- Un buen clustering es aquel que tiene una baja suma de errores al cuadrado (SSE) y una buena separación entre clusters.
Análisis de Redes Neuronales
- Las redes neuronales artificiales buscan emular el comportamiento del cerebro humano.
- Un perceptrón es un tipo de red neuronal que hace una predicción basada en los atributos de entrada.
- La entrada neta se describe por la fórmula: entrada neta = suma de las señales de entrada multiplicadas por los pesos.
Regresión Lineal
- La estrategia básica para entrenar un modelo de regresión lineal es plantearlo de forma matemática y buscar una fórmula mediante el método de mínimos cuadrados.
- La derivada de una función en un punto indica la pendiente de la función en ese punto.
Otros Conceptos
- La normalización de datos es importante en análisis de cluster y redes neuronales para evitar que algunos atributos dominen sobre otros.
- La matriz de confusión es una herramienta para evaluar la precisión de un modelo de machine learning.
- La función de activación de una neurona puede ser sigmoide, ReLU, Tanh, entre otras.### Redes Neuronales
- En una red neuronal, cada neurona puede representar un número entre 0 y 9.
- La capa oculta es una parte fundamental en la arquitectura de una red neuronal.
- La capa de entrada es responsable de recibir las entradas de la red neuronal.
- La neurona más iluminada en la capa de salida de una red neuronal entrenada para reconocer dígitos representa el número que la imagen representa.
Bias y Activación
- El BIAS en una neurona de una red neuronal representa el umbral de activación de la neurona.
- La función de activación se utiliza para empujar la suma pesada en un rango entre 0 y 1.
- La función sigmoid es comúnmente utilizada para empujar la suma pesada en un rango entre 0 y 1.
Perceptrón
- Un perceptrón es una red neuronal que se utiliza para reconocer patrones complejos en imágenes.
- La salida de un perceptrón se obtiene mediante la aplicación de la función de activación a la suma pesada de las entradas.
- El valor de neta se obtiene mediante la aplicación de la función de activación a la suma pesada de las entradas.
Soporte y Confianza
- El soporte en un conjunto de datos representa la frecuencia de aparición de un item en el conjunto de datos.
- La confianza se obtiene mediante la aplicación de la fórmula conf({producto1}->{producto2}) = supp({producto1,producto2}) / supp({producto2}).
- El soporte y la confianza se utilizan comúnmente en el algoritmo A-Priori para encontrar patrones frecuentes en un conjunto de datos.
Large Language Models (LLM)
- Los LLM son modelos de lenguaje que se entrenan con enormes cantidades de datos.
- Los LLM se utilizan comúnmente para generar texto, traducir idiomas y responder preguntas.
- El tipo de red neuronal transformer es comúnmente utilizado en los LLM para aprender contexto y significado.
Redes Neuronales Transformer
- Las redes neuronales transformer se utilizan comúnmente en los LLM para aprender contexto y significado.
- El mecanismo de atención en una red neuronal transformer se utiliza para crear y dar fuerza a las relaciones entre palabras.
- El embedding de palabras en una red neuronal transformer se utiliza para representar una palabra como un vector de números.
Fine Tuning
- El fine tuning en los LLM es el proceso de adaptar un modelo preentrenado a una tarea específica utilizando un conjunto de datos más pequeño.
- El fine tuning se utiliza comúnmente para mejorar el rendimiento de un modelo en una tarea específica.
- El fine tuning es una técnica para ajustar finamente las capas de la red.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Este cuestionario prueba tus conocimientos en inteligencia artificial, incluyendo algoritmos y técnicas de aprendizaje automático.