Preguntas PDF
Document Details
Uploaded by IssueFreeZirconium
Tags
Summary
Este documento contiene una serie de preguntas sobre conceptos matemáticos, estadísticos y de modelos, posiblemente como parte de un cuestionario o examen.
Full Transcript
Pregunta 14. Cuáles sería las columnas determinantes para el siguiente datasets, en caso de utilizar un modelo condicional o de reglas? a. nombre d. quemado g. pelo b. Ninguna de las e. pelo, estutura,...
Pregunta 14. Cuáles sería las columnas determinantes para el siguiente datasets, en caso de utilizar un modelo condicional o de reglas? a. nombre d. quemado g. pelo b. Ninguna de las e. pelo, estutura, h. estatura, peso anteriores peso, protector c. protector, pelo f. protector Pregunta 15. Qué es verdadero en relación a las características de descripción y no predicción para los árboles de decisión? a. Si todas las hojas se reeren al mismo atributo y es discreto es un árbol de clasicación. b. Recorriendo sus ramas se obtienen reglas que permiten tomar decisiones c. Su estructura jerárquica les permite mostrar cómo está organizada la información disponible Pregunta 16. Cuál sería un modelo condicional perfecto para el siguiente dataset, considerando que la columna de tipo etiqueta es RESULTADO? a. Si INGRESO=APROBADO entonces RESULTADO=APROB Si INGRESO=DESAP y FORO=SI entonces RESULTADO=DESAP b. Si ASISTENCIA>30 entonces RESULTADO=APROB Si INGRESO=DESAP y TRABAJA>=0 entonces RESULTADO=DESAP c. Si INGRESO=APROB entonces RESULTADO=APROB Si INGRESO=DESAP y FORO=NO entonces RESULTADO=DESAP d. Si TRABAJA>30 entonces RESULTADO=APROB Si INGRESO=APROB y FORO=NO entonces RESULTADO=DESAP Pregunta 17. Considerando el siguiente dataset, y el modelo. Cuál es el valor de determinación de la clase QUEMADO=SI? a.10% b. 90% c. 50% d. 80% e. 20% Pregunta 21. Cuáles son medidas de tendencia central? A. Media B. Mediana C. Moda D. Rango medio E. Varianza F. Desviación estándar G. Rango H. Cuartiles I. Rango Intercuartil a. ABF b. FHI c. BCG d. ACD e. DEF Pregunta 22. Cuál es la mediana? a. medio b. chico c. comed d. chico y medio (valores entre) e. chicomedio Pregunta 23. Cuál es el límite superior antes de determinar un valor fuera de rango, considerando los siguientes valores? a. 21 b. 19 (maximo) c. 13 d. 20 e. 14 Pregunta 24. Los datos presentados por la estadística de la herramienta son: Qué armación es correcta? a. El 64.8 % de los datos están entre los valores 43 y 160.5 b. El 68.2 % de los datos están entre los valores 91.3 y 152.5 c. El 68.2 % de los datos están entre los valores 90 y 159 d. El 70 % de los datos están entre los valores 91.3 y 152.5 e. El 68.9 % de los datos están entre los valores 121.9 y 152.5 Pregunta 25. Cuál es la mediana? Mediana numero de la mitas si son 2 se suma y divide para N Mediana= 52+56=108/2 54 a. 52 b. 54 c. 56 d. 58 e. 60 Pregunta 26. Qué tipo de simería tiene? a. Normal b. Negativa c. Positiva d. Simétrica e. De izquierda Pregunta 27. Qué alternativas aparecen cuando existen valores faltantes? A. Filtrar el registro o ejemplo B. Llenar el atributo manualmente C. Utilizar un valor especíco D. Utilizar el promedio E. Utilizar la media F. Utilizar un valor aleatorio G. Eliminar el atributo H. Eliminar el registros sin importar cuantos sean I. Utilizar un valor fuera de rango a. BCD e. EFG b. ABC f. GHI c. DEF g. AFH d. FGH h. CDE Pregunta 28. La operaciones de transformación más usuales son: A. Aumento de la dimensionalidad B. Discretización de atributos C. Reemplazo de valores faltantes D. Normalización de atributos E. Generación de valores aleatorios G. Generación de valores extremos a. ABE b. ABD c. BCD d. DEG e. CDE Pregunta 29. Si al dataset de estudiantes.csv se ltran solo los estudiantes de la zona rural, cuántos quedan? a. 200 b. 285 c. 268 d. 565 e. 1044 Pregunta 30. El proceso de transformación de datos involucra: A. Discretización B. Quitar los valores en nulo C. Numerización D. Eliminar los valores fuera de rango E. Normalización F. Filtrar los registros con valores erroneos a. CDE d. ABC b. BCD e. BDF c. ACE Pregunta 31. Se aumenta la dimensionalidad del dataset de estudiantes.csv en su atributo nota_nal. Si se desea discretizar de manera que aquellos estudiantes que tenga más de doce en su nota nal tenga el estatus de aprobado. Cuál sería el código adecuado? a. if nota_nal >12 then "SI" else "NO" b. if([nota_nal]>12,"SI","NO") c.if([nota nal]>12,SI,NO) d. if([nota nal]>12,"SI","NO") e. if([nota_nal]>12,SI,NO) Pregunta 32. Se genera atributo denominado índice de obesidad que reemplaza la altura y el peso de una persona. Qué operación se está realizando? a. Discretización de atributos numéricos b. Aumento de la dimensionalidad c. Numerización de atributos nominales d. Reducción de la dimensionalidad Pregunta 33. Dado el siguiente histograma: Se podría unicar las categorías de relación familiar a Buena, Regular y Mala con lo siguiente: a. Filtrar los datos de las cinco categorias y eliminar dos de ellas. b. Reemplazar antes de el read_csv las categorias para unicarlas en el archivo fuente c. Ninguna de las anteriores d. Implementar un Map para unicar buena y muy buena en una sola categoría, luego unicar muy mala y mala en otra categoría. e. Genera un nuevo atributo con código condicional para establecer las tres categorías Pregunta 34. De un solo curso universitario, se toma una muestra para determinar las preferencias de bebida de los encuestados, de las 120 personas que respondieron a la encuesta, 115 respondieron a la pregunta sobre su edad. Cuál es el método más adecuado para tratar los datos perdidos? a. Imputación por eliminación de los registros que no respondieron. b. Otros cinco tampoco respondieron a su peso, por lo que se imputarán todos estos más los anteriores. c. Imputación con el reemplazo de los valores faltantes por la mediana de la muestra que es 22, conocimiento que el cuartil uno es 21 y el cuartil tres es 23 d. Imputación con el reemplazo de los valores faltantes por la edad máxima de los participantes. e. Imputación con el reemplazo de los valores faltantes por la mediana de la muestra que es 22, conocimiento que el cuartil uno es 15 y el cuartil tres es 33 f. Imputación con el reemplazo de los valores faltantes por el promedio de la muestra, conocimiento que el promedio es 22.4 g..Imputación con el reemplazo de los valores faltantes por el promedio de la muestra, conocimiento que el promedio es 22.4 con desviación 1.5 h. Imputación con el reemplazo de los valores faltantes por el promedio de la muestra, conocimiento que el promedio es 22.4 con desviación 10 Pregunta 38. Las operaciones de transformación de atributos implican las operaciones de: a. Utilizar una medida de tendencia central, utilizar un algorito que obtenga el valor más probable b. Limpieza de datos, eliminación de ruido c. Datos perdidos, numerización y normalización d. Discretización, numerización y normalización e. Filtrar el registro o ejemplo, llenar el valor en blanco manualmente, utilizar un valor especíco Pregunta 42. Qué armación es correcta con respecto al peso de los atributos? a. Medir el peso de los atributos con respeto a su atributo de identicación, permite seleccionar los atributos menos determinantes y así mejorar la predicción del modelo. b. Medir el peso de los atributos con respeto a su atributo de identicación, permite seleccionar los atributos más determinantes y así mejorar la predicción del modelo. c. Medir el peso de los atributos con respeto a su atributo etiqueta, permite seleccionar los atributos menos determinantes y así mejorar la predicción del modelo. d. Medir el peso de los atributos con respeto a su atributo etiqueta, permite seleccionar los atributos más determinantes y así mejorar la predicción del modelo. e. Medir el peso de los atributos con respeto a su atributo de identicación, permite seleccionar los atributos más determinantes y así mejorar la descripción del modelo. Pregunta 46. Bootstrap reduce _______ a. la varianza d. el bias b. el conjunto de testeo e. el trade-o c. el conjunto de entrenamiento Pregunta 47. Para mejorar la respuesta hacia una hipótesis con muestras con pocos registros, es recomendable utilizar _____ a. Metacost d. Varianza b. bootstrap e. GGBoost c. Bias Pregunta 48. Qué tipo de or tiene un nivel de desorden de cero? a. Todas d.iris-versicolor b. NingunaT e. Iris-virginica c. Iris-setosa Pregunta 49. Cuál es el potencial nodo raiz? a. Ambiente b. Temperatura c. Viento d. Juega e. Humedad Pregunta 50. → Excel Dado el siguiente dataset: Determinar la medida del desorden para el atributo temperatura a dos decimales Respuesta = 0.91 Pregunta 51. Dado el siguiente dataset: Determinar la medida del desorden para el atributo humedad a dos Decimales 0.79 Pregunta 52. Se lográ un accuracy de 90% al predecir la etiqueta con la técnica de árbol decisión. Qué armación es correcta? a. El árbol tiene una profundidad de 20 niveles, si se aumenta el máximo a 30, seguramente el nivel de accuracy mejoraría. b. El árbol tiene una profundidad de 20 niveles, si se elimina la variable que representa la etiqueta, seguramente el nivel de accuracy mejoraría. c. El árbol tiene una profundidad de 20 niveles, si se aumentan todas las variables del dataset y aunque estas no estén en el árbol de decisión, seguramente el nivel de accuracy empeora. d. El árbol tiene una profundidad de 20 niveles, si se elimina de la selección de variables aquella que representa el nodo raiz, seguramente el nivel de accuracy mejoraría. e. El árbol tiene una profundidad de 20 niveles, si se reduce el máximo a 10, seguramente el nivel de accuracy mejoraría. Pregunta 53. Se aplica un árbol de decisión a un dataset de tipos de o Iris con 80% de entrenamiento y 20% de pruebas, los resultados fueron: Qué interpretación es correcta? a. el modelo predijo que la flor era la Iris-setosa, pero realmente fue una Iris-virginica b. el modelo predijo que la flor era la Iris-versicolor, pero realmente fue una Iris-virginica c. el modelo predijo que la flor era la Iris-virginica, pero realmente fue una Iris-versicolor d. el modelo predijo que la flor era la Iris-setosa, pero realmente fue una Iris-versicolor Pregunta 54. Los siguiente atributos contiene las siguientes medidas de desorden: Atributo Desorden BMI 0.60 Glucosa 0.45 Insulina 0.67 Edad 0.80 Cuál es el nodo raiz? a.Insulina d. Edad b. BMI e. Glucosa c. Ninguna de las anteriores Pregunta 55. Cuáles de las siguientes técnicas ______ utilizan para la medida del desorden, la siguiente fórmula? a. gini_index b.information_gain c. least_square d. accuracy e. gain_ratio Pregunta 56. El árbol se construye de la forma a. top-down recursive divide b. down-top recursive divide-and-conquer c. top-down recursive divide-and-conquer d. top-down recursive conquer e. top-down no recursive divide-and-conquer Pregunta 57. Al comienzo, todos los ejemplos de entrenamiento están _____ a. en el nodo down b. en el nodo raíz c. en el nodo base d. en el nodo hoja e. en el nodo podado Pregunta 58. Dado el siguiente dataset: Determinar la medida del desorden para el atributo temperatura y la clase alta. a. 0.8 b. 0.2 c. 0.5 d. 1 e. 0 Pregunta 59. Un árbol de decisión es a. un modelo de agrupación determinístico b. un modelo de agrupación no determinístico c. un modelo de predicción no determinístico d. un modelo de predicción determinístico Pregunta 60. El coeciente de Silueta es una métrica para evaluar la calidad del agrupamiento obtenido con algoritmos de clustering. El objetivo de Silueta es ______________ a. identicar cuál es el número óptimo de agrupamientos b. reducir la distancia entre las observaciones c. identicar cuál es el número óptimo de observaciones d. identicar cuales son las observaciones más alejadas de los clusters e. identicar cuales son las observaciones más cercanas a sus compañeros Pregunta 61. Para que un análisis de cluster sea eciente debe..... a. maximizar la distancia intracluster y minimizar la distancia intercluster b. minimizar la distancia intracluster y maximixar la distancia intercluster c. igualar la distancia intracluster a la distancia intercluster d. minimizar la distancia incluster y maximixar la distancia outcluster e. minimizar la distancia excluster y maximixar la distancia incluster Pregunta 62. Cuál es la armación correcta? a. Ninguno de los dos clusters es bueno b. El cluster 0 tiene menor distancia intra e inter cluster c. Los dos clusters son buenos y casi idénticos d. El cluster 1 tiene menor distancia intra e inter cluster e. No se puede analizar con este tipo de gráca Pregunta 80. El nodo sumatorio acumula todas las señales de entrada multiplicadaspor los pesos o ponderadas y las pasa a la salida a través de unafunción umbral o función de transferencia Pregunta 81. Cuál es la armación correcta con respecto al cerebro humano? a. El cerebro humano procesa información precisa rápidamente,aprende sin instrucciónes explícitas. Para ello, crea representacionesinternas que permiten estas habilitadas. b. El cerebro humano procesa información imprecisa rápidamente,aprende sin instrucciónes explícitas. Para ello, crea representacionesinternas que permiten estas habilitadas. c. El cerebro humano procesa información imprecisa rápidamente,aprende con instrucciónes explícitas. Para ello, crea representaciones internas que permiten estas habilitadas. d. El cerebro humano procesa información imprecisa rápidamente, aprended. El cerebro humano procesa información precisa rápidamente, aprende con instrucciónes explícitas. Para ello, crea representaciones internas que permiten estas habilitadas. Pregunta 82. Dado el dataset: Se desea construir un perceptrón que haga una predicción si la persona corre o no una competencia, considerando los atributosdescritos. Si los pesos de cada atributo se establecen de la siguiente form (Dinero=0.5, Tiempo=1, Clima=1) Considerando que no se normalizaran los valores. Cuál sería el vde neta para el caso de María? a. 2.5 b. 19 c. 18.5 d. 10 e. 12 Pregunta 83. La entrada neta se describe por la fórmula: a. b. CORRECTO c. d. Pregunta 84. Cada señal de entrada pasa a través de una ganancia o peso, llamado _________________ cuya función es análoga a la de la función sináptica de la neurona biológica. Los pesos pueden ser positivos (excitatorios), o negativos (inhibitorios). a. peso sináptico o fortaleza de la conexión b. conexión sináptica o fortaleza de la conexión c. conexión sináptica o excitación de la conexión d. peso ponderado absoluto de la conexión e. peso sináptico o excitación de la conexión f. neta absoluta de la conexión Pregunta 85. Dado el dataset: Se desea construir un perceptrón que haga una predicción si la persona corre o no una competencia, considerando los atributos antes descritos. Como se establecen los valores normalizados si se aplica la normalización por rango de 0 a 1, para el atributo de dinero en el caso de Juan? Respuesta : 0.5 Pregunta 86. ¿Qué puede ocurrir si el ratio de aprendizaje es muy pequeño en un algoritmo de optimización? a. El gradiente se invierte b. El algoritmo converge rápidamente c. El proceso puede ser ineciente y requerir muchas iteraciones d. ninguno de los anteriores e. El punto queda atrapado en un mínimo global Pregunta 87. ¿Qué hacemos con la derivada para encontrar un punto mínimo en una función convexa? a.Igualar la pendiente a cero y resolver la ecuación b. No hallar ningún punto c. Multiplicar un único punto mínimo d. Hallar dos puntos mínimos Pregunta 88. ¿Cuál es la estrategia básica para entrenar un modelo de regresión lineal? a. No es posible entrenar un modelo de regresión lineal b. Plantearlo de forma matemática y buscar una fórmula mediante el método de mínimos cuadrados c. ninguno de los anteriores d. Entrenarlo con datos aleatorios e. Utilizar un enfoque de prueba y error Pregunta 89. ¿Cuál es el rango de valores que puede tener la 'Activación' de una neurona en una red neuronal? a. 0 a 255 b. 0 a 100 c. 0 a 1 d. ninguna de las anteriores e. 0 a 10 Pregunta 90. Existe una matriz de 10 x 8 donde se representan número escritos a mano. Cuántas entradas tendría la red neuronal? a. 80 b. 10 c. 80 + 1 bias d. Ninguno de los anteriores e. 8 Pregunta 91. ¿Qué estrategia matemática se utiliza para encontrar mínimos locales en funciones no convexas? a. Método de Euler b. Integración numérica c. Descenso del gradiente d. Transformada de Fourier Pregunta 92. ¿Cuál es la mayor esperanza para las capas medias de una red neuronal? a. Clasicar las imágenes por colores b. Reconocer patrones no especícos en el texto c. Reconocer subcomponentes de los dígitos d. Generar nuevas imágenes e. ninguna de las anteriores Pregunta 93. ¿Qué representa una neurona en una red neuronal según el texto? a. ninguna de las anteriores b. Una imagen c. Un número almacenado entre 0 y 10 d. Una función e. Un vector Pregunta 94. ¿Qué determina las activaciones en una capa de una red neuronal? a. El brillo de cada pixel en la imagen b. El tipo de imagen c. ninguna de las anteriores d. La capa anterior, considerando las capas ocultas y la de salida e. El número de neuronas en la capa Pregunta 100. ¿Qué operación importante se hace en una red neuronal para determinar el softmax? a. La reducción de neuronas b. La optimización de la función de activación c. ninguno de los anteriores d. La eliminación de BIAS e. La multiplicación entre matrices Pregunta 101. ¿Qué indica el vector conformado por todas las derivadas parciales en diferentes direcciones? a. La dirección hacia la que la pendiente desciende b. La dirección vertical c. La dirección hacia la que la pendiente asciende d. La dirección horizontal Pregunta 102. Si existe una red neuronal para predecir un número entre 0 y 9 dibujado en una plantilla, la última capa de la red neuronal correspondería _______________ a. a los números entre 0 y 9, cada neurona correspondería a un número b. a la capa oculta c. a la capa de entrada d. a los números entre 0 y 9, donde cada neurona correspondería a una entrada en escala de colores e. a los números entre 0 y 9, donde cada neurona correspondería a una entrada en escala de grises Pregunta 103. ¿Qué representa la neurona más iluminada en la capa de salida de una red neuronal entrenada para reconocer dígitos? a. El número que la imagen representa b. ninguna de las anteriores c. El brillo de la imagen d. El tamaño de la imagen e. El color de la imagen Pregunta 104. ¿Cuál es el objetivo principal de las capas medias en una red neuronal para el ejemplo de reconocimiento de dígitos numéricos? a. Clasicar las imágenes por colores b. ninguno de los anteriores c. Reconocer patrones complejos en las imágenes d. Detectar la resolución de las imágenes e. Generar números aleatorios Pregunta 105. ¿Qué representa el BIAS en una neurona de una red neuronal? a. La cantidad de conexiones a otras neuronas b. La función de activación de la capa de entrada c. ninguna de las anteriores d. La suma de los pesos de las conexiones e. El umbral de activación de la neurona Pregunta 106. ¿Qué función se utiliza comúnmente para empujar la suma pesada en un rango entre 0 y 1? a. Tangente hiperbólica b. ninguna de las anteriores c. Softmax d. ReLU e. Sigmoid Pregunta 107. La salida y de un perceptron es por la aplicación de: a. f(x.w) b. f(w) c. f(x) d. f(neta) Pregunta 108. Se requiere entrenar un perceptrón para el siguiente problema: Una alarma tiene dos sensores X1 y X2, la alarma(t) se enciende solo en los siguientes casos: a) Cuando X1 y X2 están encendidos b) Cuando X2 está encendido y X1 está apagado Conocemos que θ tiene el valor de 0.2 y el ratio de aprendizaje es de 0.5. Si se construye el perceptrócon los valores iniciales en los pesos de w1=0.4 y w2=0.6, cuál es el valor nal de w1? Respuesta: -0.1 Pregunta 109. Dadas las siguiente entradas y pesos, determinar el valor de neta Respuesta: 2.2 Pregunta 110. Dadas las siguiente entradas a en la red neuronal, calcular el valor de neta a. 1 b. 17 c. 20 d. 3 e. 0.8 Pregunta 111. Dadas los siguientes valores de un perceptrón, deducir cuales solo los valores de y? a. 0,1,1,0 b. 1,1,1,1 c. 0,0,1,1 d. 0,1,1,1 e. 1,0,0,1 Pregunta 112. Cuál es soporte de {A}->{C} en: Exprese su respuesta con dos decimales. (Ejm: Ingrese 0.3 para expresar el 30%) Excel La respuesta correcta es: 0,4 Pregunta 113. La fórmula para obtener la conanza es: a. conf({producto1}->{producto2}) = supp({producto1,producto2}) / supp({producto2}) b. conf({producto1}->{producto2}) = supp({producto1,producto2}) / supp({producto1}) c. conf({producto1}->{producto2}) = supp({producto1}) / supp({producto2}) d. conf({producto1}->{producto2}) = supp({producto2}) * supp({producto1}) e. conf({producto2}->{producto1}) = supp({producto1,producto2}) / supp({producto2}) Pregunta 114. Cuál es la conanza en {B,C}->{D} en: Exprese su respuesta con dos decimales. (Ejm: Ingrese 0.3 para expresar el 30%) Respuesta: 0,67 La respuesta correcta es: 0,33 Pregunta 115. Cuál es el soporte en {A,B,}->{C} en: a. 0.7 b. 0.5 c. 0.2 d. 0.1 e. 0.9 Pregunta 116. Dada la siguiente base de datos: En el algoritmo A-Priori, si el soporte mínimo fuese 0.55, qué items pasarían la primera fase del algoritmo? a. {3}.{5} b. {2}.{3}.{5} c. {1}.{2}.{3} d. {1}.{4} e. Ninguno f. {1}.{3},{4},{5} g. {2}.{3} h. {1}.{2}.{3},{4},{5} 1. ¿Cuál es la arquitectura dominante para los Large Language Models? a.Transformers b.Redes Neuronales Recurrentes (RNN) c.Redes Neuronales Convolucionales (CNN) d.Long Short-Term Memory (LSTM) Respuesta correcta: a. Transformers 2. ¿Cómo se entrenan los LLM´s? a.Con datos de baja calidad b.Con datos etiquetados c.Con pocos datos d.Con enormes cantidades de datos Respuesta correcta: d. Con enormes cantidades de datos 3. ¿Qué es BERT en el contexto de los modelos generativos? a.Un modelo desarrollado por Google b.Un modelo desarrollado por OpenAI c.Un modelo que no realiza Fine Tuning d.Un modelo que no utiliza corpus de texto Respuesta correcta: a. Un modelo desarrollado por Google 4. ¿Qué son los LLM? a.Modelos de lenguaje medianos b.Modelos de lenguaje grandes c.Modelos de lenguaje gigantes d.Modelos de lenguaje pequeños Respuesta correcta: b. Modelos de lenguaje grandes 5. ¿Qué es el Diccionario Blando en los Transformers? a.Un diccionario que guarda las palabras de forma rígida b.Un diccionario que no influye en el modelo c.Un diccionario que establece la atención entre palabras d.Un diccionario que no se modifica Respuesta correcta: c. Un diccionario que establece la atención entre palabras 6. ¿Qué es el tipo de red neuronal transformer? a.Un tipo de red neuronal que aprende contexto y significado b. Un tipo de red neuronal que no aprende contexto c.Un tipo de red neuronal que solo procesa imágenes d. Un tipo de red neuronal que no necesita datos ordenados Respuesta correcta: a. Un tipo de red neuronal que aprende contexto y significado 7. ¿Cómo fueron entrenadas las redes Transformers? Respuesta a.Con datos etiquetados b. Con corpus de texto sin etiquetar С.Con poca cantidad de datos d. Con datos de baja calidad Respuesta correcta: b. Con corpus de texto sin etiquetar 8. Qué es la inteligencia artificial generativa? a. Un tipo de lA que solo puede generar texto b. Un tipo de lA que solo puede generar videos c. Un tipo de lA que solo puede generar imágenes d. Un tipo de lA capaz de generar diversos tipos de contenidos Respuesta correcta: d. Un tipo de IA capaz de generar diversos tipos de contenidos 9. ¿Qué es el Mecanismo de Atención en una red neuronal transformer? a. Un mecanismo para ignorar las palabras b. Un mecanismo para reducir la complejidad de la red c. Un mecanismo para crear y dar fuerza a las relaciones entre palabras d. Un mecanismo para eliminar la atención Respuesta correcta: c. Un mecanismo para crear y dar fuerza a las relaciones entre palabras 10. ¿Qué es el Embedding de Palabras en una red neuronal transformer? a.Una técnica para traducir palabras a diferentes idiomas b. Un método para comprimir las palabras en la red c. Un proceso para eliminar palabras del vocabulario d. Un vector de números que representa una palabra Respuesta correcta: d. Un vector de números que representa una palabra 11. ¿Qué es el Multi-head Self-Attention en una red neuronal transformer? a.Una técnica para ignorar ciertas palabras en una secuencia b. Un enfoque para prestar atención a diferentes partes de la secuencia c. Una forma de reducir la complejidad de la red d. Un método para eliminar la atención en la red Respuesta correcta: b. Un enfoque para prestar atención a diferentes partes de la secuencia 12. ¿Qué es la Capa de Atención en Decoder en una red neuronal transformer? a.Una capa que no presta atención a nada b.Una capa que solo presta atención a la salida c.Una capa que presta atención tanto a la entrada como a la salida d.Una capa que solo presta atención a la entrada Respuesta correcta: c. Una capa que presta atención tanto a la entrada como a la salida 13. ¿Qué es el fine-tuning en el contexto de los LLM? a. La eliminación de datos de entrenamiento en un LLM. b. El proceso de adaptar un LLM preentrenado a una tarea específica utilizando conjunto de datos más pequeño. c. La creación de un nuevo modelo de lenguaje desde cero. d. El proceso de preentrenamiento de un LLM. Respuesta correcta: b. El proceso de adaptar un LLM preentrenado a una tarea específica utilizando conjunto de datos más pequeño.