Repaso para el examen de IA.pdf

Repaso para el examen de I.A Pregunta 1. ¿Qué representa la siguiente gráfica? a. la aplicación de un algoritmo dependiente b. la aplicación de un algoritmo no dependiente c. la aplicación de un algoritmo supervisado d. la aplicación de un algoritmo no supervisado Pregunta 2. La regresión lineal es: a. una técnica de análisis de datos que no predice el valor de datos conocidos mediante el uso de 100 valores de datos relacionados y conocidos b. una técnica de análisis de datos que predice el valor de datos conocidos mediante el uso de técnicas de inteligencia artificial c. una técnica de análisis de datos que predice el valor de datos conocidos mediante el uso de sus propios datos d. una técnica de análisis de datos que calcula el valor de datos conocidos mediante el uso de otro valor de datos relacionado y conocido e. una técnica de análisis de datos que predice el valor de datos desconocidos mediante el uso de otro valor de datos relacionado y conocido Pregunta 3. La metodología tradicional para proyectos de desarrollo en IA o DM es: a. CRISP IADM b. CRISP DM c. DMCRISP IA d. IADM e. CRISR IA Pregunta 4. La siguiente gráfica representa una regresión _______________ a. logística b. churuda c. cosenoidal d. lineal e. senoidal Pregunta 5. ¿Cuál es el concepto que se apega a las actividades realizas en la clase anterior? a. la IA consiste en intentar que los ordenadores piensen y actúen como los humanos b. La inteligencia artificial (IA) es la base a partir de la cual se imitan los procesos de inteligencia humana mediante la creación de máquinas análogas del siglo anterior c. la IA consiste en rescatar la historia de la humanidad a través de buscar en libros antiguos d. la IA consiste en crear algoritmos que piensen en los hechos que aún no suceden Pregunta 6. ¿Cuál es el valor de la métrica de precisión del modelo? (exprese con uso de decimales ejm:0.4 es 40 %) Como se resolvió: TP= Pedro y Saul. FP= Marcia. Precisión= 2/(2+1)= 0.6 -> 60% Pregunta 7. Un hiperplano representa una clasificación de ejemplos en dos espacios __________ a. Solo para X b. Dimensionales c. Extremos d. Solo para Y e. Solo para X e Y e Z Pregunta 8. Cuál es la afirmación correcta con respecto a este dataset a. Es un dataset que contiene columnas para aplicar algoritmos de tipo no-supervisado b. Es un dataset que no se puede aplicar para un modelo de IA c. No es un dataset d. Es un dataset que contiene columnas de tipo etiqueta e. Es un dataset que contiene columnas para aplicar algoritmos de tipo supervisado f. Es un dataset que no contiene columnas de tipo etiqueta g. Es un dataset que contiene todas sus columnas no-dependientes h. Es un dataset que contiene todas sus columnas de tipo dependientes Pregunta 9. ¿El siguiente ejemplo es? a. Regresión polinomial b. Regresión lineal c. Regresión exponencial d. Regresión lineal-exponencial e. Regresión logística Pregunta 10. El aprendizaje __________ utiliza conjuntos de datos etiquetados a. supervisado b. no dependiente c. no supervisado d. hiper supervisado e. dependiente Pregunta 11. ¿Cuál es la equivalencia formal de la lectura de uno de los nodos del árbol? a. Si está lloviendo y no hace viento entonces si jugamos b. Si el Ambiente = Nublado y Viento = No entonces Jugar = Si c. Si el Ambiente = frio y Viento = No entonces Jugar = No d. Si el Ambiente = lluvioso y Viento = No entonces Jugar = Si e. Si el Ambiente = lluvioso y Viento = No entonces Si Pregunta 12. ¿Cuál es la fórmula para obtener el accuracy e un modelo? a.  CORRECTO b. c. d. Pregunta 13. Cuál es la regla adecuada para los siguiente esquema? a. Si Astigmatismo = NO y Miopia > 6 entonces Operar = SI b. Si Astigmatismo = NO y Miopia 10 entonces Operar = SI d. Si Astigmatismo = SI y Miopia =0 entonces RESULTADO=DESAP c. Si INGRESO=APROB entonces RESULTADO=APROB Si INGRESO=DESAP y FORO=NO entonces RESULTADO=DESAP d. Si TRABAJA>30 entonces RESULTADO=APROB Si INGRESO=APROB y FORO=NO entonces RESULTADO=DESAP Pregunta 17. Considerando el siguiente dataset, y el modelo. Cuál es el valor de determinación de la clase QUEMADO=SI? a.10% b. 90% c. 50% d. 80% e. 20% Pregunta 18. Qué características son verdaderas con respecto a los árboles de decisión? A. Es un modelo de predicción determinístico. B. Por su forma jerárquica, permite visualizar la organización de los atributos. C. Es un modelo de predicción no determinístico. D. Se construye a partir de la identicación sucesiva de los atributos más relevantes E. Se construye a partir de la identicación sucesiva de los etiquetas más relevantes F. Por su forma lineal, permite visualizar la organización de los atributos. a. ABD b. BCD c. ADF d. ABE Pregunta 19. Cuáles son las medidas de dispersión? A. Media B. Mediana C. Moda D. Rango medio E. Varianza F. Desviación estándar G. Rango H. Cuartiles I. Rango Intercuartil a. EFG b. RHI c. DHI d. BGH e. DEF Pregunta 20. Cuál es el rango medio? Rango medio= Maximon + minimo/2 = (110+30)/2= 140/2= 70 a. 56 b. 56 c. 58 d. 70 e. 52 Pregunta 21. Cuáles son medidas de tendencia central? A. Media B. Mediana C. Moda D. Rango medio E. Varianza F. Desviación estándar G. Rango H. Cuartiles I. Rango Intercuartil a. ABF b. FHI c. BCG d. ACD e. DEF Pregunta 22. Cuál es la mediana? a. medio b. chico c. comed d. chico y medio (valores entre) e. chicomedio Pregunta 23. Cuál es el límite superior antes de determinar un valor fuera de rango, considerando los siguientes valores? a. 21 b. 19 (maximo) c. 13 d. 20 e. 14 Pregunta 24. Los datos presentados por la estadística de la herramienta son: Qué armación es correcta? a. El 64.8 % de los datos están entre los valores 43 y 160.5 b. El 68.2 % de los datos están entre los valores 91.3 y 152.5 c. El 68.2 % de los datos están entre los valores 90 y 159 d. El 70 % de los datos están entre los valores 91.3 y 152.5 e. El 68.9 % de los datos están entre los valores 121.9 y 152.5 Pregunta 25. Cuál es la mediana? Mediana numero de la mitas si son 2 se suma y divide para N Mediana= 52+56=108/2 54 a. 52 b. 54 c. 56 d. 58 e. 60 Pregunta 26. Qué tipo de simería tiene? a. Normal b. Negativa c. Positiva d. Simétrica e. De izquierda Pregunta 27. Qué alternativas aparecen cuando existen valores faltantes? A. Filtrar el registro o ejemplo B. Llenar el atributo manualmente C. Utilizar un valor especíco D. Utilizar el promedio E. Utilizar la media F. Utilizar un valor aleatorio G. Eliminar el atributo H. Eliminar el registros sin importar cuantos sean I. Utilizar un valor fuera de rango a. BCD e. EFG b. ABC f. GHI c. DEF g. AFH d. FGH h. CDE Pregunta 28. La operaciones de transformación más usuales son: A. Aumento de la dimensionalidad B. Discretización de atributos C. Reemplazo de valores faltantes D. Normalización de atributos E. Generación de valores aleatorios G. Generación de valores extremos a. ABE b. ABD c. BCD d. DEG e. CDE Pregunta 29. Si al dataset de estudiantes.csv se ltran solo los estudiantes de la zona rural, cuántos quedan? a. 200 b. 285 c. 268 d. 565 e. 1044 Pregunta 30. El proceso de transformación de datos involucra: A. Discretización B. Quitar los valores en nulo C. Numerización D. Eliminar los valores fuera de rango E. Normalización F. Filtrar los registros con valores erroneos a. CDE d. ABC b. BCD e. BDF c. ACE Pregunta 31. Se aumenta la dimensionalidad del dataset de estudiantes.csv en su atributo nota_nal. Si se desea discretizar de manera que aquellos estudiantes que tenga más de doce en su nota nal tenga el estatus de aprobado. Cuál sería el código adecuado? a. if nota_nal >12 then "SI" else "NO" b. if([nota_nal]>12,"SI","NO") c.if([nota nal]>12,SI,NO) d. if([nota nal]>12,"SI","NO") e. if([nota_nal]>12,SI,NO) Pregunta 32. Se genera atributo denominado índice de obesidad que reemplaza la altura y el peso de una persona. Qué operación se está realizando? a. Discretización de atributos numéricos b. Aumento de la dimensionalidad c. Numerización de atributos nominales d. Reducción de la dimensionalidad Pregunta 33. Dado el siguiente histograma: Se podría unicar las categorías de relación familiar a Buena, Regular y Mala con lo siguiente: a. Filtrar los datos de las cinco categorias y eliminar dos de ellas. b. Reemplazar antes de el read_csv las categorias para unicarlas en el archivo fuente c. Ninguna de las anteriores d. Implementar un Map para unicar buena y muy buena en una sola categoría, luego unicar muy mala y mala en otra categoría. e. Genera un nuevo atributo con código condicional para establecer las tres categorías Pregunta 34. De un solo curso universitario, se toma una muestra para determinar las preferencias de bebida de los encuestados, de las 120 personas que respondieron a la encuesta, 115 respondieron a la pregunta sobre su edad. Cuál es el método más adecuado para tratar los datos perdidos? a. Imputación por eliminación de los registros que no respondieron. b. Otros cinco tampoco respondieron a su peso, por lo que se imputarán todos estos más los anteriores. c. Imputación con el reemplazo de los valores faltantes por la mediana de la muestra que es 22, conocimiento que el cuartil uno es 21 y el cuartil tres es 23 d. Imputación con el reemplazo de los valores faltantes por la edad máxima de los participantes. e. Imputación con el reemplazo de los valores faltantes por la mediana de la muestra que es 22, conocimiento que el cuartil uno es 15 y el cuartil tres es 33 f. Imputación con el reemplazo de los valores faltantes por el promedio de la muestra, conocimiento que el promedio es 22.4 g..Imputación con el reemplazo de los valores faltantes por el promedio de la muestra, conocimiento que el promedio es 22.4 con desviación 1.5 h. Imputación con el reemplazo de los valores faltantes por el promedio de la muestra, conocimiento que el promedio es 22.4 con desviación 10 Pregunta 35. Si se discretiza por rango(binning ) el atributo nota_nal del dataset de estudiantes.csv en 8 porciones. Cuál es el intervalo para el rango7? a. [12.5 - 15] b. [10 - 100] c. [10 - 20] d. [20 - 30] e. [15 - 17.5] Pregunta 36. Cuáles de las armacione son correctas con respecto a la discretización por rango (Binning) A. El rango del atributo es igual en todas las secciones B. El rango del atributo es variable para mantener un equilibiro de frecuencia C. Para la división por rango se considera el valor mínimo y el valor máximo D. Para la división por rango se considera cero y el valor máximo E. La cantidad de k partes son iguales F. La cantidad de k partes son difentes a. BDE b. BDF c. ACE d. BCE e. ACF Pregunta 37. La discretización se trata de: a. Convertir un valor continuo en valores sin decimales b. Convertir todos los atributos a una misma unidad de medida c. Convertir un valor numérico en valores discretos d. Convertir un valor discreto en valores continuos Pregunta 38. Las operaciones de transformación de atributos implican las operaciones de: a. Utilizar una medida de tendencia central, utilizar un algorito que obtenga el valor más probable b. Limpieza de datos, eliminación de ruido c. Datos perdidos, numerización y normalización d. Discretización, numerización y normalización e. Filtrar el registro o ejemplo, llenar el valor en blanco manualmente, utilizar un valor especíco Pregunta 39. Considerando el siguiente dataset. Si la partición es de 2 secciones (folds). La primera vez para entrenamiento, el algoritmo toma los datos: 3,4,7,8,11 y los valida con los datos de testeo: 44,76,59,71,2. Qué caso de particionamiento(sampling type) se está utilizando? a. ninguno de los anteriores b. linear sampling c. automatic sampling d. shued sampling e. stratied sampling Pregunta 40. Se tiene 1000 registros en el dataset y se ha congurado la validación cruzada con 10 folds. Cúal es la armación correcta? a. Se particiona a 10 registros para entrenamiento y 10 para testeo. Estose repite con diferentes registros muchas veces más. b. Se particiona a 900 registros para entrenamiento y 100 para testeo. Esto se repite con los mismos registros otras ocho veces más. c. Se particiona a 900 registros para entrenamiento y 100 para testeo. Esto se repite con diferentes registros otras ocho veces más. d. Se particiona a 100 registros para entrenamiento y 900 para testeo. Esto se repite con diferentes registros otras nueve veces más. e. Se particiona a 800 registros para entrenamiento y 200 para testeo. Esto se repite con los mismos registros otras diez veces más. f. Se particiona a 900 registros para entrenamiento y 100 para testeo. Esto se repite con los mismos registros otras diez veces más. g. Se particiona a 900 registros para entrenamiento y 100 para testeo. Esto se repite con diferentes registros otras nueve veces más. h. Se particiona a 900 registros para entrenamiento y 100 para testeo. Esto se repite con los mismos registros otras nueve veces más. Pregunta 41. La validación cruzada o cross-validation es una técnica utilizada para evaluar los resultados de la aplicación de un algoritmo y ______ a. garantizar que son independientes de la partición entre datos de entrenamiento y prueba b. garantizar que son independientes de la partición entre datos de entrenamiento y desarrollo c. garantizar que son dependientes de la partición entre datos de entrenamiento y prueba d. garantizar que son dependientes de la partición entre datos de entrenamiento y desarrollo e. garantizar que son independientes de la partición entre datos de desarrollo y prueba Pregunta 42. Qué armación es correcta con respecto al peso de los atributos? a. Medir el peso de los atributos con respeto a su atributo de identicación, permite seleccionar los atributos menos determinantes y así mejorar la predicción del modelo. b. Medir el peso de los atributos con respeto a su atributo de identicación, permite seleccionar los atributos más determinantes y así mejorar la predicción del modelo. c. Medir el peso de los atributos con respeto a su atributo etiqueta, permite seleccionar los atributos menos determinantes y así mejorar la predicción del modelo. d. Medir el peso de los atributos con respeto a su atributo etiqueta, permite seleccionar los atributos más determinantes y así mejorar la predicción del modelo. e. Medir el peso de los atributos con respeto a su atributo de identicación, permite seleccionar los atributos más determinantes y así mejorar la descripción del modelo. Pregunta 43. Algunos algoritmos, como _____________________ pueden dar lugar a minimizar funciones de coste altamente no convexas, pudiendo quedar los métodos utilizados para resolverlas en un ´optimo local a. KNN c. regresión logística b. regresión lineal d. redes neuronal Pregunta 44. Las técnicas de ensamblado permiten combinar varios modelos para dar lugar a un _______ a. mega-submodelo b. meta-algoritmo c. mega-sampling d. meta-ensamblado e. meta-sampling Pregunta 45. existen tres razones principales por las cuales combinar distintos modelos en un ensamblado: A. estadísticas B. matemáticas C. computacionales D. representacionales E. algorítmicas-determinísticas F. indeterministicas a. BDE b. ABC c. AEF d. BCD e. ACD Pregunta 46. Bootstrap reduce _______ a. la varianza d. el bias b. el conjunto de testeo e. el trade-o c. el conjunto de entrenamiento Pregunta 47. Para mejorar la respuesta hacia una hipótesis con muestras con pocos registros, es recomendable utilizar _____ a. Metacost d. Varianza b. bootstrap e. GGBoost c. Bias Pregunta 48. Qué tipo de or tiene un nivel de desorden de cero? a. Todas d.iris-versicolor b. NingunaT e. Iris-virginica c. Iris-setosa Pregunta 49. Cuál es el potencial nodo raiz? a. Ambiente b. Temperatura c. Viento d. Juega e. Humedad Pregunta 50. → Excel Dado el siguiente dataset: Determinar la medida del desorden para el atributo temperatura a dos decimales Respuesta = 0.91 Pregunta 51. Dado el siguiente dataset: Determinar la medida del desorden para el atributo humedad a dos Decimales 0.79 Pregunta 52. Se lográ un accuracy de 90% al predecir la etiqueta con la técnica de árbol decisión. Qué armación es correcta? a. El árbol tiene una profundidad de 20 niveles, si se aumenta el máximo a 30, seguramente el nivel de accuracy mejoraría. b. El árbol tiene una profundidad de 20 niveles, si se elimina la variable que representa la etiqueta, seguramente el nivel de accuracy mejoraría. c. El árbol tiene una profundidad de 20 niveles, si se aumentan todas las variables del dataset y aunque estas no estén en el árbol de decisión, seguramente el nivel de accuracy empeora. d. El árbol tiene una profundidad de 20 niveles, si se elimina de la selección de variables aquella que representa el nodo raiz, seguramente el nivel de accuracy mejoraría. e. El árbol tiene una profundidad de 20 niveles, si se reduce el máximo a 10, seguramente el nivel de accuracy mejoraría. Pregunta 53. Se aplica un árbol de decisión a un dataset de tipos de o Iris con 80% de entrenamiento y 20% de pruebas, los resultados fueron: Qué interpretación es correcta? a. el modelo predijo que la flor era la Iris-setosa, pero realmente fue una Iris-virginica b. el modelo predijo que la flor era la Iris-versicolor, pero realmente fue una Iris-virginica c. el modelo predijo que la flor era la Iris-virginica, pero realmente fue una Iris-versicolor d. el modelo predijo que la flor era la Iris-setosa, pero realmente fue una Iris-versicolor Pregunta 54. Los siguiente atributos contiene las siguientes medidas de desorden: Atributo Desorden BMI 0.60 Glucosa 0.45 Insulina 0.67 Edad 0.80 Cuál es el nodo raiz? a.Insulina d. Edad b. BMI e. Glucosa c. Ninguna de las anteriores Pregunta 55. Cuáles de las siguientes técnicas ______ utilizan para la medida del desorden, la siguiente fórmula? a. gini_index b.information_gain c. least_square d. accuracy e. gain_ratio Pregunta 56. El árbol se construye de la forma a. top-down recursive divide b. down-top recursive divide-and-conquer c. top-down recursive divide-and-conquer d. top-down recursive conquer e. top-down no recursive divide-and-conquer Pregunta 57. Al comienzo, todos los ejemplos de entrenamiento están _____ a. en el nodo down b. en el nodo raíz c. en el nodo base d. en el nodo hoja e. en el nodo podado Pregunta 58. Dado el siguiente dataset: Determinar la medida del desorden para el atributo temperatura y la clase alta. a. 0.8 b. 0.2 c. 0.5 d. 1 e. 0 Pregunta 59. Un árbol de decisión es a. un modelo de agrupación determinístico b. un modelo de agrupación no determinístico c. un modelo de predicción no determinístico d. un modelo de predicción determinístico Pregunta 60. El coeciente de Silueta es una métrica para evaluar la calidad del agrupamiento obtenido con algoritmos de clustering. El objetivo de Silueta es ______________ a. identicar cuál es el número óptimo de agrupamientos b. reducir la distancia entre las observaciones c. identicar cuál es el número óptimo de observaciones d. identicar cuales son las observaciones más alejadas de los clusters e. identicar cuales son las observaciones más cercanas a sus compañeros Pregunta 61. Para que un análisis de cluster sea eciente debe..... a. maximizar la distancia intracluster y minimizar la distancia intercluster b. minimizar la distancia intracluster y maximixar la distancia intercluster c. igualar la distancia intracluster a la distancia intercluster d. minimizar la distancia incluster y maximixar la distancia outcluster e. minimizar la distancia excluster y maximixar la distancia incluster Pregunta 62. Cuál es la armación correcta? a. Ninguno de los dos clusters es bueno b. El cluster 0 tiene menor distancia intra e inter cluster c. Los dos clusters son buenos y casi idénticos d. El cluster 1 tiene menor distancia intra e inter cluster e. No se puede analizar con este tipo de gráca Pregunta 63. Cuál es la armación correcta? a. La diferencia es que, en K-medoids, cada cluster está representado por una observación presente en el cluster (medoid), mientras que en K-means cada cluster está representado por su centroide, que se corresponde con el promedio de todas las observaciones del cluster pero con ninguna en particular b. La diferencia es que, en K-medoids, cada cluster está representado por su centroide, mientras que en K-means cada cluster está representado por una observación presente en el cluster (medoid), que se corresponde con el promedio de todas las observaciones del cluster pero con ninguna en particular c. La diferencia es que, en K-medoids, cada cluster está representadopor una observación presente en el extremo de cluster (medoid),mientras que en K-means cada cluster está representado por supromedio, que se corresponde con el promedio de todas lasobservaciones del cluster pero con ninguna en particular d. No hay diferencia entre K-means y K-medoids, porque cada caso está representado por una observación presente en el cluster Pregunta 64. Qué distancia entre dos puntos no es en linea recta? a. euclidiana b. Ninguna de las anteriores c. manhattan d. Chebysev Pregunta 65. Qué no es un análisis de cluster? A. Clasicación supervisada B. Clasicación no supervisada C. Dividir a los estudiantes agrupados por sexo D. Dividir a los estudiantes en dimensiones como calicaciones, sexo y horas de estudio E. Resultados de una consulta con SQL F. Resultados de una consulta para vericar los centroides a. ADE b. BDF ACD c. ACE Pregunta 66. La siguiente gráca tiene índice silouette con varios intentos de clusters. Cuál es la armación correcta? a. La conguración con K en 3 es la mejor b. La conguración con K en 2 y 4 son las mejores opciones c. La conguración con K en 3,5 y 6 son las mejores opciones d. La conguración con K en 6 es la mejor e. Ninguna conguración es recomendable Pregunta 67. A qué tipo de cluster pertenece la siguente gráca? a. k-means b. DBScan c. Expectation-maximization d. k-medoids e. KDE Pregunta 68. Qué defecto tiene el siguiente cluster? a. El punto centroide no está dentro de un punto de dato b. El punto centroide está bien, no hay defecto c. El punto centroide no representa al cluster d. Debe haber dos puntos centroides e. No se puede utilizar una clusterización en la gráca Pregunta 69. Cuál es la armación correcta con respecto al SSE? a. Un buen clustering con un K más pequeño puede tener un SSE menor que un clustering pobre con un K superior b. Un buen clustering con un K superior puede tener un SSE menor que un clustering pobre con un K más pequeño c. Un buen clustering con un K más pequeño puede tener un EES menor que un clustering pobre con un K superior d. Un buen clustering con un K = 2 puede tener un SSE menor que un clustering pobre con un K = 1 e. Un buen clustering con un K superior puede tener un SSE menor que un clustering pobre con un K = 1 Pregunta 70. Cómo cataloga este clustering? a. eciente b. óptimo c. sub-óptimo d. original e. ninguno de los anteriores Pregunta 71. Cuál es la armación correcta con respecto al algoritmo k-means? a. El algoritmo inicializa con K centroides generados aleatoriamente el iterativamente El algoritmo inicializa con K centroides generados aleatoriamente e b. El algoritmo inicializa con K centroides colocandos en el centro el iterativamente calcula la pertenencia de los patrones a cada grupo en base a la distancia. Luego, se ajusta el centroide moviéndolo al punto medio c. El algoritmo inicializa con K centroides generados aleatoriamente e iterativamente calcula la pertenencia de los patrones a cada grupo en base a la distancia al centroide. Luego, se ajusta el centroide moviéndolo a uno de los datos d. El algoritmo inicializa con K centroides dispuestos aleatoriamente e iterativamente calcula la pertenencia de los patrones a cada dato en base a la distancia al dato central. Luego, se ajusta el dato moviéndoloal punto extremo e. El algoritmo inicializa con K centroides generados centralmente eiterativamente calcula la pertenencia de los patrones a cada grupojerárquico en base a la distancia al centroide. Luego, se ajusta el centroide moviéndolo al punto medio Pregunta 72. A que tipo de cluster pertenece el siguiente concepto: Una división de los objetos de dato en subconjuntos disjuntos (clusters) tal que cada objeto de datos está en exactamente un subconjunto a. Jerárquico b. Divisivo c. Aglomerativo d. Particional Pregunta 73. Al modicar epsilon a 1 y minimal point a 1 la gráca presenta la siguiente organización Qué parámetro hace falta modicar y a cuanto para que se formen uno o dos clusters más? a. Modicar minimal points a 5 y epsilon a 2 b. Modicar epsilon a 3 c. Modicar epsilon a 2 d. Modicar minimal points a 10 e. Modicar minimal points a 5 f. Modicar minimal points a 10 y epsilon a 10 g. Modicar minimal points a 2 h. Modicar epsilon a 0.8 Pregunta 74. Cuál es la armación correcta con respecto al análisis de cluster? a. La agrupación no es adecuada pueden formarse otros grupos b. La agrupación no es adecuada, deben verse pocos puntos de datos con ruido c. La agrupación no es adecuada no deben existir puntos de datos con ruido d. La agrupación es adecuada aunque existan puntos de datos con ruido e. La agrupación no es adecuada pueden formarse otros grupos aunque hayan algunos puntos con ruido Pregunta 75. La medida más común para calcular la distancia de cada punto a su centroide es ____ para cada punto. a. suma de errores al cuadrado b. suma de distancias entre clusters al cuadrado c. suma de distancias intraclusters a la cuarta potencia d. suma de errores al cubo e. suma de distancias al cubo Pregunta 76. Dadas dos dimensiones, qué técnica es más adecuada para clusterizar? a. exponencial b. divisivo c. particional d. aglomerarivo e. jerárquico Pregunta 77. El cálculo de pesos de la gura, qué fórmula representa para su clasicación en el dataset? a. Diametro * -1.26 + Color * 7.60 * 0.33 b. (Diametro * 7.60 + Color * -1.26) * 0.33 c. Diametro+7.60 + Color-1.26 + 0.33 d. Diametro * 7.60 + Color * -1.26 + 0.33 e. [(Diametro * 7.60) * (Color * -1.26)] + 0.33 Pregunta 78. Dado el dataset: Se desea construir un perceptrón que haga una predicción si la persona corre o no una competencia, considerando los atributos antes descritos. Si los pesos de cada atributo se establecen de la siguiente forma: (Dinero=0.5, Tiempo=1, Clima=1) Considerando que no se normalizaran los valores. Cuál sería el valor de neta para el caso de Juan? Respuestas 12.5 Pregunta 79. Las Redes Neuronales Articiales o simplemente Redes Neuronales, buscan emular el comportamiento ___________ a. del cerebro humano b. Ninguna de la anteriores c. el cuerpo humano d. de una neurona Pregunta 80. El nodo sumatorio acumula todas las señales de entrada multiplicadaspor los pesos o ponderadas y las pasa a la salida a través de unafunción umbral o función de transferencia Pregunta 81. Cuál es la armación correcta con respecto al cerebro humano? a. El cerebro humano procesa información precisa rápidamente,aprende sin instrucciónes explícitas. Para ello, crea representacionesinternas que permiten estas habilitadas. b. El cerebro humano procesa información imprecisa rápidamente,aprende sin instrucciónes explícitas. Para ello, crea representacionesinternas que permiten estas habilitadas. c. El cerebro humano procesa información imprecisa rápidamente,aprende con instrucciónes explícitas. Para ello, crea representaciones internas que permiten estas habilitadas. d. El cerebro humano procesa información imprecisa rápidamente, aprended. El cerebro humano procesa información precisa rápidamente, aprende con instrucciónes explícitas. Para ello, crea representaciones internas que permiten estas habilitadas. Pregunta 82. Dado el dataset: Se desea construir un perceptrón que haga una predicción si la persona corre o no una competencia, considerando los atributosdescritos. Si los pesos de cada atributo se establecen de la siguiente form (Dinero=0.5, Tiempo=1, Clima=1) Considerando que no se normalizaran los valores. Cuál sería el vde neta para el caso de María? a. 2.5 b. 19 c. 18.5 d. 10 e. 12 Pregunta 83. La entrada neta se describe por la fórmula: a. b. CORRECTO c. d. Pregunta 84. Cada señal de entrada pasa a través de una ganancia o peso, llamado _________________ cuya función es análoga a la de la función sináptica de la neurona biológica. Los pesos pueden ser positivos (excitatorios), o negativos (inhibitorios). a. peso sináptico o fortaleza de la conexión b. conexión sináptica o fortaleza de la conexión c. conexión sináptica o excitación de la conexión d. peso ponderado absoluto de la conexión e. peso sináptico o excitación de la conexión f. neta absoluta de la conexión Pregunta 85. Dado el dataset: Se desea construir un perceptrón que haga una predicción si la persona corre o no una competencia, considerando los atributos antes descritos. Como se establecen los valores normalizados si se aplica la normalización por rango de 0 a 1, para el atributo de dinero en el caso de Juan? Respuesta : 0.5 Pregunta 86. ¿Qué puede ocurrir si el ratio de aprendizaje es muy pequeño en un algoritmo de optimización? a. El gradiente se invierte b. El algoritmo converge rápidamente c. El proceso puede ser ineciente y requerir muchas iteraciones d. ninguno de los anteriores e. El punto queda atrapado en un mínimo global Pregunta 87. ¿Qué hacemos con la derivada para encontrar un punto mínimo en una función convexa? a.Igualar la pendiente a cero y resolver la ecuación b. No hallar ningún punto c. Multiplicar un único punto mínimo d. Hallar dos puntos mínimos Pregunta 88. ¿Cuál es la estrategia básica para entrenar un modelo de regresión lineal? a. No es posible entrenar un modelo de regresión lineal b. Plantearlo de forma matemática y buscar una fórmula mediante el método de mínimos cuadrados c. ninguno de los anteriores d. Entrenarlo con datos aleatorios e. Utilizar un enfoque de prueba y error Pregunta 89. ¿Cuál es el rango de valores que puede tener la 'Activación' de una neurona en una red neuronal? a. 0 a 255 b. 0 a 100 c. 0 a 1 d. ninguna de las anteriores e. 0 a 10 Pregunta 90. Existe una matriz de 10 x 8 donde se representan número escritos a mano. Cuántas entradas tendría la red neuronal? a. 80 b. 10 c. 80 + 1 bias d. Ninguno de los anteriores e. 8 Pregunta 91. ¿Qué estrategia matemática se utiliza para encontrar mínimos locales en funciones no convexas? a. Método de Euler b. Integración numérica c. Descenso del gradiente d. Transformada de Fourier Pregunta 92. ¿Cuál es la mayor esperanza para las capas medias de una red neuronal? a. Clasicar las imágenes por colores b. Reconocer patrones no especícos en el texto c. Reconocer subcomponentes de los dígitos d. Generar nuevas imágenes e. ninguna de las anteriores Pregunta 93. ¿Qué representa una neurona en una red neuronal según el texto? a. ninguna de las anteriores b. Una imagen c. Un número almacenado entre 0 y 10 d. Una función e. Un vector Pregunta 94. ¿Qué determina las activaciones en una capa de una red neuronal? a. El brillo de cada pixel en la imagen b. El tipo de imagen c. ninguna de las anteriores d. La capa anterior, considerando las capas ocultas y la de salida e. El número de neuronas en la capa Pregunta 95. Qué nos indica la derivada de una función en un punto? a. ¿Qué nos indica la derivada de una función en un punto? b. ninguna de las anteriores c. El área bajo la curva en ese punto d. El valor de la función en ese punto e. La pendiente de la función en ese punto Pregunta 96. ¿Qué parámetro adicional se necesita añadir al algoritmo para completarlo? a. Derivada parcial b. Vector de dirección c. Gradiente descendente d. Vector de dirección inversa e. Ratio de aprendizaje Pregunta 97. ¿Qué tipo de estructura de capas se utiliza en la red neuronal mencionada en el video? a. Cuatro capas de entrada b. Tres capas ocultas y una capa de salida c. Tres capas ocultas d. Dos capas ocultas y una capa de salida e. Una sola capa Pregunta 98. ¿Qué sucede si el ratio de aprendizaje es muy elevado en un algoritmo de optimización? a. El gradiente se anula b. El proceso se vuelve más eciente c. El algoritmo converge rápidamente d. El punto es incapaz de converger en un mínimo coste Pregunta 99. ¿Cuántos puntos mínimos podemos encontrar en una función no convexa? a. Un único punto mínimo b. Ningún punto mínimo c. Múltiples puntos mínimos d. Dos puntos mínimos Pregunta 100. ¿Qué operación importante se hace en una red neuronal para determinar el softmax? a. La reducción de neuronas b. La optimización de la función de activación c. ninguno de los anteriores d. La eliminación de BIAS e. La multiplicación entre matrices Pregunta 101. ¿Qué indica el vector conformado por todas las derivadas parciales en diferentes direcciones? a. La dirección hacia la que la pendiente desciende b. La dirección vertical c. La dirección hacia la que la pendiente asciende d. La dirección horizontal Pregunta 102. Si existe una red neuronal para predecir un número entre 0 y 9 dibujado en una plantilla, la última capa de la red neuronal correspondería _______________ a. a los números entre 0 y 9, cada neurona correspondería a un número b. a la capa oculta c. a la capa de entrada d. a los números entre 0 y 9, donde cada neurona correspondería a una entrada en escala de colores e. a los números entre 0 y 9, donde cada neurona correspondería a una entrada en escala de grises Pregunta 103. ¿Qué representa la neurona más iluminada en la capa de salida de una red neuronal entrenada para reconocer dígitos? a. El número que la imagen representa b. ninguna de las anteriores c. El brillo de la imagen d. El tamaño de la imagen e. El color de la imagen Pregunta 104. ¿Cuál es el objetivo principal de las capas medias en una red neuronal para el ejemplo de reconocimiento de dígitos numéricos? a. Clasicar las imágenes por colores b. ninguno de los anteriores c. Reconocer patrones complejos en las imágenes d. Detectar la resolución de las imágenes e. Generar números aleatorios Pregunta 105. ¿Qué representa el BIAS en una neurona de una red neuronal? a. La cantidad de conexiones a otras neuronas b. La función de activación de la capa de entrada c. ninguna de las anteriores d. La suma de los pesos de las conexiones e. El umbral de activación de la neurona Pregunta 106. ¿Qué función se utiliza comúnmente para empujar la suma pesada en un rango entre 0 y 1? a. Tangente hiperbólica b. ninguna de las anteriores c. Softmax d. ReLU e. Sigmoid Pregunta 107. La salida y de un perceptron es por la aplicación de: a. f(x.w) b. f(w) c. f(x) d. f(neta) Pregunta 108. Se requiere entrenar un perceptrón para el siguiente problema: Una alarma tiene dos sensores X1 y X2, la alarma(t) se enciende solo en los siguientes casos: a) Cuando X1 y X2 están encendidos b) Cuando X2 está encendido y X1 está apagado Conocemos que θ tiene el valor de 0.2 y el ratio de aprendizaje es de 0.5. Si se construye el perceptrócon los valores iniciales en los pesos de w1=0.4 y w2=0.6, cuál es el valor nal de w1? Respuesta: -0.1 Pregunta 109. Dadas las siguiente entradas y pesos, determinar el valor de neta Respuesta: 2.2 Pregunta 110. Dadas las siguiente entradas a en la red neuronal, calcular el valor de neta a. 1 b. 17 c. 20 d. 3 e. 0.8 Pregunta 111. Dadas los siguientes valores de un perceptrón, deducir cuales solo los valores de y? a. 0,1,1,0 b. 1,1,1,1 c. 0,0,1,1 d. 0,1,1,1 e. 1,0,0,1 Pregunta 112. Cuál es soporte de {A}->{C} en: Exprese su respuesta con dos decimales. (Ejm: Ingrese 0.3 para expresar el 30%) Excel La respuesta correcta es: 0,4 Pregunta 113. La fórmula para obtener la conanza es: a. conf({producto1}->{producto2}) = supp({producto1,producto2}) / supp({producto2}) b. conf({producto1}->{producto2}) = supp({producto1,producto2}) / supp({producto1}) c. conf({producto1}->{producto2}) = supp({producto1}) / supp({producto2}) d. conf({producto1}->{producto2}) = supp({producto2}) * supp({producto1}) e. conf({producto2}->{producto1}) = supp({producto1,producto2}) / supp({producto2}) Pregunta 114. Cuál es la conanza en {B,C}->{D} en: Exprese su respuesta con dos decimales. (Ejm: Ingrese 0.3 para expresar el 30%) Respuesta: 0,67 La respuesta correcta es: 0,33 Pregunta 115. Cuál es el soporte en {A,B,}->{C} en: a. 0.7 b. 0.5 c. 0.2 d. 0.1 e. 0.9 Pregunta 116. Dada la siguiente base de datos: En el algoritmo A-Priori, si el soporte mínimo fuese 0.55, qué items pasarían la primera fase del algoritmo? a. {3}.{5} b. {2}.{3}.{5} c. {1}.{2}.{3} d. {1}.{4} e. Ninguno f. {1}.{3},{4},{5} g. {2}.{3} h. {1}.{2}.{3},{4},{5} 1. ¿Cuál es la arquitectura dominante para los Large Language Models? a.Transformers b.Redes Neuronales Recurrentes (RNN) c.Redes Neuronales Convolucionales (CNN) d.Long Short-Term Memory (LSTM) Respuesta correcta: a. Transformers 2. ¿Cómo se entrenan los LLM´s? a.Con datos de baja calidad b.Con datos etiquetados c.Con pocos datos d.Con enormes cantidades de datos Respuesta correcta: d. Con enormes cantidades de datos 3. ¿Qué es BERT en el contexto de los modelos generativos? a.Un modelo desarrollado por Google b.Un modelo desarrollado por OpenAI c.Un modelo que no realiza Fine Tuning d.Un modelo que no utiliza corpus de texto Respuesta correcta: a. Un modelo desarrollado por Google 4. ¿Qué son los LLM? a.Modelos de lenguaje medianos b.Modelos de lenguaje grandes c.Modelos de lenguaje gigantes d.Modelos de lenguaje pequeños Respuesta correcta: b. Modelos de lenguaje grandes 5. ¿Qué es el Diccionario Blando en los Transformers? a.Un diccionario que guarda las palabras de forma rígida b.Un diccionario que no influye en el modelo c.Un diccionario que establece la atención entre palabras d.Un diccionario que no se modifica Respuesta correcta: c. Un diccionario que establece la atención entre palabras 6. ¿Qué es el tipo de red neuronal transformer? a.Un tipo de red neuronal que aprende contexto y significado b. Un tipo de red neuronal que no aprende contexto c.Un tipo de red neuronal que solo procesa imágenes d. Un tipo de red neuronal que no necesita datos ordenados Respuesta correcta: a. Un tipo de red neuronal que aprende contexto y significado 7. ¿Cómo fueron entrenadas las redes Transformers? Respuesta a.Con datos etiquetados b. Con corpus de texto sin etiquetar С.Con poca cantidad de datos d. Con datos de baja calidad Respuesta correcta: b. Con corpus de texto sin etiquetar 8. Qué es la inteligencia artificial generativa? a. Un tipo de lA que solo puede generar texto b. Un tipo de lA que solo puede generar videos c. Un tipo de lA que solo puede generar imágenes d. Un tipo de lA capaz de generar diversos tipos de contenidos Respuesta correcta: d. Un tipo de IA capaz de generar diversos tipos de contenidos 9. ¿Qué es el Mecanismo de Atención en una red neuronal transformer? a. Un mecanismo para ignorar las palabras b. Un mecanismo para reducir la complejidad de la red c. Un mecanismo para crear y dar fuerza a las relaciones entre palabras d. Un mecanismo para eliminar la atención Respuesta correcta: c. Un mecanismo para crear y dar fuerza a las relaciones entre palabras 10. ¿Qué es el Embedding de Palabras en una red neuronal transformer? a.Una técnica para traducir palabras a diferentes idiomas b. Un método para comprimir las palabras en la red c. Un proceso para eliminar palabras del vocabulario d. Un vector de números que representa una palabra Respuesta correcta: d. Un vector de números que representa una palabra 11. ¿Qué es el Multi-head Self-Attention en una red neuronal transformer? a.Una técnica para ignorar ciertas palabras en una secuencia b. Un enfoque para prestar atención a diferentes partes de la secuencia c. Una forma de reducir la complejidad de la red d. Un método para eliminar la atención en la red Respuesta correcta: b. Un enfoque para prestar atención a diferentes partes de la secuencia 12. ¿Qué es la Capa de Atención en Decoder en una red neuronal transformer? a.Una capa que no presta atención a nada b.Una capa que solo presta atención a la salida c.Una capa que presta atención tanto a la entrada como a la salida d.Una capa que solo presta atención a la entrada Respuesta correcta: c. Una capa que presta atención tanto a la entrada como a la salida 13. ¿Qué es el fine-tuning en el contexto de los LLM? a. La eliminación de datos de entrenamiento en un LLM. b. El proceso de adaptar un LLM preentrenado a una tarea específica utilizando conjunto de datos más pequeño. c. La creación de un nuevo modelo de lenguaje desde cero. d. El proceso de preentrenamiento de un LLM. Respuesta correcta: b. El proceso de adaptar un LLM preentrenado a una tarea específica utilizando conjunto de datos más pequeño. 14. ¿Qué tipo de modelo es BERT? a. LLM preentrenados b. LLM específicos c. LLM multimodales d. LLM de solo texto Respuesta correcta: c. LLM preentrenados 15 ¿Qué es el modelo GPT en el contexto de los Transformers? a. Un modelo desarrollado por OpenAl b. Un modelo que no realiza Fine Tuning c. Un modelo que no utiliza corpus de texto d. Un modelo desarrollado por Amazon Respuesta correcta: a. Un modelo desarrollado por OpenAI 16. ¿Qué es el aprendizaje auto supervisado en los Transformers? a. Un aprendizaje con supervisión externa b. Un aprendizaje con etiquetas en los datos de entrada c. Un aprendizaje sin supervisión d. Un aprendizaje que no utiliza datos de entrada Respuesta correcta: c. Un aprendizaje sin supervisión 17. ¿Qué es el Output Embeddings en una red neuronal transformer? a. Una capa que convierte las palabras en vectores b. Una capa que no tiene función en la red c. Una capa que elimina las palabras de la secuencia d. Una capa que no procesa la salida Respuesta correcta: a. Una capa que convierte las palabras en vectores 18 ¿Qué es el Positional Encoding en una red neuronal transformer? a. Un proceso para reducir la dimensionalidad de los datos b. Una técnica para posicionar las capas de la red c. Una forma de codificar la posición de las palabras en una secuencia d. Un método para eliminar la posición de las palabras Respuesta correcta: c. Una forma de codificar la posición de las palabras en una secuencia 19. ¿Qué es el Fine Tuning en las redes neuronales? a. Un proceso para entrenar desde cero un modelo b. Una técnica para ajustar finamente las capas de la red c. Un enfoque para no adaptar el modelo a nuevas tareas d. Un método para eliminar todas las capas de la red Respuesta correcta: b. Una técnica para ajustar finamente las capas de la red 20. ¿Qué aspecto es fundamental en el desarrollo de los LLM? a. Los datos b. El color del modelo c. El tamaño de la pantalla d. La marca del procesador Respuesta correcta: a. Los datos

Repaso para el examen de IA.pdf

Document Details

Tags

Related

Full Transcript