Analisis de Datos
100 Questions
2 Views

Analisis de Datos

Created by
@Itan

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

La estadística ha sido definida como:

  • El arte de manejar con rigor los números.
  • La ciencia del aprendizaje a partir de los datos.
  • La ciencia que produce, analiza y extrae conclusiones de los datos.
  • Las respuestas B y C son correctas. (correct)
  • ¿De qué clase son cada una de las siguientes variables?

    Tipo de madera (pino, cedro, roble). = Nominal Grosor de la pintura (en milímetros). = Continua Meses del año (Enero, Febrero…). = Ordinal Número de hijos. = Discreta

    Con la estadística manejamos:

  • Información en forma de datos.
  • Números contextualizados.
  • Individuos de una población.
  • Las respuestas A y B son correctas. (correct)
  • Hoy en día en España los censos…

    <p>Ya no existen como tal.</p> Signup and view all the answers

    Decimos que una muestra es representativa cuando:

    <p>Posee una diversidad muy parecida a la de la población.</p> Signup and view all the answers

    Decimos que los estudios experimentales:

    <p>Son junto con los observacionales los dos grandes tipos de estudios estadísticos.</p> Signup and view all the answers

    Un pictograma representa la información:

    <p>En el área del dibujo.</p> Signup and view all the answers

    Referente a la infraestructura requerida para llevar a cabo análisis de datos en Big Data:

    <p>Todo lo anterior es falso.</p> Signup and view all the answers

    La aplicación de la estadística en Big Data:

    <p>La información es, a veces, demasiado compleja.</p> Signup and view all the answers

    La estadística:

    <p>Es una disciplina clásica.</p> Signup and view all the answers

    R soporta datos de tipo numérico en sus bases de datos:

    <p>Verdadero.</p> Signup and view all the answers

    R soporta datos de tipo categórico en sus bases de datos:

    <p>Verdadero.</p> Signup and view all the answers

    Histogram() es la etiqueta para desarrollar una función que elabore histogramas en un algoritmo desarrollado con R:

    <p>Incorrecto</p> Signup and view all the answers

    En estos momentos, R es un software que ofrece soporte ilimitado a la solución de problemas estadísticos en el entorno Big Data.

    <p>Todas las respuestas anteriores son correctas.</p> Signup and view all the answers

    ¿Por qué puede ser relevante la irrupción del código R en temas de ciberseguridad?

    <p>Todas las propuestas anteriores son correctas.</p> Signup and view all the answers

    Uno de los objetivos básicos de la programación es la capacidad de desarrollar código que sea reutilizable:

    <p>Verdadero, extensible al área de la estadística donde se pretenden crear códigos generalistas que puedan ser utilizados sobre distintos escenarios.</p> Signup and view all the answers

    Sobre el uso de la programación por módulos en R:

    <p>Todas las anteriores son correctas.</p> Signup and view all the answers

    R no permite compartir librerías con otros lenguajes:

    <p>Falso, las librerías se pueden compartir con otros lenguajes de programación.</p> Signup and view all the answers

    ¿Puede R trabajar con varios tipos de ficheros de datos?

    <p>Sí, puede trabajar con varios tipos de ficheros, ejemplo .txt, ,csv.</p> Signup and view all the answers

    ¿Puede un solo código R tratar simultáneamente variables categóricas y numéricas?

    <p>Sí, es algo estándar.</p> Signup and view all the answers

    ¿Cuántos cuartiles hay en una distribución de datos?

    <p>3</p> Signup and view all the answers

    ¿Qué cuantiles equivalen a la mediana?

    <p>Las respuestas A y C son correctas.</p> Signup and view all the answers

    La mediana…

    <p>Es el valor central pero solo si el conjunto de datos es impar.</p> Signup and view all the answers

    La media…

    <p>Las respuestas A y C son correctas.</p> Signup and view all the answers

    La medida estadística que menos se ve afectada por los valores atípicos es:

    <p>La mediana.</p> Signup and view all the answers

    En la fórmula de la mediana para datos agrupados: ¿Qué representan las letras y símbolos? $Me = {L_{i - 1}} + \frac{{\frac{N}{2} - {N_{i - 1}}}}{{{n_i}}} \times {a_i}$

    <p>Las repuestas A y B son correctas.</p> Signup and view all the answers

    La varianza…:

    <p>Las repuestas A y C son correctas.</p> Signup and view all the answers

    El diagrama de cajas se construye con:

    <p>Cinco valores: La mediana, el cuartil 1, el cuartil 3, el mínimo y el máximo.</p> Signup and view all the answers

    Una medida estadística que nos permite comparar entre diferentes poblaciones es:

    <p>Las respuestas A y C son correctas.</p> Signup and view all the answers

    En cuanto a la asimetría…

    <p>Las respuestas A y C son correctas.</p> Signup and view all the answers

    Las frecuencias marginales son:

    <p>Aquellas que hacen referencia a una sola variable marginando a la otra.</p> Signup and view all the answers

    La covarianza del mismo modo que la varianza…

    <p>Su magnitud no nos dice mucho sobre si covarían entre sí mucho o poco las dos variables.</p> Signup and view all the answers

    Un diagrama de dispersión nos permite ver:

    <p>Las tres anteriores son correctas.</p> Signup and view all the answers

    La causalidad entre variables…

    <p>No tiene por qué deducirse de la asociación que exista entre ellas.</p> Signup and view all the answers

    Cuando existe un asociación aproximadamente lineal entre variables que hemos modelado con una regresión lineal…

    <p>A y C son correctas.</p> Signup and view all the answers

    Si el coeficiente de correlación es nulo:

    <p>Puede estar existiendo otro tipo de relación entre las variables.</p> Signup and view all the answers

    El Método de los Mínimos Cuadrados sirve para…

    <p>Hallar la ecuación de la recta que minimiza las desviaciones respecto a las observaciones.</p> Signup and view all the answers

    El coeficiente de determinación…

    <p>A y C son correctas.</p> Signup and view all the answers

    Los modelos lineales se emplean más en estadística porque…

    <p>Suponen una aproximación matemática sencilla a relaciones entre variables que pueden ser un tanto más complejas.</p> Signup and view all the answers

    Un scatterplot es:

    <p>Un gráfico que muestra la relación entre dos variables cuantitativas.</p> Signup and view all the answers

    Si tenemos un variable aleatoria X que se distribuye como una Bi(10;0,5):

    <p>Su varianza es 2.5</p> Signup and view all the answers

    En una distribución normal a mayor sigma:

    <p>Las respuestas B y C son correctas.</p> Signup and view all the answers

    Si los tres primeros lanzamientos de una moneda han resultado cara, la probabilidad de que obtengamos cara en el cuarto lanzamiento es:

    <p>$ 1/2 $</p> Signup and view all the answers

    Dos eventos se dice que son independientes cuando:

    <p>El hecho de que ocurra uno no afecta a la probabilidad de que ocurra el otro.</p> Signup and view all the answers

    $ F\left( {{x_i}} \right) $ es

    <p>$ 1 - P\left( {X &gt; {x_i}} \right) $</p> Signup and view all the answers

    Si tiramos dos dados y sumamos sus puntuaciones. La probabilidad de obtener un 6,7 o un 8 es:

    <p>0.44.</p> Signup and view all the answers

    La V(X+Y) es igual a:

    <p>Las respuestas A y C son correctas.</p> Signup and view all the answers

    En una distribución binomial el parámetro «q» es:

    <p>Las respuestas A y B son correctas.</p> Signup and view all the answers

    La distribución normal está caracteriza por dos parámetros que son:

    <p>La media y la desviación típica.</p> Signup and view all the answers

    Si $ X\sim N\left( {5,2} \right)\ $ entonces la variable tipificada Z la obtenemos como…

    <p>$ \frac{{X - 5}}{2} $</p> Signup and view all the answers

    Para poder hablar propiamente de distribución muestral de un determinado estadístico…

    <p>Las respuestas B y C son correctas.</p> Signup and view all the answers

    El arco circunflejo lo empleamos en estadística inferencial para…

    <p>Las respuestas B y C son correctas.</p> Signup and view all the answers

    $ \hat p $ es...

    <p>El estimador de la proporción poblacional.</p> Signup and view all the answers

    ¿Por qué hay tantas variables en la naturaleza que se distribuyen normalmente?

    <p>Porque según el TCL la suma de muchos efectos aleatorios independientes se comporta normalmente.</p> Signup and view all the answers

    La desviación típica de la media muestral es:

    <p>$ \frac{\sigma }{{\sqrt[{}]{n}}} $</p> Signup and view all the answers

    Si multiplicamos por cuatro el tamaño de una muestra $ {\sigma _{\bar x}} $:

    <p>Se reduce a la mitad.</p> Signup and view all the answers

    El error estándar es…

    <p>Las respuestas B y C son correctas.</p> Signup and view all the answers

    Señala la frase correcta.

    <p>Todo estimador es una variable aleatoria función de la muestra.</p> Signup and view all the answers

    ¿Cuál es un estimador insesgado de la media poblacional?

    <p>Las respuestas A y B son correctas.</p> Signup and view all the answers

    ¿En qué se diferencian los dos tipos principales de estimación?

    <p>Un tipo de estimación da intervalos posibles para el parámetro mientras que la otra solo da un valor.</p> Signup and view all the answers

    ¿Qué fórmula es la correcta para hallar el IC de una media poblacional conocida su varianza?

    <p>Formula D</p> Signup and view all the answers

    ¿Qué es o a qué es igual «E»?

    <p>Al margen de error.</p> Signup and view all the answers

    Si hemos calculado el IC para p y resulta: 0,325

    <p>0.025</p> Signup and view all the answers

    Al IC 188cm<µ<209cm que marca con un 95% de confianza la estatura media de un equipo de la NBA lo interpretamos como…

    <p>Las respuestas B y C son correctas.</p> Signup and view all the answers

    Cuando σ no es conocida, en el cálculo de los valores críticos para construir los IC empleamos:

    <p>La T-Student.</p> Signup and view all the answers

    La T-Student es…

    <p>Las respuestas A y C son correctas.</p> Signup and view all the answers

    ¿Qué es una muestra piloto?

    <p>Una muestra que se recoge antes de hacer un estudio para tantear las características de la población.</p> Signup and view all the answers

    ¿En un IC que porcentaje de las veces éste no contendrá al parámetro?

    <p>α×100% de las veces.</p> Signup and view all the answers

    ¿Qué es un valor crítico en términos de inferencia?

    <p>Es el valor de una distribución que acumula cierta probabilidad.</p> Signup and view all the answers

    Empleamos intervalos de confianza entre otras razones porque…

    <p>Las respuestas A y B son correctas.</p> Signup and view all the answers

    ¿Para qué sirve un contraste de hipótesis?

    <p>Para contrastar si una afirmación sobre una población parece cierta o no en base a los datos.</p> Signup and view all the answers

    Generalmente el orden que seguimos en un contraste de hipótesis es…

    <p>Establecer primero la H0 para que quede delimitada aproximadamente la H1.</p> Signup and view all the answers

    ¿Cuántos diferentes planteamientos tenemos para la H1?

    <p>Las respuestas B y C son correctas.</p> Signup and view all the answers

    ¿Con que tipo de frases interpretamos un contraste de hipótesis?

    <p>«… no logramos encontrar evidencias estadísticamente significativas…»</p> Signup and view all the answers

    ¿Quién tiene que caer en la región crítica para que rechacemos la H0?

    <p>El estadístico de contraste que estemos empleando.</p> Signup and view all the answers

    ¿Qué es 1-β?

    <p>La potencia del contraste.</p> Signup and view all the answers

    La P(rechazar Ho | siendo Ho verdadera) es equivalente a:

    <p>α</p> Signup and view all the answers

    La regla del p valor para decidir un contraste de hipótesis es:

    <p>$\text{Si } p\text{-valor} &gt; \alpha \to \text{Aceptamos } H_0 \text{ mientras que si } p\text{-valor} \le \alpha \text{ rechazamos.}$</p> Signup and view all the answers

    ¿Cómo decidimos un contraste de hipótesis a través de un IC?

    <p>Si µ0 pertenece al IC construido para µ se acepta, de lo contrario rechazamos H0.</p> Signup and view all the answers

    Cuando en un contraste de hipótesis desconocemos la varianza de la población de la que provienen los datos empleamos…

    <p>La distribución T-Student como estadístico de contraste.</p> Signup and view all the answers

    El modelo de regresión lineal se supone...

    <p>No heterocedástico</p> Signup and view all the answers

    ¿Qué es lo que se contrasta en un modelo de regresión lineal?

    <p>Si la pendiente es nula o no.</p> Signup and view all the answers

    ¿Con que Test o pruebas podemos constrastar el modelo de regresión?

    <p>A y C son correctas.</p> Signup and view all the answers

    R2 equivale a:

    <p>B y D son correctas.</p> Signup and view all the answers

    Si el IC para β1 contiene al 0 esto querrá decir que: D B y C son correctas.

    <p>La regresión no es significativa.</p> Signup and view all the answers

    ¿Qué es alfa en el modelo de regresión?

    <p>La constante.</p> Signup and view all the answers

    En el ejemplo visto en el capítulo sobre las películas:

    <p>A y B son correctas.</p> Signup and view all the answers

    Si al graficar los errores estos presentar una forma de embudo:

    <p>Indicaría una falta de homocedasticidad.</p> Signup and view all the answers

    Los errores del modelo conviene que B sean casi todos elevados.

    <p>Que se alternen lo mejor posible los positivos y los negativos sin grandes saltos ni patrones.</p> Signup and view all the answers

    El modelo de regresión lineal consta de tres parámetros.

    <p>Alfa, beta y sigma.</p> Signup and view all the answers

    ¿Para qué sirve el análisis de componentes principales? ¿Para qué sirve el análisis de componentes principales?

    <p>Para reducir la dimensión de los datos.</p> Signup and view all the answers

    Los vectores de componentes principales:

    <p>Se obtienen agregando los valores de las variables del modelo.</p> Signup and view all the answers

    ¿Cuándo es una variable representativa del vector de componentes?

    <p>A y B son ciertas.</p> Signup and view all the answers

    Qué componentes son las que representan el ruido en una imagen?

    <p>las cercanas al último PC.</p> Signup and view all the answers

    Para detectar cambios en un modelo de datos…

    <p>Necesitamos distintos modelos de datos hechos en distintos tiempos o bajo distintas circunstancias.</p> Signup and view all the answers

    ¿Qué sucede si reducimos el número de componentes principales a utilizar en nuestro modelo reducido?

    <p>A y B son ciertas.</p> Signup and view all the answers

    ¿Cómo calculamos el modelo de datos reducido a partir del vector de componentes?

    <p>Generamos el valor agregado asociado a cada individuo multiplicando cada valor del vector de componentes por la variable asociada y sumando el resultado.</p> Signup and view all the answers

    Si nos atenemos al número de variables a representar, ¿qué gráfica de dispersión es más fácil de entender e interpretar?:

    <p>Una con 2 dimensiones.</p> Signup and view all the answers

    ¿Qué función de R hemos utilizado para poder calcular el vector de análisis de componentes?

    <p>prcomp</p> Signup and view all the answers

    ¿Si tenemos un modelo de datos con 5 variables, ¿cuántos vectores de componente principal generará el algoritmo?

    <p>5</p> Signup and view all the answers

    More Like This

    Use Quizgecko on...
    Browser
    Browser