Estandarización de Datos y Creación de Variables Dummy en Python

BelievableLobster avatar
BelievableLobster
·
·
Download

Start Quiz

Study Flashcards

17 Questions

¿Qué técnica se utilizó para reducir la dimensionalidad en el código proporcionado?

Análisis de Componentes Principales (PCA)

¿Qué se obtiene al aplicar np.linalg.eig(covarianza) en el código proporcionado?

Valores y vectores propios

¿Qué problema se menciona al tener 71 dimensiones en el análisis realizado?

Demasiada dispersión entre registros

¿Qué se hace con la matriz de proyección obtenida en el código?

Se multiplica por los datos

¿Qué herramienta estadística se utilizó para estandarizar las columnas en el código?

stats.zscore

¿Qué indica el parámetro n_components en el método de PCA?

El porcentaje de varianza a conservar.

¿Cuál es el objetivo principal de reducir la dimensionalidad en un análisis de datos?

Facilitar la visualización y análisis de los datos

¿Qué devuelve el método transform() de PCA?

La matriz de componentes principales del nuevo conjunto de datos.

¿Qué hace la función train_test_split() de sklearn.model_selection?

Divide el conjunto de datos en entrenamiento y prueba.

¿Para qué se utiliza el análisis discriminante lineal (LDA) en Machine Learning?

Para reducir la dimensionalidad de los datos.

¿Cuál es el propósito de partir los datos con la función train_test_split() antes de aplicar un modelo de aprendizaje automático?

Evaluar el modelo con nuevos datos.

¿Cómo se define un registro como fronterizo en el contexto del texto?

Si está a una distancia mayor que el radio eps de un punto central o principal.

¿Qué algoritmo no se emplea para predecir comportamientos o clasificar nuevos registros según el texto?

PCA

¿Qué representa la densidad de un determinado registro X en el contexto del texto?

El número de registros a una distancia menor que eps.

¿En qué consiste la función del algoritmo DBSCAN según el texto?

Determina si un registro es principal, ruido o fronterizo.

¿Para qué se emplean algoritmos como KMeans y KNN según el texto?

Para predecir comportamientos en nuevos registros.

¿Qué sucede con los puntos de la vecindad en el algoritmo DBSCAN si están lejos de cualquier grupo?

Se consideran ruido.

Learn how to standardize numerical data and create dummy variables using Python pandas and scipy libraries. This quiz covers the process of standardizing columns and creating dummy variables for categorical data.

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free

More Quizzes Like This

Use Quizgecko on...
Browser
Browser