Análisis de Regresión Lineal y Múltiple PDF
Document Details
Uploaded by ConvenientZebra
Tecnológico de Colima
Tags
Summary
Estas son notas de clase sobre análisis de regresión lineal y múltiple. El documento presenta diferentes ejemplos, fórmulas, gráficos y tipos de diagramas. Se enfoca en la relación entre variables y la predicción de valores desconocidos. El documento incluye conceptos como minimos cuadrados, intervalos de confianza, y análisis de correlación, con ejemplos prácticos y fórmulas.
Full Transcript
Estimación mediante una linea de regresión Unidad 2: Análisis de regresión lineal y múltiple TECNOLÓGICO DE COLIMA Análisis de regresión Permite comprobar la hipótesis de que una variable depende de otra u otras variables. Además, el análisis de regresión brinda una...
Estimación mediante una linea de regresión Unidad 2: Análisis de regresión lineal y múltiple TECNOLÓGICO DE COLIMA Análisis de regresión Permite comprobar la hipótesis de que una variable depende de otra u otras variables. Además, el análisis de regresión brinda una estimación de la magnitud del impacto de un cambio en una variable sobre otra. Imagina que tienes datos de dos variables, como la cantidad de horas que una persona estudia y la calificación que obtiene en un examen. Con la regresión lineal, puedes determinar si hay una relación entre estas dos variables y cómo se relacionan exactamente. La regresión lineal encuentra la mejor línea recta que se ajusta a estos datos, de manera que puedas predecir la calificación en el examen basándote en la cantidad de horas de estudio. Usos en la regresión Predicción y pronóstico: Predecir ventas futuras en función de datos de ventas pasadas. Análisis de tendencias: Analizar el crecimiento de la población en función del tiempo. Evaluación de impacto: Determinar cómo la publicidad afecta a las ventas de un producto. Control de calidad: Se utiliza para controlar y monitorear procesos industriales. Optimización de precios: Ayuda a establecer precios óptimos basados en datos históricos y variables relevantes, como costos de producción y demanda del mercado. Investigación médica: Se utiliza para analizar la relación entre factores de riesgo y enfermedades, así como para predecir resultados médicos basados en diversas variables. Modelado económico: En economía, se emplea para analizar la relación entre variables económicas como el crecimiento del PIB, el desempleo y la inflación. ¿Como se gráfica? Se utiliza un diagrama de dispersión que consiste de un gráfico que muestra los pares de datos como una nube de puntos (patrón de puntos), donde existen diferentes tipos: Positivo Lineal perfecto Negativo positivo y Nulo negativo Tipos de diagrama de dispersión Positivo: Los Negativo: Un valor valores aumentan disminuye mientras juntos. el otro aumenta. Tipos de diagrama de dispersión Nulo: No hay Lineal perfecto: Forma una línea correlación. recta entre los puntos de datos. S comú e usa nmen most rar c te para varia ómo d relac bles os ionan se entre sí. ¿Cuál es la ecuación? Pendiente Dependiente Independiente y2 - y1 y = a + bx b= x2 - x1 Intersección Pendiente en y Mínimos cuadrados Unidad 2: Análisis de regresión lineal y múltiple TECNOLÓGICO DE COLIMA Minimos cuadrados El método de los mínimos cuadrados se utiliza para calcular la recta de regresión lineal que minimiza los residuos, esto es, las diferencias entre los valores reales y los estimados por la Euclid recta. es menci ona qu linea r e la ecta e s el camin o mas corto e ntre d os puntos Ventajas y desventajas El método de mínimos cuadrados es una técnica de análisis numérico que tiene algunas ventajas y desventajas, entre ellas: Proporciona intervalos Sólo sirve para ajustar modelos pequeños de error. lineales Es una técnica flexible que se Usar demasiadas cifras puede utilizar para ajustar después del punto para lograr diferentes tipos de datos un resultado más exacto, Es relativamente fácil de Es relativamente fácil de implementar y no requiere implementar y no requiere conocimientos matemáticos conocimientos matemáticos avanzados para su uso. avanzados para su uso. Beneficios Resultados precisos Excel como a mano Fácil de implementar Lo vamos hacer en las dos formas Versátil Fórmulas Cantidad de hojas Marca Precio (y) (x) La empresa REGIO quiere saber como Elite 102 0.9 esta el mercado Suavel 110 1.4 actual, para ello realiza una relación Pétalo 125 1.2 tomando en cuenta la Premier 128 1.6 calidad y el precio de diversas marcas Cottonelle 180 2.2 existentes. Estos son Golden 205 2.4 los datos Hills 215 3 Interpretación del error estándar de estimación Unidad 2: Análisis de regresión lineal y múltiple TECNOLÓGICO DE COLIMA E R D A Error estándar de estimación R ECU La predicción perfecta es prácticamente Su simbolo es: Syx, imposible, por lo tanto es necesaria una tiene el mismo medida que indique que tan precisa es una concepto de la predicción de Y basada en X. desviación estándar. El error estándar de estimación mide la dispersión alrededor de la linea de regresión Fórmulas Análisis de correlación Unidad 2: Análisis de regresión lineal y múltiple TECNOLÓGICO DE COLIMA El coeficiente de correlación de Pearson es un índice que se encuentra entre -1 y 1, y que muestra el grado de dependencia lineal entre dos conjuntos de datos. PARA CALCULARLO Es una me EN EXCEL (FÓRMULA) dida de depend 1. Seleccionar una encia celda en blanco lineal entre dos 2. Escribir la función variables PEARSON(A:A,B:B) aleatorias INTERPRETACIÓN DEL COEFICIENTE DE CORRELACIÓN DE PEARSON GRÁFICAS DEL COEFICIENTE DE CORRELACIÓN DE PEARSON Interpretación intervalos de confianza Unidad 2: Análisis de regresión lineal y múltiple TECNOLÓGICO DE COLIMA Referencias ¿Que es el nivel de confianza? El nivel de confianza es una Este informa en qué medida estadística que nos porcentaje la indica la probabilidad de que el estimación es valor real de una característica certera. de una poblacion se encuentre dentro de un rango estimado. Referencias ¿Que es el intervalo de confianza? Es un rango que creemos que contiene el valor real de algo que estamos midiendo en una población. Le aplicamos un margen de error para ayudarnos a entender que tan precisa es nuestra estimación. Efecto de cambiar el nivel de confianza ¿Y LA ANCHURA? Un intervalo de confianza estrecho indica que la media muestral es una estimación más precisa de la media Nota Esto es in poblacional, mientras que un tuitivo; el precio qu e se paga intervalo de confianza amplio un nivel d por e confianz más alto e a indica que la media muestral es aumenta s que el margen de menos precisa. error. Un encuestador político planea Si el encuestador repite este proceso y preguntarle a una muestra construye 20 intervalos a partir de aleatoria de 500 votantes si muestras independientes separadas, apoyan o no al candidato oficial. podemos esperar que cerca de 18 de esos intervalos contengan la verdadera El encuestador tomará los proporción de votantes que apoya al resultados de la muestra y candidato construirá un intervalo de Cerca del 90% de las personas que apoyan confianza de 90% para la al candidato responderá la encuesta verdadera proporción de todos los votantes que apoyan al candidato. Si el encuestador repite este proceso varias ¿Cuál de las siguientes es una veces, entonces cerca del 90% de los intervalos producidos capturarán la interpretación correcta del verdadera proporción de votantes que nivel de confianza del 90%? apoya al candidato Si el encuestador repite este proceso y construye 20 intervalos a partir de muestras independientes separadas, podemos esperar que cerca de 18 de esos intervalos contengan la verdadera proporción de votantes que apoya al candidato Los niveles de confianza no nos dicen la tasa de Cerca del 90% de las personas que apoyan al candidato responderá la encuesta respuesta de una encuesta. Si el encuestador repite este proceso varias veces, entonces cerca del 90% de los intervalos producidos capturarán la verdadera proporción de votantes que apoya al candidato Supongamos que el entrenador Es imposible decir sin ver los del ejemplo anterior decide que datos de la muestra quieren estar más seguros. El entrenador usa los mismos datos de la muestra que antes, Aumentar la confianza aumentará el margen de error, lo que pero vuelve a calcular el resultará en un intervalo más intervalo de confianza con un amplio nivel de confianza del 99%. ¿Cómo aumentar el nivel de confianza de 95% a 99% Aumentar la confianza disminuirá afectará el intervalo de el margen de error, lo que resultará en un intervalo más confianza? angosto Es imposible decir sin ver los datos de la muestra Un margen de error mayor Aumentar la confianza aumentará produce un intervalo de el margen de error, lo que confianza más amplio que es resultará en un intervalo más más probable que contenga el amplio parámetro de interés (aumento de la confianza). Aumentar la confianza disminuirá el margen de error, lo que resultará en un intervalo más angosto Intervalos de predicción Unidad 2: Análisis de regresión lineal y múltiple TECNOLÓGICO DE COLIMA Referencias ¿Que es? Supone la distribución de Los intervalos de diferentes tipos de datos en un predicción se emplean espacio concreto, teniendo la para estimar la posibilidad de encontrar una distribución de futuros observación dentro de un sucesos individuales. intervalo. Referencias ¿En qué son diferentes los intervalos de Nota confianza y predicción? Aunque a mbos se basan en Los intervalos de confianza se una muestra d asocian a un parámetro, mientras e datos para estim que los intervalos de predicción se ar un valor desc onocido. relacionan con la dispersión de las observaciones. Análisis de regresión múltiple Unidad 2: Análisis de regresión lineal y múltiple TECNOLÓGICO DE COLIMA Regresión lineal Regresión múltiple Es una técnica estadística que se Es una técnica estadística que se utiliza para analizar datos y utiliza para estudiar la relación predecir valores desconocidos a entre una variable dependiente y partir de una variable varias variables independientes. dependiente y una variable independiente mediante una ecuación lineal. Regresión lineal Regresión múltiple Por ejemplo, podemos estar Por ejemplo, podemos estar interesados en saber cómo interesados en saber cómo influyen en la presión arterial influyen en la presión arterial sistólica de un paciente, esta sistólica de un paciente en relacionada con el peso, la relación con el peso edad y el sexo. Fórmula