Métodos y Técnicas para el Procesamiento de Datos CAPÍTULO VII - PDF
Document Details
Uploaded by GainfulMint
Laura Flores Rodríguez
Tags
Related
Summary
This document provides a comprehensive overview of methods and techniques for processing data, focusing on different analysis types. The presented slides cover descriptive, exploratory, predictive, diagnostic, and prescriptive data analysis. It also includes a section on data presentation procedures.
Full Transcript
METODOS Y TECNICAS PARA PROCESAMIENTO DE DATOS CAPITULO VII MATERIA: CIV – 222 TÉCNICAS DE INVESTIGACIÓN CIENTÍFICA DOCENTE: LAURA FLORES RODRÍGUEZ MATRIZ DE CONSISTENCIA PERMITE VERIFICAR LA COHERENCIA ENTRE EL CONTENIDO DEL PROBLEMA, OBJ...
METODOS Y TECNICAS PARA PROCESAMIENTO DE DATOS CAPITULO VII MATERIA: CIV – 222 TÉCNICAS DE INVESTIGACIÓN CIENTÍFICA DOCENTE: LAURA FLORES RODRÍGUEZ MATRIZ DE CONSISTENCIA PERMITE VERIFICAR LA COHERENCIA ENTRE EL CONTENIDO DEL PROBLEMA, OBJETIVOS, HIPÓTESIS, VARIABLES, INDICADORES E INSTRUMENTOS DE RECOLECCIÓN DE DATOS PROBLEMA OBJETIVO HIPOTESIS VARIABLE INDICADORES DISEÑO POBLACION TECNICA E Y MUESTRA INSTRUMENTO ¿Cómo Determinar la Los hábitos INDEPEND INDEPENDIENT No POBLACION: Encuesta influyen los influencia de de estudio IENTE: E: experiment 32 estudiantes Ficha de hábitos de los hábitos de influyen hábitos de Hábitos de al (se de la carrera observación estudio en el estudio en el significativam estudio estudio observan de ingeniería Análisis de rendimiento rendimiento ente en el DEPENDIE Momento de los civil de la UTB promedios académico académico rendimiento NTE: estudio elementos de los de los académico rendimient Clases en su MUESTRA: estudiantes estudiantes de los o Trabajos contexto de la carrera de 4to estudiantes académic académicos natural) de ingeniería semestre de de ingeniería o Preparación de civil de la la carrera de civil de la los exámenes UTB? ingeniería UTB Conducta civil de la frente al UTB estudio Valores de los hábitos de estudio DEPENDIENTE Promedio ponderado MÉTODOS Y TÉCNICAS DE PROCESAMIENTO DE DATOS DESCRIBIR EL TRATAMIENTO ESTADÍSTICOS DE LOS DATOS A TRAVÉS DE GRÁFICOS, TABLAS, CUADROS, DIBUJOS DIAGRAMAS, GENERADO POR EL ANÁLISIS DE LOS DATOS DESCRIBIR DATOS, VALORES, PUNTUACIÓN Y DISTRIBUCIÓN DE FRECUENCIA PARA CADA VARIABLE EL DISEÑO DE INVESTIGACIÓN UTILIZADO INDICA EL TIPO DE ANÁLISIS REQUERIDO PARA LA COMPROBACIÓN DE HIPÓTESIS TIPOS DE ANÁLISIS DE DATOS TIPOS DE ANALISIS DE DATOS ANALISIS DE ANALISIS DE ANALISIS DE ANALISIS DE ANALISIS DE DATOS DATOS DATOS DATOS DE DATOS DESCRIPTIVOS EXPLORATORIO PREDICTIVO DIAGNOSTICO PRESCRIPTIVO ANALISIS DE DATOS DESCRIPTIVOS EL OBJETIVO DEL ANÁLISIS DE DATOS DESCRIPTIVO ES DESCRIBIR LOS DATOS ENCONTRADOS EN UNA MUESTRA MEDIANTE VALORES CARACTERÍSTICOS Y PRESENTARLOS EN FORMA DE GRÁFICO O TABLA. ESTA PRESENTACIÓN DE LOS DATOS SE REFIERE A LAS VARIABLES INDIVIDUALES Y A SUS CARACTERÍSTICAS. TRATA DE RESUMIR LOS DATOS RECOGIDOS Y PROCESADOS EN TABLAS, MEDIDAS, GRÁFICOS, ETC. SIGNIFICATIVOS Y EXAMINAR EN QUÉ MEDIDA LOS RESULTADOS OBTENIDOS A PARTIR DE UNA MUESTRA PUEDEN TRASLADARSE A LA POBLACIÓN REAL DE INTERÉS ANALISIS DE DATOS DESCRIPTIVOS LA ESTADÍSTICA DESCRIPTIVA SUELE ESTAR AL PRINCIPIO DEL ANÁLISIS DE DATOS Y A MENUDO SE COMBINA CON OTROS MÉTODOS. LOS DATOS DEL PASADO SE ANALIZAN PARA SACAR CONCLUSIONES. SE UTILIZAN TRES MEDIDAS PRINCIPALES PARA DESCRIBIR LOS DATOS: MEDIDAS DE DISPERSIÓN (POR EJEMPLO, DESVIACIÓN ESTÁNDAR O VARIANZA) PARÁMETROS DE POSICIÓN (POR EJEMPLO, LA MEDIA ARITMÉTICA O LA MEDIANA) MEDIDAS DE CORRELACIÓN (POR EJEMPLO, COEFICIENTE DE CORRELACIÓN O COEFICIENTE DE CONTINGENCIA) ANALISIS DE DATOS EXPLORATORIO EL ANÁLISIS DE DATOS EXPLORATORIO O LA ESTADÍSTICA EXPLORATORIA ES UNA RAMA DE LA ESTADÍSTICA. EXAMINA Y VALORA LOS DATOS DE LOS QUE SE TIENE POCO CONOCIMIENTO SOBRE SUS RELACIONES. MUCHAS TÉCNICAS DE ADE (ANÁLISIS DE DATOS EXPLORATORIOS) SE UTILIZAN EN LA MINERÍA DE DATOS. UTILIZANDO REPRESENTACIONES Y CÁLCULOS ADECUADOS, SE EXAMINAN LOS DATOS EN BUSCA DE PATRONES O RELACIONES. LA INVESTIGACIÓN SE REALIZA PARA ENCONTRAR INFORMACIÓN INTERESANTE EN LOS DATOS QUE NO SE PUEDE VER A PRIMERA VISTA CUANDO SIMPLEMENTE SE MIRA EN EL ANÁLISIS DESCRIPTIVO. ANALSIS DE DATOS PREDICTIVO EL ANÁLISIS PREDICTIVO INCLUYE UNA SERIE DE TÉCNICAS ESTADÍSTICAS DE MINERÍA DE DATOS, MODELIZACIÓN PREDICTIVA Y APRENDIZAJE AUTOMÁTICO. LOS DATOS ACTUALES E HISTÓRICOS SE ANALIZAN PARA HACER PREDICCIONES SOBRE EVENTOS FUTUROS. POR EJEMPLO, LAS INSTITUCIONES DE CRÉDITO PUEDEN OBTENER PREDICCIONES SOBRE LA SOLVENCIA DE POSIBLES PRESTATARIOS. ANALISIS DE DATOS DE DIAGNOSTICO EL ANÁLISIS DE DIAGNÓSTICO ABORDA ESPECÍFICAMENTE LA CUESTIÓN DE POR QUÉ HA OCURRIDO ALGO. MEDIANTE LA COMPARACIÓN DE DATOS HISTÓRICOS Y DE OTRO TIPO, LA IDENTIFICACIÓN DE PATRONES Y EL DESCUBRIMIENTO DE RELACIONES, ENCUENTRA LAS CAUSAS O LAS INTERACCIONES MUTUAS. EL ANÁLISIS DE DATOS DE DIAGNÓSTICO PUEDE UTILIZARSE PARA RESOLVER PROBLEMAS CONCRETOS, YA QUE IDENTIFICA LAS CAUSAS FUNDAMENTALES. ANALISIS DE DATOS PRESCRIPTIVO EL ANÁLISIS DE DATOS PRESCRIPTIVO ES LA CATEGORÍA DE ANÁLISIS MÁS COMPLEJA Y COSTOSA. APORTA UN GRAN VALOR AÑADIDO AL RESPONDER A LA PREGUNTA DE INVESTIGACIÓN, COMO POR EJEMPLO CÓMO ALCANZAR LOS OBJETIVOS FIJADOS. SE BASAN EN DATOS HISTÓRICOS Y ACTUALES PROCEDENTES DE FUENTES DE DATOS INTERNAS Y EXTERNAS. UTILIZAN LOS RESULTADOS DE LAS CATEGORÍAS DE ANÁLISIS DESCRITAS ANTERIORMENTE. LAS PREDICCIONES SE ACTUALIZAN CONTINUAMENTE. SE UTILIZAN, POR EJEMPLO, ALGORITMOS DE APRENDIZAJE AUTOMÁTICO E INTELIGENCIA ARTIFICIAL O REDES NEURONALES. ESTADISTICA DESCRIPTIVA ES IMPORTANTE RECORDAR QUE LA ESTADITICA ES UN CONJUNTO DE TECNICAS DESEÑADAS PARA DESCRIBIR, REPRESENTAR, INFERIR Y RESUMIR LA INFORMACION DEL FENOMENO DE ESTUDIO. ADEMAS HAY QUE TENER EN CUENTA QUE LA ESTADISTICA NO ES UN CINJUNTO DE TECNOCAS CON LAS QUE UNO PUEDE PROBAR TODO AQUELLO QUE UNO DESEE PRESENTACION DE DATOS ¿CÓMO PIENSAS PRESENTAR Y ANALIZAR LOS RESULTADOS? PROCEDIMIENTOS Organizar los datos Tabularlos, según metodología utilizada Graficarlos (en los casos que exista estadística) Analizarlos Interpretarlos Contrastar la hipótesis CODIFICACION Encontrar nuevos contextos par analizar datos. Permite pasar de la indagación a la interpretación TABULACION Significa hacer tablas, listados de datos que los muestren agrupados y contabilizados ANÁLISIS DE RESULTADOS ANALISIS DE RESULTADOS ESTADISTICOS NO ESTADISTICOS DATOS NO ESTADISTICOS TECNICAS DE PROCESAMIENTO 1. ORGANIZACIÓN DE DE DATOS NO DATOS ESTADISTICOS 2. CITAS TEXTUALES O GRAFICOS 3. FORMULACION DE TABLAS O CUADROS ORGANIZADORES LISTAS VISUALES MAPAS CONCEPTUALES DATOS ESTADISTICOS TECNICAS DE PROCESAMIENTO 1. TABULACION DE DATOS DE RESULTADOS ESTADISTICOS 2. FORMULACION TABLAS O DE ORGANIZADORES CUADROS VISUALES LISTAS CIRCULAR GRAFICOS DE BARRAS GRAFICACARTESIANA TECNICAS DE ANALSIS DE DATOS NO ESTADISTICOS Método hermenéutico Análisis de contenido Análisis documental La hermenéutica es un Técnica de interpretación representa el contenido método de investigación de textos, ya sean de un documento de cualitativo que se basa escritos, grabados, manera diferente a la en la interpretación de pintados, filmados u original, generando un textos, comunicaciones e otros nuevo documento. interacciones humanas TECNICAS DE ANALISIS DE DATOS ESTADISTICOS Análisis Análisis no paramétrico paramétrico ANÁLISIS NO PARAMÉTRICO MÉTODOS DE ANÁLISIS ESTADÍSTICO QUE NO REQUIEREN QUE UNA DISTRIBUCIÓN CUMPLA CON LOS SUPUESTOS REQUERIDOS PARA SER ANALIZADAS (ESPECIALMENTE SI LOS DATOS NO SE DISTRIBUYEN NORMALMENTE). POR ESTA RAZÓN, A VECES SE LAS DENOMINA PRUEBAS SIN DISTRIBUCIÓN. ANÁLISIS NO PARAMÉTRICO O DE DISTRIBUCIÓN LIBRE, LOS CUALES NO SUPUESTOS TAN NUMEROSOS NI SEVEROS Y SON APLICABLES A CUALQUIER VARIABLE, EN PARTICULAR A LAS DE TIPO NOMINAL U ORDINAL ASÍ COMO A DISTRIBUCIONES DIVERSAS VARIABLES NOMINALES REPRESENTAN CATEGORÍAS QUE NO TIENEN ORDEN INTRÍNSECO POR EJEMPLO LA RELIGIÓN, EL CÓDIGO POSTAL, EL COLOR DE CABELLO, ETC. ANÁLISIS NO PARAMÉTRICO - PRESUPOSICIONES ACEPTAN DISTRIBUCIONES NO NORMALES PUEDEN ANALIZARSE DATOS NOMINALES U ORDINALES LAS VARIABLES DEBEN SER CATEGÓRICAS ANÁLISIS MULTIVARIADO EL ANÁLISIS MULTIVARIANTE ES UN MÉTODO ESTADÍSTICO UTILIZADO PARA DETERMINAR LA CONTRIBUCIÓN DE VARIOS FACTORES EN UN SIMPLE EVENTO O RESULTADO ANÁLISIS MULTIVARIADO SON AQUELLOS EN DONDE SE ANALIZA LA RELACIÓN ENTRE VARIAS VARIABLES INDEPENDIENTES Y AL MENOS UNA DEPENDIENTE REQUIEREN EL USO DE COMPUTADORAS PARA EFECTUAR LOS CÁLCULOS NECESARIOS LA REGRESIÓN MÚLTIPLE ES UN MÉTODO QUE PERMITE ANALIZAR EL EFECTO DE DOS O MAS VARIABLES INDEPENDIENTES SOBRE UNA DEPENDIENTE. ES UNA EXTENSIÓN DE LA REGRESIÓN LINEAL SOLO QUE CON UN MAYOR NUMERO DE VARIABLES INDEPENDIENTES REGRESIÓN MÚLTIPLE ANALISIS PARAMETRICO ESTE SE ENCARGA DE LA DISTRIBUCION DE LA POBLACION NORMAL Y LA BALANZA HOMOGENEA QUE EXISTE EN CADA UNA DE LAS POBLACIONES ANALISIS PARAMETRICO LOS MÉTODOS QUE MENCIONAMOS HASTA AHORA, SIEMPRE SUPONEN DISTRIBUCIONES PARTICULARES DE LA VARIABLE ALEATORIA, O BIEN SUS HIPÓTESIS ESPECIFICAN PARÁMETROS O DISTRIBUCIONES POR ESO LA ESTADÍSTICA QUE SE USA CON MAS FRECUENCIA SON LAS ESTADÍSTICAS PARAMÉTRICAS PERMITEN CONFIRMAR RESULTADOS O VALORAR LAS INCONSISTENCIAS DE ELLOS ANÁLISIS PARAMÉTRICO - SUPUESTOS EL UNIVERSO TIENE UNA DISTRIBUCIÓN NORMAL (LOS DATOS CERCANOS A LA MEDIA OCURREN CON MAYOR FRECUENCIA QUE LOS DATOS ALEJADOS DE ELLA) EL NIVEL DE LA MEDICIÓN DE LA VARIABLE INDEPENDIENTE ES POR INTERVALO O RAZÓN CUANDO DOS O MAS POBLACIONES SON ESTUDIADAS, ESTAS TIENEN UNA VARIANZA HOMOGÉNEA, TIENEN UNA DISPERSIÓN SIMILAR EN SUS DISTRIBUCIONES (VARIANZA REPRESENTA LA VARIABILIDAD DE UNA SERIE DE DATOS RESPECTO A SU MEDIA) ANÁLISIS PARAMÉTRICO Y NO PARAMÉTRICO LA ELECCIÓN ADECUADA DE UNA PRUEBA ESTADÍSTICA ES PRIMORDIAL PARA FACILITAR LA COMPRESIÓN Y APLICACIÓN DE LOS RESULTADOS DE UNA INVESTIGACIÓN, DE ESTA MANERA, RESULTA ELEMENTAL CONOCER LAS CARACTERÍSTICAS DEL ANÁLISIS Y LAS PRUEBAS PARAMÉTRICAS Y NO PARAMÉTRICAS. GENERALMENTE LAS PRUEBAS PARAMÉTRICAS ÚNICAMENTE SE PUEDEN UTILIZAR SI LOS DATOS MUESTRAN UNA DISTRIBUCIÓN NORMAL. EN ESTE SENTIDO, LAS PRUEBAS NO PARAMÉTRICAS SON MÁS EXIGENTES AL RECHAZAR LA HIPÓTESIS NULA DE IGUALDAD TENIENDO MENOS POSIBILIDADES DE ACERTAR CUANDO NO LA RECHAZAN. CHI - CUADRADO LA IDEA BÁSICA DE LA PRUEBA ES QUE SE COMPARAN LOS VALORES DE LOS DATOS REALES CON LO QUE SE ESPERARÍA SI LA HIPÓTESIS NULA FUERA CIERTA. DE ESTA FORMA, SE BUSCA DETERMINAR SI UNA DIFERENCIA ENTRE LOS DATOS OBSERVADOS Y LOS ESPERADOS SE DEBE AL AZAR, O SI SE DEBE A UNA RELACIÓN ENTRE LAS VARIABLES QUE SE ESTÁN ESTUDIANDO. COMO SE REALIZA CHI-CUADRADO DEFINE TUS HIPÓTESIS NULA Y ALTERNATIVA ANTES DE INICIAR LA RECOLECCIÓN DE DATOS. DECIDE CUÁL SERÁ EL VALOR ALFA. ESTO IMPLICA DECIDIR EL RIESGO QUE ESTÁS DISPUESTO A ASUMIR DE LLEGAR A UNA CONCLUSIÓN ERRÓNEA. POR EJEMPLO, SUPONGAMOS QUE FIJAMOS UN VALOR Α=0,05 PARA LAS PRUEBAS DE INDEPENDENCIA. EN ESTE CASO, HAS DECIDIDO UN RIESGO DEL 5 % DE CONCLUIR QUE LAS DOS VARIABLES SON INDEPENDIENTES, CUANDO EN REALIDAD NO LO SON. COMPRUEBA LOS DATOS PARA VER SI HAY ERRORES. COMPRUEBA LOS SUPUESTOS DE LA PRUEBA. REALIZA LA PRUEBA Y OBTÉN TUS CONCLUSIONES. COEFICIENTE DE CORRELACIÓN DE PEARSON PRUEBA ESTADÍSTICA PARA ANALIZAR LA RELACIÓN ENTRE DOS O MAS VARIABLES MEDIDAS EN UN NIVEL DE INTERVALOS O RAZÓN HIPÓTESIS: CORRELACIONALMENTE DEL TIPO “A MAYOR X, MAYOR Y” (ALTOS VALORES DE X ESTÁN ASOCIADOS CON ALTOS VALORES DE Y) “A MAYOR X, MENOR Y” (ALTOS VALORES DE X ESTÁN ASOCIADOS CON BAJOS VALORES DE Y) REGRESIÓN LINEAL MODELO MATEMÁTICO PARA ESTIMAR EL EFECTO DE UNA VARIABLE SOBRE OTRA. ESTA ASOCIADO CON EL COEFICIENTE DE PEARSON “R” DE PEARSON HIPOTESIS: CORRELACIONES Y CAUSALES