viernes, 23 de mayo de 2008

box plot

ESTADÍSTICA DESCRIPTIVA


DIAGRAMA DE CAJAS Y BIGOTES (Box and Whisker Plot)

Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.

Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente.

Procedimiento

Para el diagrama de cajas y bigotes se requiere

Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras". La altura (anchura) de la caja no interesa.


La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico Þ H = Q3 - Q1 = RIC.


El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H


Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. Así, las Cercas Internas Inferior (CIi) y Superior (CIs) estarán dadas por:

CIi = Q1 - Paso
CIs = Q3 + Paso

Si la cerca interna inferior da menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.


Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas por:

CEi = CIi - Paso
CEs = CIs + Paso


Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes de las cajas. Por simplicidad no se grafican.


"Valores extremos" son los ubicados entre las dos cercas, y merecen especial atención, ya que pueden ser valores atípicos, que, en algunos casos, no pertenecen realmente a la distribución general de donde provienen los datos.


"Valores lejanos" o , ubicados por fuera de las cercas externas, correspondientes a valores extremos, que requieren un mayor análisis que los valores atípicos.


Considere los siguientes datos, correspondientes a



De este conjunto de datos tenemos que:

Me = 90.45
Q1 = 88.25
Q3 = 92.2

Rango intercuartílico = RIC = 92.2-88.25 = 3.95 Þ Paso = 5.925
Cercas interna inferior = 88.25 - 5.925 = 82.325
Cerca interna superior = 92.20 + 5.925 = 98.125
Cerca externa inferior = 82.325 - 5.925 = 76.40
Cerca externa superior = 98.125 + 5.925 = 104.05






Como se observa hay dos valores que merecen especial atención: 98.8 y 100.3 que están entre las cercas interna y externa superior.






Presentación Presentación Objetivos Objetivos Metodología Metodología Programa detallado Programa detallado Evaluación Evaluación Bibliografía Bibliografía Notas Notas Introducción Introducción Presentación gráfica de la información Presentación gráfica de la información Medidas resumen Medidas resumen Diagrama de cajas y bigotes Diagrama de cajas y bigotes Gráficos de series de tiempo Gráficos de series de tiempo Gráficos de dispersión y medidas relacionadas Gráficos de dispersión y medidas relacionadas Diagramas de sectores y de barras Diagramas de sectores y de barras Problemas Problemas Introducción Introducción Principales estadísticos Principales estadísticos Distribuciones límites Distribuciones límites Distribuciones muestrales Distribuciones muestrales Teorema Central del Límite Teorema Central del Límite Distribución de la proporción Distribución de la proporción Distribución de la diferencia entre proporciones Distribución de la diferencia entre proporciones Distribución chi cuadrado Distribución chi cuadrado Distribución t Distribución t Distribución F Distribución F Distribución de la diferencia entre dos medias Distribución de la diferencia entre dos medias Resumen Resumen Problemas Problemas Introducción Introducción Propiedades de los estimadores Propiedades de los estimadores Métodos de estimación Métodos de estimación Problemas Problemas Introducción Introducción Para la media Para la media Para la diferencia de dos medias Para la diferencia de dos medias Para una proporción Para una proporción Para la diferencia de dos proporciones Para la diferencia de dos proporciones Para la varianza de una distribución normal Para la varianza de una distribución normal Para la relación de varianzas de dos distribuciones normales Para la relación de varianzas de dos distribuciones normales Para observaciones apareadas Para observaciones apareadas Resumen Resumen Problemas Problemas Por qué tomar sólo una muestra cuando la población es finita? Por qué tomar sólo una muestra cuando la población es finita? La especificación de la población y la característica de interes La especificación de la población y la característica de interes Muestreo probabilístico Muestreo probabilístico Sesgo y sus fuentes Sesgo y sus fuentes Usando una tabla de números aleatorios Usando una tabla de números aleatorios Muestreo aleatorio simple Muestreo aleatorio simple Muestreo para determinar una proporción Muestreo para determinar una proporción Muestreo aleatorio estratificado Muestreo aleatorio estratificado Asignación de tamaños de muestras Asignación de tamaños de muestras Muestreo estratificado para determinar una proporción Muestreo estratificado para determinar una proporción Otros métodos de muestreo Otros métodos de muestreo Planeación de un estudio muestral Planeación de un estudio muestral Resumen Resumen Problemas Problemas Introducción Introducción Definiciones Definiciones Curva característica operativa y función de potencia de una prueba Curva característica operativa y función de potencia de una prueba Las mejores pruebas Las mejores pruebas Para la media Para la media Para diferencia de medias Para diferencia de medias Para observaciones apareadas Para observaciones apareadas Para la varianza Para la varianza Para relación de varianzas Para relación de varianzas Sobre proporciones y diferencia de proporciones Sobre proporciones y diferencia de proporciones Pruebas de bondad de ajuste Pruebas de bondad de ajuste Resumen Resumen Problemas Problemas Definición Definición Aspectos especiales Aspectos especiales Ventanas Ventanas Datos para los análisis (variables) y su definición Datos para los análisis (variables) y su definición Menús principales Menús principales Barras de herramientas Barras de herramientas Procedimiento general de análisis Procedimiento general de análisis Uso de gráficos (menú Plot) Uso de gráficos (menú Plot) Análisis usando el menú Describe Análisis usando el menú Describe Algunos resultados Algunos resultados Distribución normal Distribución normal Distribución t Distribución t Distribución chi cuadrado Distribución chi cuadrado Disribución F Disribución F Distribución binomial Distribución binomial Distribución de Poisson Distribución de Poisson Statgraphics Statgraphics Tablas estadísticas Tablas estadísticas Aproximación al TCL Aproximación al TCL Descarga documetos Descarga documetos

No hay comentarios: