viernes, 26 de septiembre de 2008
Comentario
es conveniente calcular el promedio de los resultados o experimentos ponderados por la probabilidad de que suceda cada uno de los redultados pòsibles, es para sumar todos los resultados posibles
miércoles, 24 de septiembre de 2008
Esperanza matematica
En estadística la esperanza matemática (o simplemente esperanza) o valor esperado de una variable aleatoria es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Por ejemplo, en un juego de azar el valor esperado es el beneficio medio.
Si todos los sucesos son de igual probabilidad la esperanza es la media aritmética.
Definición [editar]Para una variable aleatoria discreta con valores posibles y sus probabilidades representadas por la función de masa p(xi) la esperanza se calcula como:
Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos los valores y la función de densidad :
o
La esperanza también se suele simbolizar con
Las esperanzas para se llaman momentos de orden . Más importantes son los momentos centrados .
No todas las variables aleatorias tienen un valor esperado. Por ejemplo, la distribución de Cauchy no lo tiene.
Si todos los sucesos son de igual probabilidad la esperanza es la media aritmética.
Definición [editar]Para una variable aleatoria discreta con valores posibles y sus probabilidades representadas por la función de masa p(xi) la esperanza se calcula como:
Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos los valores y la función de densidad :
o
La esperanza también se suele simbolizar con
Las esperanzas para se llaman momentos de orden . Más importantes son los momentos centrados .
No todas las variables aleatorias tienen un valor esperado. Por ejemplo, la distribución de Cauchy no lo tiene.
lunes, 15 de septiembre de 2008
comentario
es una grafica que representa los resultados posibles de un evento asi como la PROBABILIDAD de ocurrencia
arbol de probabilidad
Probabilidad condicionada
En un concurso de televisión, se dispone de 20 coches, para premiar al concursante, de las marcas y colores que se indican en la siguiente tabla:
Rojo Azul Totales
SeatPanda 2 8 10
SeatToledo 7 3 10
Totales 9 11 20
Los coches están colocados aleatoriamente, tras 20 puertas, de forma que el concursante no ve el coche que hay detrás de cada puerta.
El concursante elige un número, entre 1 y 20, y si acierta la marca y el color del coche que hay en la puerta elegida, gana, en caso contrario pierde.
El concurso lo podemos considerar como un experimento aleatorio. Cada resultado es el coche elegido.
Para describir fácilmente todo el proceso vamos a considerar:
Suceso P : El coche es un Seat Panda
Suceso T : El coche es un Seat Toledo
Suceso R : El coche es de color rojo
Suceso A : El coche es de color azul
Así el suceso : "Seat Toledo de color rojo" lo representamos por : T ∩ R y la probabilidad de este suceso, sigue de la tabla :
Rojo Azul Totales
SeatPanda 2 8 10
SeatToledo 7 3 10
Totales 9 11 20
P( T ∩ R ) = 7/20
La probabilidad de que el coche sea un Seat Toledo es :
Rojo Azul Totales
SeatPanda 2 8 10
SeatToledo 7 3 10
Totales 9 11 20
P(T)=10/20 = 1/2
¿Qué ocurre si, una vez que el concursante ha elegido puerta, el presentador, le da la pista de que el coche que hay tras la puerta es rojo?. Tendremos que cambiar la probabilidad al suceso T y al suceso P. A la probabilidad del suceso T cuando se sabe que ha ocurrido R, le llamamos probabilidad condicionada de T, sabiendo que ha ocurrido R y escribimos:
P(T/R)
Para asignar las nuevas probabilidades hemos de ser consecuentes con las propiedades que debe cumplir toda asignación de probabilidades. El nuevo espacio muestral es el señalado en rojo en la tabla siguiente. Por tanto asignamos así las probabilidades:
Rojo Azul Totales
SeatPanda 2 8 10
SeatToledo 7 3 10
Totales 9 11 20
P(T/R) = 7/9 ; P(P/R) = 2/9
De la tabla anterior, siguen fácilmente las siguientes relaciones :
Consideremos ahora el siguiente experimento : Dos urnas, A y B ,la urna A, contiene 3 bolas verdes y 2 bolas rojas, la urna B contiene 2 bolas verdes y 3 bolas rojas.
Se realiza el experimento en dos tiempos, primero se selecciona urna por un procedimiento aleatorio y posteriormente de la urna elegida se extrae una bola.
Para representar, de forma muy adecuada, este tipo de experimentos, se realiza un esquema, llamado : árbol de probabilidades
Cada flecha del diagrama se denomina rama del árbol; a cada rama, asignamos la probabilidad que le corresponde. Un recorrido, desde el comienzo del experimento hasta el final, se llama un camino.
Si sabemos que ha ocurrido el suceso A, tenemos que volver a asignar probabilidades a los distintos caminos; todos los caminos que comienzan por el suceso B, tendrán probabilidad 0 y los que empiezan por el suceso A :
Hay que aceptar por tanto las mismas relaciones entre probabilidades a las que habíamos llegado en el experimento anterior :
Para concretar tenemos que admitir la siguiente definición:
Definición 1. Probabilidad condicionada
De un suceso R sabiendo que ha ocurrido otro A
Y dos teoremas:
Teorema 1. Regla del producto
De la definicion 1, despejando, sigue que:
Teorema 2. Probabilidad total
Si A y B forman un sistema completo de sucesos , la probabilidad de cualquier otro suceso R es:
Sucesos dependientes
Dos sucesos son dependientes si el resultado de uno influye en el otro. Los sucesos A y B son dependientes si y sólo si P(A) es distinto de P(A/B) y P(B) es distinto de P(B/A)
Sucesos independientes
Dos sucesos son independientes si el resultado de uno no influye en el resultado del otro. Los sucesos A y B son independientes si y sólo si P(A)=P(A/B) y P(B)=P(B/A).
Probabilidades a posteriori. Teorema de Bayes.
Vamos a considerar de nuevo, el experimento de las urnas A y B, que contienen bolas verdes y rojas:
Si sabemos que ha salido una bola roja, los caminos posibles en el árbol de probabilidades, quedan reducidos a dos, los señalados en rojo en la imagen anterior; tenemos que reasignar probabilidades, todos los caminos que terminan en bola verde, deberán tener probabilidad 0. ¿Cómo asignamos probabilidades a los caminos que conducen a bola roja?
En resumen podemos enunciar el siguiente resultado :
Teorema de Bayes o de las probabilidades a posteriori
lunes, 8 de septiembre de 2008
comentario
Si E es un evento de un espacio muestral S y P(E) es la probabilidad de E, entonces se satisfacen los axiomas de la probabilidad es uuna accion que se justifica asi misma no necesaita de una prueba para ser evidente
Axiomas
Un axioma, en epistemología, es una "verdad evidente" que no requiere demostración, pues se justifica a sí misma, y sobre la cual se construye el resto de conocimientos por medio de la deducción; aunque, no todos los epistemólogos están de acuerdo con esta definición "clásica". El axioma gira siempre sobre sí mismo, mientras los postulados y conclusiones posteriores se deducen de este.
En matemática, un axioma no es necesariamente una verdad evidente, sino una expresión lógica utilizada en una deducción para llegar a una conclusión.
Los Axiomas no-lógicos son fórmulas específicas de una teoría y se aceptan solamente por acuerdo. Razonando acerca de dos estructuras diferentes, por ejemplo, los números naturales y los números enteros puede involucrar a los mismos axiomas lógicos, sin embargo, los axiomas no-lógicos capturan lo que es especial acerca de una estructura en particular (o un conjunto de estructuras). Por lo tanto los axiomas no-lógicos, a diferencia de los axiomas lógicos, no son tautologías. Otro nombre para los axiomas no-lógicos es postulado.
Casi cualquier teoría matemática moderna se fundamenta en un conjunto de axiomas no-lógicos, se pensaba que en principio cualquier teoría puede ser axiomatizada y formalizada, posteriormente esto se demostró imposible.
En matemática, un axioma no es necesariamente una verdad evidente, sino una expresión lógica utilizada en una deducción para llegar a una conclusión.
Los Axiomas no-lógicos son fórmulas específicas de una teoría y se aceptan solamente por acuerdo. Razonando acerca de dos estructuras diferentes, por ejemplo, los números naturales y los números enteros puede involucrar a los mismos axiomas lógicos, sin embargo, los axiomas no-lógicos capturan lo que es especial acerca de una estructura en particular (o un conjunto de estructuras). Por lo tanto los axiomas no-lógicos, a diferencia de los axiomas lógicos, no son tautologías. Otro nombre para los axiomas no-lógicos es postulado.
Casi cualquier teoría matemática moderna se fundamenta en un conjunto de axiomas no-lógicos, se pensaba que en principio cualquier teoría puede ser axiomatizada y formalizada, posteriormente esto se demostró imposible.
sábado, 30 de agosto de 2008
Comentario
El diagrama de arbol es una representación grafica que nos ayuda a encontrar posibles soluciones conbforme un fenomeno dado en el cual se esta estudiando, y tambien para encontrar las permutaciones de un fenomeno
Diagrama del arbol
Un diagrama de árbol es una representación gráfica de un experimento que consta de r pasos, donde cada uno de los pasos tiene un número finito de maneras de ser llevado a cabo.
Ejemplos:
1.Un médico general clasifica a sus pacientes de acuerdo a: su sexo (masculino o femenino), tipo de sangre (A, B, AB u O) y en cuanto a la presión sanguínea (Normal, Alta o Baja). Mediante un diagrama de árbol diga en cuantas clasificaciones pueden
estar los pacientes de este médico?
Si contamos todas las ramas terminales, nos damos cuenta que el número de clasificaciones son 2 x 4 x 3 = 24 mismas que podemos enumerar;
MAN, MAA, MAB, MBN, MBA, MBB, etc, etc.
Ejemplos:
1.Un médico general clasifica a sus pacientes de acuerdo a: su sexo (masculino o femenino), tipo de sangre (A, B, AB u O) y en cuanto a la presión sanguínea (Normal, Alta o Baja). Mediante un diagrama de árbol diga en cuantas clasificaciones pueden
estar los pacientes de este médico?
Si contamos todas las ramas terminales, nos damos cuenta que el número de clasificaciones son 2 x 4 x 3 = 24 mismas que podemos enumerar;
MAN, MAA, MAB, MBN, MBA, MBB, etc, etc.
domingo, 24 de agosto de 2008
comentario
permutaiones es un arreglo en el cual una de sus carectiristicas principales es que si importa el orden de los elementos en los conjuntos como por ejemplo: A:(1,2,3) no es lo mismo que decir A:(3,2,1)
En combinaciones es un arreglo en cual no importa el orden de los elementos como por ejemplo: A:(4,5,6) es lo mismo que decir A:(5,6,4).
En combinaciones es un arreglo en cual no importa el orden de los elementos como por ejemplo: A:(4,5,6) es lo mismo que decir A:(5,6,4).
Permutaciones y Combinaciones
Permutación
Cuando trabajamos con muchos objetos, estos conceptos aparecen frecuentemente. Una permutación es un arreglo de un conjunto de objetos en un orden definido. El número de permutaciones diferentes de estos objetos es ; esto se vé fácilmente si pensamos que para la primera alternativa disponemos de los elementos del conjunto, cada uno de los cuales puede complementarse con los restantes como segunda opción, y así hasta llegar a la última elección, conformando el producto .
Combinaciones
Como ya se mencionó anteriormente, una combinación, es un arreglo de elementos en donde no nos interesa el lugar o posición que ocupan los mismos dentro del arreglo. En una combinación nos interesa formar grupos y el contenido de los mismos.
La fórmula para determinar el número de combinaciones es:
Cuando trabajamos con muchos objetos, estos conceptos aparecen frecuentemente. Una permutación es un arreglo de un conjunto de objetos en un orden definido. El número de permutaciones diferentes de estos objetos es ; esto se vé fácilmente si pensamos que para la primera alternativa disponemos de los elementos del conjunto, cada uno de los cuales puede complementarse con los restantes como segunda opción, y así hasta llegar a la última elección, conformando el producto .
Combinaciones
Como ya se mencionó anteriormente, una combinación, es un arreglo de elementos en donde no nos interesa el lugar o posición que ocupan los mismos dentro del arreglo. En una combinación nos interesa formar grupos y el contenido de los mismos.
La fórmula para determinar el número de combinaciones es:
jueves, 21 de agosto de 2008
comentario
es una de las divisiones matematicas que estudia los conjuntos en todas sus ramas las cuales son , las intersecciones, uniones, diferencia, convinacion.
Teoria de conjuntos
La teoría de conjuntos es una división de las matemáticas que estudia los conjuntos. El primer estudio formal sobre el tema fue realizado por el matemático alemán Georg Cantor en el Siglo XIX y más tarde reformulada por Zermelo.
El concepto de conjunto es intuitivo y se podría definir como una "colección de objetos"; así, se puede hablar de un conjunto de personas, ciudades, lapiceros o del conjunto de objetos que hay en un momento dado encima de una mesa. Un conjunto está bien definido si se sabe si un determinado elemento pertenece o no al conjunto. El conjunto de los bolígrafos azules está bien definido, porque a la vista de un bolígrafo se puede saber si es azul o no. El conjunto de las personas altas no está bien definido, porque a la vista de una persona, no siempre se podrá decir si es alta o no, o puede haber distintas personas, que opinen si esa persona es alta o no lo es. En el siglo XIX, según Frege, los elementos de un conjunto se definían sólo por tal o cual propiedad. Actualmente la teoría de conjuntos está bien definida por el sistema ZFC. Sin embargo, sigue siendo célebre la definición que publicó Cantor
miércoles, 20 de agosto de 2008
comentario
los mapas conceptuales nos sirven para estudiar temas extensos de uan manera mas simple y centralizada de lo que se trata el tena en si, así como tambien una manera de estudio mas eficaz y eficientemente que nos permite estudiar temas con simples rasgos
MAPAS CONCEPTUALES
Los mapas conceptuales fueron desarrollados por el Profesor Joseph D. Novak de la Universidad de Cornell en los años 1960, basándose en la teoría de David Ausubel del aprendizaje significativo. Según Ausubel, el factor más importante en el aprendizaje es lo que el sujeto ya conoce. Por lo tanto, el aprendizaje significativo ocurre cuando una persona consciente y explícitamente vincula esos nuevos conceptos a otros que ya posee. Cuando se produce ese aprendizaje significativo, se produce una serie de cambios en nuestra estructura cognitiva, modificando los conceptos existentes, y formando nuevos enlaces entre ellos. Esto es porque dicho aprendizaje dura más y es mejor que la simple memorización: los nuevos conceptos tardan más tiempo en olvidarse, y se aplican más fácilmente en la resolución de problemas.
jueves, 24 de julio de 2008
comentario
el metodo de minimos cuadrados, es el medio por el cual se llega a encontrar la función para un mejor ajuste de las variables que se esten estudiando.
metodos de minimos cuadrados
Mínimos cuadrados es una técnica de optimización matemática que, dada una serie de mediciones, intenta encontrar una función que se aproxime a los datos (un "mejor ajuste"). Intenta minimizar la suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos generados por la función y los correspondientes en los datos. Específicamente, se llama mínimos cuadrados promedio (LMS) cuando el número de datos medidos es 1 y se usa el método de descenso por gradiente para minimizar el residuo cuadrado. Se sabe que LMS minimiza el residuo cuadrado esperado, con el mínimo de operaciones (por iteración). Pero requiere un gran número de iteraciones para converger.
Un requisito implícito para que funcione el método de mínimos cuadrados es que los errores de cada medida estén distribuidos de forma aleatoria. El teorema de Gauss-Markov prueba que los estimadores mínimos cuadráticos carecen de sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribución normal. También es importante que los datos recogidos estén bien escogidos, para que permitan visibilidad en las variables que han de ser resueltas (para dar más peso a un dato en particular, véase mínimos cuadrados ponderados).
La técnica de mínimos cuadrados se usa comúnmente en el ajuste de curvas. Muchos otros problemas de optimización pueden expresarse también en forma de mínimos cuadrados, minimizando la energía o maximizando la entropía
Un requisito implícito para que funcione el método de mínimos cuadrados es que los errores de cada medida estén distribuidos de forma aleatoria. El teorema de Gauss-Markov prueba que los estimadores mínimos cuadráticos carecen de sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribución normal. También es importante que los datos recogidos estén bien escogidos, para que permitan visibilidad en las variables que han de ser resueltas (para dar más peso a un dato en particular, véase mínimos cuadrados ponderados).
La técnica de mínimos cuadrados se usa comúnmente en el ajuste de curvas. Muchos otros problemas de optimización pueden expresarse también en forma de mínimos cuadrados, minimizando la energía o maximizando la entropía
lunes, 21 de julio de 2008
comentario
la tendencia variable es lo que no tiene un valor fijo de la constante que es un valor fijo. la estocastica su valor se encuentra en el oscilador o al azar. Y la constante que su valor se encuentra en vp.
clases de tendencia
variable:
de la función parametro incognita etc. que no es constante. Variable independiente o explicativo, que puede explicar o predecir el comportamiento de otra o otras variables.
Estocastica:
es un oscilador que se mueve entre 0 y 100 y que mediante el cruce de la linea del oscilador y de su media movil proporciona señales de compra o de venta. es un algoritmo que basa su resultado en probabilidad.
Constante:
en os procedimientos de la regresión la constante es el valor de vp cuando todas las v. toman el valor cero.
de la función parametro incognita etc. que no es constante. Variable independiente o explicativo, que puede explicar o predecir el comportamiento de otra o otras variables.
Estocastica:
es un oscilador que se mueve entre 0 y 100 y que mediante el cruce de la linea del oscilador y de su media movil proporciona señales de compra o de venta. es un algoritmo que basa su resultado en probabilidad.
Constante:
en os procedimientos de la regresión la constante es el valor de vp cuando todas las v. toman el valor cero.
comentario
la regresion:
es el metodo por el cual llegamos a estudiar fenomenos a traves de lapsos de tiempo y asi poder hacer predicciones en el futuro con base a datos pasados.
Correlación:
Es el metodo por el cual se llega a encontrar la rrelación que hay entre las variables que se estan estudiando.
es el metodo por el cual llegamos a estudiar fenomenos a traves de lapsos de tiempo y asi poder hacer predicciones en el futuro con base a datos pasados.
Correlación:
Es el metodo por el cual se llega a encontrar la rrelación que hay entre las variables que se estan estudiando.
regresión y correlación
La regresión estadística o regresión a la media es la tendencia de una medición extrema a presentarse más cercana a la media en una segunda medición. La regresión se utiliza para predecir una medida basándonos en el conocimiento de otra.
tipos de regresión:
Regresión lineal simple
Dadas dos variables (Y: variable dependiente; X: independiente) se trata de encontrar una función simple (lineal) de X que nos permita aproximar Y mediante: Ŷ = a + bX
a (ordenada en el origen, constante)
b (pendiente de la recta)
A la cantidad e=Y-Ŷ se le denomina residuo o error residual.
Regreseión no lineal
En estadística, la regresión no lineal es un problema de inferencia para un modelo tipo:
basado en datos multidimensionales x,y, donde f es alguna función no lineal respecto a algunos parámetros desconocidos θ. Como mínimo, se pretende obtener los valores de los parámetros asociados con la mejor curva de ajuste (habitualmente, con el método de los mínimos cuadrados). Con el fin de determinar si el modelo es adecuado, puede ser necesario utilizar conceptos de inferencia estadística tales como intervalos de confianza para los parámetros así como pruebas de bondad de ajuste.
Correlación
En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad (Véase Cum hoc ergo propter hoc).
tipos de regresión:
Regresión lineal simple
Dadas dos variables (Y: variable dependiente; X: independiente) se trata de encontrar una función simple (lineal) de X que nos permita aproximar Y mediante: Ŷ = a + bX
a (ordenada en el origen, constante)
b (pendiente de la recta)
A la cantidad e=Y-Ŷ se le denomina residuo o error residual.
Regreseión no lineal
En estadística, la regresión no lineal es un problema de inferencia para un modelo tipo:
basado en datos multidimensionales x,y, donde f es alguna función no lineal respecto a algunos parámetros desconocidos θ. Como mínimo, se pretende obtener los valores de los parámetros asociados con la mejor curva de ajuste (habitualmente, con el método de los mínimos cuadrados). Con el fin de determinar si el modelo es adecuado, puede ser necesario utilizar conceptos de inferencia estadística tales como intervalos de confianza para los parámetros así como pruebas de bondad de ajuste.
Correlación
En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad (Véase Cum hoc ergo propter hoc).
comentario
las series estacionarias se caracterizan en que es constante la cantidad que hay entre un dato a otro no varia mucho. Al contrario de la no estacionaria que si tiende a variar mucho
clasificación de series de tiempo
estacionarias:
Se habla de este tipo de variaciones usualmente cuando el comportamiento de la variable en el tiempo ennun periodo esta relacionado con la época o un periodo particular, por lo general en el espacio cronologico presente.
No estacionaria:
los movimientos irregulares (al azar) representan todos los tipos de movimientos de uan serue que no sea tendencia.
Se habla de este tipo de variaciones usualmente cuando el comportamiento de la variable en el tiempo ennun periodo esta relacionado con la época o un periodo particular, por lo general en el espacio cronologico presente.
No estacionaria:
los movimientos irregulares (al azar) representan todos los tipos de movimientos de uan serue que no sea tendencia.
comentario
estas graficas nos ayudan a comprender fénomenos por medio de lapsos de tiempo y los cambios que han sufrido a traves del mismo
comentario
es un conjunto de secuencias de puntos de datos para detectar la información a como se mueve la variable en el tiempo dependiendo del fenomeno que se estudie, tambien llamda cronologica que da un conjunto de observaciones de una variable, ordenada segun el tiempo.
series de tiempo
Una serie de tiempo esta dado por un conjunto de observaciones que están ordenadas en el tiempo, y que estas pueden representar el cambio de una variable ya sea de tipo económica, física, química, biológica, etc, a lo largo esa historia.
El objetivo del análisis de una serie de tiempo es el conocimiento de su patrón de comportamiento, para así poder prever su evolución en el futuro cercano, suponiendo por supuesto que las condiciones no variarán significativamente.
Los pronosticos que se puedan realizar en base al análisis de este tipo de datos serviran para el desarrollo de nuevos planes para inversiones en agricultura por ejemplo, elaboración de nuevos productos por parete de las empresas, prevención de desastres por cambios en el clima, o captar turistas para la ciudad, etc.
En estadística, procesamiento de señales, y econometría, una serie temporal es una secuencia de puntos de datos, medidos típicamente a intervalos de tiempo sucesivos , y espaciados (con frecuencia) de forma uniforme. El análisis de series temporales comprende métodos que ayudan a interpretar este tipo de datos, extrayendo información representativa, tanto referente a los orígenes o relaciones subyacentes como a la posibilidad de extrapolar y predecir su comportamiento futuro.
De hecho uno de los usos más habituales de las series de datos temporales es su análisis para predicción y pronóstico. Por ejemplo de los datos climáticos, o de las acciones de bolsa, o las series pluviométricas.
El objetivo del análisis de una serie de tiempo es el conocimiento de su patrón de comportamiento, para así poder prever su evolución en el futuro cercano, suponiendo por supuesto que las condiciones no variarán significativamente.
Los pronosticos que se puedan realizar en base al análisis de este tipo de datos serviran para el desarrollo de nuevos planes para inversiones en agricultura por ejemplo, elaboración de nuevos productos por parete de las empresas, prevención de desastres por cambios en el clima, o captar turistas para la ciudad, etc.
En estadística, procesamiento de señales, y econometría, una serie temporal es una secuencia de puntos de datos, medidos típicamente a intervalos de tiempo sucesivos , y espaciados (con frecuencia) de forma uniforme. El análisis de series temporales comprende métodos que ayudan a interpretar este tipo de datos, extrayendo información representativa, tanto referente a los orígenes o relaciones subyacentes como a la posibilidad de extrapolar y predecir su comportamiento futuro.
De hecho uno de los usos más habituales de las series de datos temporales es su análisis para predicción y pronóstico. Por ejemplo de los datos climáticos, o de las acciones de bolsa, o las series pluviométricas.
lunes, 26 de mayo de 2008
comentario
el diagrama de caja consiste en describir caracteristicas importantes de un conjunto de datos como el alejamiento de una simetria y la identificacion de valores que se encuentran extremadamente de la distribucion de datos
viernes, 23 de mayo de 2008
box plot
ESTADÍSTICA DESCRIPTIVA
DIAGRAMA DE CAJAS Y BIGOTES (Box and Whisker Plot)
Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.
Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente.
Procedimiento
Para el diagrama de cajas y bigotes se requiere
Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras". La altura (anchura) de la caja no interesa.
La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico Þ H = Q3 - Q1 = RIC.
El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H
Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. Así, las Cercas Internas Inferior (CIi) y Superior (CIs) estarán dadas por:
CIi = Q1 - Paso
CIs = Q3 + Paso
Si la cerca interna inferior da menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.
Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas por:
CEi = CIi - Paso
CEs = CIs + Paso
Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes de las cajas. Por simplicidad no se grafican.
"Valores extremos" son los ubicados entre las dos cercas, y merecen especial atención, ya que pueden ser valores atípicos, que, en algunos casos, no pertenecen realmente a la distribución general de donde provienen los datos.
"Valores lejanos" o , ubicados por fuera de las cercas externas, correspondientes a valores extremos, que requieren un mayor análisis que los valores atípicos.
Considere los siguientes datos, correspondientes a
De este conjunto de datos tenemos que:
Me = 90.45
Q1 = 88.25
Q3 = 92.2
Rango intercuartílico = RIC = 92.2-88.25 = 3.95 Þ Paso = 5.925
Cercas interna inferior = 88.25 - 5.925 = 82.325
Cerca interna superior = 92.20 + 5.925 = 98.125
Cerca externa inferior = 82.325 - 5.925 = 76.40
Cerca externa superior = 98.125 + 5.925 = 104.05
Como se observa hay dos valores que merecen especial atención: 98.8 y 100.3 que están entre las cercas interna y externa superior.
Presentación Presentación Objetivos Objetivos Metodología Metodología Programa detallado Programa detallado Evaluación Evaluación Bibliografía Bibliografía Notas Notas Introducción Introducción Presentación gráfica de la información Presentación gráfica de la información Medidas resumen Medidas resumen Diagrama de cajas y bigotes Diagrama de cajas y bigotes Gráficos de series de tiempo Gráficos de series de tiempo Gráficos de dispersión y medidas relacionadas Gráficos de dispersión y medidas relacionadas Diagramas de sectores y de barras Diagramas de sectores y de barras Problemas Problemas Introducción Introducción Principales estadísticos Principales estadísticos Distribuciones límites Distribuciones límites Distribuciones muestrales Distribuciones muestrales Teorema Central del Límite Teorema Central del Límite Distribución de la proporción Distribución de la proporción Distribución de la diferencia entre proporciones Distribución de la diferencia entre proporciones Distribución chi cuadrado Distribución chi cuadrado Distribución t Distribución t Distribución F Distribución F Distribución de la diferencia entre dos medias Distribución de la diferencia entre dos medias Resumen Resumen Problemas Problemas Introducción Introducción Propiedades de los estimadores Propiedades de los estimadores Métodos de estimación Métodos de estimación Problemas Problemas Introducción Introducción Para la media Para la media Para la diferencia de dos medias Para la diferencia de dos medias Para una proporción Para una proporción Para la diferencia de dos proporciones Para la diferencia de dos proporciones Para la varianza de una distribución normal Para la varianza de una distribución normal Para la relación de varianzas de dos distribuciones normales Para la relación de varianzas de dos distribuciones normales Para observaciones apareadas Para observaciones apareadas Resumen Resumen Problemas Problemas Por qué tomar sólo una muestra cuando la población es finita? Por qué tomar sólo una muestra cuando la población es finita? La especificación de la población y la característica de interes La especificación de la población y la característica de interes Muestreo probabilístico Muestreo probabilístico Sesgo y sus fuentes Sesgo y sus fuentes Usando una tabla de números aleatorios Usando una tabla de números aleatorios Muestreo aleatorio simple Muestreo aleatorio simple Muestreo para determinar una proporción Muestreo para determinar una proporción Muestreo aleatorio estratificado Muestreo aleatorio estratificado Asignación de tamaños de muestras Asignación de tamaños de muestras Muestreo estratificado para determinar una proporción Muestreo estratificado para determinar una proporción Otros métodos de muestreo Otros métodos de muestreo Planeación de un estudio muestral Planeación de un estudio muestral Resumen Resumen Problemas Problemas Introducción Introducción Definiciones Definiciones Curva característica operativa y función de potencia de una prueba Curva característica operativa y función de potencia de una prueba Las mejores pruebas Las mejores pruebas Para la media Para la media Para diferencia de medias Para diferencia de medias Para observaciones apareadas Para observaciones apareadas Para la varianza Para la varianza Para relación de varianzas Para relación de varianzas Sobre proporciones y diferencia de proporciones Sobre proporciones y diferencia de proporciones Pruebas de bondad de ajuste Pruebas de bondad de ajuste Resumen Resumen Problemas Problemas Definición Definición Aspectos especiales Aspectos especiales Ventanas Ventanas Datos para los análisis (variables) y su definición Datos para los análisis (variables) y su definición Menús principales Menús principales Barras de herramientas Barras de herramientas Procedimiento general de análisis Procedimiento general de análisis Uso de gráficos (menú Plot) Uso de gráficos (menú Plot) Análisis usando el menú Describe Análisis usando el menú Describe Algunos resultados Algunos resultados Distribución normal Distribución normal Distribución t Distribución t Distribución chi cuadrado Distribución chi cuadrado Disribución F Disribución F Distribución binomial Distribución binomial Distribución de Poisson Distribución de Poisson Statgraphics Statgraphics Tablas estadísticas Tablas estadísticas Aproximación al TCL Aproximación al TCL Descarga documetos Descarga documetos
DIAGRAMA DE CAJAS Y BIGOTES (Box and Whisker Plot)
Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.
Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente.
Procedimiento
Para el diagrama de cajas y bigotes se requiere
Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras". La altura (anchura) de la caja no interesa.
La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico Þ H = Q3 - Q1 = RIC.
El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H
Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. Así, las Cercas Internas Inferior (CIi) y Superior (CIs) estarán dadas por:
CIi = Q1 - Paso
CIs = Q3 + Paso
Si la cerca interna inferior da menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.
Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas por:
CEi = CIi - Paso
CEs = CIs + Paso
Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes de las cajas. Por simplicidad no se grafican.
"Valores extremos" son los ubicados entre las dos cercas, y merecen especial atención, ya que pueden ser valores atípicos, que, en algunos casos, no pertenecen realmente a la distribución general de donde provienen los datos.
"Valores lejanos" o , ubicados por fuera de las cercas externas, correspondientes a valores extremos, que requieren un mayor análisis que los valores atípicos.
Considere los siguientes datos, correspondientes a
De este conjunto de datos tenemos que:
Me = 90.45
Q1 = 88.25
Q3 = 92.2
Rango intercuartílico = RIC = 92.2-88.25 = 3.95 Þ Paso = 5.925
Cercas interna inferior = 88.25 - 5.925 = 82.325
Cerca interna superior = 92.20 + 5.925 = 98.125
Cerca externa inferior = 82.325 - 5.925 = 76.40
Cerca externa superior = 98.125 + 5.925 = 104.05
Como se observa hay dos valores que merecen especial atención: 98.8 y 100.3 que están entre las cercas interna y externa superior.
Presentación Presentación Objetivos Objetivos Metodología Metodología Programa detallado Programa detallado Evaluación Evaluación Bibliografía Bibliografía Notas Notas Introducción Introducción Presentación gráfica de la información Presentación gráfica de la información Medidas resumen Medidas resumen Diagrama de cajas y bigotes Diagrama de cajas y bigotes Gráficos de series de tiempo Gráficos de series de tiempo Gráficos de dispersión y medidas relacionadas Gráficos de dispersión y medidas relacionadas Diagramas de sectores y de barras Diagramas de sectores y de barras Problemas Problemas Introducción Introducción Principales estadísticos Principales estadísticos Distribuciones límites Distribuciones límites Distribuciones muestrales Distribuciones muestrales Teorema Central del Límite Teorema Central del Límite Distribución de la proporción Distribución de la proporción Distribución de la diferencia entre proporciones Distribución de la diferencia entre proporciones Distribución chi cuadrado Distribución chi cuadrado Distribución t Distribución t Distribución F Distribución F Distribución de la diferencia entre dos medias Distribución de la diferencia entre dos medias Resumen Resumen Problemas Problemas Introducción Introducción Propiedades de los estimadores Propiedades de los estimadores Métodos de estimación Métodos de estimación Problemas Problemas Introducción Introducción Para la media Para la media Para la diferencia de dos medias Para la diferencia de dos medias Para una proporción Para una proporción Para la diferencia de dos proporciones Para la diferencia de dos proporciones Para la varianza de una distribución normal Para la varianza de una distribución normal Para la relación de varianzas de dos distribuciones normales Para la relación de varianzas de dos distribuciones normales Para observaciones apareadas Para observaciones apareadas Resumen Resumen Problemas Problemas Por qué tomar sólo una muestra cuando la población es finita? Por qué tomar sólo una muestra cuando la población es finita? La especificación de la población y la característica de interes La especificación de la población y la característica de interes Muestreo probabilístico Muestreo probabilístico Sesgo y sus fuentes Sesgo y sus fuentes Usando una tabla de números aleatorios Usando una tabla de números aleatorios Muestreo aleatorio simple Muestreo aleatorio simple Muestreo para determinar una proporción Muestreo para determinar una proporción Muestreo aleatorio estratificado Muestreo aleatorio estratificado Asignación de tamaños de muestras Asignación de tamaños de muestras Muestreo estratificado para determinar una proporción Muestreo estratificado para determinar una proporción Otros métodos de muestreo Otros métodos de muestreo Planeación de un estudio muestral Planeación de un estudio muestral Resumen Resumen Problemas Problemas Introducción Introducción Definiciones Definiciones Curva característica operativa y función de potencia de una prueba Curva característica operativa y función de potencia de una prueba Las mejores pruebas Las mejores pruebas Para la media Para la media Para diferencia de medias Para diferencia de medias Para observaciones apareadas Para observaciones apareadas Para la varianza Para la varianza Para relación de varianzas Para relación de varianzas Sobre proporciones y diferencia de proporciones Sobre proporciones y diferencia de proporciones Pruebas de bondad de ajuste Pruebas de bondad de ajuste Resumen Resumen Problemas Problemas Definición Definición Aspectos especiales Aspectos especiales Ventanas Ventanas Datos para los análisis (variables) y su definición Datos para los análisis (variables) y su definición Menús principales Menús principales Barras de herramientas Barras de herramientas Procedimiento general de análisis Procedimiento general de análisis Uso de gráficos (menú Plot) Uso de gráficos (menú Plot) Análisis usando el menú Describe Análisis usando el menú Describe Algunos resultados Algunos resultados Distribución normal Distribución normal Distribución t Distribución t Distribución chi cuadrado Distribución chi cuadrado Disribución F Disribución F Distribución binomial Distribución binomial Distribución de Poisson Distribución de Poisson Statgraphics Statgraphics Tablas estadísticas Tablas estadísticas Aproximación al TCL Aproximación al TCL Descarga documetos Descarga documetos
comentario
el area bajo la curva es unadistribucion onde podemos encontrar porcentajes y datos para darnos resultados de un fenomeno en el cual lo estemos decifrando.
DISTRIBUCION DE PORCENTAJES BAJO LA CURVA (GRÁFICA)
Características de la distribución de probabilidad normal
inicio
arriba
La distribución de probabilidad normal y su curva tiene las siguientes características:
1. La curva normal tiene forma de campana. La media, la moda y la mediana de la distribución son iguales y se localizan en el centro de la distribución.
Distribución Normal
2. La distribución de probabilidad normal es simétrica alrededor de su media. Por lo tanto, la mitad del área bajo la curva está antes del punto central y la otra mitad después. El área total bajo la curva es igual a 1.
3. La curva normal se aproxima de manera asintótica al eje horizontal conforme se aleja de la media en cualquier dirección. Esto significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar.
La familia de la distribución de probabilidad normal
inicio
arriba
La forma de la campana de Gauss depende de los parámetros m y s . La media indica la posición de la campana, de modo que para diferentes valores de la gráfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de s, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución.
Como se deduce, no existe una única distribución normal, sino una familia de distribuciones con una forma común, diferenciadas por los valores de su media y su desviación estándar. En la siguiente gráfica puedes ver como cambia la curva normal al variar la desviación estándar y como se mueve sobre el eje horizontal al variar la media:
La Familia de la Distribución NormalCURVA 1: MEDIA DESV. ESTANDAR
CURVA 2: MEDIA DESV. ESTANDAR
La distribución normal estándar
inicio
arriba
Para facilitar los cálculos se decidió tabular la normal para diferentes probabilidades con variables que siguen la distribución normal. Pero, puesto que sería imposible tener una tabla para cada posible distribución normal, se elaboró solo una tabla, la tabla de la distribución normal estándar, que es la distribución con media igual a cero y desviación estándar igual a uno.
De esta manera solo se tiene que transformar o estandarizar una distribución normal específica, se reviza la tabla, y se conoce la probabilidad. Para estandarizar los valores de una variable, se utiliza la siguiente fórmula:
z = x – m
s
Gracias a esta fórmula podemos transformar cualquier distribución normal a la distribución normal estándar.
Áreas bajo la curva normal
inicio
arriba
Una característica que tiene cualquier distribución normal es que el área bajo la curva, que representa la probabilidad de que la variable aleatoria tome ciertos valores, se distribuye siempre en la misma proporción.
En la tabla de la distribución normal estándar, están registradas las áreas bajo la curva normal que se encuentran a la derecha de los valores Z positivos, de esta forma solo se necesita transformar la distribución normal de interés en una distribución normal estándar mediante la fórmula, y el área a la derecha del valor z será el mismo que el área a la derecha de x.
Ejemplo
Los coeficientes intelectuales de 600 aspirantes de cierta universidad se distribuyen aproximadamente de forma normal con una media de 115 y una desviación estándar de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de que:
a) Tenga un coeficiente mayor de 120.
b) Tenga un coeficiente menor de 100.
c) Tenga un coeficiente menor de 122.
d) Tenga un coeficiente entre 115 y 125.
e) Tenga un coeficiente entre 90 y 105.
Solución.
a) Hay una distribución normal con media 115 y desviación estándar de 12 y queremos saber cual es la probabilidad de que x sea mayor de 120, es decir, cuanto mide el área a la derecha del 120.
Lo primero es transformar esta distribución normal en una distribución normal estándar (con media cero y desviación estándar 1), para lo cual hay que cambiar el valor de x por un valor Z con la fórmula.
z = x – m = 120 – 115 = 0.41
s 12
La distribución ya transformada queda así:
Se busca el valor del área a la derecha del valor Z en la tabla de áreas bajo la curva normal, la unidad y la primer decimal se buscan en la primer columna, y la segunda decimal en el primer renglón, donde se cruzan renglón y columna es el valor del área a la derecha del valor z. En este ejemplo:
COMENTARIO:
los valores estandarizados son practicamente encontrados en la tabla de valores lo cual lol representa la z y que ladistribucion desempeña un papel importante.
valor estandarizado
Una distribución normal que tiene media igual a 0 y desvición estándar igual a 1 se denomina distribución normal estándar.
Valor z: la distancia entre un valor seleccionado, designado como X, y la población media μ, dividida entre la desviación estándar de la población σ,
Valor z: la distancia entre un valor seleccionado, designado como X, y la población media μ, dividida entre la desviación estándar de la población σ,
AREA BAJO LA CURVA
ÁREA BAJO LA CURVA
El concepto de área lo hemos manejado ampliamente en cursos básicos, de hecho para las figuras geométricas como el rectángulo el cálculo de su área se define como el producto de su base por su altura, del mismo modo para calcular el área de un triángulo multiplicamos su base por su altura y al resultado lo dividimos entre dos. Para calcular el área de cualquier polígono (regular e irregular) solo debemos triangular (construir triángulos en su área), calcular el área de cada uno de ellos y sumarlas...
En todas las situaciones anteriores el proceso para el cálculo del área es relativamente simple, sin embargo cuando tenemos una figura como la siguiente en la cual uno o varios de sus lados que limitan la región en la cual queremos calcular el área son curvas, no tenemos un proceso claro.
La gráfica corresponde a la función
Por lo tanto debemos proponer intuitivamente un proceso similar a la triangulación (explicada en el primer párrafo de este artículo), es decir, vamos a "rectangular" el área... Este método consiste en trazar varios rectángulos que aproximen el área de la región deseada, esto lo podemos ver en las siguientes gráfica...
En ambas gráficas podemos ver que el área calculada va a tener pequeños márgenes de error, en la primera (rectángulos amarillos) vemos que estamos calculando un área mayor mientras que en la segunda (rectángulos verdes) calculamos un área menor...
En ambas situaciones podemos identificar que la base de todos los rectángulos es de 0.25 unidades mientras que la altura es fácil de obtener usando un simple evaluación de funciones:
De esta manera podemos proponer la siguiente tabla para el área aproximada de los rectángulos verdes y de los rectángulos amarillos.
Los resultados anteriores nos van conduciendo cada vez más a poder determinar con precisión el valor del área, el Cálculo nos brinda el concepto del límite, el cual nos puede ser de mucha ayuda para poder determinar con total exactitud el área bajo la curva...
El proceso que hemos seguido es calcular las áreas de todos y cada uno de los rectángulos trazados por tanto podemos afirmar que una buena aproximación del área bajo la curva está dada por la expresión
Donde Ar es la suma de todas las áreas de los rectángulos, "delta x" es la base del rectángulo y f(xn) es la altura.
El área bajo la curva será exacta cuanto el número de rectángulos "n" sea infinito y por tanto el área bajo la curva estará dada por la expresión:
El concepto de área lo hemos manejado ampliamente en cursos básicos, de hecho para las figuras geométricas como el rectángulo el cálculo de su área se define como el producto de su base por su altura, del mismo modo para calcular el área de un triángulo multiplicamos su base por su altura y al resultado lo dividimos entre dos. Para calcular el área de cualquier polígono (regular e irregular) solo debemos triangular (construir triángulos en su área), calcular el área de cada uno de ellos y sumarlas...
En todas las situaciones anteriores el proceso para el cálculo del área es relativamente simple, sin embargo cuando tenemos una figura como la siguiente en la cual uno o varios de sus lados que limitan la región en la cual queremos calcular el área son curvas, no tenemos un proceso claro.
La gráfica corresponde a la función
Por lo tanto debemos proponer intuitivamente un proceso similar a la triangulación (explicada en el primer párrafo de este artículo), es decir, vamos a "rectangular" el área... Este método consiste en trazar varios rectángulos que aproximen el área de la región deseada, esto lo podemos ver en las siguientes gráfica...
En ambas gráficas podemos ver que el área calculada va a tener pequeños márgenes de error, en la primera (rectángulos amarillos) vemos que estamos calculando un área mayor mientras que en la segunda (rectángulos verdes) calculamos un área menor...
En ambas situaciones podemos identificar que la base de todos los rectángulos es de 0.25 unidades mientras que la altura es fácil de obtener usando un simple evaluación de funciones:
De esta manera podemos proponer la siguiente tabla para el área aproximada de los rectángulos verdes y de los rectángulos amarillos.
Los resultados anteriores nos van conduciendo cada vez más a poder determinar con precisión el valor del área, el Cálculo nos brinda el concepto del límite, el cual nos puede ser de mucha ayuda para poder determinar con total exactitud el área bajo la curva...
El proceso que hemos seguido es calcular las áreas de todos y cada uno de los rectángulos trazados por tanto podemos afirmar que una buena aproximación del área bajo la curva está dada por la expresión
Donde Ar es la suma de todas las áreas de los rectángulos, "delta x" es la base del rectángulo y f(xn) es la altura.
El área bajo la curva será exacta cuanto el número de rectángulos "n" sea infinito y por tanto el área bajo la curva estará dada por la expresión:
miércoles, 27 de febrero de 2008
lunes, 25 de febrero de 2008
estadistica
La estadística es una ciencia matemática que se refiere a la colección, estudio e interpretación de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, ciencias de la salud como la Psicología y la Medicina, y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales.
Suscribirse a:
Entradas (Atom)