Informe kolmogorov smirnov

50 %
50 %
Information about Informe kolmogorov smirnov

Published on December 28, 2016

Author: judithjulianagarbozosaenz

Source: slideshare.net

1. I. INTRODUCCIÓN Se entiende por bondad de ajuste, la asimilación de datos observados de una variable, a una función matemática previamente establecida y reconocida. A través de ésta es posible interpolar y extrapolar información; en otras palabras, predecir el comportamiento de la variable en estudio (Pizarro et al, 1986). Para la estimación de la bondad de ajuste, existen variadas pruebas, las cuales poseen distinto grado de efectividad. En el presente documento se entrega el test de Kolmogorov-Smirnov. La prueba de bondad de ajuste se aplica en diseños de investigación en los que se estudia a un único grupo. La prueba compara la distribución de frecuencias observada (Fo) de una variable usualmente cualitativa, pero que también puede ser cuantitativa, con la distribución de frecuencias de la misma variable medida en un grupo de referencia. El procedimiento de la prueba implica el cálculo de una distribución esperada (Fe) en el grupo estudiado, usando como punto de partida a la distribución de la variable en el grupo de referencia. El propósito de la prueba es averiguar si existen diferencias estadísticamente significativas entre la distribución observada (Fo) y la distribución esperada (Fe).

2. II. CUERPO O CONTENIDO 2.1 Prueba Kolmogorov – Smirnov Método por el cual se comprueba la bondad de ajuste de las distribuciones, asimismo permite elegir la más representativa, es decir la de mejor ajuste. Esta prueba consiste en comparar el máximo valor absoluto de la diferencia D entre la función de distribución de probabilidad observada Fo (xm) y la estimada F (xm): D = máx / Fo(xm) – F(xm)/ Con un valor crítico d que depende del número de datos y el nivel de significancia seleccionado (Tabla Nº 03). Si D<d, se acepta la hipótesis nula. Esta prueba tiene la ventaja sobre la prueba de X2 de que compara los datos con el modelo estadístico sin necesidad de agruparlos. La función de distribución de probabilidad observada se calcula como: Fo(xm) = 1- m / (n+1) (13) Donde m es el número de orden de dato xm en una lista de mayor a menor y n es el número total de datos. (Aparicio, 1996)

3. 2.2 Test de Kolmogorov-Smirnov en la Distribución de Gumbel Para la aplicación del test señalado, es necesario determinar la frecuencia observada acumulada. Para la frecuencia observada en el caso especial de Gumbel, se ordena la información de menor a mayor y se aplica: donde: Fn (x): frecuencia observada acumulada. n: N° total de orden N: N° total de datos. En el caso de la frecuencia teórica acumulada, ésta se determina a través de la función de Gumbel. Una vez determinadas ambas frecuencias, se obtiene el supremo de las diferencias entre ambas, en la i-ésima posición de orden, que se denomina D.

4. Luego, asumiendo un valor de significancia, se recurre a la tabla de valores criticos de D en la prueba de Bondad de ajuste de Kolmogorov-Smirnov, y considerando el tamaño de la muestra, se establece lo sieguiente: Si D < D tabla, se acepta que (el ajuste es adecuado, coon el nive de confiabilidad asumido. Ajuste a Gumbel: Se desea conocer la ley de distribución de las precipitaciones máximas en 24 horas, de la estación Monte Patria provincia de Limarí. Para ello, se dispone de los siguientes datos. De lo expuesto, se deduce que se cuenta con una información de doce años, y además que los montos denotan una extrema variabilidad. En relación al primer aspecto, es un denominador común en muchas estaciones del país, la carencia de series hidrológicas consistentes, por lo cual es difícil soslayarlo. En cuanto a la variabilidad, es preciso destacar que las zonas áridas se caracterizan por presentar este elemento como característica de la distribución y monto de las precipitaciones. No obstante lo anterior, y como se tiende a estimar valores máximos, se puede obviar este último aspecto considerando las dos o tres precipitaciones máximas anuales, para con esta nueva serie de datos elegir un número mayor de años a considerar.

5. Luego, el enfrentamiento de este problema es resorte del criterio que el ingeniero utilice para tomar la decisión, y la cual sólo podrá ser calificada a la luz de los antecedentes que cada situación denote. Así, para el caso en cuestión, se trabajará con la información deprecipitación máxima anual en 24 horas, toda vez que se trata de un ejercicio metodológico. Con los datos de la columna 1, se determina que: Luego, los parámetros u y d quedan:

6. Por consiguiente, la función de Gumbel se define como: De lo expuesto, se deduce que se cuenta con una información de doce años, y además que los montos denotan una extrema variabilidad. Por otra parte, aplicando la expresión n/N+1, se obtiene la frecuencia observada acumulada, la cual se expresa en la columna (2) del cuadro N° 2. Asimismo, reemplazando en la ecuación (1) los valores de x, se obtienen las frecuencias teóricas acumuladas, las cuales constituyen la columna (3) del cuadro N° 2. 2.3 Aplicación de Kolmogorov-Smirnov. Con la información del cuadro N° 2, se busca el En este caso, corresponde a D = 0.073 en el tercer valor del cuadro mencionado. Con un 95% de confiabilidad y n = 12, se obtiene un valor de tabla Dt = 0.375. Luego D < Dt, por consiguiente se acepta con 95% de seguridad que el ajuste es bueno.

7. 2.4 SPSS: PRUEBAS NO PARAMÉTRICAS y Kolmogorov y smirnov La prueba de Kolmogorov-Smirnov para una muestra es un procedimiento de "bondad de ajuste", que permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una distribución teórica específica. Su objetivo es señalar si los datos provienen de una población que tiene la distribución teórica especificada, es decir, contrasta si las observaciones podrían razonablemente proceder de la distribución especificada. Ejemplo. Muchas pruebas paramétricas requieren que las variables se distribuyan de forma normal. La prueba de Kolmogorov-Smirnov para una muestra se puede utilizar para comprobar si una variable (por ejemplo notas) se distribuye normalmente. Estadísticos. Media, desviación típica, mínimo, máximo, número de casos no perdidos y cuartiles. Seleccionar: • Analizar… o K-S de 1 muestra...

8. Se pueden seleccionar una o más variables de contraste numéricas. Cada variable genera una prueba independiente. En nuestro caso vamos a seleccionar t para realizar la prueba. Si lo deseas, puedes pulsar en Opciones para obtener estadísticos descriptivos, cuartiles y controlar el tratamiento de los datos perdidos.

9. Pulsamos aceptar……. Comprobamos el nivel de significación, si es menor que 0.05 la distribución no es normal, si es mayor que 0.05 la distribución es normal. En este caso la distribución es normal (nivel de significación 0.904).

10. III. CONCLUSIONES  El Test de Kolmogorov-Smirnov se basa en la idea de comparar la función de la distribución acumulada de los datos observados con la de una distribución normal, midiendo la máxima distancia entre ambas curvas.  El Tests de Kolmogorov-Smirnov se utilizan para verificar si una distribución se ajusta o no a una distribución esperada, en particular a la distribución normal.  La prueba de Kolmogórov-Smirnov se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre sí y es bastante potente con muestras grandes.  La prueba Kolmogórov-Smirnov es más sensible a los valores cercanos a la mediana que a los extremos de la distribución.

11. IV. REFERENCIA  PIZARRO, R.; NOVOA, P. 1986. Instructivo n° 5. Determinación de valores probabilísticos para variables hidrológicas. Elementos técnicos de Hidrología. Corporación Nacional Forestal (CONAF). Chile. 78 p.  http://eias.utalca.cl/Docs/pdf/Publicaciones/manuales/a_modulo_leyes.pdf  http://transparencia.mtc.gob.pe/idm_docs/normas_legales/1_0_2950.pdf  http://www.facmed.unam.mx/deptos/salud/censenanza/planunico/spii/antolo gia2012/3.pdf  http://www.uv.es/innomide/spss/SPSS/SPSS_0802A.pdf  http://www-01.ibm.com/software/pe/analytics/spss/  http://www.mangrafias.com/trabajos11/docima/docima.shtml  http://www.math.epn.edu.ec/~sandra/TDE_2013_B/Tablas%20KS.pdf

Add a comment