AnáLisis EstadíStico De Datos Usando R 1

62 %
38 %
Information about AnáLisis EstadíStico De Datos Usando R 1

Published on March 12, 2008

Author: pablramon

Source: slideshare.net

Description

Algunos comandos básicos para hecer Análisis de Varianza utilizando lenguaje R

Análisis estadístico de datos de cultivos in-vitro usando R Juan Pablo Angamarca G. Becario Escuela de Ciencias de la Computación [email_address] Mat. Pablo Ramón C. Docente Investigador Docente Investigador – LFV – UTPL [email_address] Unidad de Fisiología y Ecología Vegetal

Objetivos Realizar el análisis estadístico de los datos de cultivos in-vitro usando el lenguaje estadístico R como una mejor alternativa entre el software estadístico clásico. Incorporar nuevos procedimientos al análisis estadístico mediante el lenguaje R, concretamente representaciones gráficas, con la finalidad de optimizar la interpretación biológico-estadística. Aprovechar la flexibilidad que ofrece este lenguaje estadístico en dicho análisis.

Realizar el análisis estadístico de los datos de cultivos in-vitro usando el lenguaje estadístico R como una mejor alternativa entre el software estadístico clásico.

Incorporar nuevos procedimientos al análisis estadístico mediante el lenguaje R, concretamente representaciones gráficas, con la finalidad de optimizar la interpretación biológico-estadística.

Aprovechar la flexibilidad que ofrece este lenguaje estadístico en dicho análisis.

Metodología Fase 1: Entender el funcionamiento del lenguaje R mediante la lectura de artículos y tutoriales. Fase 2: Realizar aplicaciones sencillas de análisis de datos en el lenguaje. Fase 3: Utilizar los datos de las investigaciones realizadas en el laboratorio de Fisiología Vegetal para un análisis estadístico adecuado. Fase 4: Extender la fase 3 utilizando las características de programación del lenguaje.

Fase 1: Entender el funcionamiento del lenguaje R mediante la lectura de artículos y tutoriales.

Fase 2: Realizar aplicaciones sencillas de análisis de datos en el lenguaje.

Fase 3: Utilizar los datos de las investigaciones realizadas en el laboratorio de Fisiología Vegetal para un análisis estadístico adecuado.

Fase 4: Extender la fase 3 utilizando las características de programación del lenguaje.

Análisis de Varianza Identificar el origen de la variabilidad de una o más fuentes potenciales, llamadas “tratamientos” o “factores”. Variando los factores o niveles en un diseño predeterminado y analizando los resultados.

Identificar el origen de la variabilidad de una o más fuentes potenciales, llamadas “tratamientos” o “factores”.

Variando los factores o niveles en un diseño predeterminado y analizando los resultados.

Análisis de Varianza Comparar promedios de tratamientos. Identificar si la variabilidad depende de los diferentes tratamientos o de un error aleatorio. Hipótesis: H0: μ1 = μ2 = … = μα Donde μi representa la media de cada nivel (one-way) o tratamiento (two-way).

Comparar promedios de tratamientos.

Identificar si la variabilidad depende de los diferentes tratamientos o de un error aleatorio.

Hipótesis:

H0: μ1 = μ2 = … = μα

Donde μi representa la media de cada nivel (one-way) o tratamiento (two-way).

Condiciones de ANOVA Test de Bartlett (variabilidad) El test de Bartlett (Snedecor y Cochran, 1983) tiene como utilidad el determinar si k muestras tienen varianzas iguales (homogeneidad de varianzas). Test Kolmogorov-Smirnov Es un test de ajuste a una ley continua (normal). Test Shapiro-Wilk (Normalidad de los residuos) El test Shapiro-Wilk es un análisis de varianza (semi/no) paramétrico que nos dota de evidencia para afirmar que existen ciertos tipos de normalidad, mas no garantiza “normalidad”.

Test de Bartlett (variabilidad)

El test de Bartlett (Snedecor y Cochran, 1983) tiene como utilidad el determinar si k muestras tienen varianzas iguales (homogeneidad de varianzas).

Test Kolmogorov-Smirnov

Es un test de ajuste a una ley continua (normal).

Test Shapiro-Wilk (Normalidad de los residuos)

El test Shapiro-Wilk es un análisis de varianza (semi/no) paramétrico que nos dota de evidencia para afirmar que existen ciertos tipos de normalidad, mas no garantiza “normalidad”.

Condiciones del ANOVA Test de Bartlett (variabilidad) El test de Bartlett (Snedecor y Cochran, 1983) tiene como utilidad el determinar si k muestras tienen varianzas iguales (homogeneidad de varianzas). Test Kolmogorov-Smirnov Es un test de ajuste a una ley continua (normal). Test Shapiro-Wilk (Normalidad de los residuos) El test Shapiro-Wilk es un análisis de varianza (semi/no) paramétrico que nos dota de evidencia para afirmar que existen ciertos tipos de normalidad, mas no garantiza “normalidad”.

Test de Bartlett (variabilidad)

El test de Bartlett (Snedecor y Cochran, 1983) tiene como utilidad el determinar si k muestras tienen varianzas iguales (homogeneidad de varianzas).

Test Kolmogorov-Smirnov

Es un test de ajuste a una ley continua (normal).

Test Shapiro-Wilk (Normalidad de los residuos)

El test Shapiro-Wilk es un análisis de varianza (semi/no) paramétrico que nos dota de evidencia para afirmar que existen ciertos tipos de normalidad, mas no garantiza “normalidad”.

Análisis de Varianza Luego de realizar el test ANOVA, se realiza una prueba post-hoc, ejm: test Tukey Test post-hoc = test comparaciones múltiples

Luego de realizar el test ANOVA, se realiza una prueba post-hoc, ejm: test Tukey

Test post-hoc = test comparaciones múltiples

Lenguaje y Entorno R R lenguaje y entorno para computación estadística y gráficos Es un proyecto GNU (software libre) Posibilidad de crear gráficos, incluir símbolos y fórmulas matemáticas donde se necesiten. R es una suite integrada de utilitarios de software Un bien logrado, simple y efectivo lenguaje de programación que incluye sentencias condicionales, bucles, funciones definidas por usuario y facilidades para ingreso y presentación de datos

R lenguaje y entorno para computación estadística y gráficos

Es un proyecto GNU (software libre)

Posibilidad de crear gráficos, incluir símbolos y fórmulas matemáticas donde se necesiten.

R es una suite integrada de utilitarios de software

Un bien logrado, simple y efectivo lenguaje de programación que incluye sentencias condicionales, bucles, funciones definidas por usuario y facilidades para ingreso y presentación de datos

Lectura de datos con R R puede obtener datos desde varias fuentes Ejm: datos en Excel, así que, para facilitarnos la importación de datos, podemos exportar una hoja de Excel como un archivo de texto. Luego importarlo con la función read.table de R, que al leer el archivo, creará un objeto de datos llamado “Data frame”, que contendrá los datos del archivo. Asignación a un objeto brotacionCinchona los datos del archivo: > brotacionCinchona <-read.table(“datos_anova.txt”, header = TRUE)

R puede obtener datos desde varias fuentes

Ejm: datos en Excel, así que, para facilitarnos la importación de datos, podemos exportar una hoja de Excel como un archivo de texto.

Luego importarlo con la función read.table de R, que al leer el archivo, creará un objeto de datos llamado “Data frame”, que contendrá los datos del archivo.

Asignación a un objeto brotacionCinchona los datos del archivo:

> brotacionCinchona <-read.table(“datos_anova.txt”, header = TRUE)

Lectura de datos con R

CASO DE ESTUDIO: Brotación de C. officinalis Desarrollar un test de Bartlett para determinar si las varianzas en cada tratamiento son iguales estadísticamente. H0 = No existe diferencia significativa entre las varianzas de los tratamientos. > bartlett.test (brotacionCinchona$Brotacion, brotacionCinchona$Tratamientos) Bartlett test for homogeneity of variances data: brotacionCinchona$Brotacion and brotacionCinchona$Tratamientos Bartlett's K-squared = 6.6692, df = 11, p-value = 0.8252 Conclusión : Puesto que p-value es mayor que 0.05, no se rechaza la hipótesis de homogeneidad de varianzas.

Desarrollar un test de Bartlett para determinar si las varianzas en cada tratamiento son iguales estadísticamente.

H0 = No existe diferencia significativa entre las varianzas de los tratamientos.

> bartlett.test (brotacionCinchona$Brotacion, brotacionCinchona$Tratamientos)

Bartlett test for homogeneity of variances

data: brotacionCinchona$Brotacion and brotacionCinchona$Tratamientos

Bartlett's K-squared = 6.6692, df = 11, p-value = 0.8252

Conclusión : Puesto que p-value es mayor que 0.05, no se rechaza la hipótesis de homogeneidad de varianzas.

Test ANOVA H0 = No existe diferencia significativa en la brotación media de cada tratamiento. > aov.brotacionCinchona <- aov (brotacionCinchona$Brotacion ~ brotacionCinchona$Tratamientos) > aov.brotacionCinchona Call: aov(formula = brotacionCinchona$Brotacion ~ brotacionCinchona$Tratamientos) Terms: brotacionCinchona$Tratamientos Residuals Sum of Squares 45 230 Deg. of Freedom 11 24 Residual standard error: 3.095696 Estimated effects may be unbalanced > summary (aov.brotacionCinchona) Df Sum Sq Mean Sq F value Pr(>F) brotacionCinchona$Tratamientos 11 45.000 4.091 0.4269 0.9287 Residuals 24 230.000 9.583 Puesto que Pr > 0.05, no se rechaza la hipótesis de igualdad de promedios entre cada tratamiento.

Test ANOVA

H0 = No existe diferencia significativa en la brotación media de cada tratamiento.

> aov.brotacionCinchona <- aov (brotacionCinchona$Brotacion ~ brotacionCinchona$Tratamientos)

> aov.brotacionCinchona

Call:

aov(formula = brotacionCinchona$Brotacion ~ brotacionCinchona$Tratamientos)

Terms:

brotacionCinchona$Tratamientos Residuals

Sum of Squares 45 230

Deg. of Freedom 11 24

Residual standard error: 3.095696

Estimated effects may be unbalanced

> summary (aov.brotacionCinchona)

Df Sum Sq Mean Sq F value Pr(>F)

brotacionCinchona$Tratamientos 11 45.000 4.091 0.4269 0.9287

Residuals 24 230.000 9.583

Puesto que Pr > 0.05, no se rechaza la hipótesis de igualdad de promedios entre cada tratamiento.

Gráficas de ANOVA

Test TUKEY HSD OBJETIVO: Determinar tratamientos significativamente diferentes > resultados.tukey <- TukeyHSD (aov.cinchona) > resultados.tukey Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = Brotación ~ Tratamientos)

OBJETIVO: Determinar tratamientos significativamente diferentes

> resultados.tukey <- TukeyHSD (aov.cinchona) > resultados.tukey Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = Brotación ~ Tratamientos)

RESULTADOS TEST DE TUKEY

Tratamientos significativos > parejas.dif.significativa Parejas.de.tratamientos Valores.p 1 T-B1N0 0.0015792 2 T-B1N1 0.0230317 3 T-B1N2 0.0120260 4 T-B1N3 0.0011190 5 T-B2N0 0.0031345 6 T-B2N1 0.0061755 7 T-B2N2 0.0011190 8 T-B2N3 0.0044048 9 T-B3N0 0.0022264 10 T-B3N1 0.0031345 11 T-B3N2 0.0011190 12 T-B3N3 0.0002812

> parejas.dif.significativa

Parejas.de.tratamientos Valores.p

1 T-B1N0 0.0015792

2 T-B1N1 0.0230317

3 T-B1N2 0.0120260

4 T-B1N3 0.0011190

5 T-B2N0 0.0031345

6 T-B2N1 0.0061755

7 T-B2N2 0.0011190

8 T-B2N3 0.0044048

9 T-B3N0 0.0022264

10 T-B3N1 0.0031345

11 T-B3N2 0.0011190

12 T-B3N3 0.0002812

Gráfica Test Tukey > plot(datos.tukey)

Add a comment

Related presentations

Related pages

ANÁLISIS ESTADÍSTICO(1) USANDO R - YouTube

ANÁLISIS ESTADÍSTICO(1) USANDO R ... ANÁLISIS ESTADÍSTICO(2) USANDO R - Duration: ... Soft R (Análisis de datos y estadística) ...
Read more

Introducción al uso de R y R Commander para el análisis ...

análisis estadístico de datos en ciencias sociales ... 9.1. Instalar R Commander ... en el tratamiento y el análisis estadístico de datos usando R y R ...
Read more

Soft R (Análisis de datos y estadística) Básico Package ...

Video para iniciar el análisis de datos en R, ... Tutorial de análisis exploratorio usando ... ANÁLISIS ESTADÍSTICO(1) USANDO R ...
Read more

AnáLisis EstadíStico De Datos Usando R 1 - Business

Análisis estadístico de datos de laboratorio Análisis estadístico de datos de laboratorio Resumen Introducción La realización de análisis químicos ...
Read more

Chicana-Introduccion Al Uso de R - scribd.com

análisis estadístico de datos en ... en el tratamiento y el análisis estadístico de datos usando R y R ... Análisis bivariado con R Commander . 1.
Read more

Análisis estadístico de un curso de 1° medio - Education

AnáLisis EstadíStico De Datos Usando R 1 Algunos comandos básicos para hecer Análisis de Varianza utilizando lenguaje R Análisis estadístico de ...
Read more

Análisis estadístico y econométrico usando GNU R - Wikilibros

Análisis estadístico y econométrico usando ... de Datos en R R es un lenguaje ... indica con un espacio en blanco el final de la lista de datos. Ejemplo ...
Read more

Curso online Fundamentos de Análisis Estadístico de Datos ...

... Análisis Estadístico de Datos con R tiene como finalidad brindar una revisión de los principales conceptos de la estadística para el análisis de ...
Read more

II. ANÁLISIS DE SISTEMAS DE MEDICIÓN - uoc.edu

... Pretendemos realizar un estudio R&R sobre dos conjuntos de datos. ... 1 2 3 R Chart by ... Análisis de Sistemas de Medición Gage R&R ...
Read more