EDA

63 %
38 %
Information about EDA
Education

Published on September 7, 2009

Author: moibemo

Source: slideshare.net

Explorando Datos Multivariados 1 POP Psicología de la Educación

Estructura y Representación de los Datos Multivariados Gráficos de distribución de los datos Datos perdidos y/o extremos 2.1. Medias Restringidas 2.2. Medias Semirestringidas 2

Estructura y Representación de los Datos Observar los datos gráficamente nos permite ver cómo se distribuyen, si se cumplen los criterios para la aplicación de una determinada prueba paramétrica.. Etc… Una vez obtenidos los datos. Observarlos graficándolos de distintas maneras. Observar los datos nos permite ahorrar tiempo en los análisis paramétricos. Seleccionando la prueba adecuada. 3

Estructura y Representación de los Datos Tipos de gráficos: Histograma de Frecuencia: Nos permite intuir la distribución de probabilidad de los datos, normalidad, simetría, etc. Diagrama de Tallos y Hojas Útil para muestra de datos pequeñas. Nos da la información del histograma pero observando los valores de la variable. Cajas y bigotes Permite estudiar la simetría de los datos, y detectar valore atípicos. Gráfico de Normalidad P-P Nos permite comprobar si unos datos se ajustan a la distribución normal. Gráfico de dispersión Utilizados para ver la distribución conjunta de dos variables o más. 4

Sentencia Explore 5

Outliers Se define como aquel valor que está entre 1,5 y 3 IQR (amplitud intercuartílica P75-P25 Como inspeccionamos los outliers: Haciendo un gráfico de cajas y bigotes (boxplot) Observando los datos tipificados de la variable (puntuaciones-z) sentencia RANK (p.e. RANK ci / NORMAL) Una vez identificados los outliers ¿Qué hacemos con ellos? Quitar el caso Cambiar el dato (p.e. media grupo, media condición, media sujeto, etc.) Transformación de los datos (esto se hace en cualquier caso cuando la distribución de los datos es asimétrica) 6

Outliers Tipos de transformaciones… Tranformaciones logaritmicas (Log (Xi)). En este caso hay que tener en cuenta que si los datos están muy próximos a cero o son negativos hay que previamente transformarlos sumando una constante. Tranformación con la raíz cuadrada Tranformación recíproca (1/Xi). En este caso los valores altos se convertirán en valores próximos a cero, y los valores bajos serán los más altos. Lo que hacemos es utilizar la fórmula 1/Xmayor-Xi) Todas estas tranformaciones se utilizan para tranformar distribuciones asimétricas tanto positivas como negativas.. Una familia de transformaciones especialmente útiles es la “escalera de potencias” de Tukey 7

Corrigen asimetría negativa Corrigen asimetría positiva Outliers Escalera de potencias de Tukey 8

Outliers Si la transformación falla, podemos reemplazar el dato… ¿cómo? por el valor más alto mas uno Reemplazarlo por el valor que tiene en 3 desviaciones típicas Una variación del anterior es cambiar el valor por el que corresponde a 2 desviaciones típicas Lo mejor es transformar los datos, en lugar de quitar o sustituir, cuando tenemos outliers. Si transformamos una variable porque su distribución es asimétrica, tenemos que hacer lo mismo con todas las demás. 9

Ejemplo. Datos de TR de un participante No sólo que hay algunas puntuaciones atípicas a ambos lados, sino que hay una clara asimetría positiva.

Ejemplo. Datos (transformados; raiz cuadrad) de TR de un participante (cont.) HEMOS EFECTUADO LA RAIZ PARA HACER MÁS SIMETRICA LA DISTRIBUCIÓN. No sólo que aún queda algo de asimetría positiva. Con el logaritmo, podremos reducir más la asimetría positiva, es lo que haremos ahora

Ejemplo. Datos (transformados; logaritmo) de TR de un participante (cont.) Nota: Si algún valor fuera 0, emplear log(1+x) En este caso no sólo que la asimetría positiva ha desaparecido (si acaso hay cierta asimetría negativa causada por unas pocas puntuaciones atípicas).

Ejemplo. Datos (transformados; cuadrado) de TR de un participante (cont.) Nota: Emplear el cuadrado no se debe hacer para corregir la asimetría positiva...sólo la negativa! Lo que hemos hecho es aumentar la asimetría positiva y eso no es lo que queríamos...(y si empleamos el cubo, aún peor para nuestros fines).

Transformación de Variables Esta familia de transformaciones (“escalera de Tukey”) tiene importantes propiedades: Preservan el orden de los valores; es decir, los valores mayores de la escala original seguirán siendo los valores mayores en la escala transformada. 2. Modifican la distancia entre los valores. Con potencias p<1 (raíz x o log x) se comprimen los datos en la parte superior de la distribución en relación a los valores menores; Con potencias p>1 (como el cuadrado de x) se tiene el efecto contrario. 3. El efecto sobre la forma de la distribución cambia sistemáticamente con p. Si raíz x hace menos pronunciada la asimetría positiva de una distribución, el log x provocará que la distribución resultante sea aún menos asimétrica positiva (en relación a raíz x). 14

Transformación de Variables En definitiva, las transformaciones de potencia pueden hacer que la variable transformada tenga menos asimetría. ¿Por qué es eso importante? – Las distribuciones que muestran una clara asimetría son difíciles de estudiar. – Los valores originales aparentemente atípicos se encontrarán más cercanos al grueso de los datos. – Los métodos estadísticos suelen emplear la media aritmética; pero la media de una distribución asimétrica no es un buen índice del grueso de los datos. 15

Estructura y Representación de los Datos Estadísticos (Estimadores) robustos (ESTADÍSTICA INFERENCIAL): Son aquellos estadísticos (estimadores) que funcionan bien para varios tipos distintos de distribuciones teóricas, aunque pueden no ser el mejor estimador para ningún tipo concreto de distribución. Es decir, son el “mejor compromiso”. La media no es un estimador robusto. La mediana es un estimador más robusto que la media, si bien hay otros estimadores más robustos que veremos en el punto siguiente del temario. 16

Medidas robustas de tendencia central 1. Medias Recortadas Consiste en calcular la media aritmética sobre un subconjunto central del conjunto de datos, no considerándose una determinada proporción p por cada extremo. (p se expresa normalmente como porcentaje). Por ejemplo, una media recortada al 40% en una secuencia de 10 datos implica no tener en cuenta ni los 4 valores menores ni los 4 valores mayores. Observar que la media recortada al 0% es la media aritmética. A la media recortada al 25% se la denomina centrimedia. 17

Medidas robustas de tendencia central 1. Medias Recortadas (cont) Calculamos la media recortada al 10% de los siguientes datos: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11 El valor es 6 Calcula la centrimedia El valor es 5.8 18

Medidas robustas de tendencia central 2. Media Winsorizada Es análogo a las medias recortadas excepto en que las puntuaciones eliminadas, ya no lo son sino que se sustituyen por los valores menor y mayor que quedan para el cómputo de la media winsorizada. Así, en la media recortada a nivel 2 implicaría eliminar las dos puntuaciones mayores y las 2 menores: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11 Y quedan los datos: 4, 5, 5, 6, 7, 8 y se calcula la media de los mismos En la media winsorizada, los datos 3 y 4 (los dos menores) y el 9 y 11 (los dos mayores) se sustituyen por 4 y 8 respectivamente. Es decir, 4, 4, 4, 5, 5, 6, 7, 8, 8, 8 y se calcula la media de los mismos, que será la media winsorizada a nivel 2 (debe de dar 5.9) 19

Medidas robustas de tendencia central 3. Otros tipos de media en la que se recortan datos En muchas ocasiones lo que se hace es emplear un valor mínimo y uno máximo más allá del cual se eliminan los datos que sobrepasen tales valores. Por ejemplo, en experimentos de tiempo de reacción para discriminar palabras/pseudopalabras se pueden eliminar datos menores de 200 ms y mayores de 1500 ms. (Menos de 200 ms es demasiado rápido; más de 1500 ms es demasiado lento.) De esta manera, si todos los datos están en el rango 200-1500 ms no se elimina ningún dato 20

Medidas robustas de tendencia central 4. Trimedia Es un índice de tendencia central que consiste en calcular una media aritmética ponderada de tres medidas, la Mediana (con peso doble) y el primer y tercer cuartil. Pensemos que en un conjunto de datos, el primer cuartil es 51, la mediana es 55 y el tercer cuartil es 63. La trimedia es: 21

Medidas robustas de tendencia central 5. Otras medidas robustas El estimador-M de Huber, el estimador biponderado de Tukey, el estimador M-redescendente de Hampel y el estimador en onda de Andrew. Estos estimadores se diferencian entre sí por el tipo de ponderación aplicada sobre los datos. Por ejemplo, en el Estimador-M de Huber (Estimador M de posición): Las puntuaciones típicas que sean menores que una constante, reciben un peso de 1. Los casos que tienen los mayores valores absolutos tienen pesos tanto más pequeños cuanto mayor es su distancia respecto a cero. La constante es 1.339.  Cálculo: lo da el SPSS. 22

Sentencia Explore Nos permite obtener una serie de datos tanto numéricos como gráficos sobre nuestros datos. (hay otras sentencias para estudiar desde un punto de vista descriptivo los datos. ES BUENO PRACTICAR!!!) 23

Glastonburyfestival.sav 24

Sentencia Explore 25

Sentencia Explore 26

Sentencia Explore 27

Sentencia Explore 28

Sentencia Explore 29

Sentencia Explore 30

Add a comment

Related presentations

Related pages

EDA – Wikipedia

Eda steht für: Eda (Name), Vor- und Familienname; Eda (Gemeinde), Gemeinde in Schweden; Eda (Eda), Ort in der schwedischen Gemeinde Eda; EDA steht für:
Read more

European Defence Agency (EDA)

Learn about the European Defence Agency, our role in European military coordination, security and and defence policy and the latest industry news.
Read more

Vorname Eda - Bedeutung und Herkunft - Baby-Vornamen.de

Alles zum Mädchennamen Eda wie Bedeutung, Herkunft, Namenstag und Beliebtheit auf Baby-Vornamen.de
Read more

Eidgenössisches Departement für auswärtige Angelegenheiten

Eidgenössisches Departement für auswärtige Angelegenheiten EDA; Hauptsitz: Bern, Bundeshaus West: Vorsteher: Didier Burkhalter (FDP/NE), Bundesrat ...
Read more

Electronic Dance Art - EDA - EDA - Electronic Dance Art

Electronische Partys, Konzerte, Festivals und mehr für das Rhein-Main-Gebiet
Read more

Home - EDA

Die EDA ist eine Weiterbildungs-Akademie im Bereich Financial Education. Themenschwerpunkte sind Risikomanagement, Asset Management und Anlageberatung.
Read more

LEDA - Hersteller für Kaminofen, Speicherofen, Kachelofen ...

Kamine, Kachelöfen, Kaminöfen, Speicheröfen vom Ofen-Hersteller LEDA aus Norddeutschland
Read more

EDA - European Dental Association

Die EDA ist der Dachverband Europäischer Fortbildungsorganisationen und Institutionen. Sie bietet die Möglichkeit der Weiterbildung und Spezialisierung ...
Read more

Electronic design automation - Wikipedia

Electronic design automation (EDA) is a category of software tools for designing electronic systems such as printed circuit boards and integrated circuits.
Read more

Eda Vendetta - YouTube

Hallo. Ich weiß nicht wohin das führen soll. Ich möchte es auch nicht wissen. POSTFACH: Make Up Not War Postfach 470566 12314 Berlin Falls ihr Lust auf ...
Read more