Medidas estadísticas en datos no agrupado
Medidas de tendencia central
Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se representa por la letra griega µ cuando se trata del promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante destacar que µ es una cantidad fija mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc.
Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:
Estos cálculos se pueden simbolizar:
Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda observación y así sucesivamente. En general, con “n” observaciones, Yi representa el valor de la i-ésima observación. En este caso el promedio está dado por
De aquí se desprende la fórmula definitiva del promedio:
Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del dato y la media:
Ejemplo de desviaciones:
Una propiedad interesante de la media aritmética es que la suma de las desviaciones es cero.
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana.
Si el número de observaciones es par, la mediana corresponde al promedio de los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.
Moda
La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una muestra puede tener más de una moda.
Medidas de dispersión
Las medidas de dispersión entregan información sobre la variación de la variable. Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación estándar, Coeficiente de variación.
Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de la variable.
La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz cuadrada, la desviación estándar. La varianza se representa con el símbolo σ² (sigma cuadrado) para el universo o población y con el símbolo s2 (s cuadrado), cuando se trata de la muestra. La desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma) cuando pertenece al universo o población y por “s”, cuando pertenece a la muestra. σ² y σ son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores que cambian de muestra en muestra dentro de una misma población. La varianza se expresa en unidades de variable al cuadrado y la desviación estándar simplemente en unidades de variable.
Fórmulas
Donde µ es el promedio de la población.
Donde Ȳ es el promedio de la muestra.
Consideremos a modo de ejemplo una muestra de 4 observaciones
Según la fórmula el promedio calculado es 7, veamos ahora el cálculo de las medidas de dispersión:
s2 = 34 / 3 = 11,33 Varianza de la muestra
La desviación estándar de la muestra (s) será la raíz cuadrada de 11,33 = 3,4.
Interpretación de la varianza (válida también para la desviación estándar): un alto valor de la varianza indica que los datos están alejados del promedio. Es difícil hacer una interpretación de la varianza teniendo un solo valor de ella. La situación es más clara si se comparan las varianzas de dos muestras, por ejemplo varianza de la muestra igual 18 y varianza de la muestra b igual 25. En este caso diremos que los datos de la muestra b tienen mayor dispersión que los datos de la muestra a. esto significa que en la muestra a los datos están más cerca del promedio y en cambio en la muestra b los datos están más alejados del promedio.
Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la desviación estándar de la muestra expresada como porcentaje de la media muestral.
Es de particular utilidad para comparar la dispersión entre variables con distintas unidades de medida. Esto porque el coeficiente de variación, a diferencia de la desviación estándar, es independiente de la unidad de medida de la variable de estudio.
Gráficas estadísticas
Los datos numéricos obtenidos en un estudio estadístico pueden presentarse de forma visual a través de gráficas estadísticas, lo que hace que sean más fácilmente comprensibles.
Hay muchos tipos de gráficas, las más comunes son:
- Diagrama de barras
- Diagrama de líneas (polígono de frecuencias).
- Diagrama de sectores
Hacer gráficos es bastante sencillo si tenemos los datos organizados en tablas de frecuencias.
Los datos numéricos obtenidos en un estudio estadístico pueden presentarse de forma visual a través de gráficas estadísticas, lo que hace que sean más fácilmente comprensibles.
Hay muchos tipos de gráficas, las más comunes son:
- Diagrama de barras
- Diagrama de líneas (polígono de frecuencias).
- Diagrama de sectores
Hacer gráficos es bastante sencillo si tenemos los datos organizados en tablas de frecuencias.
Diagrama de barras
Hemos encuestado a 50 estudiantes del colegio sobre su deporte favorito:
- Los resultados los hemos organizado en esta tabla de frecuencias.
- Hemos representado gráficamente mediante un diagrama de barras para obtener una visualización general de los resultados de nuestra encuesta.
El proceso para construir un diagrama de barras es muy sencillo.
- Se construyen dos ejes.
- En el eje horizontal, o eje de abscisas, se representan los datos o modalidades obtenidos. En nuestro caso: baloncesto, fútbol, balonmano, etc.
- En el eje vertical, eje de ordenadas, se representan con números las frecuencias de cada dato o modalidad.
- Sobre el eje horizontal se levantan barras o rectángulos de igual base hasta hasta la altura del valor numérico de la frecuencia de cada modalidad. En nuestro caso: baloncesto hasta 12, fútbol hasta 8, balonmano hasta 10, etc.
Hemos encuestado a 50 estudiantes del colegio sobre su deporte favorito:
- Los resultados los hemos organizado en esta tabla de frecuencias.
- Hemos representado gráficamente mediante un diagrama de barras para obtener una visualización general de los resultados de nuestra encuesta.
El proceso para construir un diagrama de barras es muy sencillo.
- Se construyen dos ejes.
- En el eje horizontal, o eje de abscisas, se representan los datos o modalidades obtenidos. En nuestro caso: baloncesto, fútbol, balonmano, etc.
- En el eje vertical, eje de ordenadas, se representan con números las frecuencias de cada dato o modalidad.
- Sobre el eje horizontal se levantan barras o rectángulos de igual base hasta hasta la altura del valor numérico de la frecuencia de cada modalidad. En nuestro caso: baloncesto hasta 12, fútbol hasta 8, balonmano hasta 10, etc.
Diagrama de líneas (polígono de frecuencias).
El proceso es muy similar al empleado en los gráficos de barras:
- En el eje horizontal, abscisas, se representan los datos.
- En el eje vertical, ordenadas, se representan los valores de cada dato si la variable es cuantitativa o la frecuencia de cada dato si la variable es cualitativa.
- Se trazan puntos o marcas que representan esos datos y se unen con segmentos.
En este ejemplo hemos tomado las temperaturas mínimas durante una semana de la estación meteorológica del colegio y lo hemos representado como una línea poligonal que nos indica muy bien las variaciones.
CONCLUSION: LO QUE PODEMOS CONCLUIR DE ESTE TEMA ES QUE LA MEDIA ARITMETICA ES EL PROMEDIO, LA MEDIA ES EL DATO QUE QUEDA EN MEDIO Y LA MODA ES EL QUE MAS SE REPITE.
AQUI TE DEJO UN VIDEO PARA QUE COMPRENDAS MAS EL TEMA
El proceso es muy similar al empleado en los gráficos de barras:
- En el eje horizontal, abscisas, se representan los datos.
- En el eje vertical, ordenadas, se representan los valores de cada dato si la variable es cuantitativa o la frecuencia de cada dato si la variable es cualitativa.
- Se trazan puntos o marcas que representan esos datos y se unen con segmentos.
En este ejemplo hemos tomado las temperaturas mínimas durante una semana de la estación meteorológica del colegio y lo hemos representado como una línea poligonal que nos indica muy bien las variaciones.
CONCLUSION: LO QUE PODEMOS CONCLUIR DE ESTE TEMA ES QUE LA MEDIA ARITMETICA ES EL PROMEDIO, LA MEDIA ES EL DATO QUE QUEDA EN MEDIO Y LA MODA ES EL QUE MAS SE REPITE.
AQUI TE DEJO UN VIDEO PARA QUE COMPRENDAS MAS EL TEMA
No hay comentarios.:
Publicar un comentario