ESTIMACIÓN DE LAS MEDIDAS DE TENDENCIA CENTRAL
La estadística permite estimar algunas caracteristicas propias de ciertas muestras de poblaciones, a través de la observación detenida de la distribución de frecuencias y de las gráficas de barras y lineal correspondientes. Tal es el caso al realizar el estudio de la estatura de los niños y niñas de grado octavo de los colegios de Bogotá.
Se toma una muestra, o parte de la población, formada por \(50\) estudiantes de ese grado; con ella se construye una distribución de frecuencias y los correspondientes diagramas de barras y lineal.
Con base en la distribución de frecuencias se puede estimar el valor de cada medida de tendencia central, al dar respuesta a las preguntas \(1\),\(2\) y \(3\).
1. ¿Cuál es la estatura (en cm) más frecuente de los alumnos de octavo grado en los colegios de Bogotá? O lo que es lo mismo: ¿cuál es la moda de la distribuciónde estaturas de la muestra de los alumnos de octavo grado?
En latabal de distribución de frecuencias se observa que el intervalo \(160-164\) es la clase modal, porque presenta la mayor frecuencia absoluta \((14)\). Como la estatura es una variable continua, la moda se encuentra entre los límites reales de ese intervalo: \(159.5cm\) y \(164.5cm\)
Si deseamos acercarnos más, comparamos las frecuencias absolutas de lso intervalos adyacentes a la clase modal; como \(13>5\), el valor de la moda se desplaza y, por tanto, se encuentra por debajo de la marca de clase de la clase modal, es decir, la moda está entre \(159.5 \ cm\) y \(162 \ cm\)
Ahora, observemos los diagramas de barras y lineal correspondientes a la tabla de distribución de frecuencia.
En el histograma, la estatura más frecuente corresponde a alguno de los valores de estatura que están en la base de la barra de mayor altura.
La moda de una distribución está ubicada en el intervalo de mayor frecuencia y corresponde, en el histograma, a algún valor entre los extremos de la base de la barra de mayor altura; la marca de clase de de tal inervalo es una estimación de la moda. Si se desea una mejor estimación se ubica en el semi-intervalo que queda al lado de la base de la clase contigua con mayor frecuencia.
2.¿Cuál es la estatura de un alumno tal que la mitad de los compañeros tiene una estatura menos o igual que él y la otra mitad tien una estatura mayor o igual? O en forma directa: ¿cuál es la mediana de la distribución de estatura de los alumnos de graqdo octavo?
Como los datos de la distribución de frecuencias ya están ordenados, la mediana es el dato cuya frecuencia acumulada es \(25\) (la mitad del total de datos). La frecuencia acumulada de la distribución de frecuencias indica que ese valro se encuentra en el intervalo \(155-159\) que es la clase mediana. Si se supone que lso datos de la distribución se encuentran equitativamente distribuidos en cada intervalo, la mediana es el dato \(11\) de los \(13\) que hay en la clase mediana y se encontrará entre la marca de clase de este intervalo y su extremo superior es decir entre \(157cm\) y \(159.5cm\).
Los diagramas lineales correspondientes a la frecuencia acumulada absoluta y relativa sirven para encontrar un valor aproximado de la mediana. Con la gráfica de la fecuencia absoluta acumulada basta determinar la estatura que corresponde a la frecuencia acumulada \(25\).
Si n es la cantidad de elementos de la muestra, la mediana se encuentra en la clase mediana, cuya frecuencia acumulada anterior es menor que \(\frac{n}{2}\) y cuya frecuencia acumulada siguiente es mayor que \(\frac{n}{2}\). En las gráficas lineales de frecuencias acumuladas es el valor de la abscisa, que corresponde a una frecuencia absoluta acumulada \(\frac{n}{2}\) o a una frecuencia relativa acumulada \(50%\).
3. ¿Cuál es la estatura que tendrian todos los estudiantes de grado octavo de colegios de Bogotá si se supone que todos tienen la misma estatura?; es decir, ¿Cuál es la estatura promedio o la media aritmética de la estatura de este grupo de estudiantes?
En la tabla de frecuencias se ve que si tomamos como media aritmética un valor de la estatura en las dos primeras clases o en las dos últimas, estamos excluyendo la mayor parte de los niños, cuya estatura se encuentra entre \(155cm\,y\,169cm\)
De los intervalos que quedan, aquellos que tienen mayor frecuencia con \(155\) y \(159-164\). Como el intervalo 160 \(160-164\) no es representativo de la estatura de los alumnos, por que hay bastantes con estatura mucho menor, una mejor aproximación para la media es un valor entre \(155\) y \(159\) y en particular el promedio de estos valores, es decir, \(157cm\); esta es una buena estimación para la media aritmética de la estatura de los niños de grado octavo.Es posible que ningún alumno de la muestra elegida mida \(157cm\) de estatura, pero para este valor se compensan las diferencias de estatura entre los más altos y los mas bajos.
En el histograma se puede tomar como clase para la media la que tiene la barra más alta. En caso de no ser representativa de la muestra, se toma aquel intervalo que, no tiene ni la barra más alta ni la más baja, está muy cerca de la más alta.Para nuestro caso, como el intervalo \(160-164\) no es representativo de la estatura de los alumnos, por que hay demasiados con estatura mucho menor, se toma el intervalo \(155-159\) y se puede deir que en el se encuentra la media.
La media aritmética generalmente es un valor muy cercano a los de la clase que contiene la moda; algunas veces tal clase no es representativa de la muestra o población y, en ese caso, la media se desplaza hacia los intrevalosque tengan mayor frecuencia.
PREGUNTA: ¿Cuál es la medida que menos se deja afectar por los valores de la base de datos?