
¿Qué son los datos agrupados en clases?
Cómo agrupar datos en estadística
Contents
La clase modal o la clase de moda es el intervalo de clases en una tabla de distribución de frecuencias que contiene la mayor frecuencia. Al calcular la moda en estadística, la clase modal desempeña un papel importante, especialmente al calcular la moda de los datos agrupados. Conozcamos más sobre la clase modal, la fórmula y resolvamos algunos ejemplos.
En estadística, el intervalo de clase con la mayor frecuencia se define como clase modal. La frecuencia en el intervalo de clase es la más alta en una distribución cuantitativa continua en la que los valores se agrupan en clases con dimensiones similares. La moda no se utiliza como medida de tendencia central para las variables cuantitativas continuas, ya que es más útil para las variables cualitativas. Por lo tanto, para calcular la moda de los datos agrupados, se utiliza el rango medio de la clase modal. En otras palabras, la moda no puede obtenerse simplemente mirando la frecuencia, sino que primero tenemos que averiguar la clase modal, en la que se encuentra la moda de los datos dados.
Como ya sabemos, el modo es el número que aparece más veces. Para encontrar la clase modal, primero ordenamos las frecuencias de forma ascendente para buscar la clase con la mayor frecuencia. La clase con la mayor frecuencia se considerará la clase modal que también contiene la moda. Ya que la clase modal es la clase de los datos agrupados que contiene la moda. Las frecuencias dadas son:
Ejemplo de datos no agrupados
Considere los datos que aparecen en la tabla. El número de estudiantes para cada valor de los datos se denomina frecuencia de ese valor de los datos. Por ejemplo, la frecuencia de la clase 8585 a 9090 es 55.
Por ejemplo, los valores de 81,281,2 y 84,684,6 se introducen en la clase 8080 a 8585. Si los valores se van a utilizar para algún cálculo (como el cálculo de la media), en lugar de los valores reales se utiliza la marca de clase 82.582.5 en su lugar.
Diferencia entre datos agrupados y no agrupados
Determinación de medias con datos agrupadosLa mediaYa sabemos cómo hallar la media a partir de una tabla de frecuencias. Encontrar la media de los datos agrupados es muy similar. La tabla de frecuencias agrupadas muestra el número de álbumes comprados por algunos estudiantes en el último año.
Número de álbumesFrecuencia0 – 4105 – 91210 – 14615 – 192Encontrando los puntos medios de los otros grupos, obtenemos: Número de álbumesFrecuenciaPunto medio \[x\]Punto medio\[x\] Frecuencia0 – 4102205 – 91278410 – 146127215 – 1921734Total = 30Total = 210La media es \(\frac{{20 + 84 + 72 + 34}{10 + 12 + 6 + 2}} = \frac{{210}{30}} = 7\)Recuerda: Esto es sólo una estimación de la media.La medianaLa mediana es el valor medio cuando los valores están ordenados por tamaño. Como los datos se han agrupado, no podemos encontrar un valor exacto para la mediana, pero podemos encontrar el grupo que contiene la mediana.
Problemas de ejemplo de datos agrupados
Una pregunta reciente ha planteado una cuestión diferente sobre las distribuciones de frecuencias agrupadas de la que hemos hablado anteriormente: ¿Qué se hace cuando la última clase está etiquetada como “30 o más”? Como veremos, ¡no hay una sola respuesta correcta!
Mirando hacia atrás en viejas respuestas no archivadas (porque no hay nada sobre esto publicado en el archivo de Pregúntale al Dr. Matemáticas), encontré un par de preguntas como esta que nunca fueron contestadas, ¡probablemente porque estábamos demasiado ocupados incluso para contestar las preguntas que podíamos responder con seguridad! Aquí hay una de 2008:
(Obsérvese que esta distribución es continua, y debe interpretarse de modo que “10-15” signifique “al menos 10 y menos de 15”, de modo que 15 no esté incluido en dos clases). El último intervalo va, en principio, de 30 a infinito, por lo que su punto medio sería infinito.
En realidad no está agrupado, ya que cada fila pertenece a un único valor -¡excepto la última, que es un grupo que representa todos los números superiores! Al parecer, el autor de este problema dice que no podemos encontrar la media, debido a la clase abierta. (Nótese que podemos encontrar la mediana y la moda, porque ninguna de ellas se ve afectada por los valores atípicos de esa última clase).