La organización y análisis de datos son fundamentales para la toma de decisiones en diversos ámbitos, desde la investigación científica hasta la gestión empresarial. Una de las herramientas más utilizadas en estadística para estructurar la información es la tabla de frecuencias, la cual permite resumir y visualizar un conjunto de datos de manera ordenada. A través de estas tablas, es posible calcular medidas estadísticas como la media, la mediana y la moda, facilitando la interpretación de la información y permitiendo extraer conclusiones clave. En este contexto, la construcción de tablas de frecuencia se convierte en un paso esencial para analizar datos de forma eficiente y fundamentar decisiones basadas en evidencia.
Medidas de variabilidad o de dispersión
Muestran la separación existente entre los valores en general con respecto a los valores centrales, y permiten distinguir que tan dispersos están los datos de una distribución para complementar los cálculos estadísticos y hacerlos más objetivos y aceptados.
Las medidas de variabilidad o dispersión más conocidas son las que calculan la variación de los datos con respecto a la media aritmética como: rango, desviación y varianza.
Rango:
Es la diferencia de datos entre el mayor y el menor, es la distancia que hay entre ellos.
Medidas de dispersión.
Miden el grado de separación o alejamiento que tiene una variable estadística en torno a una medida de posición o tendencia central.
Varianza
Desviación estándar
Clase | Intervalo de clase
| Frecuencia absoluta
| Frecuencia acumulada
| Frecuencia relativa | Marca de clase
Mci | Mc-x | (Mc-x)2 | fi(Mc-x)2 |
1 | 16000-22000 | 11 | 11 | 0.275 | 19000 | -12450 | 155002500 | 170505500 |
2 | 23000-29000 | 7 | 18 | 0.175 | 26000 | -5450 | 29702500 | 207917502 |
3 | 30000-36000 | 12 | 30 | 0.3 | 33000 | 1550 | 2402500 | 28830000 |
4 | 37000-43000 | 5 | 35 | 0.125 | 40000 | 8550 | 73102500 | 365512500 |
5 | 44000-50000 | 2 | 37 | 0.05 | 47000 | 15550 | 241802500 | 483605000 |
6 | 51000-57000 | 1 | 38 | 0.025 | 54000 | 22550 | 508502500 | 508502500
|
7 | 58000-65000 | 2 | 40 | 0.05 | 61500 | 30050 | 903002500 | 1806005000 |
|
| 40 |
|
| Media 31,450 |
|
| 3570878002 |
Varianza
Desviación estándar
A continuación, realizaremos unos ejercicios sencillos:
La base de datos se conformó con la información suministrada por
la entidad financiera Bank America. Con base en la tabla, realiza lo siguiente:
a) Clasifica cada variable en cualitativa o cuantitativa
(discreta o continua)
b) Elabora una distribución de frecuencias absolutas y relativas
para los datos agrupados de la variable salario anual y represéntalas
con las gráficas correspondientes
c) Determina la media aritmética, la moda y la mediana para los
datos agrupados de la variable salario anual, selecciona una de ellas
para que represente al conjunto y explícala
d) Escribe una conclusión sobre la distribución de los datos
e) Elabora una distribución de frecuencias relativas de la
variable tipo de contrato y represéntalas con la gráfica pertinente
f) Obtén la medida de tendencia central correspondiente a este
tipo de variable y al respecto escribe una conclusión
g) Realiza un diagrama de tallo y hojas de la variable experiencia
laboral y al respecto escribe una conclusión.
Sexo | Tipo de contrato | Salario anual (dólares) | Experiencia laboral (meses) | Meses desde el contrato |
Hombre Hombre Mujer Mujer Hombre Hombre Hombre Mujer Mujer Mujer Mujer Hombre Hombre Mujer Hombre Hombre Hombre Hombre Hombre Mujer Mujer Hombre Mujer Mujer Mujer Hombre Hombre Hombre Hombre Hombre Hombre Hombre Hombre Hombre Hombre Mujer Hombre Hombre Hombre Mujer | Indefinido Anual Anual Temporal Anual Indefinido Indefinido Temporal Anual Anual Temporal Anual Temporal Indefinido Temporal Indefinido Indefinido Temporal Anual Anual Anual Indefinido Anual Anual Indefinido Indefinido Indefinido Anual Anual Anual Indefinido Indefinido Temporal Indefinido Anual Anual Indefinido Indefinido Indefinido Temporal | $57500 $40200 $21450 $21900 $45000 $32100 $36000 $21900 $27900 $24000 $30380 $28350 $27750 $35100 $27320 $40800 $46430 $42350 $26250 $38850 $21750 $24280 $16950 $21150 $31050 $60375 $32550 $42000 $31350 $29100 $31360 $36180 $19255 $23565 $35085 $23725 $29640 $30730 $60985 $35560 | 144 236 381 190 238 67 114 215 244 143 307 165 228 240 56 444 120 432 168 144 108 49 151 314 240 284 191 209 229 324 264 252 208 240 35 288 180 258 284 284 | 77 78 75 80 78 79 75 76 78 80 77 78 77 78 75 76 75 76 77 77 78 78 79 78 80 76 77 78 76 77 76 78 78 78 77 77 78 78 77 78 |
a) Clasificación de las variables:
Sexo: Es una variable cualitativa (nominal), ya que representa categorías sin un orden específico (Hombre, Mujer).
Tipo de contrato: Es una variable cualitativa (nominal), pues tiene categorías como "Indefinido", "Anual" y "Temporal", sin un orden implícito.
Salario anual (dólares): Es una variable cuantitativa (continua), porque se trata de valores numéricos que pueden tomar cualquier valor dentro de un rango y se pueden sumar, restar, promediar, etc.
Experiencia laboral (meses): Es una variable cuantitativa (discreta), ya que se mide en unidades (meses) y no toma valores decimales. Los valores son enteros.
Meses desde el contrato: Similar a la variable de experiencia laboral, es una variable cuantitativa (discreta), ya que también se mide en unidades y no toma valores decimales.
b) Elabora una distribución de frecuencias absolutas y relativas para los datos agrupados de la variable salario anual y represéntalas con las gráficas correspondientes.
Clase | Intervalo de clase
| Frecuencia absoluta
| Frecuencia acumulada
| Frecuencia relativa | Frecuencia relativa acumulada | Distribución de porcentajes | Distribución de porcentajes acumulados | Marca de clase
Mci | MC*fi |
1 | 16000-22000 | 11 | 11 | 0.275 | 0.275 | 27.5% | 27.5% | 19000 | 209000 |
2 | 23000-29000 | 7 | 18 | 0.175 | 0.45 | 17.5% | 45% | 26000 | 182000 |
3 | 30000-36000 | 12 | 30 | 0.3 | 0.75 | 30% | 75% | 33000 | 396000 |
4 | 37000-43000 | 5 | 35 | 0.125 | 0.875 | 12.5% | 87.5% | 40000 | 200000 |
5 | 44000-50000 | 2 | 37 | 0.05 | 0.925 | 5% | 92.5% | 47000 | 94000 |
6 | 51000-57000 | 1 | 38 | 0.025 | 0.95 | 2.5% | 95% | 54000 | 54000 |
7 | 58000-65000 | 2 | 40 | 0.05 | 1 | 5% | 100% | 61500 | 123000 |
|
| 40 |
|
|
|
|
| Media | 31450 |
c) Determina la media aritmética, la moda y la mediana para los datos agrupados de la variable salario anual, selecciona una de ellas para que represente al conjunto y explícala.
La moda es aquel dato que se repite con más frecuencia en este caso teniendo ya nuestra tabla de frecuencias sobre la variable Salario anual podemos determinar que la moda se encuentra en la clase 3 con el intervalo de clase de 30000-36000 ya que cuenta con una frecuencia de 12.
La fórmula para calcular la moda ya con estos datos identificados será esta:
Mo = Li
Li= Límite inferior del renglón en donde debe estar la moda
fi= Frecuencia del renglón de la moda
Fi +1= Frecuencia superior al renglón de la moda
fi –1= Frecuencia anterior al renglón de la moda
ai= Tamaño del intervalo
Calcular fi – fi-1 = 12 – 7 = 5
Calcular fi – fi+1 = 12 – 5 = 7
Ubicar la amplitud de la clase que es 36000 – 30000 = 6000
Entonces:
Mo = 30000 + 2500
Mo = 32500
No es un valor exacto, pero si el que determinamos de acuerdo con la formula indicada.
La mediana es el valor que divide la secuencia ordenada de observaciones en dos partes iguales, es decir, a la derecha del valor de la mediana se encuentra el 50% de los datos y a la izquierda de dicho valor el otro 50%, por lo que para una distribución con datos agrupados se deben seguir los siguientes pasos:
Me = li
Li = límite inferior del renglón en dónde debe estar la mediana.
Fi-1 = Frecuencia acumulada anterior al renglón de la mediana.
Fi = Frecuencia del renglón de la mediana.
ai = Tamaño del intervalo.
Ubicar la clase de la mediana, para ello se debe buscar en qué clase se encuentra.
Ubicar la frecuencia acumulada del dato 20, que es igual a 18.
Ubicar el límite inferior de la clase de la mediana que es igual a 23,000.
Ubicar la frecuencia absoluta de la mediana que es igual a 7.
Ubica la frecuencia acumulada anterior a la clase de la mediana es igual a 11.
Ubicar la amplitud de la clase que es 29,000 – 23,000 = 6,000
Me = 23,000 +
Me = 30,714
La media aritmética es la suma de la marca de clase por frecuencia absoluta entre el número de datos.
Mci = Marca de clase
fi = frecuencia
n = Número de datos
La media aritmética = 31,450
d) Escribe una conclusión sobre la distribución de los datos.
La distribución de los datos permite analizar la dispersión, tendencia central y patrones dentro del conjunto de valores. En este caso, al observar la distribución de frecuencias absolutas y relativas de los salarios anuales, se pueden identificar intervalos con mayor concentración de datos, así como posibles sesgos o variaciones significativas. Esto facilita la toma de decisiones, el establecimiento de rangos salariales y la comparación con estándares del mercado. Además, el uso de representaciones gráficas permite visualizar de manera más clara la distribución, evidenciando si los datos siguen una tendencia normal o si presentan asimetrías.
e) Elabora una distribución de frecuencias relativas de la variable tipo de contrato y represéntalas con la gráfica pertinente.
Tipo de contrato | Frecuencia absoluta | Frecuencia relativa |
Indefinido | 14 | 0.35 (35%) |
Anual | 16 | 0.40 (40%) |
Temporal | 10 | 0.25 (25%) |
Total | 40 | 1.00 100% |
f) Obtén la medida de tendencia central correspondiente a este tipo de variable y al respecto escribe una conclusión.
La variable tipo de contrato es una variable categórica nominal, lo que significa que no tiene un orden natural ni valores numéricos con los que podamos calcular la media o la mediana. Para este tipo de variable, la medida de tendencia central adecuada es la moda, que representa la categoría con mayor frecuencia.
Cálculo de la moda:
Observamos que en la tabla de frecuencias:
Indefinido: 14 veces
Anual: 16 veces
Temporal: 10 veces
La categoría con mayor frecuencia es "Anual", ya que aparece 16 veces.
Conclusión:
La moda nos indica que el tipo de contrato más común en esta muestra es el contrato anual. Esto sugiere que la mayoría de los empleados en este conjunto de datos tienen contratos con una duración de un año, lo que podría reflejar una política de contratación de la empresa basada en renovaciones anuales en lugar de contratos indefinidos o temporales.
g) Realiza un diagrama de tallo y hojas de la variable experiencia laboral y al respecto escribe una conclusión.
Tallo | Hoja
1 | 08, 14, 20, 43, 44, 44, 51, 65, 68, 80, 90, 91
2 | 08, 09, 15, 28, 29, 36, 38, 40, 40, 40, 44, 52, 58, 64, 84, 84, 84, 88
3 | 07, 14, 24, 81
4 | 32, 44
El diagrama de tallo y hojas muestra la distribución de los años de experiencia laboral en meses. Se observa que la mayoría de los valores están concentrados entre 140 y 280 meses (aproximadamente entre 12 y 23 años de experiencia), lo que indica que la mayor parte de los empleados tienen un nivel de experiencia intermedio a alto. También hay algunos valores más bajos, pero la distribución sugiere que los empleados con menos experiencia son menos frecuentes en esta muestra.
Referencias
Susi Profe. (Productor). (6 de mayo del 2018). Tabla de frecuencias. Estadística #1 [Archivo de video]. De https://www.youtube.com/watch?v=xq6tBKbg3HQ
Saber programas. (Productor). (8 de mayo del 2017). Excel - crear gráficos estadísticos en Excel según el tipo de datos. Tutorial en español HD [Archivo de video]. De https://www.youtube.com/watch?v=cucK3A0BXEk
WissenSync. (Productor). (27 de mayo del 2015). Datos agrupados: intervalos de clase [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=7ZwXsnZG3Sk&vl=es-419
Comentarios
Publicar un comentario