Estadística 1

 La organización y análisis de datos son fundamentales para la toma de decisiones en diversos ámbitos, desde la investigación científica hasta la gestión empresarial. Una de las herramientas más utilizadas en estadística para estructurar la información es la tabla de frecuencias, la cual permite resumir y visualizar un conjunto de datos de manera ordenada. A través de estas tablas, es posible calcular medidas estadísticas como la media, la mediana y la moda, facilitando la interpretación de la información y permitiendo extraer conclusiones clave. En este contexto, la construcción de tablas de frecuencia se convierte en un paso esencial para analizar datos de forma eficiente y fundamentar decisiones basadas en evidencia.  

Medidas de variabilidad o de dispersión 

Muestran la separación existente entre los valores en general con respecto a los valores centrales, y permiten distinguir que tan dispersos están los datos de una distribución para complementar los cálculos estadísticos y hacerlos más objetivos y aceptados. 

Las medidas de variabilidad o dispersión más conocidas son las que calculan la variación de los datos con respecto a la media aritmética como: rango, desviación y varianza. 

Rango:  

Es la diferencia de datos entre el mayor y el menor, es la distancia que hay entre ellos 

Medidas de dispersión. 

Miden el grado de separación o alejamiento que tiene una variable estadística en torno a una medida de posición o tendencia central. 

 

Varianza 

2=Ν=1Μ𝜒21
 

Desviación estándar 


 

 

Clase 

Intervalo de clase 

 

Frecuencia absoluta 

 

 

Frecuencia acumulada 

 

 

Frecuencia relativa 

Marca de clase 

 

Mci 

Mc-x 

(Mc-x)2 

fi(Mc-x)2 

1 

16000-22000 

11 

11 

0.275 

19000 

-12450 

155002500 

170505500 

2 

23000-29000 

7 

18 

0.175 

26000 

-5450 

29702500 

207917502 

3 

30000-36000 

12 

30 

0.3 

33000 

1550 

2402500 

28830000 

4 

37000-43000 

5 

35 

0.125 

40000 

8550 

73102500 

365512500 

5 

44000-50000 

2 

37 

0.05 

47000 

15550 

241802500 

483605000 

6 

51000-57000 

1 

38 

0.025 

54000 

22550 

508502500 

508502500 

 

7 

58000-65000 

2 

40 

0.05 

61500 

30050 

903002500 

1806005000 

 

 

40 

 

 

Media 31,450 

 

 

3570878002 

 

Varianza 


  
2357087800239=91560974.41025641
  

 

Desviación estándar 


 

 

 A continuación, realizaremos unos ejercicios sencillos:

La base de datos se conformó con la información suministrada por la entidad financiera Bank America. Con base en la tabla, realiza lo siguiente:

a) Clasifica cada variable en cualitativa o cuantitativa (discreta o continua)

b) Elabora una distribución de frecuencias absolutas y relativas para los datos agrupados de la variable salario anual y represéntalas con las gráficas correspondientes

c) Determina la media aritmética, la moda y la mediana para los datos agrupados de la variable salario anual, selecciona una de ellas para que represente al conjunto y explícala

d) Escribe una conclusión sobre la distribución de los datos

e) Elabora una distribución de frecuencias relativas de la variable tipo de contrato y represéntalas con la gráfica pertinente

f) Obtén la medida de tendencia central correspondiente a este tipo de variable y al respecto escribe una conclusión

g) Realiza un diagrama de tallo y hojas de la variable experiencia laboral y al respecto escribe una conclusión.

Sexo 

Tipo de contrato 

Salario anual (dólares) 

Experiencia laboral (meses) 

Meses desde el contrato 

Hombre 

Hombre 

Mujer 

Mujer 

Hombre 

Hombre 

Hombre 

Mujer 

Mujer 

Mujer 

Mujer 

Hombre 

Hombre 

Mujer 

Hombre 

Hombre 

Hombre 

Hombre 

Hombre 

Mujer 

Mujer 

Hombre 

Mujer 

Mujer 

Mujer 

Hombre 

Hombre 

Hombre 

Hombre 

Hombre 

Hombre 

Hombre 

Hombre 

Hombre 

Hombre 

Mujer 

Hombre 

Hombre 

Hombre 

Mujer 

Indefinido 

Anual 

Anual 

Temporal 

Anual 

Indefinido 

Indefinido 

Temporal 

Anual 

Anual 

Temporal 

Anual 

Temporal 

Indefinido 

Temporal 

Indefinido 

Indefinido 

Temporal 

Anual 

Anual 

Anual 

Indefinido 

Anual 

Anual 

Indefinido 

Indefinido 

Indefinido 

Anual 

Anual 

Anual 

Indefinido 

Indefinido 

Temporal 

Indefinido 

Anual 

Anual 

Indefinido 

Indefinido 

Indefinido 

Temporal 

$57500 

$40200 

$21450 

$21900 

$45000 

$32100 

$36000 

$21900 

$27900 

$24000 

$30380 

$28350 

$27750 

$35100 

$27320 

$40800 

$46430 

$42350 

$26250 

$38850 

$21750 

$24280 

$16950 

$21150 

$31050 

$60375 

$32550 

$42000 

$31350 

$29100 

$31360 

$36180 

$19255 

$23565 

$35085 

$23725 

$29640 

$30730 

$60985 

$35560 

144 

236 

381 

190 

238 

67 

114 

215 

244 

143 

307 

165 

228 

240 

56 

444 

120 

432 

168 

144 

108 

49 

151 

314 

240 

284 

191 

209 

229 

324 

264 

252 

208 

240 

35 

288 

180 

258 

284 

284 

77 

78 

75 

80 

78 

79 

75 

76 

78 

80 

77 

78 

77 

78 

75 

76 

75 

76 

77 

77 

78 

78 

79 

78 

80 

76 

77 

78 

76 

77 

76 

78 

78 

78 

77 

77 

78 

78 

77 

78 

 

a) Clasificación de las variables: 

  1. Sexo: Es una variable cualitativa (nominal), ya que representa categorías sin un orden específico (Hombre, Mujer). 

  1. Tipo de contrato: Es una variable cualitativa (nominal), pues tiene categorías como "Indefinido", "Anual" y "Temporal", sin un orden implícito. 

  1. Salario anual (dólares): Es una variable cuantitativa (continua), porque se trata de valores numéricos que pueden tomar cualquier valor dentro de un rango y se pueden sumar, restar, promediar, etc. 

  1. Experiencia laboral (meses): Es una variable cuantitativa (discreta), ya que se mide en unidades (meses) y no toma valores decimales. Los valores son enteros. 

  1. Meses desde el contrato: Similar a la variable de experiencia laboral, es una variable cuantitativa (discreta), ya que también se mide en unidades y no toma valores decimales. 

b) Elabora una distribución de frecuencias absolutas y relativas para los datos agrupados de la variable salario anual y represéntalas con las gráficas correspondientes. 

Clase 

Intervalo de clase 

 

Frecuencia absoluta 

 


 
 

Frecuencia acumulada 

 


 
 

Frecuencia relativa 

Frecuencia relativa acumulada 

Distribución de porcentajes 

Distribución de porcentajes acumulados 

Marca de clase 

 

Mci 

MC*fi 

1 

16000-22000 

11 

11 

0.275 

0.275 

27.5% 

27.5% 

19000 

209000 

2 

23000-29000 

7 

18 

0.175 

0.45 

17.5% 

45% 

26000 

182000 

3 

30000-36000 

12 

30 

0.3 

0.75 

30% 

75% 

33000 

396000 

4 

37000-43000 

5 

35 

0.125 

0.875 

12.5% 

87.5% 

40000 

200000 

5 

44000-50000 

2 

37 

0.05 

0.925 

5% 

92.5% 

47000 

94000 

6 

51000-57000 

1 

38 

0.025 

0.95 

2.5% 

95% 

54000 

54000 

7 

58000-65000 

2 

40 

0.05 

1 

5% 

100% 

61500 

123000 

 

 

40 

 

 

 

 

 

Media 

31450 

 

c) Determina la media aritmética, la moda y la mediana para los datos agrupados de la variable salario anual, selecciona una de ellas para que represente al conjunto y explícala. 

La moda es aquel dato que se repite con más frecuencia en este caso teniendo ya nuestra tabla de frecuencias sobre la variable Salario anual podemos determinar que la moda se encuentra en la clase 3 con el intervalo de clase de 30000-36000 ya que cuenta con una frecuencia de 12. 

La fórmula para calcular la moda ya con estos datos identificados será esta: 

Mo = Li


  

Li= Límite inferior del renglón en donde debe estar la moda  

fi= Frecuencia del renglón de la moda 

Fi +1= Frecuencia superior al renglón de la moda 

fi –1= Frecuencia anterior al renglón de la moda 

ai= Tamaño del intervalo 

 

Calcular fi – fi-1 = 12 – 7 = 5 

Calcular fi – fi+1 = 12 – 5 = 7 

Ubicar la amplitud de la clase que es 36000 – 30000 = 6000 

Entonces:  

Mo = 30000 + 2500  

Mo = 32500 

No es un valor exacto, pero si el que determinamos de acuerdo con la formula indicada. 

 

La mediana es el valor que divide la secuencia ordenada de observaciones en dos partes iguales, es decir, a la derecha del valor de la mediana se encuentra el 50% de los datos y a la izquierda de dicho valor el otro 50%, por lo que para una distribución con datos agrupados se deben seguir los siguientes pasos: 

Me = li 


    

Li = límite inferior del renglón en dónde debe estar la mediana. 

Fi-1 = Frecuencia acumulada anterior al renglón de la mediana. 

Fi = Frecuencia del renglón de la mediana. 

ai = Tamaño del intervalo. 

  1. Ubicar la clase de la mediana, para ello se debe buscar en qué clase se encuentra. 


 

  1. Ubicar la frecuencia acumulada del dato 20, que es igual a 18. 

  1. Ubicar el límite inferior de la clase de la mediana que es igual a 23,000. 

  1. Ubicar la frecuencia absoluta de la mediana que es igual a 7. 

  1. Ubica la frecuencia acumulada anterior a la clase de la mediana es igual a 11. 

  1. Ubicar la amplitud de la clase que es 29,00023,000 = 6,000 

Me = 23,000 +


  

Me = 30,714 

 

La media aritmética es la suma de la marca de clase por frecuencia absoluta entre el número de datos. 

Mci = Marca de clase 

fi = frecuencia 

n = Número de datos 

𝜇 
= Media  

La media aritmética = 31,450 

d) Escribe una conclusión sobre la distribución de los datos. 

La distribución de los datos permite analizar la dispersión, tendencia central y patrones dentro del conjunto de valores. En este caso, al observar la distribución de frecuencias absolutas y relativas de los salarios anuales, se pueden identificar intervalos con mayor concentración de datos, así como posibles sesgos o variaciones significativas. Esto facilita la toma de decisiones, el establecimiento de rangos salariales y la comparación con estándares del mercado. Además, el uso de representaciones gráficas permite visualizar de manera más clara la distribución, evidenciando si los datos siguen una tendencia normal o si presentan asimetrías. 

 

 

e) Elabora una distribución de frecuencias relativas de la variable tipo de contrato y represéntalas con la gráfica pertinente. 

Tipo de contrato 

Frecuencia absoluta  

Frecuencia relativa 

Indefinido 

14 

0.35 (35%) 

Anual 

16 

0.40 (40%) 

Temporal 

10 

0.25 (25%) 

Total 

40 

1.00 100% 

 

f) Obtén la medida de tendencia central correspondiente a este tipo de variable y al respecto escribe una conclusión. 

La variable tipo de contrato es una variable categórica nominal, lo que significa que no tiene un orden natural ni valores numéricos con los que podamos calcular la media o la mediana. Para este tipo de variable, la medida de tendencia central adecuada es la moda, que representa la categoría con mayor frecuencia.  

Cálculo de la moda: 

Observamos que en la tabla de frecuencias:  

  • Indefinido: 14 veces  

  • Anual: 16 veces  

  • Temporal: 10 veces 

La categoría con mayor frecuencia es "Anual", ya que aparece 16 veces 

Conclusión: 

La moda nos indica que el tipo de contrato más común en esta muestra es el contrato anual. Esto sugiere que la mayoría de los empleados en este conjunto de datos tienen contratos con una duración de un año, lo que podría reflejar una política de contratación de la empresa basada en renovaciones anuales en lugar de contratos indefinidos o temporales. 

 

g) Realiza un diagrama de tallo y hojas de la variable experiencia laboral y al respecto escribe una conclusión. 

Tallo | Hoja 

1  |  08, 14, 20, 43, 44, 44, 51, 65, 68, 80, 90, 91 

2  |  08, 09, 15, 28, 29, 36, 38, 40, 40, 40, 44, 52, 58, 64, 84, 84, 84, 88 

3  |  07, 14, 24, 81 

4  |  32, 44 

 

El diagrama de tallo y hojas muestra la distribución de los años de experiencia laboral en meses. Se observa que la mayoría de los valores están concentrados entre 140 y 280 meses (aproximadamente entre 12 y 23 años de experiencia), lo que indica que la mayor parte de los empleados tienen un nivel de experiencia intermedio a alto. También hay algunos valores más bajos, pero la distribución sugiere que los empleados con menos experiencia son menos frecuentes en esta muestra. 

 

Referencias 

Susi Profe. (Productor). (6 de mayo del 2018). Tabla de frecuencias. Estadística #1 [Archivo de video]. De https://www.youtube.com/watch?v=xq6tBKbg3HQ 

Saber programas. (Productor). (8 de mayo del 2017). Excel - crear gráficos estadísticos en Excel según el tipo de datos. Tutorial en español HD [Archivo de video]. De https://www.youtube.com/watch?v=cucK3A0BXEk 

WissenSync. (Productor). (27 de mayo del 2015). Datos agrupados: intervalos de clase [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=7ZwXsnZG3Sk&vl=es-419 

 

 

Comentarios