📊 ¿Qué es la estadística?

La estadística es la rama de las matemáticas que se ocupa de recopilar, organizar, analizar e interpretar datos numéricos para tomar decisiones fundamentadas. Se divide en dos grandes ramas: la estadística descriptiva, que resume características de los datos mediante tablas, gráficas y medidas numéricas; y la estadística inferencial, que permite generalizar conclusiones de una muestra hacia una población más amplia (Molina y Rodrigo, 2010).

En esta entrada se presenta un ejemplo práctico completo basado en una base de datos real de la entidad financiera Bank America, con 40 registros y las variables: sexo, tipo de contrato, salario anual, experiencia laboral (meses) y meses desde el contrato.


📋 1. Base de datos: Bank America

La siguiente tabla contiene los 40 registros de empleados analizados, con cinco variables de diferente naturaleza que permiten aplicar una amplia variedad de técnicas estadísticas.

Base de datos Bank America

Tabla 1. Base de datos de empleados — Bank America (n = 40).



🔍 2. Clasificación de variables

El primer paso en cualquier análisis estadístico es identificar la naturaleza de cada variable, pues de ello depende qué procedimientos son aplicables.

VariableTipoSubtipoJustificación
SexoCualitativaNominalCategorías sin orden: Hombre / Mujer
Tipo de contratoCualitativaNominalCategorías sin jerarquía: Indefinido, Anual, Temporal
Salario anualCuantitativaContinuaPuede tomar cualquier valor dentro de un rango
Experiencia laboralCuantitativaDiscretaSe mide en unidades enteras (meses)
Meses desde el contratoCuantitativaDiscretaSe mide en unidades enteras (meses)

📈 3. Distribución de frecuencias — Salario anual

Se agruparon los 40 salarios en 9 intervalos de amplitud $5,000 para obtener una visión panorámica de su distribución.

Intervalo ($)Marca de clase (xᵢ) fᵢFᵢhᵢ%Hᵢ
16,000 – 21,00018,500220.0505.0%0.050
21,000 – 26,00023,5009110.22522.5%0.275
26,000 – 31,00028,5009200.22522.5%0.500
31,000 – 36,00033,5008280.20020.0%0.700
36,000 – 41,00038,5005330.12512.5%0.825
41,000 – 46,00043,5003360.0757.5%0.900
46,000 – 51,00048,5001370.0252.5%0.925
51,000 – 56,00053,5000370.0000.0%0.925
56,000 – 61,00058,5003400.0757.5%1.000
Total40 1.000100%

Tabla 2. Distribución de frecuencias de salario anual (datos agrupados).

Histograma de distribución de salarios

Gráfica 1. Histograma de frecuencias absolutas — Salario Anual.



📐 4. Medidas de tendencia central

Las medidas de tendencia central identifican el valor representativo del conjunto de datos (Susi Profe, 2018).

4.1 Media Aritmética

x̄ = (Σxᵢ) / n = 1,308,170 / 40 = 32,704.25 dólares

Con datos agrupados (usando marcas de clase):

x̄ = (Σ xᵢ · fᵢ) / n = 1,320,000 / 40 = 33,000.00 dólares

4.2 Mediana

Al ordenar los 40 salarios, la mediana es el promedio del dato 20 y 21 (n par):

Me = (30,380 + 31,360) / 2 = 30,890 dólares

4.3 Moda

Mo = 21,900 dólares (valor que más se repite: 2 veces)
📌 Medida representativa elegida: Mediana (30,890 dólares)
La mediana es la mejor representante del grupo porque ubica exactamente al 50% de los trabajadores por encima y al 50% por debajo, sin verse afectada por los salarios extremos ($60,375 y $60,985) que distorsionan la media hacia arriba.

📏 5. Medidas de dispersión

Las medidas de dispersión indican qué tan alejados o concentrados están los datos respecto a su valor central.

5.1 Rango

R = Valor máximo − Valor mínimo = 60,985 − 16,950 = 44,035 dólares

5.2 Varianza (s²)

s² = Σ(xᵢ − x̄)² / (n − 1) = 113,605,062.24 dólares²

5.3 Desviación estándar (s)

s = √s² = √113,605,062.24 = 10,658.57 dólares

5.4 Coeficiente de variación (CV)

CV = (s / x̄) × 100 = (10,658.57 / 32,704.25) × 100 = 32.59%

Un CV del 32.59% indica dispersión moderada-alta, lo que refleja heterogeneidad en los ingresos del grupo.

MedidaValorInterpretación
Rango$44,035Amplitud total entre salario más bajo y más alto
Varianza (s²)$113,605,062.24Dispersión cuadrática promedio
Desviación estándar (s)$10,658.57Dispersión promedio alrededor de la media
Coef. de variación (CV)32.59%Variabilidad relativa moderada-alta

Tabla 3. Resumen de medidas de dispersión — Salario Anual.


📉 6. Forma de la distribución

6.1 Coeficiente de asimetría

As = 1.0674 → Asimetría positiva (sesgada a la derecha)

Como Media (32,704) > Mediana (30,890) > Moda (21,900), la distribución presenta una cola larga hacia los salarios altos, confirmando la asimetría positiva.

6.2 Curtosis

K = 0.8434 → Leptocúrtica (más apuntada que la curva normal)

Una curtosis positiva indica que los datos se concentran alrededor de la media con colas más pronunciadas que una distribución normal.

💡 Regla de las tres medidas: Cuando Media > Mediana > Moda, la distribución es asimétrica positiva. Significa que la mayoría gana por debajo del promedio, pero algunos salarios muy altos elevan la media hacia arriba.

🗂️ 7. Distribución por tipo de contrato (Frecuencias relativas)

Para la variable cualitativa tipo de contrato se aplica distribución de frecuencias relativas y la moda como medida de tendencia central.

Tipo de ContratofᵢFᵢhᵢ%Hᵢ
Temporal880.20020%0.200
Anual16240.40040%0.600
Indefinido16400.40040%1.000
Total40 1.000100%

Tabla 5. Frecuencias de tipo de contrato.

Moda = Anual e Indefinido (16 empleados cada uno = 40%)
El 80% de los trabajadores tiene contratos estables (Anual + Indefinido), lo que refleja predominio de empleos con permanencia en la organización.
Gráfica de pie tipo de contrato

Gráfica 2. Distribución porcentual por tipo de contrato.



🌿 9. Diagrama de Tallo y Hoja — Experiencia Laboral

Este diagrama organiza los datos de experiencia laboral conservando los valores originales, permitiendo visualizar la distribución a detalle.

Tallo | Hojas
─────────────────────────────────
  0  |  35  49  56
  1  |  08  14  20  43  44  44  51  65  68  80  90  91
  2  |  08  09  15  28  29  36  40  40  40  44  52  58  64
  3  |  07  14  14  24  24  29
  4  |  32  44  81
─────────────────────────────────
Unidad: Tallo = centenas, Hojas = decenas y unidades (meses)

Tabla 6. Diagrama de tallo y hojas — Experiencia laboral en meses.

La distribución muestra que la mayoría de los empleados se concentra entre 100 y 300 meses de experiencia (8 a 25 años), con pocos casos en los extremos, lo que indica un equipo con trayectoria laboral consolidada.


✅ 10. Conclusión general

Al revisar los datos de los 40 empleados de Bank America, encontramos lo siguiente:

Salarios

En promedio, cada empleado gana alrededor de $32,704 dólares al año. Sin embargo, el salario más "típico" del grupo es de $30,890, ya que algunos empleados con sueldos muy altos hacen que el promedio suba un poco. Esto también significa que la mayoría gana por debajo del promedio, y que los salarios varían bastante entre empleados.

Tipo de contrato

8 de cada 10 empleados tienen un contrato anual o indefinido, lo que indica que la mayoría cuenta con un empleo estable en la institución.

Experiencia

La mayor parte de los empleados lleva entre 8 y 25 años trabajando, lo que muestra que se trata de un equipo con bastante experiencia y trayectoria profesional.

 

 


📚 Referencias

Molina, G., y Rodrigo, M. (2010). Organización y representación gráfica de los datos. Universidad de Valencia. Recuperado de http://ocw.uv.es/ciencias-de-la-salud/pruebas-1/1-3/t_02nuevo2.pdf

Susi Profe. (2018, 6 de mayo). Tabla de frecuencias. Estadística #1 [Video]. YouTube. https://www.youtube.com/watch?v=xq6tBKbg3HQ

Matemáticas profe Alex. (s.f.). Tabla de frecuencias agrupada en intervalos | Ejemplo 1 [Video]. YouTube. https://www.youtube.com/watch?v=Nm7log51vFA

Triola, M. F. (2018). Estadística (12.ª ed.). Pearson Educación.

Walpole, R. E., Myers, R. H., Myers, S. L., y Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias (9.ª ed.). Pearson Educación.

Comentarios