Tema

Diagramas de Caja y Bigotes: Visualiza la Distribución

Introducción

El diagrama de caja y bigotes (también conocido como boxplot) es una representación gráfica que resume cinco estadísticos clave de un conjunto de datos en una sola imagen. Es perfecto para detectar valores atípicos y comparar distribuciones entre diferentes grupos.

Anatomía de un Diagrama de Caja

Un diagrama de caja muestra cinco estadísticos importantes:

1. Valor mínimo: El extremo inferior del "bigote" izquierdo.

2. Primer cuartil (Q1): El borde izquierdo de la caja. El 25% de los datos está por debajo.

3. Mediana (Q2): La línea dentro de la caja. El 50% de los datos está por debajo.

4. Tercer cuartil (Q3): El borde derecho de la caja. El 75% de los datos está por debajo.

5. Valor máximo: El extremo del "bigote" derecho.

Cómo Construir un Diagrama de Caja

1. Ordena los datos de menor a mayor

2. Calcula Q1, Q2 (mediana) y Q3

3. Calcula el rango intercuartílico: RIC = Q3 - Q1

4. Determina los límites para valores atípicos:

   • Límite inferior: Q1 - 1.5 × RIC

   • Límite superior: Q3 + 1.5 × RIC

5. Dibuja la caja, los bigotes y marca los valores atípicos como puntos individuales

Ejemplo Paso a Paso

Datos: 12, 15, 18, 20, 22, 25, 28, 30, 35, 50

• Q1 = 17 (percentil 25)

• Q2 = 23.5 (mediana)

• Q3 = 31 (percentil 75)

• RIC = 31 - 17 = 14

• Límite inferior: 17 - 21 = -4

• Límite superior: 31 + 21 = 52

• El valor 50 está dentro de los límites, por lo que no es atípico

Interpretación del Diagrama

Posición de la mediana: Si está centrada en la caja, la distribución es simétrica. Si está desplazada, indica asimetría.

Tamaño de la caja: Una caja grande indica mayor dispersión del 50% central de los datos.

Longitud de los bigotes: Bigotes largos indican mayor dispersión en los extremos.

Valores atípicos: Puntos fuera de los bigotes merecen investigación especial.

Ventajas del Diagrama de Caja

• Resume mucha información en un espacio compacto

• Facilita la comparación entre múltiples grupos

• Identifica claramente los valores atípicos

• No se ve afectado tanto por valores extremos como otras medidas

Conclusión

El diagrama de caja y bigotes es una herramienta visual poderosa que te permite ver de un vistazo la distribución de tus datos, su centro, su dispersión y sus valores inusuales. Es especialmente útil cuando necesitas comparar varios grupos de datos simultáneamente.

Volver al Inicio