Introducción
El diagrama de caja y
bigotes (también conocido como boxplot) es una representación gráfica que
resume cinco estadísticos clave de un conjunto de datos en una sola imagen. Es
perfecto para detectar valores atípicos y comparar distribuciones entre
diferentes grupos.
Anatomía de un Diagrama de Caja
Un diagrama de caja muestra cinco
estadísticos importantes:
1. Valor mínimo: El
extremo inferior del "bigote" izquierdo.
2. Primer cuartil (Q1): El
borde izquierdo de la caja. El 25% de los datos está por debajo.
3. Mediana (Q2): La línea
dentro de la caja. El 50% de los datos está por debajo.
4. Tercer cuartil (Q3): El
borde derecho de la caja. El 75% de los datos está por debajo.
5. Valor máximo: El
extremo del "bigote" derecho.
Cómo Construir un Diagrama de Caja
1. Ordena los datos de menor a
mayor
2. Calcula Q1, Q2 (mediana) y Q3
3. Calcula el rango
intercuartílico: RIC = Q3 - Q1
4. Determina los límites para
valores atípicos:
• Límite inferior: Q1 - 1.5 × RIC
• Límite superior: Q3 + 1.5 × RIC
5. Dibuja la caja, los bigotes
y marca los valores atípicos como puntos individuales
Ejemplo Paso a Paso
Datos: 12, 15, 18, 20, 22, 25,
28, 30, 35, 50
• Q1 = 17 (percentil 25)
• Q2 = 23.5 (mediana)
• Q3 = 31 (percentil 75)
• RIC = 31 - 17 = 14
• Límite inferior: 17 - 21 = -4
• Límite superior: 31 + 21 = 52
• El valor 50 está dentro de
los límites, por lo que no es atípico
Interpretación del Diagrama
Posición de la mediana: Si
está centrada en la caja, la distribución es simétrica. Si está desplazada,
indica asimetría.
Tamaño de la caja: Una
caja grande indica mayor dispersión del 50% central de los datos.
Longitud de los bigotes: Bigotes
largos indican mayor dispersión en los extremos.
Valores atípicos: Puntos
fuera de los bigotes merecen investigación especial.
Ventajas del Diagrama de Caja
• Resume mucha información en un
espacio compacto
• Facilita la comparación entre
múltiples grupos
• Identifica claramente los
valores atípicos
• No se ve afectado tanto por
valores extremos como otras medidas
Conclusión
El diagrama de caja y bigotes
es una herramienta visual poderosa que te permite ver de un vistazo la
distribución de tus datos, su centro, su dispersión y sus valores inusuales. Es
especialmente útil cuando necesitas comparar varios grupos de datos simultáneamente.