# Calculadora Chi-Cuadrado de Independencia
Mientras que las herramientas clásicas como el Test A/B o la Estadística Descriptiva trabajan excelentemente con números continuos (medias, ganancias, pesos), el mundo real está lleno de datos categóricos (colores, marcas, niveles de satisfacción). La Calculadora Chi-Cuadrado de Independencia es la prueba "Reina" para determinar analíticamente si dos variables cualitativas están estadísticamente conectadas o si bailan de forma completamente independiente.
# ¿Para qué sirve exactamente el Estadístico Chi-Cuadrado (χ²)?
El Test de Independencia Chi-cuadrado compara las Frecuencias Observadas (los números reales que tú has medido y recogido) con las Frecuencias Esperadas (los recuentos que esperaríamos tener en cada celda si no hubiera interacción alguna entre las variables).
Variables Dependientes (Hay Relación)
Las proporciones de una categoría varían salvajemente dependiendo de la otra.
- Ejemplo: Los visitantes de móvil prefieren el Diseño A, pero los de PC el Diseño B.
- El Chi-Cuadrado (χ²) se dispara y el P-Valor cae.
- El valor V de Cramer señala la fuerza (ej. Fuerte > 0.5).
Variables Independientes (Azar)
Las proporciones se mantienen estables como una roca en todos los niveles.
- Ejemplo: El color de ojos de un cliente no afecta a qué marca de coche compra.
- El Chi-Cuadrado es diminuto y el P-Valor es mayor de 0.05.
- La Hipótesis Nula no puede ser descartada.
# V de Cramer: Entendiendo la Fuerza del Vínculo
Obtener un P-Valor bajísimo no significa que las variables estén "intensamente" unidas; solo indica que el azar no puede ser el culpable (quizás porque tienes docenas de miles de casos reales). Para medir el "tamaño del efecto", incorporamos automáticamente el Coeficiente V de Cramer.
| Calculadora (Valor V) | Calificación Analítica | Traducción |
|---|---|---|
| 0.00 a 0.10 | Asociación Nula / Trivial | Son teóricamente dependientes, pero de forma imperceptible e inútil para el negocio. |
| 0.11 a 0.30 | Asociación Débil | Existe un vínculo leve, pero multitud de otros factores externos tienen más peso. |
| 0.31 a 0.50 | Asociación Moderada | Ambas características influyen de forma notable la una sobre la otra. |
| Más de 0.50 | Asociación Fuerte | Nexo clarísimo. Conocer la variable A predice asombrosamente la variable B. |
Condiciones de Viabilidad Matemática
¡Ojo con las celdas desérticas! Para que la aproximación chi-cuadrada de Pearson siga siendo robusta bajo la campana, se requiere metodológicamente que al menos el 80% de las Frecuencias Esperadas (y no las observadas) sean superiores a 5, y ninguna celda inferior a 1. Si esto no se cumple, nuestro semáforo de alerta se disparará sugiriéndote fusionar categorías.
# Mapa de Calor Residual Incorporado
Para potenciar el UX y facilitar conclusiones para informes, nuestra matriz tintará automáticamente el fondo de las celdas basándose en sus de residuos estandarizados (desviación):
Tintes Verdes: La celda tiene muchos más éxitos de los puramente matemáticamente esperables.
Tintes Rojos: La celda está peligrosamente "vacía" en comparación a la norma esperada.
# Glosario del Chi-Cuadrado
- Frecuencia Observada
- El recuento tal y como tú lo has contado en laboratorio o encuestas píticamente.
- Frecuencia Esperada
- Cálculo teórico resultante de cruzar el ratio marginal de la fila por el de la columna.
- Grados de Libertad (df)
- La cantidad geométrica de datos libres. Se halla restando 1 a las filas y a las columnas, y multiplicándolos.
- Residuo Estandarizado
- Diferencia normalizada entre lo observado y lo real. Mide qué celda 'empuja' más el descubrimiento.