| p_tdnr_dt_factor | Hombre | Mujer | Total |
|---|---|---|---|
| No | 739 | 350 | 1089 |
| Sí | 11118 | 16270 | 27388 |
| Total | 11857 | 16620 | 28477 |
Unidad 5: Estadística Descriptiva Bivariada
2025-11-17
En la clase anterior, vimos cómo analizar la relación entre una variable categórica y una cuantitativa.
Hoy, nos enfocamos en el caso Categórica (X) ➞ Categórica (Y), uno de los análisis más clásicos e importantes en sociología.
Una tabla de contingencia cruza las categorías de una variable explicativa (X) con las de una variable respuesta (Y), y muestra la frecuencia de casos en cada celda.
Ejemplo con ENUT 2023: - Pregunta: ¿Se asocia el sexo (X) con la participación en trabajo doméstico no remunerado (p_tdnr_dt, Y)?
| p_tdnr_dt_factor | Hombre | Mujer | Total |
|---|---|---|---|
| No | 739 | 350 | 1089 |
| Sí | 11118 | 16270 | 27388 |
| Total | 11857 | 16620 | 28477 |
Problema: Hay más mujeres que hombres en la muestra que contestó el cuestionario de uso del tiempo. Comparar los conteos directos (9,742 vs. 17,646) puede ser engañoso. Necesitamos porcentajes.
En una tabla de contingencia, podemos calcular tres tipos de porcentajes:
(frecuencia de la celda / N Total) * 100.
(frecuencia de la celda / Total de la Fila) * 100.
(frecuencia de la celda / Total de la Columna) * 100.
Para analizar una relación explicativa (X → Y), debemos seguir un procedimiento simple pero fundamental:
1. Calcula los porcentajes en la dirección de la variable explicativa (X).
2. Compara los porcentajes en la dirección opuesta.
Si los porcentajes son diferentes entre las columnas, significa que la distribución de Y depende de la categoría de X. ¡Hay una asociación!
Pregunta: ¿Se asocia el sexo (X) con la participación en trabajo doméstico (Y)?
| p_tdnr_dt_factor | Hombre | Mujer | Valor Perdido |
|---|---|---|---|
| No | 739 (6.2%) | 350 (2.1%) | 0 (-) |
| Sí | 11,118 (93.8%) | 16,270 (97.9%) | 0 (-) |
| Valor Perdido | 0 (0.0%) | 0 (0.0%) | 0 (-) |
Interpretación:
sexo_factor está en las columnas).El análisis bivariado es solo el primer paso. Una pregunta fundamental en sociología es:
¿La relación que observamos entre X e Y se mantiene, o es un “espejismo” creado por una tercera variable (Z) que no hemos considerado?
Para responder a esto, usamos una técnica central en el análisis de datos: el control estadístico.
La idea es estratificar: rehacemos nuestro análisis de la relación entre X e Y, pero esta vez por separado para cada categoría de la variable de control Z. Esto nos permite ver si la relación original se comporta de la misma manera en diferentes contextos.
Antes de usar nuestros datos, veamos un ejemplo conceptual clásico para entender la lógica.
Relación Bivariada Original (X → Y): En una ciudad, se observa que a mayor número de bomberos (X) en un incendio, mayores son los daños económicos (Y).
Introducimos una Variable de Control (Z): La magnitud del incendio (pequeño / grande).
Análisis Estratificado:
Conclusión Final: La relación original era espuria (engañosa). La magnitud del incendio (Z) era la causa común que explicaba tanto el aumento de bomberos (X) como el aumento de los daños (Y).
Paso 1: La Relación Original (X → Y)
Analicemos la relación bivariada entre sexo (X) y la participación en trabajo de cuidados no remunerado (p_tcnr_dt, Y).
| p_tcnr_dt_factor | Hombre | Mujer | Valor Perdido |
|---|---|---|---|
| No | 8,409 (70.9%) | 9,811 (59.0%) | 0 (-) |
| Sí | 3,448 (29.1%) | 6,809 (41.0%) | 0 (-) |
| Valor Perdido | 0 (0.0%) | 0 (0.0%) | 0 (-) |
Interpretación Inicial: Observamos una clara brecha de género. Un 41.0% de las mujeres participa en trabajo de cuidados, en comparación con solo el 29.1% de los hombres. Esto representa una diferencia de casi 12 puntos porcentuales en la participación.
Paso 2: Introduciendo la Variable de Control (Z)
Pregunta: Pero, ¿es esta brecha de género la misma para todas las personas? ¿O podría depender de su relación con el mercado laboral? Por ejemplo, entre las personas que ya tienen un trabajo remunerado, la distribución de cuidados podría ser diferente.
cae (Condición de Actividad Económica).Paso 3: Las Tablas Parciales o Estratificadas
| p_tcnr_dt_factor | Hombre | Mujer | Valor Perdido |
|---|---|---|---|
| No | 5,011 (66.4%) | 4,290 (53.2%) | 0 (-) |
| Sí | 2,540 (33.6%) | 3,778 (46.8%) | 0 (-) |
| Valor Perdido | 0 (0.0%) | 0 (0.0%) | 0 (-) |
| p_tcnr_dt_factor | Hombre | Mujer | Valor Perdido |
|---|---|---|---|
| No | 2,628 (80.7%) | 4,832 (64.8%) | 0 (-) |
| Sí | 630 (19.3%) | 2,629 (35.2%) | 0 (-) |
| Valor Perdido | 0 (0.0%) | 0 (0.0%) | 0 (-) |
Al comparar las tablas parciales, observamos un patrón de Especificación (o Interacción):
Entre las personas ocupadas: La brecha de género en la participación de cuidados se mantiene, y de hecho, es similar a la brecha general. Un 46.8% de las mujeres ocupadas participa en cuidados, frente a un 33.6% de los hombres ocupados (una diferencia de 13.2 puntos).
Entre las personas inactivas: La brecha de género también se mantiene, siendo incluso ligeramente mayor. La participación de las mujeres inactivas es del 35.2%, mientras que la de los hombres inactivos es solo del 19.3% (una diferencia de 15.9 puntos).
Conclusión Sociológica: La relación entre sexo y trabajo de cuidados no es espuria, sino robusta y especificada por la condición de actividad. La brecha de género existe tanto dentro como fuera del mercado laboral, pero se manifiesta de forma diferente: aunque en términos absolutos la participación en cuidados es mayor entre las personas ocupadas, la desigualdad relativa (la diferencia porcentual entre hombres y mujeres) es aún más pronunciada entre quienes están fuera de la fuerza de trabajo.
Al introducir una variable de control (Z), la relación original entre X e Y puede:
Replicarse: La relación se mantiene igual en todas las tablas parciales. Esto refuerza nuestra confianza en la relación original.
Desaparecer (Explicación / Asociación Espuria): La relación desaparece en las tablas parciales. Esto sugiere que Z es una causa común que explica la relación original (como en el ejemplo de los bomberos).
Especificarse (Interacción): La relación es diferente en las distintas categorías de Z, siendo más fuerte para un grupo que para otro. Esto es lo que acabamos de encontrar en nuestro ejemplo de la ENUT: la relación entre sexo y trabajo de cuidados fue especificada por la condición de actividad.
Resumen de la sesión de hoy:
En el práctico de hoy:
janitor para crear tablas de contingencia ponderadas y estratificadas, aplicando la regla de los porcentajes.Adelanto de la próxima clase:
