Unidad 2: Muestreo y Población
2025-09-01
En la clase anterior, establecimos el camino para medir un concepto sociológico:
Hoy, respondemos a la siguiente pregunta: una vez que sabemos qué medir y en quiénes, ¿cómo seleccionamos a las unidades de análisis que efectivamente vamos a estudiar?
Población (o Universo)
- Es el conjunto completo de todas las unidades de análisis sobre las que queremos hacer afirmaciones (ej. todos los estudiantes de pregrado en Chile).
- Estudiar a toda la población se llama Censo. Es extremadamente costoso, lento y a menudo impracticable.
Muestra
- Es un subconjunto de la población que seleccionamos para estudiar.
- El objetivo es usar la información de la muestra para hacer inferencias (generalizaciones) sobre la población total.

El muestreo probabilístico es el pilar de la investigación cuantitativa que busca generalizar. Su lógica se basa en un principio fundamental:
La selección aleatoria (al azar).
Aquí es donde la teoría se encuentra con la realidad.
El problema fundamental: El marco muestral casi nunca es una representación perfecta de la población objetivo. Esta brecha puede ser una importante fuente de error.
Aunque es el modelo base de la estadística, el MAS casi nunca se usa en encuestas sociales a gran escala por tres razones fundamentales:
Por estas razones, se han desarrollado diseños más complejos y eficientes.
Las encuestas reales como CASEN combinan estas técnicas en un diseño muestral complejo y multietápico.
El diseño de CASEN es probabilístico, estratificado y bietápico:
Este diseño equilibra la representatividad (gracias a la estratificación) con la eficiencia logística (gracias al muestreo por conglomerados).
Ya hemos resuelto el problema de a quiénes estudiar a través de la lógica del muestreo. Ahora, enfrentamos una pregunta igualmente importante:
¿Qué tan bien estamos midiendo lo que queremos estudiar?
La calidad de nuestros datos no solo depende de una buena muestra, sino también de la calidad de nuestros instrumentos de medición. Esto nos introduce a dos conceptos fundamentales: fiabilidad y validez.
La fiabilidad (o confiabilidad) se refiere a la consistencia y estabilidad de una medición. Si aplicamos el mismo instrumento repetidamente al mismo objeto bajo las mismas condiciones, ¿obtenemos siempre el mismo resultado?
En sociología, la falta de fiabilidad puede ocurrir si:.
- Las preguntas de una encuesta son ambiguas y cada persona las interpreta de forma distinta en momentos distintos.
- Los observadores que codifican un comportamiento usan criterios que cambian con el tiempo o entre ellos.
La validez se refiere al grado en que una medida empírica refleja adecuadamente el significado real del concepto que pretende medir. Es una pregunta sobre la exactitud conceptual.
En sociología, la falta de validez es un riesgo constante porque:.
- Nuestros conceptos son abstractos (ej. “anomia”, “capital social”).
- Las personas pueden dar respuestas socialmente deseables en lugar de honestas.
- Nuestros indicadores pueden ser una simplificación excesiva del concepto.
La validez no es un concepto único. En la práctica, la evaluamos de diferentes maneras, cada una respondiendo a una pregunta distinta sobre la calidad de nuestra medición.
1. Validez de Contenido
Pregunta clave: ¿La medida cubre todas las facetas relevantes del concepto?
Se enfoca en la amplitud y representatividad de los indicadores. Se evalúa teóricamente, a menudo con juicio de expertos.
Ejemplo: Una medida de “bienestar social” que solo incluye indicadores de ingreso económico tendría baja validez de contenido, pues omite dimensiones cruciales como la salud, las redes sociales o la seguridad.
2. Validez de Criterio (o Predictiva)
Pregunta clave: ¿La medida se correlaciona con un resultado o comportamiento externo (criterio) que debería predecir?
Se enfoca en la utilidad práctica de la medida.
Ejemplo: Una escala que mide el “riesgo de deserción escolar” tiene alta validez de criterio si los estudiantes con puntajes altos en la escala son, efectivamente, los que tienen más probabilidades de abandonar la escuela al año siguiente.
3. Validez de Constructo
Pregunta clave: ¿La medida se comporta de la manera que la teoría sociológica predice que el concepto debería comportarse?
Es la forma de validez más importante y abstracta.
Ejemplo: La teoría dice que el “capital social” se asocia positivamente con la “participación cívica”. Si nuestra nueva escala de capital social muestra una fuerte correlación con una medida de participación cívica, es una evidencia a favor de su validez de constructo.
Una forma clásica de entender la diferencia es con la analogía de un tirador:
En la práctica, a menudo existe una tensión entre ambos criterios.
Pensemos en medir el “estado de ánimo” de los trabajadores.
La primera medida es muy fiable pero de validez cuestionable (el estado de ánimo es más que la ausencia de quejas). La segunda es potencialmente muy válida pero menos fiable (depende de la interpretación del observador y es difícil de replicar).
El desafío del investigador es encontrar un equilibrio razonable.
Nuestras conclusiones no solo dependen de a quiénes seleccionamos (muestreo), sino también de cómo medimos (calidad de la medición).
El Error Total de Encuesta es un marco que nos ayuda a pensar en todas las fuentes de imprecisión. Se compone de dos grandes tipos de error:
El objetivo de un buen diseño de investigación es minimizar el error total.
La Falacia de la Muestra Grande:
- Creer que una muestra muy grande (bajo error muestral) puede compensar mediciones de mala calidad (alto error no muestral). Esto es falso.
- Si las preguntas de una encuesta son sesgadas, una muestra de un millón de personas solo nos dará una respuesta equivocada con mucha precisión.
- La calidad de la medición es tan importante, o incluso más, que el tamaño de la muestra.
Escenario de Investigación: Queremos realizar un estudio sobre el “bienestar subjetivo de los estudiantes de la UDP”.
En grupos, discutan:
1. Población y Marco Muestral: ¿Cuál es la población objetivo? ¿Qué marco muestral usarían? ¿Qué sesgos de cobertura podría tener ese marco?
2. Fiabilidad: Si usan una pregunta como “¿Qué tan feliz es usted en una escala de 1 a 7?”, ¿qué problemas de fiabilidad podrían surgir?
3. Validez: ¿La pregunta “¿Qué tan feliz es usted?” es una medida válida de “bienestar subjetivo”? ¿Qué otras dimensiones importantes del bienestar podría estar omitiendo?
4. Error Total: ¿Cuál creen que sería la mayor fuente de error en este estudio, el error muestral o el error no muestral? ¿Por qué?
Adelanto de la próxima clase:
- Comenzaremos con la Unidad 3: Marcos de datos para la investigación social. Aprenderemos cómo se organizan estas mediciones en una base de datos y daremos nuestros primeros pasos para explorarlas con R.
