Dec 12, 2024
representación adecuada de la población, de manera que se reproduzcan los rasgos esenciales de lo que se investiga
qué parte de una población debe seleccionarse?
inferencias adecuadas
Población: conjunto de los casos que comparten las características que queremos generalizar (universo)
Unidad de observación: elemento sobre el cual se realiza la medición
Marco muestral: listado de unidades de muestreo (censo: listado de hogares, individuos…)
Muestra: Subgrupo de la población de interés sobre el cual se recolectarán los datos
probabilístico (aleatorio): Todos los elementos de la población tienen la misma posibilidad de ser escogidos. La selección es aleatoria y su número depende del tamaño de la población.
no probabilístico: depende del proceso de toma de decisiones de un/a investigador/a, los criterios de investigación y la posibilidad de acceder a las unidades de análisis
selección al azar (1 a n, sorteo)
marco muestral adecuado (debemos conocer la población)
no adecuado para poblaciones heterogéneas (con sub-grupos diferentes entre sí)
con reemplazo o sin reemplazo: una vez seleccionado un individuo se reintegra a la población original o no.
Se selecciona un punto aleatorio al inicio y posteriormente se elige a cada \(k\)-ésimo miembro de la población
Tras seleccionar al primer elemento de la población se suma el valor de K para obtener el segundo elemento y así hasta completar la muestra.
qué pasa cuando tenemos ponbalciones que tienen grupos con diferentes caracteríticas?
La población se divide en estratos (población con determinadas características) y se selecciona de forma aleatoria una muestra de cada estrato
forma de definir los estratos: afijación
La variable elegida para formar los estratos no debe permitir que un individuo o elemento de la población pertenezca a más de uno de ellos
Afijación proporcionada: la muestra deberá tener estratos que guarden las mismas proporciones observadas en la población.
Afijación uniforme: cuando asignamos el mismo tamaño de muestra a todos los estratos definidos, sin importar el peso que tienen esos estratos en la población.
La muestra final será la que contemple todos los estratos
Conglomerado: subdivisión pre-existente o natural de la población (provincia, instituto). Tiene que ser heterogéneo en sí mismo; idealmente contiene toda la variabilidad de la población.
aleatorio cuando son heterogéneos en sí mismos y homogéneos respecto a otros conglomerados
útil cuando no se dispone de una lista completa de la población a estudiar
NO son aleatorios, aunque sí pueden ser representativos
cuando no se dispone de marco muestral o es difícil de conseguir
cuando las condiciones de la encuesta impiden realizar muestreos aleatorios
variación de estratificado
Se establecen estratos, que se suponen homogéneos y se asigna una cuota o tamaño de muestra de ese estrato (proporcional a la población).
no se hace a partir de un listado poblacional, sino que se deja al criterio del encuestador siempre que cumpla con las cuotas de cada estrato.
equipo investigador determina la muestra según su propio criterio, aunque siempre con la intención de obtener una muestra más o menos representativa de la población
cuando se carece de marco muestral y de información sobre la población estudiada
intentando minimizar los sesgos: igual número por sexo, edad, grupos sociales
Diferencia entre el estadístico de una muestra y el parámetro de la población correspondiente
especificación de la población: no está clara la población que se necesita investigar
errror de selección: cuando los respondentes se auto-seleccionan (voluntarios)
marco muestral: se hace una muestra de una población equivocada
no respuesta: cuando no se obtiene respuestas con el instrumento
sesgos
Sujetos que son excluidos a priori de la muestra, es decir, que son parte de la población, pero no aparecen en el marco muestral
Fuentes de sesgo:
Mal diseño de la muestra
Mal diseño del instrumento (encuesta)
Unidad muestral “hogar”: sesgo de selección del respondente (padre…)
tamaño: número de elementos necesario para conseguir una muestra lo más parecida posible a la población
Reducir el error al máximo posible
Conseguir una mayor representatividad (inferencia: que los resultados correspondan con los del universo poblacional)
el tamaño
de la muestra
importa?
Si es muy grande: el estudio más complejo (demasiados datos) y costoso.
Puede ser una muestra más precisa, pero los costos superan a los beneficios.
mayor representatividad
menor número de elementos posible
Reducir los costes del trabajo de campo
valores determinados en el diseño:
¿cuál es el tamaño de una muestra ideal para una población de 100 personas, con \(\epsilon\) = 0.05 y NC de 95%?
¿y para poblaciones de 1000, 10000, 100000?
¿cuál es el tamaño de muestra adecuado si quiero estudiar niveles de felicidad de estudiantes de la USAL con un NC de 95% y un \(\epsilon\) de 0.03? \(N\) = 28000
necesitamos la información del marco muestral (proporciones de estratos, por ejemplo)
se calculan el total de elementos para cada uno de los estratos, ya sea por afijación fija o proporcional:
Estrato | Nh |
---|---|
Grado | 21191 |
Doctorado | 2491 |
Máster | 1923 |
Título Propio | 1571 |
Otro | 824 |
Total | 28000 |