Muestreo por Conglomerados
El muestreo es una de las técnicas más importantes de la estadística, y es la base para cualquier investigación donde se requiera estudiar un gran conjunto de datos. Uno de los tipos en que se clasifica es el muestreo por conglomerados, el cual permite seleccionar los grupos definidos dentro de una población con el fin de conformar la muestra necesaria para el estudio.
Este tipo de muestreo probabilístico brinda a los investigadores la oportunidad de conocer la naturaleza o comportamiento de una población a partir de los grupos o conglomerados conformados dentro de la misma. En este artículo te explicaremos de qué se trata y qué debes hacer para aplicarlo correctamente.
¿Qué es muestreo por conglomerados?
El muestreo por conglomerados es una técnica, propia de la estadística inferencial, mediante la cual la población objetivo de una investigación se divide en grupos de elementos heterogéneos, los cuales se encuentran conformados de manera natural debido a una clasificación previa de los mismos: por ejemplo, regiones, países, las facultades de una universidad, grupos escolares, entre otros.
A este tipo de muestreo también se le denomina muestreo por racimos, cúmulos o áreas, en el que cada grupo pertenece a una misma línea o nivel de clasificación. Es decir, un tipo de grupo puede ser un país, por lo tanto, los demás grupos deben ser, asimismo, países, y no regiones o continentes.
La muestra, en este muestreo, se encuentra conformada por los conglomerados, de manera que la totalidad de los elementos que se encuentran dentro de ellos hacen parte de la misma. Estos grupos o clústers (conjuntos, en inglés) se seleccionan aleatoriamente, por lo que no todos hacen parte de la muestra.
Cuando se utiliza el muestreo por conglomerados
El muestreo por conglomerados es utilizado en ciertos contextos, por lo que en algunos casos es recomendable implementar uno, mientras que en otros es preferible emplear otro tipo de muestreo.
Algunos de los casos en los que se utiliza el muestreo por conglomerados son:
- La población se encuentra dividida, naturalmente, en conglomerados heterogéneos. Por esta razón, este método es implementado para estudiar los datos de grandes extensiones geográficas.
- La información de la población se encuentra dispersa en diferentes grupos, por lo que se hace necesario abarcar varios de ellos para realizar una investigación con resultados precisos.
- Investigaciones donde se requiere abarcar grandes poblaciones y representarlas en una muestra.
- En cualquiera de los anteriores casos, el muestreo por conglomerados permite reducir los costos, por lo que es una excelente técnica para grupos de investigaciones que no disponen de un gran capital.
Diferencia entre muestreo por conglomerado y estratificado
Un tipo de muestreo similar al muestreo por conglomerados es el muestreo estratificado, y aunque guardan ciertas similitudes como la agrupación de los datos, son diferentes y se usan en ciertos contextos que difieren uno del otro. En este apartado te explicaremos cuáles son sus principales diferencias:
- Al implementar un muestreo por conglomerados, los grupos ya se encuentran definidos por alguna razón natural, histórica o política, y por lo tanto, los elementos que los conforman no necesariamente responden a una característica en común, sino a la clasificación a la que pertenecen. Por esta razón, se dice que son heterogéneos tanto externa como internamente.
Por otro lado, en el muestreo estratificado, los grupos, que se denominan estratos, están conformados por elementos homogéneos, es decir, que sí guardan una característica en común. Además, la agrupación de los mismos se realiza a juicio del investigador, pues no existe una clasificación previa al estudio.
- En el muestreo por conglomerados se busca seleccionar solo algunos de los grupos conformados dentro de la población, mientras que en el muestreo estratificado todos los estratos cuentan con alguna representación en la muestra.
- Los elementos que conforman el conglomerado seleccionado son tomados en cuenta, totalmente, para la muestra. Por otra parte, los elementos que hacen parte de un estrato se seleccionan aleatoriamente. Esto varía dependiendo de los tipos de muestreo por conglomerado, pues en ocasiones, se debe realizar un muestreo estratificado para seleccionar ciertos subgrupos de los conglomerados, y los elementos que los conforman.
Este aspecto será tratado en el apartado de tipos de muestreo probabilístico por conglomerados.
Ventajas y desventajas
Ventajas del muestreo por conglomerados
- Permite obtener resultados precisos de grupos cuyos elementos presentan cierta variación.
- La clasificación previa a la investigación supone una gran ventaja, pues ahorra tiempo y dinero en el posterior análisis poblacional.
- Brinda a los investigadores la posibilidad de realizar muestreos subsiguientes.
- No es necesario que la investigación disponga de un marco o listado muestral de los elementos que conforman la población.
- Se pueden utilizar muestras de gran tamaño, pues se pueden analizar grupos de los conglomerados y sus subgrupos.
- Es el más adecuado para el análisis de grandes y extensas áreas geográficas.
- Todos los grupos tienen la misma posibilidad de ser incluidos en la muestra.
Desventajas del muestreo por conglomerados
- Debido a que no considera la totalidad de los conglomerados como parte de la muestra, se puede perder representatividad de ciertas poblaciones.
- En algunos casos, a causa de la heterogeneidad de los grupos, los resultados pueden no ser precisos.
- Es necesario disponer de ciertos datos para determinar la cantidad de conglomerados de la investigación.
- Posee un margen de error considerable, pues grandes porciones de la población no se consideran al conformar la muestra.
Tipos de muestreo probabilístico por conglomerados
El muestreo por conglomerados permite aplicar diversas selecciones sucesivas, las cuales se realizan por etapas, mediante las cuales se busca reducir el número de elementos que conforman la muestra.
De esta manera, los elementos que conforman un conglomerado que corresponde a una clasificación, pueden ser seleccionados de acuerdo a una subclasificación, proceso que se puede repetir hasta alcanzar la última ramificación.
A partir de esto, el muestreo por conglomerados se divide en dos tipos, principalmente:
Muestreo unietápico por conglomerados (de una etapa)
En este caso, se realiza una selección aleatoria de los conglomerados para formar la muestra de la investigación, de manera que los elementos que hacen parte de los grupos seleccionados se consideran en su totalidad al ser representados.
Muestreo polietápico por conglomerados (de dos etapas)
Los muestreos polietápicos por conglomerados son aquellos en donde se realizan dos o más selecciones posteriores a la primera selección de grupos, lo que permite obtener clasificaciones subyacentes de la información de manera sucesiva.
La implementación de este tipo de muestreo supone el uso de un muestreo estratificado, para obtener cierta proporcionalidad entre los datos, y de un muestreo aleatorio simple, para la aplicación de métodos de selección aleatoria.
Una doble selección en un muestreo por conglomerados se denomina como bietápica, pues al seleccionar, en primera instancia, los conglomerados, se implementa otra selección de los elementos que los conforman.
Pasos para realizar un muestreo por conglomerados
1. Definir la población
En primera instancia, se debe conocer la naturaleza de la población a analizar, recopilando la suficiente información para emprender los demás pasos. Además, es necesario tener un objetivo claro y específico sobre la investigación.
2. Dividir la población en conglomerados
Esta etapa, en realidad, se trata de una identificación de los posibles conglomerados en los que se encuentra dividida la población, información que se puede obtener a través de documentos, previos estudios o por evidencia. Cabe destacar que esta división se hace de acuerdo al propósito de la investigación, por lo que es necesario seleccionar aquellos conglomerados que sí permiten obtener los datos requeridos.
3. Seleccionar los conglomerados
Los conglomerados se deben seleccionar aleatoriamente mediante un muestreo aleatorio simple o sistemático, es decir, mediante un sorteo y una asignación de números aleatorios a cada elemento.
4. Seleccionar los elementos dentro de los conglomerados
Esta etapa corresponde a un muestreo bietápico y, por lo tanto, se debe aplicar un muestreo estratificado, ya sea proporcional o por afijación igual, con el fin de seleccionar solo algunos de los elementos de los conglomerados seleccionados.
5. Establecer el tamaño de la muestra
El tamaño de la muestra se puede determinar mediante las diferentes fórmulas declaradas en el muestreo aleatorio simple, dependiendo del tipo de variable y de población. Una mayor heterogeneidad de los elementos permitirá obtener una mayor representatividad de la población real.
6. Realizar la recolección de datos
Con base a los resultados obtenidos en los anteriores pasos, los investigadores pueden emprender la recopilación de los datos de la población objetivo. Se debe asegurar que estos elementos cumplan con la cantidad definida por la muestra.
7. Analizar los datos
Cualquier investigación supone un posterior análisis de los datos obtenidos a partir de los diferentes cálculos y procesos realizados. En esta última etapa se preparan las conclusiones que serán la base para la ejecución de ciertos planes. Para ello, se pueden utilizar diversas técnicas incluidas en la estadística descriptiva, lo que facilita la interpretación de la información.
Ejemplos de muestreo por conglomerados
A menudo, el muestreo por conglomerados es implementado en estudios que abarcan grandes extensiones geográficas, como continentes, países o regiones. Por lo tanto, un buen ejemplo de este tipo de enfoque es el análisis de la población que conforma la fauna del Amazonas, territorio comprendido entre 9 países:
- Brasil.
- Colombia.
- Perú.
- Bolivia.
- Surinam.
- Venezuela.
- Ecuador.
- Guyana.
- Guayana Francesa.
Estos países, por lo tanto, conforman los conglomerados del estudio. A continuación veremos de qué manera se puede aplicar este tipo de muestreo en caso de utilizar varias etapas.
Ejemplo de muestreo unietápico
En el caso de realizar un estudio de la fauna basado en las provincias nacionales que ocupan el territorio amazónico, se puede implementar un muestreo unietápico de la siguiente manera:
- Se estima el tamaño de la muestra: este dato equivale a 5 conglomerados.
- Seleccionar los conglomerados: los investigadores encargados del estudio deben seleccionar, aleatoriamente, 5 países para la muestra. Para ello, utilizan algunos de los métodos proporcionados por el muestreo aleatorio simple, como el sorteo y la asignación de números aleatorios para cada nación.
Posteriormente, se seleccionan los grupos mediante un ordenamiento. En este caso, se escogen aquellos primeros cinco países que fueron asignados con los números aleatorios más pequeños:
De esta manera, las provincias que serán tomadas en cuenta para la investigación hacen parte de Colombia, Surinam, Guyana, Brasil y Perú. Luego, se pueden seleccionar las diferentes especies ubicadas en cada provincia mediante un muestreo estratificado, donde cada especie es un estrato, o simplemente abarcar toda la población.
Ejemplo de muestreo polietápico
Siguiendo el anterior ejemplo, los investigadores pueden perfeccionar los resultados del estudio agregando más etapas de selección al análisis de muestreo por conglomerados. En este caso, los países seleccionados previamente cuentan con ciertas provincias (más pobladas) que ocupan el territorio amazónico, a saber:
- Colombia: Caquetá.
- Surinam: Paramaribo.
- Guyana: Demerara-Mahaica.
- Brasil:
- Amazonas.
- Pará.
- Maranhao.
- Rondonia.
- Amapá.
- Acre.
- Roraima.
- Tocantins.
- Perú:
- Loreto.
- Ucayali.
- San Martín.
- Madre de Dios.
Como se puede observar, los primeros tres países solo cuentan con una provincia que puede ser considerada como de mayor población respecto a las demás, y por lo tanto, serán seleccionados de igual manera. Sin embargo, Brasil y Perú cuentan con más elementos. Para escoger solo algunos de los estados se puede aplicar un muestreo estratificado:
- Los investigadores optan por aplicar un muestreo estratificado de afijación proporcional, de manera que todos los conglomerados cuenten con la misma representación en la muestra final. Esta muestra debe contener 9 elementos de la población.
En resumen, para realizar este paso se debe aplicar la fórmula:
(número de elementos del conglomerado / total de elementos de la población) x n,
donde n es el tamaño de la muestra.
- Ahora, los investigadores pueden aplicar nuevamente un muestreo aleatorio simple para seleccionar los elementos de cada conglomerado, como se hizo en la primera etapa. Se debe asegurar que cada conglomerado cuente con al menos un elemento dentro de la muestra.
- Si los investigadores quisieran seguir reduciendo la población a sus partes más básicas, lo podrían hacer considerando las ciudades, las poblaciones o zonas, taxonomía de la fauna, entre otras clasificaciones. Los elementos de cada una de estas divisiones se deben calcular mediante una nueva etapa de muestreo por conglomerados.
Cómo hacer un muestreo por conglomerados en Excel
En el campo de la informática y la computación se han desarrollado una gran variedad de herramientas que permiten realizar cálculos estadísticos de manera eficaz y precisa. Uno de ellos, el más utilizado y adecuado para este tipo de labores, es Microsoft Excel, tanto por su amplia gama de funciones matemáticas y estadísticas como por las diversas herramientas para el tratamiento y organización de datos.
Para realizar un muestreo de conglomerados en Excel solo es necesario que tengas en cuenta las siguientes instrucciones:
- Antes de emprender cualquier tipo de actividad o análisis en Excel (e incluso en cualquier ámbito) es recomendable organizar y clasificar la información a utilizar. Esto se puede hacer mediante una tabla a partir de la cual se pueda identificar la naturaleza de cada dato, como en la siguiente imagen:
De esta manera, no solo se facilita la comprensión de la información sino que también la implementación de fórmulas, como veremos más adelante.
Cabe destacar que para calcular el tamaño de la muestra, uno de los datos conocidos en primera instancia, es necesario utilizar las fórmulas estipuladas en el muestreo aleatorio simple, por lo que te recomendamos visitar este artículo si aún no conoces cómo obtener esta información.
- Ahora, se puede aplicar un muestreo aleatorio simple para seleccionar los conglomerados que conforman la población. Para ello, se puede utilizar la función ALEATORIO para generar un número aleatorio para cada dato de la población, escribiendo su sintaxis en la barra de fórmulas de Excel.
- Repetimos el anterior paso haciendo click sobre el vértice inferior derecho de la celda donde implementamos la función y arrastrando hasta el último de los datos. Para que el valor de los número aleatorios generados no cambie, copiamos el rango de celda y, haciendo click derecho sobre el mismo, seleccionar la opción Valores, la cual se encuentra sombreada en la imagen.
- La selección de los datos se puede realizar mediante un ordenamiento de los mismos. Esto se puede hacer seleccionando el rango de celdas que contiene los números aleatorios y utilizando la herramienta Ordenar y filtrar, ubicada en la cinta de opciones de Inicio. Seleccionamos la opción Ordenar de mayor a menor, en primera instancia.
- Aparecerá una ventana, en la cual debemos escoger la opción Ampliar selección, de manera que el ordenamiento se lleve a cabo tanto para los números como para cada uno de los datos.
- Una vez hecho lo anterior, todos los datos serán reorganizados, como se observa en la imagen.
- Lo anterior supone un muestreo por conglomerados unietápico. En el caso de que se opte por agregar una nueva etapa, es necesario seguir las instrucciones para diseñar un muestreo estratificado en Excel, por lo que te recomendamos visitar nuestro artículo donde te explicamos cómo hacerlo. Sin embargo, en general debes utilizar la fórmula descrita en el ejemplo y la función REDONDEAR.
Conclusiones y recomendaciones
La estadística es una de las ramas del conocimiento más importantes dentro de cualquier ámbito, debido a su rigurosidad matemática y por la precisión con la que se pueden obtener resultados confiables acerca de cualquier población o fenómeno. Las raíces de esta ciencia reflejan la importancia de la misma en la toma de decisiones de un Estado y, por consiguiente, de todas las instituciones, grupos e, incluso, a nivel personal.
El muestreo, por su parte, ha significado una de las principales técnicas para la obtención de datos, ante la imposibilidad de abarcar toda la información existente en el ámbito de estudio. Además, la implementación de otros cálculos estadísticos como la varianza, la desviación estándar, entre otros, permiten conocer de manera precisa la naturaleza de los elementos recopilados.
Cualquiera que sea el ámbito en el que te desempeñas o en el cual te estás especializando, un constante aprendizaje supone un aspecto de vital importancia para la formalización de tus conocimientos. Por esta razón, en Excel Para Todos hemos preparado una gran cantidad de artículos, los cuales puedes encontrar en nuestro blog, a partir de los cuales podrás conocer diversos temas relacionados a las finanzas, la contabilidad y las ciencias empresariales.
De igual manera, conocemos la importancia de Microsoft Excel en la actualidad, y queremos que aproveches al máximo tus conocimientos y capacidades mediante las herramientas tecnológicas del presente, por lo que te recomendamos visitar nuestros cursos y plantillas en Excel, a partir de los cuales podrás emprender cualquier tipo de labor y obtener resultados precisos en menor tiempo y eficazmente.