Il campionamento a grappolo può essere utilizzato quando è impossibile o impraticabile compilare un elenco esaustivo degli elementi che compongono la popolazione target. Di solito, tuttavia, gli elementi della popolazione sono già raggruppati in sottopopolazioni e gli elenchi di tali sottopopolazioni esistono già o possono essere creati. Ad esempio, supponiamo che la popolazione target in uno studio fosse membri della chiesa negli Stati Uniti. Non esiste un elenco di tutti i membri della chiesa nel paese. Il ricercatore potrebbe, tuttavia, creare un elenco di chiese negli Stati Uniti, scegliere un campione di chiese e quindi ottenere elenchi di membri da quelle chiese.
Per condurre un campione di cluster, il ricercatore seleziona prima gruppi o cluster e quindi da ciascun cluster, seleziona i singoli soggetti mediante campionamento casuale semplice o campionamento casuale sistematico. Oppure, se il cluster è abbastanza piccolo, il ricercatore può scegliere di includere l'intero cluster nel campione finale piuttosto che un sottoinsieme di esso.
Quando un ricercatore include tutti i soggetti dei cluster scelti nel campione finale, questo viene chiamato campione cluster a uno stadio. Ad esempio, se un ricercatore sta studiando gli atteggiamenti dei membri della Chiesa cattolica nei confronti della recente esposizione di scandali sessuali nella Chiesa cattolica, potrebbe prima di tutto assaggiare un elenco di chiese cattoliche in tutto il paese. Diciamo che il ricercatore ha selezionato 50 chiese cattoliche negli Stati Uniti. Lui o lei avrebbe quindi esaminato tutti i membri della chiesa di quelle 50 chiese. Questo sarebbe un esempio di cluster a uno stadio.
Un campione di cluster a due stadi si ottiene quando il ricercatore seleziona solo un numero di soggetti da ciascun cluster, sia attraverso un semplice campionamento casuale o un campionamento casuale sistematico. Usando lo stesso esempio di cui sopra in cui il ricercatore ha selezionato 50 chiese cattoliche negli Stati Uniti, non includerebbe tutti i membri di quelle 50 chiese nel campione finale. Invece, il ricercatore userebbe un campionamento casuale semplice o sistematico per selezionare i membri della chiesa da ciascun gruppo. Questo è chiamato campionamento di cluster a due stadi. Il primo stadio è campionare i cluster e il secondo è campionare i rispondenti di ciascun cluster.
Un vantaggio del campionamento dei cluster è che è economico, rapido e semplice. Invece di campionare l'intero paese quando si utilizza un semplice campionamento casuale, la ricerca può invece allocare risorse ai pochi cluster selezionati casualmente quando si utilizza il campionamento di cluster.
Il secondo vantaggio del campionamento a grappolo è che il ricercatore può avere una dimensione del campione maggiore rispetto a se stesse usando un semplice campionamento casuale. Poiché il ricercatore dovrà solo prelevare il campione da un numero di cluster, può selezionare più argomenti poiché sono più accessibili.
Uno dei principali svantaggi del campionamento dei cluster è che è il meno rappresentativo della popolazione tra tutti i tipi di campioni di probabilità. È comune per le persone all'interno di un cluster avere caratteristiche simili, quindi quando un ricercatore utilizza il campionamento di cluster, c'è la possibilità che lui o lei possa avere un cluster sovrarappresentato o sottorappresentato in termini di determinate caratteristiche. Questo può distorcere i risultati dello studio.
Un secondo svantaggio del campionamento dei cluster è che può avere un errore di campionamento elevato. Ciò è causato dai cluster limitati inclusi nel campione, che lasciano una parte significativa della popolazione non campionata.
Diciamo che un ricercatore sta studiando le prestazioni accademiche degli studenti delle scuole superiori negli Stati Uniti e ha voluto scegliere un campione di cluster basato sulla geografia. In primo luogo, il ricercatore avrebbe diviso l'intera popolazione degli Stati Uniti in gruppi o stati. Quindi, il ricercatore selezionerebbe un campione casuale semplice o un campione casuale sistematico di tali cluster / stati. Diciamo che ha scelto un campione casuale di 15 stati e che voleva un campione finale di 5.000 studenti. Il ricercatore selezionerebbe quindi quei 5.000 studenti delle scuole superiori tra i 15 stati attraverso un campionamento casuale semplice o sistematico. Questo sarebbe un esempio di un esempio di cluster a due fasi.