在社会研究中,有一种常用的不等概率抽样方法,叫做“概率与元素的规模大小成比例的抽样”,简称PPS抽样。
其原理可以通俗地理解成以阶段性的(或暂时的)不等概率换取最终的、总体的等概率。其做法是:在第一阶段,每个群按照其规模(所含元素的数量)被给予大小不等的抽取概率;大的群具有比小的群更大一些的概率;但到了抽样的第二阶段,从每个抽中的群中都抽取同样多的元素(也是不等概率的)。正是通过这样两个阶段上的不等概率抽样,使得总体中的每一个元素最终都具有同样的被抽中的概率。 其实质是:第一个阶段中,大的群被抽中的概率大,而小的群被抽中的概率小;这样到了第二阶段,被抽中的大的群中的元素被抽中的概率显然就小于被抽中的小的群中的元素了。正是这一大一小,平衡了由于群的规模所带来的概率差异。我们还可以用下列公式来说明PPS抽样的原理: