新闻中心
当前位置: 首页   ·   新闻中心   ·   我院新闻   ·   正文

讲座回顾|赵延东:如何对总体不明群体开展概率抽样调查

发布时间:2022/11/08浏览量:来源:

 2022年10月28日下午两点,中国人民大学社会与人口学院教授,中国人民大学北京社会建设研究院首席专家赵延东教授主讲的“如何对总体不明群体开展概率抽样调查”研究生经典学术讲堂在腾讯会议线上举行。本次讲座由中国社会科学院大学社会与民族学院教授、博士生导师李炜教授主持,线上百余名同学参加。

图:李炜教授主持本场讲座

 讲座针对社会调查中常出现无法获得总体抽样框,传统概率抽样方法无法运用于无样框群体抽样的实际情况,详细介绍了二次抽样、捕获-再捕获抽样、网络抽样/适应性抽样等多种适用于对总体不明群体进行概率抽样的方法。

 讲座开始,赵延东教授介绍到,在实际的社会调查过程中,经常出现无法获得抽样框的情况——如存在抽样框但研究者无法获得,或针对稀少/隐藏人口进行调查时根本没有抽样框。面对这样的情形,以往研究者多采取滚雪球抽样、典型抽样、便宜抽样等方式的非概率抽样方法。但近年来研究者陆续开发出一些对针对无样框总体进行概率抽样的方法,一般包括二次抽样、捕获-再捕获抽样、网络抽样/适应性抽样。

图:主讲人赵延东教授

 赵延东教授首先介绍了二次抽样方法。二次抽样常用于分布较均匀的总体不明群体,具体做法为先在总体人口中抽取一个常规的样本,然后在样本中找出属于特定研究群体的对象。二次抽样需要满足一定的条件:首先,研究对象群体分布应比较均匀,否则抽样效率低;其次研究群体规模不能太小。

 接下来赵延东教授介绍了捕获-再捕获抽样方法。这一抽样方法始于生物学家对特定生物种群数量研究的实践,后被用于对特殊人群的研究,可以用来估计人群的规模、存活概率和出生率等。这一抽样方法建立在一定的假设基础上,这些假设包括两次抽样彼此独立,对第一次抽样的样本进行标记并不会影响其被再度抽取到的概率;所有个体都有同等被不同取样捕获的概率;两次抽样期间总体是封闭的,没有迁入或迁出,没有死亡或出生;关于某个体是否曾经被捕获的信息是可信的。这些假设预设了进行抽样的理想环境,但在实际操作中,总有意想不到的困难,如某些“隐藏群体”第一次被抽中后就会隐藏更深,或研究总体经常出现变动,或在后续抽样中难以准确识别第一次被标记过的个体,这就促使抽样方法出现新的发展,以适应“开放总体”的现实。赵老师还用“应用捕获-再捕获法估计2006 年深圳市男同性恋人群规模”及“捕获-标记-再捕获法在工伤漏报调查中的应用”两项研究作为案例具体展示了这一抽样方法的实际应用及存在困难。

 最后,赵延东教授着重介绍了网络抽样方法。网络抽样又称“适应性抽样”,是一种利用人们之间的网络联系特征的抽样方法。其特征为一个或多个抽样单位的抽取取决于前一阶段对同样类型的抽样单位的抽取,包括被访者驱动抽样(RespondentDrivenSampling)和适应性区群抽样(AdaptiveClusterSampling)。

 适应性区群抽样方法适用于对稀少、分布不规则但有高度聚集性的对象抽样。其具体做法为先将研究区域划分为不同的区群,从中选择一个普通的区群单元,如果选中区群中发现符合研究特征的对象,就扩大选择该区群周围所有的相邻区群单元;如果在某一相邻区群发现特征对象,就继续重复这一程序,直到周围所有区群都找不到特征对象为止。这一抽样方法的优点是操作过程和统计估计都较简便,只要研究对象具备聚集性,就有较好效度。但同时也存在不易预先规划和控制的缺点,即如果研究对象过于稀少,就会找不到相应对象或无法向外扩展;如果对象数量较大,就会衍化为普查。

 受访者驱动抽样利用社会网络的理论与方法,为研究”隐藏人口”提供了一种可推论总体结构的抽样方法。其具体做法为,第一步,任意找到几个要研究的目标群体的成员作为“种子”(seeds),对种子调查后,给予一定的物质奖励,然后给每个“种子”发放若干张首轮“调查招募券”,要求“种子”把这些招募券分发给自己认识的目标群体成员;第二步,确认持首轮招募券来接受调查的人属于目标群体成员后,对其进行调查,再度让他们成为“种子”,给予同样数量的次轮“招募券”,发展新一轮被招募人加入调查。不断重复以上步骤,进行下一轮调查,直到达到研究设计所确定的样本总数为止。受访者驱动抽样在实际操作具有独特优势,它可以吸引所有符合条件的目标群体成员主动来接受调查,由于物质激励和人际网络的亲和性,也基本上不会遇到拒访的问题,从而使调查组织和实施也更加方便。由于马尔可夫过程的快速收敛特性,一般只需经过几轮调查就可达到样本特征的均衡态,因此调查效率也较高。但受访者驱动抽样同时也存在局限性,即它不能直接估计目标群体的总体实际规模,不适用于一些成员间彼此隔绝的群体(如逃税者群体),而且可能导致研究伦理问题,如发放激励、收集个人信息等。

 讲座的最后,赵延东教授对同学们提出的问题进行了耐心的解答,并在回答中与同学们分享了自己的研究经历。李炜教授对赵老师的讲座进行了总结:讲座信息量大,内容详实,详细介绍了二次抽样、捕获-再捕获抽样、网络抽样/适应性抽样三种无样框抽样方式的预设、定义、原理、操作方式、执行方式,并配以独到的研究事例展示了每种抽样方式的优长和限度。

 整场讲座学术性强,开阔了同学们的学术视野,启发了学术思维,加强了研究方法训练,为今后的学术研究打下了坚实的研究基础。