「众人参与」人几多?—估算公共事件参与人数

2011-11-15



  2011年有21万人在香港「七一」游行示威,还是只有6万人?「六四」维园烛光晚会有6万人抑或是15万人?一万名学生在伦敦街头抗议学费上涨?100万人聚集观赏英国皇室婚礼? 果真如此吗?笔者的忠告是:估算公共事件的参与人数是一项非常困难的工作,不要轻信媒体告诉你的。至少二十年前人类已经开始关注如何估算一簇人群到底包括多少人。《圣经》里写道:「那群吃东西的人除了妇女儿童之外,还包括大约五千男子。」(马太福音 14:21)政治活动和公关活动长期以来都喜欢宣称参与其活动的人数多达若干,但是不同机构或组织宣布出的数据常常大相迳庭。原因有二:其一,估算人数本来就非常困难;其二,有些人更是有意想要得出一个错误的数据。

  估计人群大致可以分为两种:一种是静态地聚集在某些区域,另一种是动态地通过某些游行线路。六四维园烛光晚会是第一种,七一游行是第二种。参与人数至关重要,因为人们经常根据参与人数的多少判断一项活动的成功与否。如果参与者众多,该项运动就更加容易争取其他人的加入,当权者也就更加难以拒绝他们的诉求。大型游行示威之后,不同方面估算出的参与人数时常迥异。有的方面会夸大人数来为活动护航,有的方面则会低估人数来显示活动不得人心。媒体大多会取个中间值来报导,但是也有些媒体会根据自身的政治立场选择报导某些极端的数据。

外国的经验

  1995年10月在华盛顿有一场号称「百万人大游行」的社会运动。由于这个称号,究竟多少人参与了这场游行成为衡量活动成功与否的重要指标。游行组织者估计参与人数介于150万到200万之间,美国公园警察则估算人数为40万。结果国家公园管理处被告上了法庭。正当双方辩论如火如荼时,波士顿大学遥控感应中心给出了一个折中的估算结果:87万人,误差范围大约25%。不过公园管理处并没有收回他们的估算数值,而且他们的估算得到了一些统计学家的支持。自这场关于「百万人大游行」参与人数的争论之后,美国公园警察不曾再就游行人数发出官方估算。

  即使在没有政治诉求的情况下,人数估算依然可以引起很大分歧。例如最近的英国皇室婚礼的参与人数被估计为介于50万至100万不等。奥巴马就职典礼的参与人数,一些人综合卫星图片、气球上拍到的照片,以及当时在场人士拍到的照片推算出的结果是180万人。有趣的是,其他人基于同样的照片估算出的数值却是约100万人。

静态人群估算 — 「六四」维园烛光晚会

  估算一个静态人群的人数可以很简单:将一个区域面积乘以该区域 的人口密度即可。这个方法最早由Jacobs在1967年提出,用以估算伯克利骚乱的参与人数。当时学生聚集的广场被划分成若干方格,只要数出方格的数量并估算出每个方格里平均有多少学生,就可轻易得出总人数。他估算人群密度的法则到今天仍常常被使用:以站立的情况估计, 一个疏松人群的密度大约是每平方米有一个人,一个拥挤人群的密度大约是每平方米两个人,一个极端拥挤人群的密度则大约是每平方米4个人。若要坐下来,相信每平方米能容纳的人会更少。

  仅凭目测我们就可以做出快速的估算。想做好一点的话,你可以在现场抽取一个代表性方格作为样本来点算。或者更好的话,根据现场的照片抽取样本作出点算。通过这样的取样可以作出估算,也可以算出标准误差。拍照是估算人群密度和聚集面积的最好基础。拍照的方法可以有很多。如果重视图片的质量,可以调整像素;或者也可以调节图片的其他特性,例如纹理、边缘点、形状或者人头点算。

  根据一张好的图片,我们可以获得一个人群聚集区域A的估计面积和标准误差,以及人群密度D(见框一)。

  运算结果显示,在目前的科技水平基础上,一张中等尺寸的图片带来的相对标准误差(RSE),

大约在10%左右。可能带来二倍误差的兼容性估算(英国皇室婚礼就是一例),其相对标准误差为大约20%,这也是误差范围的上限。图片可以帮助我们确定聚集区域的防御边界,再加上平均密度的合理边界,我们就可以推算出样本量的边界。

  有了这些基础,就比较容易判断在一组差异巨大的估算结果里,哪个更接近事实, 表一列出2004至2011年大会和警方的估算,两者相差有二至三倍之多。最近维园纪念六四事件22周年的烛光集会,关于集会的参与人数,路透社、BBC等国际传媒都引述了集会主办方估算的数据:15万人。而警方估算的数据是7万7千人。地图显示这次集会地点的面积,合理的数据是A=42 000平方米。根据当晚集会现场的密集程度,我们估算人群密度略低于每平方米2人,最终的估算结果接近警方的数据。如果想得出主办方所估算的15万人,就意味着现场极端拥挤,人群密度接近每平方米4人。可是根据当晚的人群聚集情况,事实并非如此。

动态人群估算 — 「七一」游行示威

  动态游行时人群密度偏低并且易变,也增加了估算困难。动态的人群会随着时间和地点发生变化:一个游行队伍的头部通常较为有组织,尾部却常常趋于松散,而当队伍领袖要发表演讲时,参与人群又霎时变得非常集中。因此对动态人群的估算比对静态人群的估算更加不确定。例如2007年2月在伦敦发生的停战大游行,主办方估计有6万人参与,警方则估计为1万人,双方差异足足六倍。

  表二列出不同团体对历届「七一」游行的人数估算。每年参与人数的准确性都一直都引起诸多争论,但遗憾的是各方从没有深入的讨论,各自说话。其实估算类似这种动态游行人数的难度在于,人们随时都有可能加入或者离开游行队伍,不确定性非常大。统计工作者通常会在游行队伍会经过的主要地点设立观测站,由观察员在选定的时间段点算通过该站点的人数。游行示威一般都会有一个焦点地段,通常这个点就设在最后的终点。但是,焦点地段也是最难点算人数的。通常情况下,这个焦点会发生在一个面积较大的区域,例如一个广场,这时参与人群容易扩张,移动缓慢,并且波动很大。因此我们必须设置多个观测站。基于这种方法,参与某次游行的人数N就等于在特定游行时段通过特定的游行线路的总人数。以下我们将介绍两种常用的定点观测方法,每种方法都可以估算出参与人数N和标准误差。

单点点算与电话跟进

  这种方法就是在距离焦点地段较近的位置选取观测点A,点算通过这个位置的游行人数。这样我们就可以得出一个初步的估算。可是即使我们在这个时候的点算极尽精确,这个结果仍存在问题:有些参与者可能在到达这个观测点之前就已经离开游行队伍,或者有些参与者在这个观测点之后才加入队伍。一种补救的办法是在游行之后在全部人口里随机抽取一些样本进行电话调查。这就意味着我们首先要在抽样样本里找到参与游行的人士,然后要询问他们是否有经过我们的观测点,A。

  即使一个游行示威规模非常大,其参与者往往也只是全部人口中的小部分。在全部人口里进行抽样电话调查就意味着我们可能要打非常非常多的电话才能找到一定的参与者。而电话调查还有其他问题:例如抽取的样本可能不具有代表性,可能某些家庭或者集群被集体纳入样本,很多人可能不愿意回应查询,即使回应了,其真实性也值得怀疑,等等。此外,在一些高压政治环境里,例如「阿拉伯之春」所涵盖的突尼西亚、埃及等国的游行示威,其参与者很可能因为害怕受到迫害,而不愿意在电话里向陌生人承认他们参与了相关游行。

  不过无论如何,如果具备可行性的话,电话调查可以辅助地面点算,让我们得出一个估算值和标准误差。这也是香港大学民调中心所采取的方法,但香港大学的民调方法即时没有当天的到达这个观测点之前就已经离开游行队伍的估算,便需要借用旧年用电话访问中所搜集的数据作为今年的运算基础。这是其中一个限制和不准确的原因。但值得一提,这个估计通常会在警方和主办单位之间,但这不代表一定是准确的。根据笔者理解,警方的估算是在游行路线设立三个观察点作出点算的。

双点复查与定点调查

  如果不想使用电话调查,笔者与多位统计的学者提议另一种方法,是在游行线路中选择两个点A和B,而非一个点,作为观测点。这两个点不宜太靠近,其中一个点应邻近终点。当然这种方法也不是完美的:有的参与者可能只经过其中的一个点,或者有的人两个点都没有经过。这种方法增加了点算的花费,也增加了下面我们要讲到的定点问卷调查的花费,不过却省下了电话调查在时间和物资上的耗费,也避免了电话调查带来的偏差。这种方法的优势在于高效、及时。

  将电话调查和双点复查两种方法算出的标准误差进行对比,我们可以看到双点复查的方法可以提供一个较为精准的数据。此外,双点复查的数据更为及时,在点算当天就可算出。

  表二列出2003年至2011年的结果,游行主办方所估算的数据一直都比警方的数据高出二到三倍。但值得一提,因04年主办单位的计算出现明显[植树问题]错误之后,当年仍坚持有53万人参加。在05年,主办单位使用另外一种数算方法,结果则出乎意外地相似,无论是警方、港大民调、笔者和主办单位都是两万人左右。在05年,笔者、港大民调与及警方都没有改变统计人数的方法。但很可惜,主办单位并没有认真正视这个问题。06年之后,故态复萌,参与人数再回复二、三倍之分歧现象。

结论

  每年「六四」晚会和「七一」游行的人数总是新闻一则,但很可惜地,一些资深的传媒人士对处理主办单位的数目都是人格分裂,明知数目不对,还是要用头条报导,在网上更充斥一些不求甚解的言论,难道传媒工作者的求平持真的态度在这些地方便会自动消失吗?

  我们坚信一个尽量精准的估算比一个「公关化妆」式的估算能够更好地服务公众。笔者建议所有参与计算者都要清楚交代数据,而媒体则有责任评核资料的可信性。如此可避免一些不负责任的估算,也可以为日后比较不同的估算结果提供基础。如果某项游行被视为吻合公众利益的,那么夸大其参与人数就会被视为善意的谎言,而低估人数则会被视为政治上居心叵测。我们应该以怀疑警惕的态度看待这些估算结果。


后记:本文章是基于Watson and Yip (2011) 在统计权威期刊Significance 所发表的一篇文章翻译而成。
下载
相关文章 / Related Articles

香港学生反修例运动中网络关系解体的实证调查

宋昭勋、吴静、胡欣立
2021-01-11

警队与社交媒体

黄子健、马伟杰
2017-05-08

2016年度新闻与社交媒体使用行为调查

马伟杰 周展梁 叶诗颖 伍淑冰 梁俊仁
2016-09-21