工作动态 | 流动人口 | 理论研究 | 人口博览 | 专题报道 | 生殖健康 | 视频新闻 | 人口论坛
 
谈谈中国人口数据的可靠性
甘肃省人口和计划生育委员会 www.gsjsw.gov.cn 有位读者读过此文  2006-2-18 18:00:54   来源:


    秋 实

   [新观察]·文库版·大饥荒档案 www.xgc2000.com 转载时请注明作(译)者及出处在大饥荒之争中,经常有网友对我国人口数据的可靠性提出疑问。大多数人是出于对实际情况的不了解。也有些人,出于对基本概念的误解。

   比如,有人说,我国人口统计的误差是10%,三千万人误差一下就出来了,跟零没有差别。于是,所谓非正常死亡两三千万的说法,统计上没什么意义。他们显然没整明白整体(比如若干个随机变量之和)的误差,与其构成部分(比如其中单个变量)的误差之间关系。举个简单反例:五六十年代之交,我国少数民族的总人数也不过三千多万,难道也是误差一下出来的,跟零没什么区别吗?建议提出这种说法的朋友,自修一下概率统计入门知识。

   其实,我国三项主要的人口数据--人口普查、人口抽查和户籍登记--中,除户籍登记数据之外,其它数据的误差都没有上面网友猜测的那么大。俺这里简单地介绍一下三大类人口数据的误差范围,同时着重谈一谈户籍死亡和出生数据的漏报情形,这是人口专家在估算大饥荒非正常死亡人数时,都特别给予注意的一大问题。

   一 人口普查数据

   人口普查点算整个群体,不是抽样,无所谓抽样误差。但在点算时会出现多报或漏报的问题。这就需要抽取一定比例人口进行复查,以确定其误差范围。下面是我国前三次人口普查的复查结果:

   1953年普查:复查覆盖地区占直接调查人口9%, 结果发现,全国总人口数重复登记1.39‰,漏报2.55‰,净漏报1.16‰,毛误差3.94‰。误差低于千分之四。[1]

   1964年普查:全部大陆人口系直接调查。复查覆盖地区占人口5.3%。总人口数重复登记0.38‰,漏报0.39‰,净漏报0.01‰,毛误差0.77‰。误差低于千分之一。

   1982年普查:这次普查采用国际通用方法,进行了严格质量控制。复查结果如下:

   --总人数重复登记0.71‰,漏报0.56‰,净重报0.15‰,毛误差1.27‰。误差约为千分之一点二。

   --出生人数重登率0.78‰,漏报2.61‰,净漏报1.83‰,毛误差3.39‰。误差低于千分之四。注意此处的误差是以出生人口为基数计算的。

   --死亡人数重登率2.64‰,漏报7.04‰,净漏报4.40‰,毛误差9.68‰。误差约为千分之十。注意此处的误差是以死亡人口为基数计算的。

   由此可见,人口普查数据的精度是相当高的。这就是为什么大家总是尽可能地以人口普查数据作为基础,去校验其他人口数据。

   二 抽样调查数据

   人口抽样调查的误差范围,在设计调查方案时予以控制。以下谈到的误差范围,置信概率均为95%。

   1、一年一度的千分之零点五抽样的人口变动情况调查,人口出生率的允许误差范围正负5‰。

   国家统计局公布的一九八二年后每年的出生率和死亡率,便来自于此项调查。

   2、生育率调查,包括1982年的千分之一抽样的妇女婚姻生育史调查,以及1985年的千分之二抽样的妇女生育节育调查等。后者的出生率允许误差在正负0.3‰以内。

   蒋正华、BANISTER、ASHTON等人口专家用于校正中国户籍人口登记数据的生育率历史资料,便来自于1982年的调查。

   3、1987年的百分之一人口抽样调查,这是一次微型人口普查,半年出生率允许误差正负0.11‰,半年死亡率允许误差正负0.06‰。

   此外还有其它一些抽样调查,此处不一一列出。从以上例子看,抽样调查的允许误差都控制在极低水平。当然,这些都是设计误差,要求调查者按规定进行抽样与询问,才能达到。至于调查者是否人为引入了系统误差,在发现可靠的证明材料之前,俺不想妄加猜测。从现有资料看,抽样调查数据与人口普查数据吻合度相当高,不象是有可观系统误差的样子。

   三 户籍登记数据

   户籍登记的人口总数、死亡人数、出生人数等数据,不是由专门的统计调查来的,而是行政部门负责管理的。其好处是解放以来年年都有,坏处就是户籍登记与人们的权利义务联系过于密切,登记数字的可靠性,直接为人们的切身利益所左右,可靠性远远不及前两类数据。下面根据现有的资料,谈一谈户籍登记的人口总数、出生数以及死亡人数的可能误差。

   1、总人口

   1964年整顿户口和人口普查本身,共查出多报人口1172万,漏报人口357万人。按1964年普查人口计算,多报率16‰,漏报率5‰,净多报11‰,毛误差21‰。

   1982年整顿户口与人口普查,共查出多报人口622万,漏报人口899万人。多报率6‰,漏报率9‰,净漏报3‰,毛误差15‰。

   2、死亡率:

   1982年人口普查得到的1981年死亡率为6.60‰,而这年户籍登记的死亡率却为6.11‰,登记完备率约为4%。

   不过,1982年因有人口普查,情况较为特殊。比较一下其它年份户籍登记的死亡率与人口变动抽样调查得到的死亡率,就可以发现,除1982年外,八十年代前期的死亡漏报相当严重,户籍登记的完备率只有85-90%左右,如下表所示:

   表一、1982-85年死亡率漏报情况

   --------------------------------------------------

    年份 户口登记‰  抽样调查‰ 死亡漏报率(%)

   --------------------------------------------------

     1982   6.11     6.36     3.93

     1983   6.09     6.60     8.42

     1984   5.93     6.86     13.56

     1985   5.93     6.69     12.86

    --------------------------------------------------

   资料来源:《中国统计年鉴1988》

   转引自《中国人口--总论》(袁永熙主编,中国财政经济出版社,1991)第620页

   五、六十年代,我国的户籍登记中漏报死亡的情况,同样十分严重。

   1964年人口普查时,对该年上半年人口出生、死亡、迁入、迁出四个项目进行了核对性检查。 普查得到的1964年上半年死亡率为7‰。假如上下两个半年死亡人数相当,推算全年死亡率应为14‰左右。而户籍登记的死亡率,仅有11.5‰,比普查推算数低18%!由此可见当时漏报死亡的严重性。

   至于1964年以前的情况,我们可以从两次人口普查的数据以及当时所作的死亡情况调查,大致看出漏报死亡的严重情形。

   根据资料,1964年普查人口69458万人中,年满11周岁以上的人口占69%,约为48105万,此即1953年的58260万人口中尚存的人数。因此,不计算五三年到六四年之间出生后又死亡的人数,此期间也至少死亡10155万人。而同期户籍登记的死亡人口仅仅只有9500万人! 假如这个期间有大量死亡是出生后没活几岁的儿童,我们就可以肯定,户籍登记的死亡人数,是大大低估了的。

   那么,儿童死亡情形究竟如何呢?我国分别在1957年和1963年,也即这个期间死亡率最低的两个年份,进行了两次大规模的死亡情况调查。根据这些调查,死亡人口中很多是少年儿童(表三)。1957年和1963年,0-4岁死亡人数占死亡人口的比重分别为42.3%和46.2%。

   1957年,死亡人口的一半,没有活到18岁,1963年更惨,一半人没有活到10岁!

   用以上数据,不难对户籍死亡登记的漏报情形,作出粗略的估算。根据人口普查资料,1953年4岁以上,到1964年已经死亡的人口,大约7900万人,这是该期间死亡的4岁以上人口的下限。按0-4岁死亡人口占死亡人口40%算,此期间0-4岁死亡人口至少有7900 * 40% / 60% = 5366万人,约相当于登记死亡人数的55%。 两项合计,死亡人数13000万人,户籍登记的死亡漏报率为28%左右。

   注意以上估计未使用任何出生资料,却与蒋正华教授等根据生育调查资料估算的死亡漏报率相当一致。根据蒋的估算,1954-64年间大部分年份,漏报率都在23%到40%之间。事实上,中国五六十年代漏报死亡极其严重,早已是绝大多数人口专家的共识。

   表二、中国死亡人口比重(%)

   -----------------------------------------------------

   年份  0-4岁(%)  50岁+(%)   死亡人口年龄中位数(岁)

   ----------------------------------------------------

    1957   42.3     35.9        17.6

    1963   46.1     34.8         9.6

    1975   14.3     67.3        63.2

    1981   15.9     64.7        62.0

    1987   14.4     69.1        64.5

    --------------------------------------------------

   资料来源:《中国人口年鉴1985》,《中国1%人口抽样调查资料》

   转引自《中国人口--总论》(袁永熙主编,中国财政经济出版社,1991)第164页

   从表二还可以看出,七十年代以后,儿童死亡情形有了翻天覆地的改变。 0-4岁死亡的比重,从40%以上,下降到16%以下;死亡年龄中位数则从十岁十几岁,上升到六十多岁。一些生长在七、八十年代的网友,不了解五、六十年代之事,看到人口专家估算的死亡人口中包括了大量儿童死亡,觉得无法理解,又不肯去了解历史,动辄就把这些估算斥之为“疯狂”“荒谬”。其实,真正“疯狂”而“荒谬”的,正是这些人不懂装懂而又不肯虚心了解事实的偏执态度。

   3、出生率

   1982年人口普查得到的1981年出生率为20.91‰, 按误差率计算,其范围20.89-20.96‰之间。但这年户籍登记的出生率却为18.53‰,登记完备率只有88.6%。

   出生率的情形与死亡率相似,户籍数据也有可观的漏报。而且在八十年代,出生率漏报情形,远比死亡率的漏报来得严重。除1982年以外,登记完备率仅有80%左右(表三)。

   表三、1982-85出生漏报情况

   --------------------------------------------------

   年份 户口登记‰  抽样调查‰ 出生漏报率(%)

   --------------------------------------------------

     1982   18.53     21.09     12.14

     1983   15.11     18.22     17.08

     1984   13.85     17.50     20.85

     1985   13.63     17.80     23.48

    --------------------------------------------------

   资料来源:《中国统计年鉴1988》

   转引自《中国人口--总论》(袁永熙主编,中国财政经济出版社,1991)第620页

   由此表可见,户籍出生率统计的可靠性同样十分可疑。国家统计局自1982年起便不再使用户籍出生率和死亡率,正式公布的数字一律以抽样调查数字为准。

   五十年代,我国的户籍登记制度刚刚建立不久,很多新出生人口,都未及时申报登记。再加上婴儿死亡率较高,很多出生后不久就死亡的孩子,根本就没有登记出生,也没有登记死亡。蒋正华根据人口普查数据和生育率回顾调查数据,用估计参数模型的方法计算出生率,发现五十年代到六十年代初,出生率漏报程度同样达到10%左右,1962年更达到17%。

   此後漏报程度便大幅降低。其原因,一是户籍登记制度更为健全;二是越来越多的基本消费品按人头分配,漏报出生人口带来的利益损失扩大了;三是婴儿死亡率大幅降低。低水平的漏报率一直维持到七十年代。随着计划生育政策的推行日趋严厉,出生漏报率再次于七十年代后期升到10%以上。这里有瞒报出生因素。更有不少地区,将出生人口假报为迁入人口,这样既降低了出生率,又不损害按人头分配票证的利益。

   ASHTON等人估计的1953-1964年户口登记出生的完备率,以及其他人口专家的估算数,与蒋正华的估算相差不大,都在80-90%之间。这些估算,与现有的人口资料以及我国有关政策变化的时间序列,都是相当吻合的。

   四、小结

   我国人口普查数据和抽查数据,可靠性都是相当高的。这一点,打从我国于1983年首次完整公布前三次人口普查数据开始,就得到国内外主要人口专家的多方检验确认,基本上已经成为人口学界的共识。问题比较大的是户籍出生和死亡数据,都存在比较大的漏报,其中又以死亡人数的漏报,尤为严重。这就是为什么根据户籍上报的死亡人数算出的1500万左右非正常死亡,通常只被被绝大多数人口专家视为下限的缘故。

   注释

   [1] 在1953年人口普查中,除直接调查的人口外,另有占总人口1.44%的人口为间接估算,主要是西藏昌都等极少数边远少数民族地区。因其占比重小,其误差对全国总人口误差影响很小。

   (2000年5月6日贴于[新观察/xgc2000.com],2000年6月5日修改)

   

相关新闻/图片:

请注意:
· 遵守国家有关法律、法规,尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任。
· 甘肃网人口网管理笔名和留言的一切权利。