较较真儿,扒一扒《月收入不足千元,这6亿人都在哪》这篇文章

文/老C

1、

5月30日,在总理记者招待会后,我写了《关于总理说的:“6亿人月收入也就是1000元。”》这篇文章。用我自己的理解,解释了一下6亿人月收入1000元的问题。

我的观点是总理说的”6亿人月均收入也就是1000元的意思,应该是中国收入最低的6亿中低收入人口的平均收入,大概处于1000元左右的水平。” 而不是有6亿人的收入都低于1000元。

6月3日,财新杂志的观点(Opinion) 专栏刊发了由北京师范大学中国收入分配研究院撰写的《月收入不足千元,这6亿人都在哪》这篇文章(以下简称”该文章“)。

当时看完后,我觉得里面数据比较古怪,当时挑出了文章中的一个明显错误。文章中引用的美国的人均可支配收入(税后)的数字,比人均税前收入还高

微博上随便说了一句,感觉这篇文章硬伤比较多,就没再理会。

但随后,这篇文章在网络舆论场上开始流传。《财新》在6月6日再次登了一篇记者撰写的文章,引用了这个数据。

网上也有质疑的文章,但大多数都集中在家庭人均月收入超过2万,只有70万人这个数字上,觉得不可能这么少。

有朋友也在网上问我,说这个文章的结论,和你说的不一样呀。里面说月收入低于1090元的人就有6亿之多。

那我今天就较较真儿,虽然对方是国字头的“中国收入分配研究院”,是国内研究收入分配最权威的机构,而我是个业余写文章的自媒体。

2、

中国收入分配研究院的这篇文章的数据来源语焉不详,只是说了一句“北京师范大学收入分配研究院课题组分层线性随机抽取了7万个代表性样本”,对这7万个样本的抽取时间,抽取方法都没有详细表述。

文章多次提到国家统计局,给读者一个印象,就是数据来源和国家统计局有关,但国家统计局的官方数据和该文章的数据有明显不一致的地方。

财新6月6日的文章,也引用了国家统计局的官方数据。

统计局的数据,按全国居民五等份收入分组,低收入组人均可支配收入7380元,中间偏下收入组人均可支配收入15777元,中间收入组人均可支配收入25035元,中间偏上收入组人均可支配收入39230元,高收入组人均可支配收入76401元。

财新文章的数据没错,但结论错了。中等偏下户的月均收入1315元,而不是中等偏下户所有人的月均收入都低于1315元,这是一个基本概念性错误。

假设中等偏下户这20%的群体的月收入中位数和月收入均值一致,应该是有30%的人口,也就是4.2亿人的收入低于1315元,而不是5.6亿人低于1315元。(因为收入最高的群体会拉高均值,整体人口的收入均值肯定大于中位数。但是中等偏下的这20%群体中没有超高收入人口,可以假设中位数和均值相差不大)

中等偏下户和中间收入户之间的分界,应该是在(1315+2086)/2 = 1700元左右。按国家统计局的官方数据,应该是大约5.6亿人的收入低于1700元,这5.6亿人的收入均值应该在(1315+615) / 2 = 965元左右。

这个结论,和我之前文章中写的,中国最低收入的6亿人,收入均值在1000元左右。是一致的。

3、

收入研究院的文章数据,和国家统计局的数据,另一个明显不一致的就是收入中位数

该文章的数据中,1500元收入以下的人口总百分比是 0.39 + 15.42 + 14.43 + 8.86 + 3.75 + 0.37 + 13.30 = 56.52%。1500元以上的人口总百分比是 12.13 + 14.81 + 11.21 + 4.52 + 0.56 + 0.05 = 43.48%。

可支配收入中位数,是排位在50%的人的收入。按这个数据,肯定是低于1500元/月的。大致估算。1100-1500元收入有13.30%。假设均值和中位数一致,大概有6.65%的人大于1300元。这么估算,大概派位在50%的人,月收入应该是1300元左右,年收入 1300 * 12 = 15600元。

然而,国家统计局公布的2019年,全国可支配收入中位数是 26253元,月均 2188元。比该文章的1300元左右,高出了 59%。

这么大的差异,很难用误差解释。

要么国家统计局的数字是错的,要么收入分配研究院的数字是错的。

4、

做统计有句话,rubbish in, rubbish out。发现有奇怪的地方,首先看数据来源。百度一下中国收入分配研究院 和 7万个样本两个关键词,基本上找出的都是这篇文章。

于是,我就去了中国收入分配研究院的官网。

官网首页中就有,中国家庭收入调查(CHIP),在30年内做了5轮调查。

在进入CHIP的首页,里面写着,为了追踪中国收入分配的动态情况,中国家庭收入调查(CHIP)已经相继在1989年、1996年、2003年、2008年和2014年进行了五次入户调查。它们分别收集了1988、1995、2002、2007和2013年的收支信息,以及其他家庭和个人信息,分别编号为CHIP1988、CHIP1995、CHIP2002、CHIP2007和CHIP2013。

Wait a second, 里面写的最后一轮调查是在2014年进行的,收集了2013年的收支信息。

点击进入CHIP 2013,里面是这么写的,CHIP2013的样本来自国家统计局2013年城乡一体化常规住户调查大样本库。后者覆盖全部31个省(市、自治区)的16万户居民。CHIP项目组按照东、中、西分层,根据系统抽样方法抽取得到CHIP样本。样本覆盖了从15个省份126城市234个县区抽选出的18948个住户样本和64777个个体样本,其中包括7175户城镇住户样本、11013户农村住户样本和760户外来务工住户样本。

64777个个体样本,这个数字和7万个样本,似乎很接近了。

在整个中国收入研究院的网站,我没有找到任何2014年之后新的关于7万个样本调查的资料。

5、

OK。该文章7万个样本,和CHIP2013 64777个样本之间有没有关系呢?

那让我们回头看看2013年的数据。

2013年,全国人均可支配收入18311元,但没有给出可支配收入中位数数据,只给了城镇和农村分开的中位数数据。

农村人均比中位数高12.5%。城镇人均比中位数高 11.4%。按这个估计,全国的可支配收入的中位数大概应该在 16000元-16200元之间。每个月1330-1350元。

这个数据,和我根据收入研究院的这篇文章的数据,推算出了可支配收入中位数在1300元左右,是非常一致的!

因此,我有理由怀疑,北京师范大学中国收入分配研究院,这个中国收入分配领域研究的权威机构,在2020年6月撰写,财新杂志刊发的《月收入不足千元,这6亿人都在哪》文章,使用的是CHIP2013的64777个样本的数据。根本不是像文章中表格中写的2019年的数据。

所谓2019年的数据,只是用了2019年总人口14亿的数字。里面的收入数据和收入分布都是2014年收集的2013年的数据!

2013年,只有70万人,家庭人均月收入大于2万,有6亿人家庭人均月收入低于1090元,这个很合理,毕竟是6-7年之前的事情了。

但现在已经是2020年了。

不是不可以用2013年的数据,但如果真的用了2013年的数据是否应该说明一下!而不应该在表格里写,本表是2019年数据。

CHIP2013,是目前我国对外公布的,最完整的收入调查数据。

使用这个数据无可厚非。

但是,如果用了CHIP2013的数据,应该说明,这个数据是2014年收集的2013年的收入数据,并非最新的2019年的数据。

特别是做为优秀的权威媒体,做为国家级的权威的研究机构,在如何披露使用数据上应该更为小心谨慎。

在这篇文章已经广泛传播的今天,我认为《财新》和文章的作者,有责任站出来澄清一下,用的数据到底是2019年的,还是2013年的?

如果确实是2019年的数据,能否说明一下数据来源和获取方法。解释一下为什么和统计局的官方数据,有如此大的差异?到底谁错了?

6、

无论是,我的结论 - 收入最低的6亿人,人均月收入1000元,还是该文章的结论 - 有6亿人月收入不到1000元。其实都反映了我国还是一个发展中国家的现实,我们还需要走非常漫长的路。

东西差距,贫富差距,城乡差距,都非常大。这些绝大部分人都承认。

然而,事实就是事实。不应该为了立场曲解事实。

自媒体为了流量,不够严谨,时而夸大,时而瞎写,也就罢了。

但做学术研究,特别是国家的权威学术机构,还是应该对自己有更高的要求。7万个样本的来龙去脉,有责任和大家说清楚。如果真的是2013年的数据,写成2019年是绝对不应该的。

做为严肃媒体,也应该给自己提更高的要求。除了对数据来源应该更多的验证。基本逻辑错误不能犯。一群人的月均收入1315元,和这群人的月收入低于1315元,根本不是一回事儿。

今天就写到这里吧。

估计这篇文章又会得罪不少朋友了。文章对事不对人,先道个歉,多多见谅。

打开APP阅读更多精彩内容