作者:芦哲、张佳炜(芦哲 系东吴证券首席经济学家、中国首席经济学家论坛理事)
核心观点
核心观点:2023年以来,美国非农就业数据出现频繁、大幅的“修正”,引发市场对于美国就业数据真实性的质疑。我们从非农数据修正的原理展开,发现数据的修正更多源自调查问卷反馈的滞后、不同调查统计的口径分歧、估算模型的失真等问题,而非刻意“粉饰太平”,但也同时反映了美国就业市场存在的小企业经营恶化、非法移民对就业的贡献等现象。2月7日公布1月非农就业数据时,BLS将就2024年全年数据进行修正,我们预计此次数据的下修幅度可能是很大的、同时失业率存在上修风险,届时需要关注数据修正给市场带来的负面冲击。
月度修正:每月BLS公布美国非农就业数据时,会同时修正前两个月的数据,这一频繁的数据修正与其编制方法密切相关,即企业存在延迟反馈问卷的现象。疫情危机后,CES企业调查的初次反馈率持续下降,同时非农的下修变得愈发频繁。这一现象背后的真相可能是:小型企业的经营状况开始变差,反馈问卷也更加怠慢,而那些更糟糕的延迟反馈问卷造成了数据的下修。因此,近期非农频繁的下修虽说是一个“技术问题”,但也侧面反映了在美国经济下行周期的背景下,小型企业经营环境恶化的现实。
基于失业保险的校准。BLS在每年2月会对上一年全年数据做出全面的“年度校准”,其内容包括基于失业保险数据、企业生死模型、人口普查数据进行的校准。其中,为了弥补CES调查样本的有限性问题,BLS根据基于企业失业保险记录的就业和工资季度普查数据(QCEW),在次年2月对非农就业进行年度校准。23H2以来,QCEW就业与CES非农就业之间的分歧不断加大,这或与不同问卷对非法移民的统计有关:QCEW基于失业保险数据,难以捕捉到非法移民,且不存在CES调查对兼职就业的重复统计问题,而这正是疫情后美国新增就业的重要贡献之一。因此,2024年8月BLS基于QCEW对2024年3月数据初步校准的大幅下修可能是“矫枉过正”的,即忽略了非法移民的就业。
基于生死模型的校准。企业成立与倒闭对就业净增长存在影响,但其在就业统计中存在滞后性,对此,BLS引入企业净出生-死亡模型(NBD),对这一效应进行估算。每年2月,BLS同样会对上年NBD的预测数据进行校准。2024年2月BLS的校准显示,截至2023年3月,NBD模型累计高估了330万的总就业。这一现象与模型假设有很大关系:NBD模型假定因企业成立与倒闭带来的净就业增长趋势相对稳定,而疫情危机以来,美国新注册企业数目增速大幅加快。随着近期新注册企业数目的降低,NBD模型给非农带来的高估也面临着更大的下修风险。
基于人口普查的校准。除去CES企业调查,BLS也会在每年2月对家庭调查(CPS)数据进行校准。CPS的年度校准主要来自人口控制方法,该方法基于最新的人口普查、净移民等数据进行校准,并对失业率等数据产生影响。2024年12月19日,人口普查局更新的统计数据上修了美国移民人口,这将体现在最新年度调整中对CPS数据进行的调整中。
2024年度大校准前瞻。2月7日,美国劳工部将公布1月非农数据,并对2024年数据做年度校准。我们认为此次数据需要尤其关注以下两点:①2024年的新增非农就业是否大幅下修,幅度是多少?②2024年的失业率是否上调?对于非农就业,我们通过对比不同非农问卷口径下2024年的美国劳务市场新增就业,预计截至2024年12月,美国非农总就业人数或存在93-154万的下修,这较2024年3月81.8万的初步校准有所增加。对于失业率,由于本次人口普查局的更新统计主要将南部边境的移民数据纳入统计,而这一群体的失业率远高于均值,因此纳入新的非法移民数据意味着2024年美国失业率可能将迎来上调。
风险提示:模型风险;统计风险;样本风险。
内容目录
1. 月度的小修正
2. 年度的大校准
2.1. 基于失业保险的校准
2.2. 基于生死模型的校准
2.3. 基于人口普查的校准
3. 2024年度大校准前瞻
4. 风险提示
2023年以来,市场关于美国非农数据“频繁修正”的讨论持续升温,国内外很多机构开始质疑美国非农就业数据的真实性。例如,2023-24年公布的23期非农数据中,有16期数据在首次修正中出现了下修,占比70%,而这一比例在1964年以来的721期非农中为46%。再例如,2024年8月,BLS将2024年3月的非农总就业人数进行修正,修正后的新增非农较此前减少了81.8万人,是1979年有该修正以来的第二大下修幅度。Powell在9月FOMC发布会上表示,此次修正暗示美国就业数据可能被人为调高且将被下调(…suggests that the payroll report numbers that we're getting may be artificially high and will be revised down)。那么,美国非农就业数据近期频繁修正的原因是什么?后续是否还会有较大幅度的修正,给市场带来一个又一个的“惊喜”?
本报告将首先就美国非农数据修正的原理展开分析,接着再论证非农修正只是因为“技术原因”还是拜登政府在背后“粉饰太平”。最后,2025年2月7日公布1月非农就业数据时,BLS将就2024年全年数据进行修正,我们将分析论证这次数据的下修幅度可能是很大的,届时需要关注数据修正给市场带来的负面冲击。
1. 月度的小修正
美国非农数据的修正可大致分为两类:①每月非农数据公布时对前两个月数据进行的修正,即月度的小修正(revision);②每年2月对上一年全年数据做出的全面校准,即年度的大校准(benchmarking)。每年8月,BLS还会对当年3月的数据做一次初步校准。市场平时所讨论的非农数据的频繁下修,多为月度的小修正。
事实上,每次公布非农数据时,前两个月的非农数据都会被修正,这也是为何市场经常参考“三个月平均”新增非农数据的一个原因。而月度非农之所以会出现频繁的修正,其实和美国非农数据的编制方法有密切关联。从编制原理上看,这是一个纯粹由“技术问题”导致的修正。
月度公布的非农数据来自美国劳工部统计司(BLS)企业问卷(Establishment Survey)获取的当前就业数据问卷(CES,Current Employment Statistics)。BLS一般在每月包含12号当周通过电话、电邮、EDI三种途径搜集数据。50人以上的大型公司一般采用EDI(Electronic Data InterChange)搜集,受访者通过提交特定、统一格式的电子文件上传数据,而电话、电邮则针对小型公司。虽然BLS每月发放问卷的时间是准时的,但受访者回答的时间却不一定是及时的,这就导致了部分问卷要多等1-2个月才能反馈。也正因如此,BLS才会对每个月公布的非农数据进行2次修正。例如,2024年10月企业问卷首次收集率只有47.4%,但二次、三次收集率分别高达92%、93.5%。正是延迟反馈问卷的存在,导致BLS不得不在获得这部分问卷后重新对此前的数据进行修正。
但疫情危机后,越来越多的问卷未在第一时间反馈给BLS。图2可见,2020年以来,CES的首次收集率从70%迅速回落至60%,但二次、三次收集率则在90%附近保持稳定。单从疫情后的数据来看,CES问卷反馈愈发拖沓的同时,非农的下修开始变得愈发频繁,即后反馈的数据显示出的就业情况更差。现实情况中,大型企业通过EDI反馈,时效性一般较强,但通过电话电邮等方式受访的中小企业很难说有专设的相关岗位,因此更容易出现问卷反馈的延后。而从ADP统计的不同规模公司的就业总人数变化来看,1-19人的小型公司在23H2便开始缩编(图4)。因此,疫后美国非农数据频繁下修背后的真相可能是:小型企业的经营状况开始变差,最早出现了缩编与裁员。这也导致小型企业在反馈问卷时也变得更加怠慢,使得问卷首次收集率大幅下降,而在BLS在拿到这些延迟反馈的结果更糟糕的数据后,便相应对数据进行了下修。因此,近期非农频繁的下修虽说是因问卷设计导致的一个“技术问题”,但也侧面反映了在美国经济下行周期的背景下,小型企业经营环境恶化的现实。
2. 年度的大校准
除去月度的小修正外,年度的大校准发生频率更低,但修复幅度也相对更大。2024年8月,BLS根据最新公布的普查数据将2024年3月的非农总人数下修了81.8万,占非农总人数的0.5%,是1979年以来第二大幅度的下修(图6)。此外,由于原定于北京时间22点就应公布的数据校准被无故推迟到了22:37才公布,市场对BLS“数据作假”的质疑变得更深。
2.1. 基于失业保险的校准
前述我们提到,月度公布的非农数据来自调查问卷,而调查问卷反馈的延迟导致了数据的修正。作为调查问卷,CES仅仅覆盖了美国30%的就业人员,因此其不可避免地存在统计误差。为解决这一问题,每个季度BLS会基于企业的失业保险缴纳记录生成就业和工资季度普查数据(Quarterly Census of Employment and Wage, QCEW),该普查数据覆盖97%的美国企业,剩余3%通过人口普查局的其他数据补全。
因此,在每年8月当年一季度的QCEW数据发布时,BLS将对当年3月的就业数据进行“初步校准”,随后在次年2月进行“年度最终校准”。由于基于CES的非农数据是基于对11.9万家企业的抽样调查,而基于QCEW的就业数据是基于对1160万家企业的普查数据,因此两份数据时常存在差异。如图7,23H2以来,非季调的QCEW口径下的就业人数与CES非农之间的轧差不断走阔。截至最新2024年6月,QCEW、CES非农分别对应的就业同比增速分别为0.81%、1.59%。
那么,为何23H2以来CES与QCEW的分化开始加剧?对2024年3月的初步校准又为何会出现如此大幅度的下修?我们认为这或与不同问卷对非法移民的统计有关。作为普查数据,QCEW统计的依据是失业保险。而拜登政府时期引入的非法移民并不具备合法身份,因此无法获取失业保险,意味着他们难以被统计数据覆盖。此外,CES非农在调查时询问的其实是新增岗位数,如果涌入的非法移民在不同的企业身兼数职,则非法移民很可能被重复统计。
例如有40万非法移民涌入美国。他们上午在肯德基、下午在麦当劳兼职,则CES非农问卷统计到的是80万就业,而由于这40万非法移民都未缴纳失业保险,因此QCEW统计到的新增就业为0,这就导致BLS在拿到普查数据进行校准时,会对数据进行大幅下修。从数据上看,根据CBO估算,受拜登政府放开非法移民政策影响,2022-24年美国每年预计新增移民267、330、330万人,显著高于2004-2020年99万的均值(图8)。而这些涌入的非法移民多在教育医保行业中的社区医院兼职护工、休闲餐旅行业中的餐厅兼职服务员(图9),因此很容易被CES问卷重复统计,但无法被QCEW问卷捕捉到。因此,2024年8月BLS基于QCEW对2024年3月数据的初步校准可能是“矫枉过正”的:正是QCEW与CES非农问卷一个低估、另一个高估了非法移民带来的就业影响,才导致初步校准出现了如此大幅度的修正。
2.2.基于生死模型的校准
每时每刻美国都有新的企业注册成立、新的企业破产注销,因此BLS在统计就业时会存在一个很现实的问题:新注册成立的企业经过登记、纳入样本、信息处理等流程,最终出现在CES企业调查样本上的时滞长达一年多,因此月度的非农问卷很难统计到这些新成立的企业信息和其带来的就业。对劳务市场而言,就业与失业变化来自两部分:存量企业的扩张与缩编,以及企业的成立与倒闭。如图10,截至最新24Q2,对生产与非管理岗的私营部门而言,由企业扩张带来的就业、缩编带来的失业分别为604、616.2万人,而由企业成立带来的就业、倒闭带来的失业分别为155.1、159.2万人。由企业成立与倒闭带来的就业波动不容忽视。这意味着,BLS在计算就业变化时,必须考虑企业成立与倒闭带来的影响。而相对于扩张与缩编,由企业成立与倒闭带来的净就业增长趋势相对稳定(图11)。这一特征意味着,只需要估算新注册企业带来的就业增长,即可捕捉到企业“生死”给劳务市场带来的波动,这即BLS所用净出生-死亡模型(Net Birth-Death Model, NBD)的原理。例如,当前美国有100家企业,同时新成立、倒闭了5家企业。因此BLS会对95家存量企业进行调查统计,同时通过NBD模型预测5家新注册企业带来的就业增长。
如图12,2023年以来,非季调口径下,由NBD模型根据新注册企业带来的就业贡献了美国40%的新增非农就业。换言之,这部分就业并非来自BLS的非农问卷调查,而是纯粹来自NBD模型的预测。每年2月,BLS会对上年NBD的预测数据进行校准。如图13,2024年2月,BLS对2022年4月至2023年3月NBD模型的预测值进行了校准,校准后的数据显示,到2023年3月,NBD模型累计高估了330万的就业。
NBD模型为何会高估非农就业?这与模型假设有很大关系。如前述,NBD模型假定企业成立与倒闭带来的净就业增长趋势相对稳定,而2020年以来,美国新注册企业数目增速加快(图14)。2021年以来,新注册企业数目明显高于新注销企业,这导致美国企业净增加数显著增多(图15)。Richmond联储工作论文显示,这一趋势反映的并非企业创业情绪的提升,而是疫情造成的工作生活方式变化带来的企业重组。而随着新注册企业数目的降低,NBD模型给非农带来的高估也面临着更大的下修风险。
2.3.基于人口普查的校准
除去企业调查问卷,BLS也会在每年2月对家庭调查(Household Survey)的当前人口问卷(Current Population Survey, CPS)进行校准。CPS主要用于编制失业率、劳动参与率、就业率等数据。CPS每月通过上门、电话访谈等形式获取约10.5万名 16 岁及以上居民的就业信息,因此数据的反馈是即时的,不存在类似CES的每月修正。
CPS的年度校准主要来自人口控制(population control)。该方法由美国人口普查局制定,主要基于最新的人口普查、出生死亡、净移民数据进行校准,并在十年一次的人口普查更新后引入新的人口基数并进行相应调整。以2024年1月数据为例,1月数据采用2024年新的人口控制,导致其与2023年12月数据不可比。因此,CPS同时公布了2024年人口控制对失业率等主要数据的影响(图16)。此外,CPS还会对2023年12月的劳务市场数据应用新的人口控制模型进行修正(图17)。2024年12月19日,人口普查局更新的人口普查数据上修了移民人口,表示2023-24年美国净增加了280万移民,并将在最新年度调整中对CPS数据进行相应调整。
3. 2024年度大校准前瞻
2025年2月7日,美国劳工部将公布1月非农数据,并对2024年数据做年度校准。我们认为此次数据需要尤其关注以下两点:①2024年的新增非农就业大幅下修;②2024年的失业率是否上调。
首先需明确的是,基于QCEW的年度校准针对的是全年每个月的数据。例如2023年度校准中,BLS将2023年3月基期数据下修了26.6万,而校准后的2023年12月数据较此前则高出11.5万(图18),背后原因在于,每个月非农的误差具有一定的随机性,QCEW在校准时会对部分时期的非农就业数据做出上修、对另一部分时期的非农数据做出下修。如图19,2023年6月的新增非农较此前上修13.5万至24万,而3月新增非农则较此前下修7.1万至14.6万。
2024年度校准后,新增非农的下修幅度是多少?我们通过计算不同非农问卷口径下2024年的美国劳务市场增加了多少就业来回答这个问题。2023年12月至2024年12月,美国非农就业总人数增加223万至15954万,同期调整后CPS(BLS编制的、用于与CES可比的CPS数据)增加58.9万至15523万(图20),即整个2024年CES非农较调整后CPS多增加了164万就业。若与最新QCEW数据对比,则CES非农多增加了154万就业。若由此简单推演,到2024年12月,美国非农就业总人数将出现154-164万的下修。而根据彭博经济的模型预测,本次QCEW与NBD模型将分别下修70、23.4万的非农就业,即对2024年12月非农就业总人数合计带来93.4万的下修。因此,2024年12月的非农或存在93-154万的下修,这较2024年3月81.8万的初步校准有所增加。
2024年度校准后,失业率的上修幅度是多少?2024年度校准中,BLS将根据人口普查局更新后的人口数据对2024年的CPS数据进行人口控制。而本次人口普查局主要将南部边境的移民数据纳入统计,这使得2022-24年的净移民数量大幅增加(图23)。根据人口普查局测算,2023-24年间有280万净移民流入美国。由于南部边境移民多为拉丁裔,而拉丁裔的失业率远高于均值(如图22,截至最新2024年12月,美国拉丁裔失业率为5.13%,较4.09%的失业率均值高出1.04%),因此纳入新的非法移民数据意味着2024年美国失业率可能将迎来上调。根据高盛测算,这将导致失业率上修4bps。
4. 风险提示
模型风险:BLS公布的美国非农就业数据编制依赖于净出生-死亡模型等复杂的统计学模型,模型参数的大幅调整可能加大分析误判的风险。
统计风险:近年来,企业和家庭调查的响应率持续下降,可能导致数据质量下降和统计误差扩大。
样本风险:非农就业数据主要覆盖合法就业,可能低估非法移民、零工经济从业者等群体的就业情况。