零一万物牵手阿里云背后 是正在加剧的AI人才荒

过去两天,零一万物的热度超过正在进行的CES。

1月2日,零一万物与阿里云成立“产业大模型联合实验室”,推动大模型从技术到应用的发展。其背后的更深入合作,则是零一万物预训练团队和Infra团队转手阿里云,双方达成一次各取所需的合作与交接。

除了大模型公司在预训练投入与商业化缓慢之间的巨大鸿沟,国内的AI人才荒也是本次双方合作的重要基石。

在过去一年半,字节开启空前的人才网罗行动,阿里则成为人才流失的重灾区。公开信息显示,字节不仅挖走零一万物前预训练负责人黄文灏,谷歌原VideoPost项目负责人蒋路、面壁智能原核心成员,也从阿里云挖走通义千问核心技术负责人周畅,及其手下的十多名团队成员。据介绍,字节为周畅提供一份难以拒绝的8位数的薪酬包,其团队成员同样获得了相当于阿里P10、P9级别的优厚待遇。字节的Seed团队(专注大模型底层技术研发)和Flow团队(负责AI原生应用研发)的规模分别迅速扩张到150人和300人。

此次阿里云与零一万物的战略合作,也被认为是在填补阿里云的技术空缺,稳定市场信心。

“一些成员擅长和愿意投入Scaling Law,所以部分团队会通过联合实验室和阿里深度整合。”李开复在回应媒体采访时公开表示。

1、“强强联合”背后

在过去一年,零一万物三位重量级负责人相继离职——8月技术联创、算法副总裁黄文灏转投字节,9月产品负责人曹大鹏离职。零一万物8月完成A轮融资,来自某国际战投东南亚财团,融资额在“六小虎”中并不突出。

人员动荡下,零一万物的大模型训练依然取得不错成绩。

2024年10月,零一万物曾发布新旗舰模型Yi-Lightening,在国际权威盲测榜单LMSYS上,超越OpenAI的GPT-4o-2024-05-13和Anthropic Claude 3.5 Sonnet,排名世界第六。

这个成绩在当时超出零一万物团队的预想。LMSYS属于盲测榜,通过平台随机比试与匿名众筹,进行线上盲测评选,测评结果受到OpenAI、Anthropic、Google、Meta等企业的认可。

零一万物内部员工表示,团队也没有想到Yi-Lightening取得这样的好成绩,本来只打算将结果简单发布,成绩出来后随即决定开线上发布会。李开复在会上宣布,“零一万物紧随OpenAI、Google之后,与xAI打平,进击全球前三大模型企业。”

这是对零一万物大模型团队的一次证明,比如与稠密模型架构不同的MoE架构、独特的混合注意力机制(Hybrid Attention)、动态Top-P路由、 多阶段训练(Multi-stage Training)等。“我们有更成熟的训练方法,只花了xAI成本的1%或2%,做出来的Pre-training模型跟Grok-2-08-13打平。”李开复解释。

同时零一万物还透露,李开复博士正在接触“一位预训练大咖,非常厉害。”目前看来正是《LoRA:Low-Rank Adaptation of Large Language Models》的二作YeLong Shen,曾任微软Azure AI首席研究员。

尽管由于预训练投入与商业化营收之间鸿沟,让零一万物调整战略缩减团队,这样一支成熟的大模型训练团队依然价值不菲。

《智能涌现》报道称,零一万物预训练团队收到阿里“通义”的offer,Infra团队则收到了阿里智能云团队的offer。

2、AI人才荒凸显,缺口高达数百万

过去一年,阿里云不仅要在模型性能面临国内外挑战,在人才争夺上也面临激烈竞争。

2024年11月,阿里起诉通义前员工周畅违反竞业协议的仲裁案,暴露了大厂之间的人才军备竞赛。周畅2017年加入阿里巴巴,花名“钟煌”,曾参与多款语言模型和多模态模型的研发。2024年7月,周畅以创业为名提出离职,并签署了竞业协议,随之离开的还有十几名团队成员。几个月后该团队均低调加入字节跳动,从事大模型相关工作。

阿里对周畅提出仲裁并要求巨额赔偿,同时寻找新的“AI战略人才”。

急于补充AI人才的不止阿里,近期小米集团董事长雷军亲自挖来95后AI女工程师罗福莉,或供职于小米AI实验室,领导小米大模型团队,并开出了千万元级别的薪酬offer。

事实上,不仅AI顶尖人才的年薪破千万,各行各业都加入这场AI人才争夺战。

脉脉高聘发布的报告显示,大模型算法研究员新发岗位平均月薪高达6.4万元,领跑高薪岗位榜。新金融科技行业为多个岗位开出了全行业最高薪资,如人工智能工程师平均月薪为67460元;智能硬件行业的产品经理和销售经理薪资也高于其他行业。

随着大模型应用的普及,大模型开发人员也水涨船高。算法工程师作为人工智能技术的核心岗位,需求量最大,新发岗位占比接近一半,达到46.45%。自然语言处理岗位占比11.04%,位居第二。

同时国内的AI人才更多集中于应用层。根据中科科界的数据,应用层AI人才占比达到54.3%。这些人才在实际项目中积累了丰富的经验,能够迅速推动AI技术的应用和普及。而基础层人才存量较低,仅占17.1%。

高薪抢人背后,AI人才缺口仍然明显。麦肯锡公司此前发布的报告预计,2030年中国对熟练AI专业人员的需求将增至2022年的六倍,达到600万,而AI人才缺口可能多达400万。

在本次人才竞速中,阿里与零一万物无疑完成一次各取所需的合作。零一万物剥离投入巨大的预训练和Infra团队,轻装上阵,为全力冲刺商业化做好准备。阿里则补充弹药,填补技术空缺,稳定市场信心。

只是不知道,下一个面临着陆的大模型公司,会不会有零一万物的智慧和运气。

打开APP阅读更多精彩内容