智谱CEO张鹏
2024年中国AI大模型行业最后一轮融资诞生。
12月17日消息,钛媒体AGI获悉,AI大模型公司智谱近期完成新一轮三十亿人民币融资。新的投资方包括多家战投及国资,君联资本等老股东继续跟投。
据了解,本轮融资将用于智谱GLM大模型系列的进一步研发,从回答问题到解决复杂推理、多模态任务,更好地支撑行业生态发展。
这是智谱半年内第二轮融资。今年9月,中关村科学城公司宣布以投前200亿估值领投智谱,用于支持国产基座大模型的技术创新和生态发展。智谱不仅是估值率先超过200亿的大模型创业企业之一,也是目前估值最高的大模型公司之一。
钛媒体AGI还了解到,2024年智谱业务保持高速增长,商业化收入增长超过100%,平台日均Tokens消耗量增长150倍。今年以来,智谱商业化收入相比2023年逆势取得100%以上的增长,尤其是智谱推出的MaaS开放平台,API年收入同比增长超过30倍,日均Tokens消耗量增长150倍。MaaS平台已经吸引了70万企业和开发者用户,在商业化和企业业务中的渗透率越来越高。
据悉,智谱AI成立于2019年,由清华大学计算机系的技术成果转化而来,致力于打造新一代认知智能通用模型。
公司于 2020 年底研发 GLM 预训练架构,2021 年训练完成百亿参数模型 GLM-10B,同年利用 MoE 架构成功训练出收敛的万亿稀疏模型,2022 年研发了中英双语千亿级超大规模预训练模型 GLM-130B 并开源。2023 年,智谱推出千亿基座对话模型 ChatGLM 并两次升级,开源版本的 ChatGLM-6B 让大模型开发者的本地微调和部署成为可能,在开源社区受到广泛欢迎。
目前,智谱开源模型系列ChatGLM等50余款模型,全球累计下载量超过 3000 万、累计获超15万GitHub星标。
2024 年 1 月,智谱推出新一代基座大模型 GLM-4,整体性能相比上一代大幅提升;6 月开源 GLM-4-9B 及视觉模型 GLM-4V-9B,多模态能力媲美 GPT-4V;7 月推出视频生成模型 CogVideoX,推理速度较前代提升 6 倍;8 月,智谱新升级基座大模型 GLM-4-Plus 推出,能力比肩世界先进水平。10 月,智谱发布最新的端到端情感语音模型 GLM-4-Voice 和大模型交互智能体(Agent)AutoGLM。11月迎来Agent新升级,推出GLM-PC,开启“无人驾驶”PC的技术探索。
算力层面,目前GLM-130B已经实现大模型在昇腾、海光、神威等国产平台上的从零训练;适配在寒武纪、摩尔、燧原等国内外40多种GPU芯片上的高效推理。
商业化层面,C端产品,智谱清言App拥有超过2500万用户,年化收入(ARR)超千万,清言可以通过文本、图像、音频、视频来进行多模态互动,是拥有最全模态的AI助手;B端层面,智谱业务覆盖智能汽车、制造、大消费、金融、政务服务、医疗健康、游戏娱乐、文化旅游等行业,近期推出的Agent带动大模型在智能设备的落地。
智谱CEO张鹏早前在2024 T-EDGE创新大会暨钛媒体财经年会上表示,如今的Agent可以做到像人一样,理解界面、规划任务、使用工具、完成任务,从而更聪明地代替人类行动。我们对于对于AI 内心所真正期待的是,AI 像人一样,拥有各种各样类型能力,而且都在水平线以上的综合性AI能力,并且能够像人一样处理复杂任务,而不是单一任务,从而解答复杂的问题。
“瞄向AGI的路程还很长,有大量的任务等待我们做,大可不必那么悲观说在语言层面上碰到的(Scaling Law)停滞现象,我们就觉得AGI‘完蛋’了。”张鹏指出,对于人类本身的 AI 能力是比较明确的,我们需要对照人类的智能能力去打造通用人工智能(AGI)。
展望未来,张鹏强调,随着语言模型、多模态以及AI Agent等技术走向成熟,从整个技术演进方面来看,我们对此非常有信心,真正让大模型的技术能够走入现实世界,帮助大家解决更复杂的问题。同时,这些技术在成熟的过程当中,让这些技术变成相应产品,创造更大的生产力价值,以及相应的市场回报。
“对于智谱来讲,我们的目标永远是让‘机器像人一样思考’,并且让机器服务人类。”张鹏在结尾表示。
智谱2024年产品时间点:
11月,发布AutoGLM升级版,可以自主执行超过 50 步的长步骤操作,也可以跨 app 执行任务,同时开启「全自动」上网新体验,支持基于浏览器的数十个网站的无人驾驶。
11月,发布GLM-PC内测,基于智谱的多模态模型 CogAgent,是面向「无人驾驶」PC的一次技术探索。可以代替用户参与视频会议、处理文档、搜索网页并总结、远程定时操作——就像人在操作电脑一样。
11月,视频模型CogVideoX迎来新升级,支持10s 时长、4k、60 帧超高清画质、任意尺寸,以及更好人体动作和物理世界模拟。CogVideoX v1.5-5B、CogVideoX v1.5-5B-I2V同期开源。
10月,GLM-4-Voice 端到端情感语音模型发布,并上线清言app,它能够理解情感,有情绪表达、情感共鸣,可自助调节语速,支持多语言和方言,并且延时更低、可随时打断。
10月,AutoGLM 内测版发布,只需接收简单的文字/语音指令,AutoGLM就可以模拟人类操作手机。理论上,AutoGLM 可以完成人类在电子设备上可以做的任何事,不受限于 API 调用,操作逻辑与人类类似。
10月,三星与智谱宣布战略合作,双方将携手在AI手机领域展开深度共创,共同打造卓越体验的AI产品。10月,高通骁龙峰会上,宣布将GLM-4V端侧视觉大模型面向骁龙8至尊版进行深度适配和推理优化,支持丰富的多模态交互方式。
8月,国内首个跨文本音频和视频模态实时推理大模型 GLM-4-Videocall 发布,实现 AI与人的实时视频通话。通过 API 接口可无缝部署在包括手机在内各类带摄像头端侧设备。
8月,在 KDD 现场,新一代基座大模型GLM-4-Plus发布,在语言理解、指令遵循、长文本处理等方面性能得到全面提升,整体上比肩国际标杆GPT-4o水平。
7月,视频生成模型“清影”在清言PC端、移动应用端以及小程序端正式上线,提供文本生成视频和图像生成视频的服务,仅需30秒即可完成6秒视频的生成,真实还原物理世界中的运动过程。
6月,GLM-4-9B 模型开源,支持多达100万Tokens的长文本和26种语言,并首次开源了基于GLM的视觉模型GLM-4V-9B,其多模态能力比肩GPT-4V。
1月,新一代基座大模型GLM-4发布,整体性能相比上一代大幅提升,比肩世界先进水平。它支持更长上下文,具备更强多模态能力,推理速度更快,支持更高并发,大大降低推理成本。
作者|林志佳,编辑|胡润峰)