凤凰网财经讯 2025(第三届)长白山论坛于2月22日在吉林·白山隆重举办,本届论坛以“冰雪长白 东风日白”为主题,由凤凰网财经主办、东北证券协办,汇聚各界智慧,探讨经济发展与东北振兴的全新路径。
北京智谱华章科技有限公司资深专家初宪
北京智谱华章科技有限公司资深专家初宪发表了以“大模型思维,小步伐实践”为主题的主旨演讲。他基于公司在国产大模型领域的深耕经验,围绕大模型技术发展、创新应用及对上市公司的赋能展开分享,引发与会者对大模型时代企业发展变革的深度思考。
初宪指出,当下时代正经历深刻变革,大模型已悄然融入企业与个人的工作生活。从技术层面看,热门大模型产品依然是在预测下一个向右生成内容,但DeepSeek出现后,其功能从单纯向右生成内容,进阶到能自主推理、思考下一步行动,维度上升了。
如何看待DeepSeek这一现象?初宪表示,在底层逻辑上,这是在水平大模型基础上的改进。“以前的大模型其实也有神经网络,但没有产生智慧现象。OpenAI将参数量突破1000亿量级后,涌现出智慧现象。人类还解释不了,这个东西还挺神的。”初宪说。
他认为这是从量变达到了质变。像DeepSeek、千问Max、盘古等MOE架构模型,在处理问题时展现出独特优势。同时,智谱华章也是对标OpenAI,在模型产品特性、公司组织架构及产业投资等方面积极看齐,涵盖文本对话、文生图、代码生成与理解、互联网检索、图片理解、工具调用等多个领域。
在产品应用展示环节,初宪通过两段视频呈现大模型强大的功能。一是视频通话能力,实现对图片、视频文件理解,能实时处理视频流,与用户进行实时互动;二是面向UI层面交互的智能体效果,可代理用户跨应用协同操作,操作过程模拟人类,大幅简化传统IT软件操作流程。
初宪介绍,智谱华章十分注重开源与开放协同,其 6B 模型在 GitHub 上与 LLaMA 三个版本模型的星标量(Star数)、点赞量持平,自 2022 年起持续进行模型开源。公司于 2019 年成立,2021 年成功验证万亿 MOE 架构大模型方向,已与众多行业头部客户建立合作。