1.阿里巴巴开源ZeroSearch大模型搜索引擎,是无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架。基于大模型预训练知识,将其转化为检索模块,可动态控制生成内容质量。
2.联想集团推出了天禧个人超级智能体,天禧具备感知与交互、认知与决策、自主与演进三大核心功能,能够实时感知环境并与用户互动,理解复杂意图并提供个性化建议。
3.腾讯ARC实验室推出的FlexiAct模型是一项创新的动作传输技术,已在Hugging Face平台开源。该技术能够将视频中的动作无缝迁移至任意目标图像,支持灵活的布局和视点变换。
4.ChatGPT推出“深度研究”功能,可连接GitHub。用户提出与GitHub代码库相关问题时,ChatGPT能直接连接并分析代码、文档等,生成答案。功能目前处于测试阶段,后续将向Plus、Pro用户开放。
5.阶跃星辰与ACE Studio联合开源音乐大模型ACE-Step(音跃)。模型参数量3.5B,具备快速生成、强可控性、易于拓展等特点,支持19种语言歌曲创作,涵盖多种音乐风格。
6.Gemini API推出隐式缓存功能,可自动识别请求共同前缀触发缓存,为开发者提供高达75%的Token折扣,无需手动配置。