1.昆仑万维集团推出「天工大模型4.0」o1版和4o版,分别具备中文逻辑推理能力和多模态对话功能,供用户免费使用。o1版擅长处理数学、代码等逻辑推理任务,而4o版的Skyo助手具备情感表达和多语言对话能力,响应迅速且自然。
2.阿里巴巴达摩院推出“SHMT:自监督层次化妆转移”技术,利用潜在扩散模型实现妆容迁移,只需提供化妆参考图和目标照片即可上妆。该技术已被NeurIPS2024接收,团队开源了代码和预训练模型,便于研究与应用。
3.Snap推出了 SnapGen AI 图像生成器,能够直接在高端手机上生成高分辨率图像,让用户在手机上也能享受高效便捷的图像创作体验,打破了传统 AI 图像生成需要强大计算能力的局限。
4.微软推出 LAM (Large Action Model)"大型动作模型",能够独立操作Windows程序,将用户请求转化为实际行动。是首个专门训练与微软Office产品一起工作的模型。在Word测试中,LAM的成功率达到71%,速度超过GPT40。
5.马斯克宣布 Grok3 即将推出,预训练已完成,计算量比 Grok2高出十倍。去年7月,Grok3 使用了 10 万块英伟达 H100 芯片进行训练,但未能如期发布。去年 12月,xAI向所有X平台用户免费推出了 Grok-2 模型,Premium用户将优先访问新功能。
6.捷成股份其旗下AI智能视频创作引擎“ChatPV”正式推出“文生视频”全新功能,该功能可根据用户文字描述,智能生成对应动态画面的高质量视频素材。