1、OpenAI发布两款多模态推理模型o4-mini、满血版o3
OpenAI在技术直播中推出了其最新的多模态模型o4-mini和满血版o3,这两款模型具备同时处理文本、图像和音频的能力,并能调用外部工具进行复杂任务的处理。o4-mini在各项测试中表现优异,准确率高于o3,并在编程竞赛中名列前茅。
【AiBase提要:】
🛠️ o4-mini和o3具备多模态处理能力,能同时处理文本、图像和音频,并自动调用外部工具。
📊 o4-mini在AIME2024和2025测试中准确率分别达到93.4%和92.7%,超越满血版o3。
💻 在编程竞赛中,o4-mini获得2700分,跻身全球前200名程序员,展现出强大的编程能力。
2、微信首个AI助手 “元宝” 正式上线,可以添加为微信好友
腾讯推出的“元宝”是首个在微信平台上运行的AI助手,用户可以直接在微信中搜索并添加为好友,享受更真实的聊天体验。元宝不仅能解析微信公众号文章、图片和文档,还能进行智能互动,回答用户的进一步提问。该助手关注用户隐私,具备证件照自动打码功能,虽然目前不支持语音或视频通话。
【AiBase提要:】
🌟 微信首个 AI 助手 “元宝” 上线,用户可直接在微信中搜索添加。
📊 元宝支持解析公众号文章、图片和文档,提供智能互动。
🔒 具备隐私保护功能,支持证件照自动打码。
3、字节发布豆包1.5深度思考模型:多模态深度思考、延迟低
在4月17日的火山引擎 AI 创新巡展杭州站上,字节跳动发布了豆包1.5深度思考模型,展示了其在数学、编程、科学推理及创意写作等领域的卓越能力。该模型采用MoE架构,参数配置优越,推理成本低。结合视觉理解技术,模型能够分析照片、辅助旅行和项目管理,并且视频搜索能力显著增强,提升了用户获取信息的便利性。
【AiBase提要:】
📈 豆包1.5模型在数学、编程等领域表现出色,采用MoE架构,参数配置优越。
🌍 新模型结合视觉理解技术,能够分析照片,辅助旅行和项目管理,功能强大。
🎥 视频搜索能力显著增强,用户可快速获取视频中的相关信息,使用量持续增长。
4、月之暗面Kimi开源数学定理证明模型Kimina-Prover
Kimi技术团队发布了Kimina-Prover的预览版,开源了多个模型和数据集,展现出在形式化定理证明领域的出色性能。Kimina-Prover通过结合大规模强化学习与形式化推理,显著提升了模型的推理能力和样本效率,达到了80.7%的通过率,超越了以往最佳结果。
【AiBase提要:】
🔍 Kimina-Prover在miniF2F基准测试中达到了80.7%的通过率,超越了之前的最佳结果。
🚀 该模型结合了大规模强化学习与形式化推理,显著提升了推理能力和样本效率。
📚 Kimina-Prover的可解释性强,用户可以查看推导过程,为理解模型行为提供便利。
5、OpenAI开源超Agent:Codex CLI,五小时内破5000颗星
OpenAI最近发布了Codex CLI,这是一款轻量级的代码智能体工具,发布后迅速获得了极大的关注,仅在五小时内便突破了5000颗星的评价,预计当天将突破1万颗星。Codex CLI具备自动生成、运行代码、重构和测试等强大功能,极大地提升了开发者的工作效率。
【AiBase提要:】
🌟 Codex CLI 在发布后仅5小时便获得5000颗星评价,预计今天将突破1万颗星。
💻 该工具可以自动生成代码、运行代码、重构和测试代码,功能强大且实用。
📈 OpenAI 计划持续推出更多智能体产品,并在探索收购 AI 编程平台以增强竞争力。
6、谷歌 Gemini Live 功能全面开放,安卓用户迎来新体验
谷歌最近宣布将其 Gemini 应用中的 Gemini Live 功能免费向所有安卓用户开放,此前该功能仅限于 Pixel9和三星 Galaxy S25用户。Gemini Live 的强大之处在于能够实时识别摄像头和屏幕上的内容,为用户提供即时反馈和信息,极大增强了互动体验。随着用户反馈积极,谷歌决定推广这一功能,预计在未来几周内全面上线。
【AiBase提要:】
🌟 Gemini Live 功能现已免费向所有安卓用户开放,原本仅限于 Pixel9和 Galaxy S25用户。
📸 该功能可以实时识别摄像头和屏幕内容,提供即时信息和反馈,提升用户互动体验。
🚀 微软同日推出类似的 AI 工具 C o p i l o t Vision,显示出实时信息识别技术的快速进步。
7、OpenAI 拟以30亿美元收购 AI 编程工具 Windsurf
OpenAI 正在与 AI 编程工具 Windsurf 展开收购谈判,交易金额约为30亿美元。这一收购将成为 OpenAI 最大的并购交易,标志着其在 AI 开发者工具市场的重要布局。Windsurf 是一款受欢迎的 AI 编程助手,能够生成和解释代码,并已获得超过2亿美元的融资。
【AiBase提要:】
💰 OpenAI 正在与 Windsurf 进行30亿美元的收购谈判,若达成将成为其最大规模的并购交易。
🚀 Windsurf 是一款广受欢迎的 AI 编程助手,支持代码生成和解释,已获得超过2亿美元的融资。
📈 此次收购将增强 OpenAI 的编程能力,帮助其在竞争激烈的 AI 工具市场中占据领先地位。
8、JetBrains 推出编码智能体 Junie AI,助力编程与调试全新体验
JetBrains 最近宣布其新编码智能体 Junie AI 已达生产就绪状态,旨在帮助开发者更高效地进行代码编写与调试。Junie AI 的推出标志着 JetBrains 在 AI 工具领域的重大进展。此外,JetBrains 还更新了其旧版 AI 助手,支持最新的 AI 模型,并增强了用户体验。为了应对市场竞争,JetBrains 计划推出免费套餐,吸引更多开发者使用其工具。