AI日报:百度明年推新版文心大模型;OpenAI拟推自研浏览器;搜狗输入法打造全新AI搜索体验;全新FLUX.1 Tools工具包来了

1、李彦宏:百度计划在明年初推出新版本文心Ernie模型

百度在最新财报中透露,将于明年初推出新版本的文心 Ernie 模型,以加强在基础模型领域的领导地位。李彦宏强调,模型的开发需满足实际市场需求,并将视觉基础模型应用于自动驾驶领域。百度正致力于减少模型 “幻觉”,提高准确性,增强模型的应用价值。

【AiBase提要:】

📉 百度第三季度总营收为336亿元人民币,同比下降3%。

🚀 李彦宏宣布计划于明年初推出新版本文心Ernie模型,进一步提升基础模型能力。

🤝 百度在模型开发上以应用为导向,致力于满足市场需求并降低推理成本。

2、搜狗输入法升级!打造全新AI搜索体验,输入即搜索

搜狗输入法12.0版本推出了多项新功能,核心在于与腾讯混元大模型结合,实现边输入边搜索的 AI 搜索功能,提升用户的搜索效率。还新增了 AI 快查、AI 陪伴、魔术手势等功能,增强了输入法的互动性和便捷性。

image.png

【AiBase提要:】

🌟 新版搜狗输入法推出 AI 搜索和 AI 快查功能,实现 “输入即搜索”。

💡 用户可通过输入关键词快速获取信息,提升学习和办公效率。

🌍 AI 快查功能覆盖40多个生活场景,满足用户日常查询需求,完全免费。

3、OpenAI 拟推出自研浏览器 挑战谷歌霸主地位

OpenAI 正计划通过推出一款基于 AI 聊天机器人的自研浏览器,向谷歌的搜索市场发起正面挑战。这一举措凸显了 OpenAI 在搜索领域的野心,同时也是其扩展生态系统的重要一步。

【AiBase提要:】

🤖 OpenAI 正与多个平台合作,计划在旅行、食品、房地产和零售等领域提供 AI 驱动的搜索服务。

📱 OpenAI 考虑为三星设备提供 AI 功能,进一步扩大其在硬件领域的影响力。

📰 OpenAI 与众多新闻出版商达成合作,增强其内容资源库,提升在搜索市场的竞争力。

4、写作能力更强!OpenAI对GPT-4o重大升级,重夺最佳AI模型桂冠

OpenAI 宣布对其旗舰模型 GPT-4o 进行了重大升级,提升了推理、跨媒体和对话能力。GPT-4o 在 “Chatbot Arena” 评估平台上表现优异,位列第一,超越其他竞争模型。用户可通过 ChatGPT Plus 订阅享受更高质量的服务

image.png

【AiBase提要:】

🌟 GPT-4o在最近的更新中,提升了推理、跨媒体和对话能力,成为更强大的AI模型。

🏆 在“Chatbot Arena”评估平台上,GPT-4o在与其他模型对比中取得了第一的成绩。

💼 ChatGPT Plus用户可以享受更优质的使用体验,包括无限制访问和额外功能。

5、谷歌新Gemini试验版夺回AI竞技榜首,GPT-4o仅称王一天

近期,谷歌与OpenAI之间的竞争愈发激烈。谷歌新发布的Gemini-Exp-1121模型在多个领域表现出色,迅速超越了OpenAI的GPT-4o,重回AI竞技榜首。同时,OpenAI也在研发新功能,未来可能改变与AI的交流方式。

image.png

【AiBase提要:】

📈 谷歌新模型Gemini-Exp-1121在GPT-4o登顶后迅速反超,重回AI竞技榜首。

🔍 Gemini-Exp-1121在代码、推理和视觉理解能力上均有所提升,表现出色。

🎥 OpenAI正在研发“实时摄像”功能,未来或将改变与AI的交流方式。

6、黑森林实验室推出全新FLUX.1Tools工具包 小白也能秒变P图大神

黑森林实验室发布了 FLUX.1Tools 工具包,提升了 FLUX.1模型的控制性和可操控性,允许用户精确修改图片。工具包包含 FLUX.1Fill、FLUX.1Depth、FLUX.1Canny 和 FLUX.1Redux,分别提供图像修复、深度修改、边缘检测和图像变体生成等功能。该工具包分为开源和 API 版本,并与多个合作伙伴合作发布。

打开凤凰新闻客户端 提升3倍流畅度

【AiBase提要:】

🛠️ FLUX.1Fill是先进的图像修复工具,超越现有解决方案,支持根据文字描述和掩码进行无缝编辑。

🌌 FLUX.1Depth和FLUX.1Canny利用结构信息引导图像生成,保持原始结构,提供更高的输出多样性和一致性。

🎨 FLUX.1Redux适用于生成图像变体,支持根据文字描述重新设计风格,集成于FLUX1.1[pro] Ultra模型中。

详情链接:https://huggingface.co/black-forest-labs/FLUX.1-Redux-dev

7、新一代视觉追踪模型SAMURAI:复杂的场景里也能追踪到主体

SAMURAI模型的推出标志着视觉追踪技术的重大进步,尤其是在复杂场景中的应用。通过引入运动感知机制,SAMURAI不仅提高了追踪的准确性,还展示了其在零-shot条件下的强大性能。这一创新将为未来的智能设备提供更强的视觉识别能力,推动视觉追踪领域的发展。

打开凤凰新闻客户端 提升3倍流畅度

【AiBase提要:】

🔍 SAMURAI 是对 SAM2模型的创新改进,旨在提升在复杂场景中的视觉对象追踪能力。

⚙️ 通过引入运动感知记忆机制,SAMURAI 能够准确预测物体运动并优化掩膜选择,避免了错误传播。

📈 在多个基准数据集上,SAMURAI 显示出强大的零 - shot 性能,显著提高了追踪成功率和精度。

详情链接:https://yangchris11.github.io/samurai/

8、苹果正在研发更具对话性的 Siri 语音助手 计划2026年发布

苹果公司正在积极开发一款全新的 Siri 语音助手,计划于2026年春季发布。这款助手将采用先进的大型语言模型技术,以提供更自然的对话体验。苹果希望通过这一创新,提升用户的交互体验,满足日益增长的对语音助手的期望。

【AiBase提要:】

🌟 苹果正在研发一款全新的 Siri 语音助手,计划于2026年春季发布。

🤖 新 Siri 将采用大型语言模型技术,能够实现更自然的对话体验。

🔗 在新版本发布之前,苹果将依赖第三方的 AI 功能,包括 OpenAI 的 ChatGPT。

9、到2025年,数据质量将成为AI成功的关键

随着人工智能技术的迅猛发展,数据质量和治理的重要性愈发凸显。专家们指出,企业在未来必须重视高质量、实时的数据,以推动AI的成功。开放平台的使用将促进数据的无缝集成,确保AI的创新能力。

【AiBase提要:】

🌟 数据质量和治理将主导 AI 的成功,而非生成性技术。

📈2025年,专有商业数据将成为推动 AI 效率和竞争力的核心。

🔄 开放平台与无关系统将促进 AI 的创新和数据的无缝集成。

10、全新突破!YouTube Shorts上线AI视频背景生成功能

YouTube 为 Shorts 功能推出了 Dream Screen,整合 Google DeepMind 的 Veo 模型,支持 AI 生成 1080p 视频背景。创作者可以输入场景描述,系统生成多个动态背景供选择。

image.png

【AiBase提要:】

🌟 通过整合Google DeepMind的Veo模型,YouTube Shorts现支持1080p AI视频背景生成,提升创作质量。

🎨 创作者只需简单描述场景,系统便可生成多种动态背景,令短视频创作更具创意。

🚀 这一功能目前已在多个国家上线,显示出YouTube在短视频领域的技术优势,进一步吸引全球创作者。

11、三星推出全新 Gauss2AI 模型或将成为下一个Galaxy大脑

三星在开发者大会上发布 Gauss 2 AI 模型,提升了性能和效率,适用于智能手机及家电等设备。Gauss 2 具备多模态能力,支持图像、文本和代码处理,运行速度比前代快 1.5 到 3 倍,且提供三种版本以满足不同需求。

【AiBase 提要:】

✨ 新增的对话模式允许用户在初始搜索后继续提问。

🔍 Brave 承诺保护用户隐私,不存储任何查询记录。

🤖 该功能结合了传统搜索与 AI 聊天的优势,提升搜索效率。

12. 重磅升级!Brave 搜索推出 AI 对话功能,打造搜索引擎新体验

Brave 搜索引擎近日推出了 AI 对话功能,增强了其 "Answer with AI" 功能的连续追问能力,使用户可以深入探讨搜索主题。此功能在提供信息的同时,保障用户隐私,不会存储查询记录。Brave 通过结合搜索引擎与 AI 聊天机器人的优势,提升了搜索体验的连贯性和深度。

image.png

【AiBase 提要:】

✨ 新增的对话模式允许用户在初始搜索后继续提问。

🔍 Brave 承诺保护用户隐私,不存储任何查询记录。

🤖 该功能结合了传统搜索与 AI 聊天的优势,提升搜索效率。

打开APP阅读更多精彩内容