1、DeepSeek推首款推理模型R1-Lite-Preview,性能超越 OpenAI o1
DeepSeek最近推出的R1-Lite-Preview模型在推理能力上表现出色,甚至超越了OpenAI的o1-preview。这一创新不仅展示了透明的推理过程,还为用户提供了实时观察逻辑步骤的机会。未来DeepSeek计划发布开源版本和API,进一步推动开源AI社区的发展。
【AiBase提要:】
🌟 DeepSeek发布R1-Lite-Preview模型,性能接近并超越OpenAI o1。
📊 模型展示透明的推理过程,用户可以实时观察逻辑步骤。
🔍 深度学习与逻辑推理能力显著,未来将发布开源版本和API。
2、快手程一笑:可灵AI已有超500万用户 单月流水超千万元
快手科技在 2024 年第三季度业绩中显示,营收超 311 亿元,净利润达 39 亿元。程一笑介绍可灵 AI 已有 500 万用户,支持 1080P 视频生成,商业化进展显著,月流水超千万元。未来将继续探索多元化的变现模式,力求 AI 与业务场景结合,创造更大商业价值。
【AiBase提要:】
📈 第三季度营收达到311.3亿元人民币,同比增长11.4%,超出市场预期。
🤖 可灵AI自发布以来吸引超过500万用户,月活跃用户数突破150万,单月流水超过千万人民币。
💡 快手科技将继续推进AI大模型在短视频、直播等多个场景的应用,致力于实现算法创新和商业价值的提升。
3、阿里发布超100个开源模型 超30万家企业接入通义大模型
在 2024 年世界互联网大会上,阿里巴巴首席执行官吴泳铭强调人工智能对互联网行业的深远影响,介绍了阿里发布的 100 多个开源模型及 30 万家企业接入通义大模型的情况。他指出,AI 推动各行业生产力变革,并表示阿里将继续降低算力成本,促进 AI 技术的发展。
【AiBase提要:】
🌟 AI技术是今年互联网行业的主要变化,推动生产力变革。
📈 阿里巴巴目前已有30万企业使用通义大模型,开源模型数量超100个。
💰 推理成本大幅降低,阿里云致力于继续降低AI算力成本,促进行业发展。
4、AI版本《黑客帝国》问世!The Matrix实现无限生成720p视频,3A画质
随着人工技术的飞速发展,一个名为“The Matrix”的AI基础世界模拟器正式推出,能够无限生成高保真的720p真实场景视频,并支持实时交互,带来前所未有的虚拟体验。
【AiBase提要:】
🌐 AI版《黑客帝国》模拟器“The Matrix”问世,支持无限生成720p视频。
🎮 用户可实时控制视频场景,体验每秒16帧的动态画面。
🚀 该技术具备零样本泛化能力,能够预测不同环境中的物体行为。
5、次元壁破了?Comfyui_Object_Migration不仅支持一键换装,真人还能秒变3D模型
Comfyui_Object_Migration 技术,能够让用户通过上传服装图片和人物照片,轻松实现 “一键换装”。该技术不仅能实现跨次元服装风格转换,还能生成高质量的 3D 模型,极大地方便了设计师和二次元爱好者。
【AiBase提要:】
👗 一键换衣功能:用户只需上传服装和人物图片,轻松实现服装迁移,效果自然逼真。
🧵 跨次元换装:支持将卡通风格服装转为写实风格,打破次元壁,满足各种创意需求。
🖥️3D模型生成:将二维角色设计转换为三维模型,支持自定义动作和高保真度渲染,适合多种应用场景。
6、英伟达Blackwell AI 芯片进入全面生产,业绩屡创新高
英伟达的Blackwell AI芯片正式进入全面生产阶段,推动了公司业绩的持续增长。AI业务收入大幅提升,显示出市场对AI技术的强劲需求。尽管面临竞争压力,英伟达依然在AI领域保持领先地位。
【AiBase提要:】
🌟 英伟达的Blackwell AI芯片已进入全面生产,预计将持续推动业绩增长。
📈 本季度英伟达数据中心的AI收入达307亿美元,利润为193亿美元。
🚀 AMD也在加快AI芯片的开发,转型以适应市场需求。
7、glif又出爆款玩法!利用AI玩转Logo周边,一键生成超酷个性化设计!
最近,glif推出了一项基于In-Context LoRA的黑科技,能够将Logo转化为令人惊艳的周边设计。这个创新的设计流程分为三个步骤,展示了AI在创意设计领域的巨大潜力,为设计师和品牌方提供了革命性的个性化创作工具。
【AiBase提要:】
🖼️ 精准捕捉Logo图像特征,通过提示词提取核心视觉元素,分析构图和设计特点。
💡 智能生成定制化提示词,利用大语言模型重组Logo的DNA,赋予其新生命形态。
✨ 借助ComfyUI完成渲染,快速生成风格一致的周边设计,提升创意设计效率。
8、脑残视频学习法爆红TikTok:AI学习工具是真创新还是营销噱头?
“PDF 转脑残视频” 作为一种新兴的 AI 学习工具爆红TikTok。它通过将教材内容转为 AI 语音,并结合放松的视频,吸引年轻用户。这种学习方式在些情况下提高了学习趣味性,但同时也引发了对学习内容失真和营销真实性的担忧。专家提醒,过度依赖这种工具可能导致学习效果下降。
【AiBase提要:】
🎮 这种工具将教材内容转化为AI语音,配合ASMR或游戏画面,创造独特的学习氛围。
📈 尽管存在营销争议,这种学习方式为部分学生提供了新的可能性,帮助他们集中注意力。
⚠️ 专家警告,过度依赖可能导致学习内容失真,AI生成的潮语版本可能扭曲原始知识。
9、aiOla开源AI音频转录模型Whisper-NER 实时保护敏感信息
aiOla 推出了开源 AI 音频转录模型 Whisper-NER,能够在转录过程中实时遮蔽敏感信息,如个人姓名和电话号码。该模型基于 OpenAI 的 Whisper,支持多语言和口音,适用于法律、医疗等领域。开发者可以自定义和优化模型,促进 AI 技术的创新与发展。
【AiBase提要:】
📌 Whisper-NER模型可以实时遮蔽敏感信息,保护用户隐私。
🔍 该模型支持多种语言和口音,适用于法律、医疗和教育等多个领域。
💻 开源特性允许用户自定义和优化模型,促进AI技术的创新。
10、OpenAI CEO 薪酬曝光:去年年薪仅76001美元,财富却高达20亿
OpenAI 首席执行官山姆・阿尔特曼在 2023 年的薪酬为 76,001 美元,尽管薪水较低,但他的个人净资产已达到约 20 亿美元。阿尔特曼专注于公司长远发展和创新,而非短期收益,这体现了他的经营理念。OpenAI 在他领导下不断推出前沿产品,巩固了在人工智能领域的领先地位。
【AiBase提要:】
🌟 阿尔特曼在2023年的薪酬为76,001美元,较2022年增长3.4%。
💰 他的个人净资产估计达到20亿美元,显示出他在科技行业的成功。
🚀 阿尔特曼专注于 OpenAI 的长远发展,反映出他重视创新而非短期利益的经营理念。