AI最新资讯|英伟达发布80亿参数新AI模型;Anthropic App 收入突破100万美元

每日行业新闻

1、英伟达发布 80 亿参数新 AI 模型:精度、效率高,可在 RTX 工作站上部署

英伟达发布 Mistral-NeMo-Minitron 8B 小语言 AI 模型,具备精度高、计算效率高等优点,可在 GPU 加速的数据中心、云和工作站上运行模型。

上月,英伟达携手 Mistral AI 发布开源 Mistral NeMo 12B 模型,在此基础上英伟达再次推出更小的 Mistral-NeMo-Minitron 8B 模型,共 80 亿个参数,可以在搭载英伟达 RTX 显卡的工作站上运行。

就其规模而言,Mistral-NeMo-Minitron 8B 在语言模型的九项流行基准测试中遥遥领先。这些基准涵盖了各种任务,包括语言理解、常识推理、数学推理、总结、编码和生成真实答案的能力。

2、历时 16 周,Anthropic 的 Claude AI 移动应用收入突破 100 万美元

根据应用情报公司 Appfigures 公布的最新报告,Anthropic 的 Claude 移动应用解锁新成就,在谷歌 Play Store 和苹果 App Store 上的应用总收入突破了 100 万美元。

不过,Claude 的排名仍然远远落后于主要竞争对手 ChatGPT,后者在美国 iOS 平台上的总下载量排名第一,收入排名第 26 位。在生产力类别中,Claude 的下载量仅排名第 95 位,收入排名第 68 位。

Claude 上架首周外界反应较为平淡,全球下载量仅为 15.7 万次。

相比之下,ChatGPT 在美国推出仅限 iOS 系统的头五天内,移动应用程序的安装量就达到了 48 万次,且 3 周就解锁 100 万美元成就。

不过 Claude 还是领先于Copilot 和 Perplexity,后者分别用了 19 周和 22 周才达到 100 万美元这一数字。

3、微软 Azure AI 语音服务推出虚拟人形象,支持文本转视频

微软 Azure AI 语音服务允许开发者构建多语言生成式 AI 语音应用,Azure AI 语音服务最新推出了文本到语音虚拟人功能,可以将简单的文本转换为人类自然说话视频。

今天,微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧。

4、Midjourney全面开放网站,向所有用户免费提供每天25张额度

曾经在AI图像生成领域无可匹敌的领导者Midjourney,上周五推出了网页版图像编辑器。新编辑器巧妙集成了重绘、缩放等核心功能。不仅提高了操作效率,而且使整体交互逻辑更加清晰。

8月22日,Midjourney宣布,将升级后的新工具向所有人免费开放试用。

之前,Midjourney 一直局限于 Discord 平台,去年还推出过一个 “alpha” 网站,限制了只有生成一定数量图像的用户才能使用。而现在,无论你是不是注册用户,都可以在这个全新的平台上体验到 AI 图像生成的乐趣。

联合创始人兼 CEO 大卫・霍尔茨表示,新用户可以免费生成大约25张图像。这对新用户和现有用户来说,都是一个很好的机会,大家可以在没有任何经济负担的情况下,尽情探索这个平台的功能。

5、谷歌任命原Character.AI首席执行官为Gemini联合技术负责人

相关报道援引公司发送给员工的消息称,本月重返谷歌的Character.AI联合创始人兼原首席执行官诺姆·沙泽尔(Noam Shazeer)将担任谷歌人工智能项目“双子座”(Gemini)的联合技术负责人。沙泽尔将与谷歌长期从事人工智能研究的Jeff Dean和Oriol Vinyals一起开发Gemini,其目标是与OpenaI的GPT竞争。

6、Ideogram发布最新版文生图模型Ideogram 2.0,所有用户免费使用

Ideogram团队隆重发布了其最新版本的文本到图像模型——Ideogram2.0。这一重磅更新不仅为用户带来了免费的使用权限,更引入了一系列创新功能和工具,标志着文本到图像技术的一次重大飞跃。

Ideogram2.0最引人注目的特性之一是其多样化的样式选择。

用户现可在常规、现实、设计、3D和动漫五种风格中任选,以满足不同创作需求。其中,"写实"样式尤为出众,能够生成极为逼真的照片级图像,大幅提升了纹理质量,使人物特征如手、眼睛、皮肤和头发更加栩栩如生。

针对专业设计需求,Ideogram2.0对设计样式进行了重大改进,特别是在文本渲染方面。这使得用户能够轻松创建高级图形设计,如贺卡、T恤设计、海报和插图,同时支持更长、更准确的文本呈现。

为了让用户更好地掌控创作过程,Ideogram2.0引入了强大的色彩控制功能。用户可以从多个预设图像调色板中选择,精确控制配色方案,也可以自定义调色板,以确保品牌一致性或捕捉特定氛围。

7、豆包大模型综合能力提升20.3%,火山引擎成立零售大模型生态联盟,加速企业AI落地

2024火山引擎 AI 创新巡展在上海举办,带来豆包大模型的一系列产品升级。豆包语音模型和视觉模型再升级,对话式 AI 实时交互解决方案进一步强化 AI 交互体验。

此外,火山引擎携手多点 DMALL 成立了零售大模型生态联盟,同时介绍了汽车大模型生态联盟最新进展,宣布 AI 创造者大赛开赛。来自沐瞳、浙江大学等单位的嘉宾就与火山引擎合作、落地大模型的实践进行了分享。

火山引擎总裁谭待表示,豆包大模型获得众多行业客户青睐,模型能力也在持续提升。最新版豆包大语言模型的综合能力相比三个月前首次发布时提升了20.3%,豆包·文生图模型、豆包·语音识别模型等模型也有大幅升级,对话式 AI 实时交互解决方案整合了豆包大模型和实时音视频(RTC)技术,为用户提供更顺畅、自然的交互体验。

8、AI辅助搜索越来越受欢迎 Perplexity计划在四季度开始投放广告

人工智能(AI)搜索初创公司Perplexity AI宣布,该公司计划于第四季度在其搜索应用程序上投放广告。

据知情人士声称,在广告方面,Perplexity将采用一种名为CPM(每千次展示成本)的模式,价格将超过50美元。它指的是广告主付给媒体的每千次广告展示费用,而不是每次点击费用。

CPM价值在于,可以让广告主更好地控制广告展示的频率和成本,同时也能让媒体利用广告位获得更高的收益。

Perplexity在其推介材料中表示,其主要广告类别最初将包括科技、健康和制药、艺术和娱乐、金融以及食品和饮料等主题。广告商将能够赞助答案下方的“相关问题”,并在答案右侧购买展示广告。

实际上,Perplexity早在4月份就宣布了这一计划,但并未公布实施时间。据介绍,超过八成的Perplexity用户拥有本科学历,而三成的用户处于“高级领导职位”,65%的用户处于“高收入白领职业”,如医学、法律和软件工程。

Perplexity成立于2022年,其定位为AI搜索引擎公司,和ChatGPT一样,它将利用AI对谷歌发起挑战,它也是用户增长最快的生成式AI应用之一。

每日投融资事件

1、用AI检测对抗AI伪造,「中科睿鉴」完成近亿元融资

近日数字内容伪造检测企业“中科睿鉴”,已经完成了近亿元融资,由达晨财智独家投资。据了解,该轮融资主要的用途是将业务线从ToG拓展成ToG、B和C三条产品线,实现AI鉴伪产品的规模化。

中科睿鉴成立于2020年,主打用AI技术检测AI伪造的音视图文内容,包括深度伪造(Deepfake)、生成式人工智能伪造(AIGC)、软件编辑篡改(PS)等,在AI伪造检测、虚假信息识别、多媒体内容安全审核、大模型安全评估等场景具有技术的布局,面向监管单位、企业、个人提供解决方案和产品服务。

打开APP阅读更多精彩内容