AI日报：可灵1.5模型升级！上线人脸模型；华为Mate 70系列将支持AI隔空传送；Runway新增视频扩展画面功能_

AI日报：可灵1.5模型升级！上线人脸模型；华为Mate 70系列将支持AI隔空传送；Runway新增视频扩展画面功能

站长之家

11/25 15:52站长之家官方账号来自福建

1、可灵AI平台1.5模型升级:上线人脸模型功能新增「标准模式」

可灵 AI 平台最近升级至1.5版本，推出多项新功能，包括增强的高品质视频生成模式和新增的标准模式，后者支持快速生成720p 视频。新的人脸模型功能面向高级会员开放，用户可在训练后随时生成视频。

【AiBase提要:】

🎨 高品质模式增强，用户可指定运动轨迹，添加静止区域，提供更精细的控制。

⚡ 新增标准模式，快速生成720p视频，创作时间大幅缩短，性价比高。

👤 人脸模型功能面向会员开放，解决人脸ID保持难题，支持随时调用生成视频。

2、Runway新增视频扩展画面功能“Expand Video”

Runway 近日推出 “Expand Video” 功能，用户可通过文本提示在原视频基础上生成额外视觉内容，并调整视频。该功能支持动态效果，如快速变焦和拉远镜头，使视频更加生动。此工具标着视频生成技术的又一进步，进一步丰富创作可能性。

打开凤凰新闻客户端提升3倍流畅度

【AiBase提要:】

🎥 新功能上线: RunwayML推出“Expand Video”，允许用户通过文本提示在原视频基础上扩展内容。

⚙️ 动态效果实现: 用户可以创造快速变焦和拉远镜头等动态效果，提升视频的视觉体验。

🚀 生成速度提升: 新一代Gen-3Alpha模型生成速度显著提高，满足用户快速创作的需求。

3、华为Mate70系列将支持AI隔空传送余承东亲自演示

华为 Mate70系列即将发布，搭载 AI 隔空传送和魔法手势操作功能。用户可通过手势轻松传送内容，提升使用体验。此外，Mate70系列将首次搭载原生鸿蒙系统，标志着华为在移动操作系统领域的进展。

【AiBase提要:】

🤖 AI隔空传送:用户可通过简单手势将内容从Mate70手机传送至平板，操作便捷。

✋ 魔法手势操作:在不便用手时，用户可通过手势翻页等操作，增加灵活性。

🌐 原生鸿蒙系统:Mate70系列首次搭载原生鸿蒙系统，标志着中国在移动操作系统领域的进步。

4、Lightricks开源实时视频生成模型LTX-Video 生成一个视频只要4秒!

Lightricks 推出了名为 LTX Video 的开源视频生成模型，具有20亿参数。该模型可以以每秒24帧的速度生成高达5秒的视频，仅需4秒，性能显著。LTXV 与 ComfyUI 无缝集成，提升用户体验，促进创意产业的发展。

打开凤凰新闻客户端提升3倍流畅度

【AiBase提要:】

🚀 LTXV模型基于扩散变换器架构，拥有20亿参数，生成速度快于视频播放，4秒生成5秒视频。

💻 采用bfloat16精度，在主流显卡上高效运行，优化内存使用，确保视频质量。

🌍 LTXV与ComfyUI无缝集成，降低使用门槛，推动创意科技的民主化，为创作者提供无限可能。

5、EchoMimicV2:输入图片、音频和手势视频即可生成“同款”数字人

EchoMimicV2是最新的动画生成技术，支持输入一张图、一段手势视频和一段音频，能够生成高质量的半身人类动画该技术通过 Audio-Pose Dynamic Harmonization 策略提升动画细节，简化生成过程，并引入头部局部注意力机制来解决数据稀缺问题。

打开凤凰新闻客户端提升3倍流畅度

【AiBase提要:】

✨ EchoMimicV2通过简化控制条件，实现高质量的半身人类动画生成。

🎨 采用 Audio-Pose Dynamic Harmonization 策略，提升动画细节与表现力。

📊 新基准评估方法显示，EchoMimicV2在效果上优于现有技术。

6、音频驱动生成面部视频技术JoyVASA

JoyVASA 是一种新兴的音频驱动图像动画技术，旨在提升视频质量和嘴形同步精度。其创新的两阶段设计使得生成更长的动画视频成为可能，同时支持人物和动物的动画化，展现出良好的多语言支持能力。

【AiBase提要:】

🎨 JoyVASA 技术通过解耦面部表情与三维模型，实现更长的动画视频生成。

🔊 该技术能够根据音频线索生成动作序列，具有人物与动物动画的双重能力。

🌐 JoyVASA 在中英文数据集上训练，具备多语言支持，为全球用户提供服务。

7、PicMenu:用AI将菜单可视化随手一拍就能生成高质量菜单

PicMenu 是一款创新的 AI 菜单可视化工具，通过简单的拍照操作，将传统纸质菜单转化为生动直观的数字化展示。它为餐饮行业的数字化转型提供了全新解决方案，展现出极强的实用性和技术实力。

【AiBase提要:】

📸 PicMenu 能通过拍照自动识别并提取菜品信息，生成高质量的数字化菜单展示。

🌍 该工具采用多重 AI 技术栈，确保菜品信息提取和图像生成的高效性与准确性。

🔧 项目开源，开发者可通过 GitHub 获取源代码，便于个性化定制和部署。

8、英伟达发布Edify3D生成模型2分钟即可生成高质量3D资产

NVIDIA 推出的 Edify3D 技术能够在两分钟内，根据文本描述或参考图像生成高质量的3D 模型，具备完整的 UV 贴图、4K 纹理和 PBR 材质。该技术结合了多视角扩散模型和基于 Transformer 的重建技术，显著提高了3D 资产的创作效率，支持多样化的应用场景。

打开凤凰新闻客户端提升3倍流畅度

【AiBase提要:】

🎨 Edify3D技术能在两分钟内生成高质量3D模型，支持完整UV贴图和4K纹理，适用于多种行业。

🔍 该技术结合了多视角扩散模型和Transformer重建技术，确保生成的模型具有精确的网格结构和高分辨率纹理。

🌐 Edify3D还支持根据文本提示生成复杂3D场景，提供了强大的艺术设计和3D建模支持。

9、更聪明了!小米智能家庭屏系列产品推送大模型超级小爱

小米公司宣布对智能家庭屏系列产品进行大模型升级，增加超级问答和闲聊对话等新功能。此次升级覆盖六款设备，用户需通过小爱音箱 App 完成设置。升级后，音箱将支持文本创作，具备更全面的知识库，提升用户体验。

【AiBase提要:】

🔧 升级覆盖六款设备，包括Xiaomi智能家庭屏10和小米小爱触屏音箱Pro8等。

📱 用户需将音箱升级到最新版本，并在App中设置大模型功能。

🌐 新功能支持文本创作和实时搜索，用户可直接向音箱询问各种问题。

10、REDMI K80Pro搭载Xiaomi AISP2.0影像算法:融合四大模型

小米公司今日披露了REDMI K80系列手机的影像配置细节，标志着该系列在摄影能力上的全面提升。Xiaomi AISP2.0包含了融合光学大模型2.0、影调大模型2.0、色彩大模型2.0以及人像大模型2.0，这些技术的应用将进一步提升K80Pro的影像处理能力。

【AiBase提要:】

📷 REDMI K80系列搭载旗舰级高动态主摄和浮动长焦镜头，满足高质量摄影需求。

⚙️ K80Pro内置Xiaomi AISP2.0技术，支持150张全算法高画质快拍，提升拍摄体验。

💰 标准版与Pro版在主摄和体验上保持一致，但不含高成本浮动长焦镜头，提供更具性价比的选择。

11、胖东来发声明:警告多账号擅自利用AI生成于东来声音

胖东来商贸集团近日发布声明，警告多个账号未经授权使用其创始人于东来声音，并篡改视频内容。这些行为严重侵犯了公司的著作权和人格权，误导公众，影响品牌形象。胖东来表示将采取法律措施追究责任，以维护其合法权益和网络生态的正常秩序。

【AiBase提要:】

🔊 多个账号利用AI生成与于东来相似的声音，进行非法剪辑和篡改。

⚖️ 胖东来强调此行为侵犯著作权，并制造虚假信息，破坏网络生态。

🚫 公司要求相关账号立即停止侵权，并表示将采取法律行动。

12、2028年全球生成式AI芯片市场预计将达862.4亿美元

根据最新报告，生成式人工智能芯片市场正在经历快速增长，预计到2028年市场规模将达到862.4亿美元。这一增长反映了对计算能力的需求激增和云计算的普及。

【AiBase提要:】

🌟 市场规模预计到2028年将达862.4亿美元，年均增长率为27.9%。

💻 主要驱动因素包括计算能力需求增加、深度学习发展及云计算普及。

📈 高通推出新一代芯片，提升智能手机生成式AI能力，推动市场创新。

打开APP阅读更多精彩内容