百度智能云首发智能视频云3.0全景图

DoNews5月14日消息(程梦玲)5月13日,百度智能云“云智技术论坛-智能视频专场”活动在北京举行,重磅发布了智能视频云3.0全景图。百度智能视频云3.0基于云原生架构,融合百度前沿的视频云技术和AI能力架构矩阵,从云智技术一体化、产品平台化、应用场景化三个层面全面赋能视频创作、生产、应用等全流程。

百度集团副总裁侯震宇在致辞中表示,消费互联网内容视频化加速发展的同时,许多行业的业务也正在不断被视频化,变化趋势背后的驱动力是AI与云计算的发展,使得智能视频体验进入内容高清化、体验沉浸化、分析智能化的新阶段。各行业为了积极应对业务视频化趋势,需要开始统一规划云智一体的视频平台。百度在视频领域有长期丰富的业务实践,并据此构建了云智一体的领先技术能力,希望为各行业的智能视频发展提供强大助力。

论坛上,百度智能视频云总经理连林江详细解析了智能视频云3.0全景图。智能视频云3.0将“云智一体”的独特优势与视频技术全面融合,形成云智一体化、平台化、全场景化,为行业提供前沿的视频云技术、全面的AI视频能力矩阵、实用的视频创作分发平台和视联网感知平台,以及覆盖全场景的智能视频技术方案。

云边端一体的基础技术架构是智能视频云3.0的核心依托,目前智能云视频3.0已构建起完整的云边端基础产品体系,进一步拓展算力边界。在此基础上,智能视频云3.0具有完整的技术能力与产品矩阵,满足高扩展、高稳定、高性能、高效率的需求。其中,视频分发基础设施CDN拥有遍布全球1000+节点、100T带宽储备,以强大网络基础设施带来极致视频分发体验和效率;智能编码技术的BD265编码器通过深度学习网络提取视频特征生成自适应编码参数,并自研60+种算法,实现同画质降低码率30%+、提速2x+;智感超清的视频处理技术,通过老片修复、画质增强、4K超分等方面大幅提升画质体验、弥补超高清内容缺失,加速了超高清产业发展,相关技术在国际权威比赛中屡次夺冠;实时音视频通讯依靠核心自研的多个算法,实现通讯顺畅的超低延时互动体验;低延时直播在采用全链路SRT协议技术传播方案与mpegTS封装结合上,可稳定支撑千万级直播并发;面向不同业务场景提供All in one的智能视频SDK矩阵能力,涵盖视频特效、短视频、互动直播、播放器、增强超分等。

基于云智一体,百度智能视频云3.0的视频创作分发平台和视联网感知平台面向不同场景应用提供一站式服务和平台化支撑。视频创作分发平台面向泛互联网、泛媒体行业,聚焦工作流和媒介资源管理,覆盖视频接入、生产、处理、审核分析和个性化推荐分发全流程,利用AI能力对于数据的分析理解加快数据流动、提高媒资数据利用率。视联网感知平台面向传统产业,对视频端设备和泛视频数据流进行统一连接、分析和管理,实现通用的面向生产、控制和治理等场景的链接、链感、链管的基础平台,在企业生产、园区管理、城市和社会治理方面能发挥重要价值。

在云能力基础之上,AI能力使得智能视频从“刀耕火种”走向“精耕细作”。 百度视觉技术部总监丁二锐介绍了“智能视频云3.0全景图”的AI能力。在视频内容理解分析上,可通过图像、声音、场景、人物、文本描述等信息,对进行视频智能分析、内容智能审核、智能检索。基于百度自研业界最大包含了5500亿海量知识的多元异构知识图谱,增强视频深度理解,提升视频编目效率,支持视频分析、审核、检索等方面得到广泛应用。在视频智能生产上,通过图文资讯、数据、图集等多种内容载体向短视频进行转换,并基于知识图谱对结构化数据、事件脉络进行增强理解,实现创新的视频生成。在视频交互与生成方面,全新构建了交互与生成AI能力矩阵,其中基于元学习-迁移学习的视频生成技术可根据需求快速定制不同风格的高质量视频;同时结合虚拟数字人形象生成与语音合成、唇动等技术,可低成本制作形象丰富灵动、线上线下多端覆盖的的数字人,不仅交互自然、声音动听,还能够适配多种业务场景需求,如百度智能云的数字人虚拟主播“小C”,在今年两会直播节目担任主持人时拥有出色的表现。

论坛现场还分享了百度智能视频云在泛互联网、泛媒体和泛产业方向的智能视频方案与应用案例,覆盖互动娱乐、内容生产、智能分析、远程实时通讯、生产管理、安全管理等场景。

打开APP阅读更多精彩内容