快手可灵AI开启视频生成2.0时代！全球用户数已突破2200万_凤凰网财经

快手可灵AI开启视频生成2.0时代！全球用户数已突破2200万

凤凰网财经

04/16 14:16凤凰网财经官方账号来自北京市

4月15日，可灵AI在北京中关村国际创新中心举行“灵感成真”2.0模型发布会，宣布基座模型再次升级，面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。

数据显示，自去年6月发布以来，可灵AI已累计完成超20次迭代。截至目前，全球用户规模突破2200万。来自世界各地的超1.5万开发者和企业客户，将可灵的API应用于不同的行业场景中。

快手高级副总裁、社区科学线负责人盖坤

快手高级副总裁、社区科学线负责人盖坤表示，可灵希望让每个人都能用AI讲出好故事，实现更加精准的复杂创意表达。

可灵AI全系模型进入2.0时代，定义人和AI交互的全新方式

根据全球知名AI基准测试机构Artificial Analysis发布的最新的全球视频生成大模型榜单，快手可灵1.6pro（高品质模式）以1000分的Arena ELO基准测试评分登陆图生视频（Image to Video）赛道榜首。

作为全球首个用户可用的DiT视频生成模型，截至目前，可灵AI累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里，可灵AI的月活用户数量增长25倍。

盖坤认为，AI在辅助创意表达上拥有巨大潜力，但当前的行业发展现状还远远无法满足用户需求，在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍有“很多挑战”。在本次2.0模型的迭代中，可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language（MVL），让用户能够结合图像参考、视频片段等多模态信息，将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意，直接高效地传达给AI。MVL由TXT（Pure Text，语义骨架）和MMW（Multi-modal-document as a Word，多模态描述子）组成，能从视频生成设定的基础方向以及精细控制这两个层面，精准实现AI创作者们的创意表达。

基于MVL理念，可灵AI正式推出多模态编辑功能。“从今天起，大家可以在可灵AI的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入，生成符合自己想法的创意视频。”盖坤介绍，MMW将不只局限于图片和视频，也可以引入其它模态的信息，例如声音、运动轨迹等，让用户实现更加丰富的表达。

可灵2.0大师版正式发布，全新上线多模态视频编辑功能

基于MVL这一全新交互方式，发布会现场，快手副总裁、可灵AI负责人张迪发布了全新的可灵2.0大师版。可灵2.0大师版全面升级视频及图像创作可控生成与编辑能力，上线全新的多模态视频编辑功能，能灵活理解用户意图。支持在一段视频的基础之上，通过输入图片或文字，对生成的视频内容实现元素的增加、删减、替换，帮助创作者们实现更加灵活的二次编辑和处理。

可灵2.0大师版操作界面

张迪披露，快手的可图2.0拥有多项核心优势，诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。在风格化响应上，可图2.0可支持60多种风格化的效果转绘，模型出图创意和想象力实现大幅跃升。同时，可图2.0支持图像可控编辑功能——局部重绘和扩图，支持图片的增加、修改和修复。在图像的多模态可控生成中，可图2.0还上线了全新的风格转绘功能，只需要上传一张图片加上风格描述，就能一键切换图片的艺术风格，同时精准保留原图的语义内容。 AIGC技术迅猛发展，为全行业发展注入全新活力

除了C端订阅用户，可灵AI也面向B端商家提供API接入等服务。目前，可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。

盖坤披露，来自世界各地的超1.5万开发者，已将可灵的API应用于不同的行业场景中，累计生成的图像数量约1200万个，生成的视频素材超过4000万个。为了进一步激发AI爱好者们的创作热情，快手副总裁、可灵AI负责人张迪还在发布会现场正式发起“可灵AI NextGen 新影像创投计划”。该计划将加大对于AIGC创作者的扶持力度，通过千万资金投入、全球宣发、IP打造和保障，以全资出品、联合出品和技术支持等灵活多样的合作方式，让AI好故事走向世界。同时，可灵AI面向全球创作者发出征集邀约，邀请用户共同打造全球首支用户共创AI创意短片，让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。

打开APP阅读更多精彩内容