(资料图片仅供参考)

9 月 11 日消息,美图公司旗下美图秀秀、RoboNeo、Wink 和 开拍等多款产品已基于通义万相系列模型进行深度开发与训练,推出全新动漫特效、AI 变身等视频生成功能。

/strip/ignore-error/1|imageslim">

早在去年 6 月,美图就已和阿里展开大模型合作,目前基于开源的通义万相首尾帧生视频、图生视频和文生视频等模型,美图结合自身在影像领域积累的经验已训练多个垂直领域模型,并在美图秀秀、RoboNeo 和 Wink 等多款产品上线。

据介绍,基于通义万相首尾帧生视频模型以及美图“AI 换装”能力,美图秀秀与Wink 推出了“打歌舞台”“相扑小子”“复古美漫”等功能风格,在稳定性和一致性上均表现优秀。例如使用打歌舞台功能,用户仅需上传一张人物照片,就能生成一段身穿舞台服装的人物形象在演唱会场景下舞动的视频。

基于通义万相图生视频模型,美图训练了垂直领域模型,目前已在美图旗下 AI 口播工具开拍“创意片头”功能上线,用户无需复杂提示词,就能一键生成创意片头,帮助视频创作者快速实现短视频开头的“黄金 3 秒”创意,让非专业用户也能一键做出有网感的开场效果。

此外,基于通义万相全能编辑模型 VACE,美图旗下视频编辑工具 Wink 和影像智能体 RoboNeo 上线了视频转绘风格功能,可将视频一键转换成多种动漫风格;RoboNeo还深度集成了通义万相的文生视频能力,用户只需输入一句话,就可以快速生成一段连贯且动态化的短视频,大幅降低视频创作的门槛。

自今年 2 月以来,通义万相已连续开源文生视频、图生视频、首尾帧生视频、全能编辑、音频生视频等多款模型,在开源社区和三方平台的下载量已超3000万,是开源社区最受欢迎的视频生成模型之一。目前,通义万相系列模型已广泛应用于影像、设计、影视等行业。

校对 陶善工

推荐内容