
公司情报专家《财经涂鸦》获悉,12月16日,阿里发布国内首个支持角色扮演功能的视频模型——新一代万相2.6系列模型,面向专业影视制作和图像创作场景进行全面升级。
该模型同时支持音画同步、多镜头生成及声音驱动等功能,目前已同步上线阿里云百炼、万相官网。
当天,千问APP亦迅速上线“AI小剧场”功能,提供Sora2同款玩法,并宣布接入万相Wan2.6模型。原创方向,该功能可支持定制个人AI分身,生成原创视频,并邀请好友合拍;二创方面,用户可基于分享的视频模版,上传图片替换人物和自己,增加创意。
今年9月,阿里曾在国内发布音画同步的视频生成模型万相2.5,极大提升了视频创作效率。在权威大模型评测集LMArena上,万相图生视频位居国内第一。
截至目前,万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力,已广泛应用于AI漫剧、广告设计和短视频创作等领域。
此次发布的万相2.6在画质、音效、指令遵循等方面有进一步提升,单次视频时长实现国内最高的15s,并新增了角色扮演和分镜控制功能,不仅能一键完成单人、多人、人与物合拍的视频,还能自动实现多镜头切换等专业任务,满足专业影视级场景需求。
据介绍,通义万相在模型结构上集成了多项创新技术,可对输入参考视频进行多模态联合建模与学习,参考具有时序信息的主体情绪、姿态和多角度全面视觉特征,同时提取音色、语速等声学特征,在生成阶段作为参考条件控制,实现从画面到声音的全感官全维度一致性保持与迁移,目前可支持单人和多人的表演。
在分镜控制上,通义万相能通过高层语义理解,将原始输入构建为具备完整故事线与叙事张力的专业级多镜头段落,在多镜头丝滑切换的过程中保持核心主体、场景布局和环境氛围统一建模,确保全片在内容、节奏和氛围上的高一致性。
同时,角色扮演功能可令普通用户也能在影视级画面里表现精湛的演技。例如,用户上传一段个人视频,并输入一段科幻悬疑风格的提示词,万相2.6即可快速完成分镜设计、角色演绎、画面配音等环节工作,生成一段镜头叙事完整、电影级运镜的短片。
面向广告设计、短剧制作等专业场景,通过输入连续提示词,万相还能生成一段完整叙事的短片,让人人都能当导演。例如,输入一段广告创意的提示词,万相2.6能生成一段包含人物角色和商品的广告视频,并且在多镜头切换的情况下保持主体、场景等关键信息的一致性。
自发布当日,公众可直接在万相官网体验万相2.6。企业用户可能通过阿里云百炼调用模型API。
作者:苏打
编辑:tuya
出品:财经涂鸦(ID:caijingtuya)
本文作者可以追加内容哦 !
本文来源:财经涂鸦
来源:财经涂鸦
重要提示:本文仅代表作者个人观点,并不代表乐居财经立场。 本文著作权,归乐居财经所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至ljcj@leju.com,或点击【联系客服】