4MITeKXwZ37 tech.huanqiu.comarticle可灵AI发布升级版系列模型 开启视频生成2.0时代/e3pmh164r/e3pmh18ap【环球网科技综合报道】4月15日,可灵AI在北京举行“灵感成真”2.0模型发布会,宣布基座模型再次升级。此次升级涵盖视频生成领域的可灵2.0模型和图像生成领域的可图2.0模型。数据显示,自2024年6月首次发布以来,可灵AI已完成20余次技术迭代,目前全球注册用户超过2200万。来自150多个国家和地区的1.5万余家开发者与企业,将可灵的API应用于不同的行业场景中。可灵AI全系模型升级,重新定义人与AI的交互方式据悉,本次升级主要围绕模型基础性能提升展开。可灵2.0模型在动态表现、语义理解、视觉美感等关键技术指标达到行业领先水平;可图2.0模型则优化了指令执行精度与艺术风格呈现效果。据团队内部评估,在文字相关性、画面清晰度等核心维度较前代产品有显著改进。自去年6月发布以来,可灵AI已累计完成超20次迭代。3月27日,全球知名AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)以1000分的Arena ELO基准测试评分登陆图生视频(Image to Video)赛道榜首。截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里,可灵AI的月活用户数量增长25倍。快手高级副总裁盖坤认为,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍有“很多挑战”。也因此,要真正实现“用AI讲好每一个故事”的愿景,必须对基模型能力进行全方位提升,定义人和AI交互的“全新语言”。 一直以来,可灵AI致力于提升模型基础质量和模型效果,并引入更多创新功能,以满足用户的多样化需求。在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),该模式通过整合文本指令与多模态参考素材(含图像、视频片段),帮助用户更精准地传达创作意图。快手高级副总裁盖坤表示:"单纯的文字描述难以完整呈现影像信息,我们需要建立更高效的人机交互语言。"基于此理念开发的编辑工具支持用户通过图文混合输入,实现对视频内容的增删改操作。现场演示显示,系统可快速解析用户提供的参考图,完成场景替换、角色调整等复杂编辑任务。可灵2.0大师版发布,上线多模态视频编辑功能 基于MVL这一全新交互方式,发布会现场,快手副总裁、可灵AI负责人张迪发布了全新的可灵2.0大师版,在语义响应、动态质量、画面美学等方面显著提升生成效果。“可灵2.0大师版不仅仅是一次简单的技术升级,更是一次全方位的体验跃升。”张迪介绍,可灵2.0大师版实现了技术、体验、美学的三重突破。值得一提的是,可灵2.0大师版全面升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能,能灵活理解用户意图。支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。张迪披露,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。张迪介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。同时,可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图2.0还上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时精准保留原图的语义内容。AIGC技术赋能,为全行业发展注入新活力除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务。目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系,为广告营销、专业创作、影视制作、娱乐创意等领域提供技术支持。盖坤披露,来自世界各地的超1.5万开发者,已将可灵的API应用于不同的行业场景中,累计生成的图像数量约1200万个,生成的视频素材超过4000万个。据二次元创作平台狸谱负责人一休介绍,接入可灵AI后,平台动态效果处理能力显著提升,近期推出的"新春萌偶摇"活动获得60万次传播。可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇分享了影视制作中的应用经验:"相比传统拍摄,AIGC技术极大扩展了创作可能性。我们已完成首部全程依托AI生成的剧集级作品,验证了其在工业化生产中的可行性。"为了进一步激发AI爱好者们的创作热情,快手副总裁、可灵AI负责人张迪发起“可灵AI NextGen 新影像创投计划”。该计划将加大对于AIGC创作者的扶持力度,通过千万资金投入、全球宣发、IP打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让AI好故事走向世界。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。面向未来,盖坤表示,可灵AI将持续大力推动技术创新,用人与AI交互的全新语言,帮助用户实现复杂创意的精确表达,“我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来”。(心月) 1744770005905环球网版权作品,未经书面授权,严禁转载或镜像,违者将被追究法律责任。责编:吴涛环球网17447700059051[]//img.huanqiucdn.cn/dp/api/files/imageDir/74612133288c243da05123821cdfdfddu1.png{"email":"wutao@huanqiu.com","name":"吴涛"}
【环球网科技综合报道】4月15日,可灵AI在北京举行“灵感成真”2.0模型发布会,宣布基座模型再次升级。此次升级涵盖视频生成领域的可灵2.0模型和图像生成领域的可图2.0模型。数据显示,自2024年6月首次发布以来,可灵AI已完成20余次技术迭代,目前全球注册用户超过2200万。来自150多个国家和地区的1.5万余家开发者与企业,将可灵的API应用于不同的行业场景中。可灵AI全系模型升级,重新定义人与AI的交互方式据悉,本次升级主要围绕模型基础性能提升展开。可灵2.0模型在动态表现、语义理解、视觉美感等关键技术指标达到行业领先水平;可图2.0模型则优化了指令执行精度与艺术风格呈现效果。据团队内部评估,在文字相关性、画面清晰度等核心维度较前代产品有显著改进。自去年6月发布以来,可灵AI已累计完成超20次迭代。3月27日,全球知名AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)以1000分的Arena ELO基准测试评分登陆图生视频(Image to Video)赛道榜首。截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里,可灵AI的月活用户数量增长25倍。快手高级副总裁盖坤认为,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍有“很多挑战”。也因此,要真正实现“用AI讲好每一个故事”的愿景,必须对基模型能力进行全方位提升,定义人和AI交互的“全新语言”。 一直以来,可灵AI致力于提升模型基础质量和模型效果,并引入更多创新功能,以满足用户的多样化需求。在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),该模式通过整合文本指令与多模态参考素材(含图像、视频片段),帮助用户更精准地传达创作意图。快手高级副总裁盖坤表示:"单纯的文字描述难以完整呈现影像信息,我们需要建立更高效的人机交互语言。"基于此理念开发的编辑工具支持用户通过图文混合输入,实现对视频内容的增删改操作。现场演示显示,系统可快速解析用户提供的参考图,完成场景替换、角色调整等复杂编辑任务。可灵2.0大师版发布,上线多模态视频编辑功能 基于MVL这一全新交互方式,发布会现场,快手副总裁、可灵AI负责人张迪发布了全新的可灵2.0大师版,在语义响应、动态质量、画面美学等方面显著提升生成效果。“可灵2.0大师版不仅仅是一次简单的技术升级,更是一次全方位的体验跃升。”张迪介绍,可灵2.0大师版实现了技术、体验、美学的三重突破。值得一提的是,可灵2.0大师版全面升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能,能灵活理解用户意图。支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。张迪披露,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。张迪介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。同时,可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图2.0还上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时精准保留原图的语义内容。AIGC技术赋能,为全行业发展注入新活力除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务。目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系,为广告营销、专业创作、影视制作、娱乐创意等领域提供技术支持。盖坤披露,来自世界各地的超1.5万开发者,已将可灵的API应用于不同的行业场景中,累计生成的图像数量约1200万个,生成的视频素材超过4000万个。据二次元创作平台狸谱负责人一休介绍,接入可灵AI后,平台动态效果处理能力显著提升,近期推出的"新春萌偶摇"活动获得60万次传播。可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇分享了影视制作中的应用经验:"相比传统拍摄,AIGC技术极大扩展了创作可能性。我们已完成首部全程依托AI生成的剧集级作品,验证了其在工业化生产中的可行性。"为了进一步激发AI爱好者们的创作热情,快手副总裁、可灵AI负责人张迪发起“可灵AI NextGen 新影像创投计划”。该计划将加大对于AIGC创作者的扶持力度,通过千万资金投入、全球宣发、IP打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让AI好故事走向世界。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。面向未来,盖坤表示,可灵AI将持续大力推动技术创新,用人与AI交互的全新语言,帮助用户实现复杂创意的精确表达,“我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来”。(心月)