您现在的位置是:首页 > 科技讯息网站首页科技讯息

腾讯混元发布并开源图生视频模型 上线对口型与动作驱动等玩法

  • 编辑:穆浩杰
  • 2025-03-07 11:36:24
  • 来源:网易

腾讯混元AI系统最近发布了一款新的图生视频模型,并且已经开源。这款新模型可以将图像转化为视频,支持包括对口型和动作驱动在内的多种玩法。

在图像到视频的转换过程中,该模型能够生成连贯且高质量的视频序列,使静态图像“活”起来。例如,用户上传一张包含人脸的图片,通过模型处理后,图片中的人脸不仅能够根据输入的音频对口型说话,还能做出相应的面部表情和头部动作,大大增强了用户的交互体验。

此外,该模型还支持动作驱动功能,即通过输入的动作参数或动画序列,控制图像中人物的身体动作,使其完成指定的动作。这使得图像不仅能表达语言信息,还能传达动作指令,丰富了应用场景,如虚拟主播、游戏动画制作等。

腾讯此次开源这一技术,旨在促进AI领域的交流与合作,推动图像处理和视频生成技术的发展。对于开发者而言,他们可以直接使用该模型进行二次开发,以满足特定需求,为用户提供更加丰富和个性化的服务。同时,这也意味着更多的创新应用将被开发出来,为用户带来前所未有的体验。

总之,腾讯混元AI系统的这一举措不仅展示了其强大的AI能力,也为AI技术的应用开辟了新的可能。

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
Top