您现在的位置是：首页 > 科技讯息网站首页 科技讯息

腾讯混元发布并开源图生视频模型上线对口型与动作驱动等玩法

编辑：穆浩杰
2025-03-07 11:36:24
来源：网易

腾讯混元AI系统最近发布了一款新的图生视频模型，并且已经开源。这款新模型可以将图像转化为视频，支持包括对口型和动作驱动在内的多种玩法。

在图像到视频的转换过程中，该模型能够生成连贯且高质量的视频序列，使静态图像“活”起来。例如，用户上传一张包含人脸的图片，通过模型处理后，图片中的人脸不仅能够根据输入的音频对口型说话，还能做出相应的面部表情和头部动作，大大增强了用户的交互体验。

此外，该模型还支持动作驱动功能，即通过输入的动作参数或动画序列，控制图像中人物的身体动作，使其完成指定的动作。这使得图像不仅能表达语言信息，还能传达动作指令，丰富了应用场景，如虚拟主播、游戏动画制作等。

腾讯此次开源这一技术，旨在促进AI领域的交流与合作，推动图像处理和视频生成技术的发展。对于开发者而言，他们可以直接使用该模型进行二次开发，以满足特定需求，为用户提供更加丰富和个性化的服务。同时，这也意味着更多的创新应用将被开发出来，为用户带来前所未有的体验。

总之，腾讯混元AI系统的这一举措不仅展示了其强大的AI能力，也为AI技术的应用开辟了新的可能。

免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

标签：

相关文章

最新文章

Top