灵动人像LivePortrait
首页 > AI视频 > 数字人

灵动人像LivePortrait

灵动人像LivePortrait是阿里云推出的AI数字人视频生成工具,基于一张静态肖像照片和文字/音频,即可生成人物开口说话的动态视频。它操作简单、效果自然,适合视频创作、直播、企业营销等场景。

标签: 数字人
Trae

灵动人像LivePortrait:让照片“活过来”的AI神器

灵动人像LivePortrait是阿里云推出的AI数字人视频生成工具,基于一张静态肖像照片和文字/音频,即可生成人物开口说话的动态视频。它操作简单、效果自然,适合视频创作、直播、企业营销等场景。

灵动人像LivePortrait(图1)

 一、核心优势与特点

  1. 操作便捷,小白友好

    无需专业设备或剪辑技能,上传照片+文字/音频即可生成视频。

    支持在线使用(如魔搭社区)和本地部署两种模式。

  2. 高度拟真的表情和动作

    精准口型同步:采用阿里云自研算法,让口型与音频高度匹配。

    自然眼神控制:通过技术模拟眨眼频率(0-4档可调),增强真实感。

  3. 丰富的个性化选择

    提供28种声音类型,可自由搭配不同音色。

    支持唇齿修复功能,优化细节效果。

  4. 低成本高效率

    在线版按使用时长计费(0.02元/秒),适合轻量需求。

    本地部署开源免费,适合开发者或高频用户。

二、使用教程(以在线版为例)

    步骤1:访问平台

        打开阿里云魔搭社区的[灵动人像LivePortrait页面](https://modelscope.cn/studios/DAMOXR/LivePortrait/summary),无需安装软件即可使用。

    步骤2:上传素材

        肖像照片:选择正面清晰、光线均匀的人物照片(建议分辨率≥512×512)。

        驱动内容:

            -文字驱动:输入100字以内的文案,系统自动转换为语音。

            - 音频驱动:上传MP3/WAV格式的录音文件(时长≤30秒)。

    步骤3:调整参数

        声音选择:从28种预设音色中挑选合适的声音。

        唇齿修复:若口型模糊,勾选修复功能优化细节。

        眨眼频率:设置0-4档(数值越大眨眼越频繁)。

    步骤4:生成与导出

        点击“生成视频”,等待约1-3分钟即可预览效果。满意后下载MP4格式文件,支持直接用于社交媒体或二次剪辑。

 三、注意事项

  1. 素材要求:照片需为正面半身照,避免遮挡五官或复杂背景。

  2. 免费额度:

    新用户可享1800秒免费生成时长(有效期180天)。

  3. 常见问题:

    若网页无法打开,尝试更换浏览器或关闭屏蔽插件。

    本地部署需安装Python环境及FFmpeg工具(参考官方文档)。

四、适用场景

    自媒体创作:为静态人物配解说,制作趣味短视频。

    企业营销:生成虚拟主播介绍产品或活动。

    教育培训:将课件文字转换为真人讲解视频。


热门应用