阿里巴巴推出AI图生视频模型EMO

2024-02-29 08:35:44
分享

2月28日消息,阿里巴巴集团智能计算研究院在近日上线了一款新的AI图片-音频-视频模型技术EMO,官方称其为“一种富有表现力的音频驱动的肖像视频生成框架”。目前,EMO框架上线到GitHub中,相关论文也在arxiv上公开。据悉,用户只需要提供一张照片和一段任意音频文件,EMO即可生成会说话唱歌的AI视频,以及实现无缝对接的动态小视频,最长时间可达1分30秒左右。表情非常到位,任意语音、任意语速、任意图像都可以一一对应。

更加详细情况,请关注本站最新动态。
    Baidu
    map