知产宣传周丨新技术名词解读:AI语音合成

时间: 2024-04-25

AI语音合成是指使用人工智能技术将文字转化为语音的过程。简单来说,语音合成就是让机器模仿人类说话,即输入一段文字,最终输出一段语音。在AI语音合成中,最新兴起的技术是AI语音克隆,它指的是使用人工智能和机器学习算法来模仿特定人的语音,生成与目标人声音非常相似的合成语音,包括其音调、节奏、语调和情感特征。
AI语音合成技术的应用前景广泛,它可以创建个性化的虚拟助手,可以为影视剧、短视频、游戏等领域的配音带来全新的可能,还可以为音乐制作提供新的创作维度。但同时,AI语音合成技术可能构成潜在的侵权风险。例如:2023年爆火的顶流歌手“AI孙燕姿”,是利用AI软件在音频素材中提取歌手本人的声音,大量产出翻唱视频,并模仿歌手的音色、唱腔,达到以假乱真的程度,引发了侵权争议;2024年4月23日,北京互联网法院对全国首例AI生成声音人格权侵权案进行一审判决,明确认定在具备可识别性的前提下,自然人声音权益的保护范围可及于AI生成声音,AI生成声音可识别性的认定应综合考虑行为人使用情况,并以相关领域普通听众能否识别作为判断标准。
(来源:部分内容来源于“北京互联网法院”微信公众号)