要说这段时间哪家公司蓬勃发展,那不是三只羊,每隔一段时间就要上一次新闻,还是那种法律专栏。
前几天,月饼门事件还没过去,又来了一个录音门。
事情是这样的, 9 月 20 一段疑似三只羊高管陆某的录音突然在网上流传。
录音中涉及到很多三只羊的女主播,具体内容我们在这里就不多讨论了,但确实很爆裂。
录音爆发后,很快就在网上引起了一波热度。
有人说这段录音纯粹是男人喝多了吹的牛逼,但讨论的方向很快就变成了这个东西。是不是真的? AI 很多所谓的所谓所产生的,甚至都是钓出来的 AI 专家,开始分析。
结果,两天后,警方的通知出来了:都散散吧,是的 AI 干的。
此次事件的另一位主角, Reecho 瑞生公司也终于浮出水面,锤了自己的用户一把。
有趣的是,即使官方出面了,还是有网友认为卢某是 “ 酒后吐真言 ” ,通知只是把锅扔给了无法自证的人 AI 。
但不管怎样,官方的调查通知都出来了,你信不信,这件事就这么定调了。
不过以我对 AI 对语音的理解,像三只羊录音门这样的情况,确实有可能,主要是现阶段 AI 语音技术,真的很成熟。
因为我们只需要上传一两句话,剩下的直接扔给我们 AI 只要,几分钟就能克隆一个人的音色。
现在就这么说吧 AI 语音合成中比较常见,开源项目也比较多,就数 TTS 、 SVC&RVC 两大类技术。
所谓 TTS ,简单地说,就是 Text To Speech ,将文本转化为语音。
像很多 AI 数字人、有声书、视频配音,大家刷抖音经常听到 “ 注意,这个男人叫小帅 ” ,还有剪映素材库里的那些 TVB 女声,广西表哥,基本上都是女声, TTS 干的。
就像这次三只羊的录音门一样, Reecho 瑞声,也是一个 TTS 模型生成网站。
上来先用《 意大利面拌 42 号混凝土 》的 “ 名篇节选 ” 整波,你不说,你真的不说。
音色的复制程度可以有一个复制程度 80%-90% ,而且,说话的语气也像小偷。如果你不仔细听,你会认为你在做严肃的科普工作。
我们本来想借的 AI 差评君给大伙儿送了一波福利,没想到这个 AI 小翻车了一下, 10 台 iPhone 16 说成了 “ 一零台 iPhone sixteen” 。
穿帮真的太明显了,这个福利想送也送不出去啊,可惜。
还没有评论,来说两句吧...