近日,TikTok推出了一项新功能,允许用户创建自己声音的AI模拟版本。这意味着,用户可以为自己的短视频配上个性化的数字语音,而非应用内千篇一律的模板音效。
正如应用研究员乔纳·曼萨诺分享的示例所示,部分TikTok用户现在可以在视频配音选项中看到“创建你自己的AI语音”这一选择。选定后,用户只需对着设备说话,即可生成属于自己的AI语音。此后制作视频时,便可直接使用这一数字声音,既省去了反复录制真人语音的麻烦,也能将自定义配音翻译成其他语言。
这一功能源于TikTok母公司字节跳动在AI语音复制技术上的研究,是其整体人工智能战略布局的又一环节。早在今年一月,就有媒体报道称,字节跳动开发了一种新的AI模型,能够仅凭极少量的语音样本,就以令人信服的准确度模仿任何人的声音。其“StreamVoice”系统仅需寥寥数语,即可实时复刻人声,几乎能模拟任何人的语音。
然而,这项技术也潜藏着问题——它可能让基于真人声音的深度伪造和骗局变得更加逼真,从而难以辨别。
因此,这或许并非一项全然有益的创新。但出于某种原因,社交平台似乎坚信,用户会热衷于创造自己的AI版本。无独有偶,Mate(Facebook)目前也允许创作者打造以其风格和声音回应的AI聊天机器人。
但问题是,人们真的想与真人对应的机器人版本互动,而不是与另一个真实的人进行实际的社交吗?
从效率的角度来看,或许可以理解。Mate(Facebook)表示,知名度高的创作者常常需要回复海量信息,其中许多是程式化的询问,一个模仿其风格的聊天机器人在某些情境下或许能提供帮助。但这本质上并非社交。实际上,这与社交媒体旨在促进人际连接的初衷背道而驰,粉丝们恐怕也不会欣然接受以此作为替代。
相比之下,TikTok的这项应用显得更合理一些——用户终于可以在自己的视频中使用自己的声音,而不是那些在无数视频中听腻了的库存机器人音效。语言翻译无疑是一大亮点,其价值显而易见。但反过来说,如果你并不真的需要语言翻译(我猜大多数TikTok发布者并不需要),亲自为自己的视频配音真的有那么困难吗?这究竟是一个巨大的省时利器,还是仅仅是一个噱头?
我仍然感觉,社交平台正在寻找一些AI可以“解决”的问题,而在没有明确应用场景的情况下,它们只是基于自身开发的技术,尽可能地将各种功能塞给用户。然而,所有这些AI元素都在偏离社交平台赖以建立的核心——真实的人际互动,因此其价值未必显著。它们固然具有新奇性,但能否成为持久、持续增值的工具,真正提升每个应用的用户体验?
平心而论,我认为TikTok这个例子比社交平台推出的其他一些AI创作工具要好。但它是否真的具有实质价值,仍有待观察。



