ChatGPT和AI正怎么改变播客行业?
2023年随着人工智能采取的快速发展而迅速启动,从ChatGPT的推出到AI DJ,这项技术正在完全改变常规做法,影响着消费者、创作者和行业领导者。
一样,人工智能技术也在完全改变文娱业,包括播客。或许这场革命中最具争议的部份是人工智能语音生成,这引发了创作者的公道耽忧,他们担心自己的声音会在未经许可的情况下被使用。
但是,播客创作者却有一个特别的机会来将他们的声音变现。新的工具允许他们根据文本生成主持人浏览的广告、介绍,乃至全部剧集,从而减少在演播室花费的时间和对昂贵录音装备的需求。但人工智能语音生成是一把双刃剑,它既给创作者带来了便利,也给他们带来了风险,由于他们的声音可能被未经授权的使用者滥用,从而造成毛病信息的传播。
新机遇:音频广告中的AI
广告商已在使用人工智能技术微调播客广告。今年2月,美国最大的音频媒体公司iHeartMedia宣布与音频智能平台Sounder合作,为播客广告客户提供新的品牌安全技术,允许在广告投放前评估和解释播客内容的含义和背景,从而帮助品牌做出品牌安全和合适性的判断。
据报导,iHeartMedia利用Sounder的音频数据云技术,为其旗下超过750个原创播客节目提供这项服务,其中包括一些世界上最大的播客和创作者。这些节目每个月有超过3.92亿次下载和收听,比排名第二至第四的播客版权商加起来还多。
另外,播客平台Acast利用人工智能技术推出了一种新的对话式定位工具,可以根据剧集的内容,将广告放置在最适合的位置,从而提升广告的效果和品牌安全性。
如果一个品牌想要宣扬其环保理念,那末对话式定位工具就能够将其广告放置在播客中讨论环境问题或可延续发展的部份。这样可以增加广告的相关性和吸引力,同时避免与不符合品牌价值或敏感话题的内容相冲突。
现在,一些公司正在探索怎样使用人工智能技术来制作完全的音频广告。
比方,音频广告技术公司Adswizz正在开发一项基于人工智能的语音生成工具,旨在帮助播客广告客户更精准地投放广告。这些工具由Adswizz的技术创新实验室开发,利用AI和机器学习算法来解释播客内容,并根据品牌的要求和目标来定位广告,从而消除雇佣配音演员的本钱。
但是,播客主持人朗诵的广告被认为更有效,由于播客听众信任他们的主持人,对广告的相关性比一般消费者更敏感。这为主持人自己利用人工智能语音模型提供了机会。
据TechCrunch报导,Spotify已在其AI DJ功能中使用了AI技术制作播客广告的方法,通过训练一个AI模型来模仿其文化合作部门主管兼播客主持人Xavier “X” Jernigan的声音。现在,Spotify可能将这类技术利用到广告领域。
Spotify高管兼播客主持人Bill Simmons流露,Spotify正在测试人工智能技术,将使播客能够即时生成用自己声音朗诵的广告。这样,创作者可以在更短的时间内制作出听起来像是主持人亲身朗诵的广告,从而增加广告数量和收入。
除此以外,这项技术还可以帮助定位听众,并翻译成各种语言的广告,条件是主持人允许复制他们的声音。这类工具可能会吸引更多的广告商和创作者加入Spotify,这与Spotify最近转向为独立创作者服务的方向一致。
但是,Spotify其实不是唯逐一个致力于这类功能的平台。例如,Podcastle推出的一款名为Revoice的AI语音克隆工具,可以用AI技术创建一个与真实主持人类似的数字声音。
Revoice的使用方法很简单,用户只需录制自己朗诵70个区别的句子,和一个法律免责声明,以保护用户的声音安全和隐私。然后,Podcastle的AI算法会在24小时内处理并生成用户的数字声音。用户可以在Podcastle平台上输入任何内容,让AI用数字声音生成高质量的音频文件。
新风险:毛病信息的传播
播客的声音多是他们最宝贵的资源之一。对许多创作者来讲,他们的声音是他们唯一的标识,特别是那些不制作播客视频的人。
Joe Rogan是一名著名的播客主持人,他的节目《The Joe Rogan Experience》约请了各行各业的佳宾,进行了深入的对话。但在今年5月,有人用人工智能技术创造了一个虚构的播客,模仿了Joe Rogan和一些从未上过他节目的佳宾的对话。
这个播客叫做《Joe Rogan AI Experience》,由一名澳大利亚的创意总监Hugo制作,他用了一个可以克隆任何声音的文本转语音平台,和一个基于ChatGPT的对话生成器。Hugo说,他只是出于好玩而做了这个项目,并没有想要要挟真实的Joe Rogan或其他播客主持人。
Hugo发布了第一集播客一个月前,其中摹拟了Joe Rogan和OpenAI开创人Sam Altman的对话。这个对话很诡异地触及了人工智能制造虚假内容的风险,而这正是这个播客所做的。
另外,Hugo还制作了其他几集播客,模仿了Joe Rogan和Andrew Tate、Steve Jobs等佳宾的对话。这些对话虽然有时候有点荒诞或无聊,但也有时候听起来很逼真或有趣。Hugo说,他希望通过这个项目展现人工智能技术的发展和潜力,也提示人们要警惕虚假内容的危害。
与此同时,TikTok还删除一个用Joe Rogan的声音制作的虚假病毒广告。
事实上,新闻是播客的主要类型,这意味着毛病的内容可能会带来严重的后果,致使毛病信息大范围传播。人工智能语音生成工具正在以闪电般的速度发展,但围绕保护其声音的监管将需要时间来发展。不过,如果平台能够制定有效的措施,避免滥用和标记未授权的作品,播客乃至可以借助人工智能技术将他们的声音拓展到其他文娱情势。
比如,播客主持人可以将自己的声音授权给电影和电视。在《星球大战》系列电影中,黑武士Darth Vader的声音一直由演员James Earl Jones来配音,他的声音深沉而威严,给观众留下了深入的印象。但是,现年91岁的琼斯表示,他想要放下这个角色,让人工智能来代替他。
据《Vanity Fair》报导,Jones已将他过去的声音作品的权利转让给了迪士尼,允许乌克兰的初创公司Respeecher利用人工智能技术,在迪士尼+的《Obi-Wan Kenobi》中重现他的声音。
Respeecher使用声音片断来“克隆”一个演员的声音,让制作方可以在没有演员在场的情况下录制新的台词。Skywalker Sound的监督音效编辑Matthew Wood告知《Vanity Fair》,当Jones“提到他想要放弃”Darth Vader的角色时,他就向Jones提出了这个选项。
在Jones同意让卢卡斯影业使用人工智能生成的声音后,《Vanity Fair》称,制作方拜托Respeecher让Darth Vader听起来像45年前的Jones,在迪士尼+的《Obi-Wan Kenobi》中显现出那种“黑暗面”的无赖气质。这也是为何你可能会注意到,在《Obi-Wan Kenobi》中,Darth Vader听起来很像他在初期电影中的模样,而不是Jones在2019年的《星球大战:天行者突起》中的实际声音。
与艺术家、演员和其他文娱创作者区别,播客最具价值的资产是他们的语音——这意味着他们更有动机去探索如何与AI语音技术合作,而不是抵制它。
精彩回顾
格莱美发布新规:制止纯AI生成的作品参评