又一行業遭衝擊 亞馬遜谷歌上架AI有聲書

【2023年06月18日訊】(記者高杉編譯報導)亞馬遜、蘋果和谷歌即將上架銷售由人工智能模仿人類聲音朗讀和配音的有聲書。雖然有聲書的歷史比蘋果和亞馬遜的歷史都要長很多,但它直到在手機中普及後才真正流行起來。

根據出版業研究機構Wordsrated的預測,有聲讀物行業的銷售額目前超過50億美元。其中,接近20億美元來自世界上最大的有聲讀物市場——美國。而且,從2022年到2030年,該行業的收入預計將每年增長26.4%。這將導致有聲讀物的銷售額在2030年達到350億美元以上。Wordsrated指出,這使有聲讀物將「以很大的優勢成為世界上增長最快的圖書格式」。

這也使得有聲讀物成為人工智能試圖滲透、進入和占領的又一個市場。也就是說,人工智能生成的AI聲音,將從配音演員手中搶過話筒。

那麼,消費者們準備好讓人工智能在他們的耳朵裡悄悄地訴說了嗎?而真正的事實是,這已經發生了。

谷歌母公司Alphabet的Google Play和Apple Books,都已經在一定程度上利用了人工智能生成的聲音,而且這一趨勢可能會繼續下去。只要出版商擁有有聲讀物的版權,並選擇為其自動配音,Google Play就能為出版商提供AI自動配音。當然,沒有任何上架的有聲讀物是未經出版商同意自行配音的,也不是消費者合法地自行利用AI配音製作的。

據美國全國廣播公司財經頻道(CNBC)報導,Google Play Books的產品管理總監朱迪‧張(Judy Chang)對此表示:「對於許多出版商來說,有聲讀物的製作可能是一項重大投資。支付配音演員的費用是計算總成本等式的一部分。」她說:「而現在出版商可以在對人工配音進行投資之前,利用AI配音來評估對其有聲書作品的需求。」

人們如何聽書

人們喜歡有聲讀物。它們是僅次於音樂的最常見的音頻消費產品。但是,人工智能語音在有聲讀物中的使用,帶來了可以被公平地描述為「與新技術親密接觸」的一種使用形式。這不像向Alexa詢問天氣或讓其播放一首歌曲的那種方式。這可能也是對消費者(和公司)在多大程度上能夠接受、以計算機生成的聲音取代真人配音的一個小測試。

最大的配音市場Voices的首席執行官大衛‧奇卡雷利(David Ciccarelli)表示:「實際上,人們對聲音非常敏感。雖然你的眼睛可以以每秒24幀的速度辨別運動,但耳朵卻可以識別每秒震動2萬次的聲波。」他還表示:「因為大多數人是用耳機聽有聲書的,所以會與聲音有更大的親近感。」

有聲書的朗讀和配音質量也是一個重要的問題,因為它是決定聽眾與聲音聯繫感的主要因素。奇卡雷利說:「將近60%的聽眾,會因為不喜歡朗讀者而放棄一本有聲書。……但人們喜歡聽別人說話,特別是在他們講故事的時候。」

讓人工智能的聲音不僅聽起來像人,而且還能與聽眾有某種交流,這並不那麼容易做到的。配音畢竟是一種表演,而其中的藝術是很難被複製的。

奇卡雷利說:「人類能做得很好而人工智能做不到的是:表達的時機。無論是表達尷尬的停頓,還是表達滑稽的喜劇感,人工智能的語音都很難信手拈來。」

對人工智能來說,速度可能也是一個問題。因為人的朗讀速度會根據所讀內容的變化而變化。我們在閱讀某些情節或強調某些部分時,速度會很自然地與其它部分不同,而這是因為我們了解我們正在閱讀的內容,但AI則不然。

奇卡雷利說:「專業解說員知道何時加快速度,然後何時恢復到正常的閱讀速度。他們也知道如何發音,不會產生同音字帶來的問題。」

當然,人工智能的聲音將會變得更好,聽眾對它的抵觸情緒也會相應地降低。人工智能甚至不會有能否成為改變遊戲規則的新技術的問題,而是何時能夠成為。奇卡雷利也知道這一點。

他說:「業界認識到,變化已經出現。而且人工智能既然已經到來,只會變得越來越好。它已經從可笑的水平變成了合格水平。而且它一直在變得更好。」

他還補充說,可以預見的是,將出現對專業配音藝術家的語音克隆。這個問題則涉及了道德的問題,以及保護配音演員工作權利的重要性,包括「信用、同意和補償」。

即使有了人工智能語音,也需要有一個提供人類語音原型的播音員。Voicebot.ai的創始人兼首席執行官布雷特‧金塞拉(Bret Kinsella)對此解釋說,文字轉語音系統已經在媒體中變得很流行了,因為它們能夠通過合成的人類聲音,來更高保真地表達聲音中的情感內容。要做到這一點,仍然需要一個配音演員,以他的聲音作為模板,來製作任何有聲書。

配音演員怎麼看

對於一些配音演員來說,他們正在選擇不配合。擁有14年經驗的配音演員布拉德‧齊弗(Brad Ziffer)表示:「我拒絕那些聲明會用我的聲音製作人工智能模型的VO工作。因為保護自己的最好辦法就是不配合他們。」

在過去的20年裡,從閱讀到聽有聲讀物的變化是巨大的。人們從最開始在電腦上閱讀印刷書籍的影印件,並在網頁上編輯出翻頁的聲音,到之後在平板電腦上閱讀數字文件;從專門在錄音室錄音到在家裡錄製許多有聲書;音頻編輯從用剃刀片拼接磁帶到通過倒回和剪切錄製錯誤來編輯數字文件;出版商已經從用磁帶到用CD、再到用數字文件的方式提供內容。

「三藩有話説」立足華人社區,服務華人朋友,堅守傳統媒體的良知與價值觀,向民眾傳遞真實的資訊。請關注我們的社媒主頁,及時獲取最新咨詢!

看完這篇文章您覺得:

已經有 0 次投票 抢沙发
推薦文章
文章評論區

发表评论