您當(dāng)前的位置 :創(chuàng)業(yè) >
推動(dòng)生成式AI更好應(yīng)用于聲音類(lèi)文藝創(chuàng)作
2024-09-05 15:26:24   來(lái)源:經(jīng)濟(jì)參考報(bào)  分享 分享到搜狐微博 分享到網(wǎng)易微博

聲音類(lèi)產(chǎn)品作為文藝創(chuàng)作的重要表現(xiàn)形式,與生成式AI(人工智能)的結(jié)合為文藝創(chuàng)作帶來(lái)了全新的可能性。通過(guò)生成式AI技術(shù),聲音類(lèi)產(chǎn)品在音樂(lè)創(chuàng)作、語(yǔ)音合成有聲讀物、虛擬主播、影像音效制作等方面不斷變革創(chuàng)新,為文藝創(chuàng)作提供了全新的創(chuàng)作手段和表達(dá)方式。生成式AI技術(shù)在文藝創(chuàng)作中的應(yīng)用為聲音類(lèi)產(chǎn)品發(fā)展提供了新的機(jī)遇,但面臨的風(fēng)險(xiǎn)與挑戰(zhàn)也需積極應(yīng)對(duì)和解決。

生成式AI產(chǎn)品應(yīng)用領(lǐng)域廣泛

AI音樂(lè)創(chuàng)作“風(fēng)生水起”。生成式AI技術(shù)已經(jīng)在音樂(lè)領(lǐng)域得到廣泛應(yīng)用,主要體現(xiàn)在分類(lèi)識(shí)別(音樂(lè)檢索、樂(lè)譜識(shí)別、音頻識(shí)別)、生成(AI作曲、虛擬歌手)及傳播(MIDI音響、教育)這三個(gè)方面。AI在音樂(lè)創(chuàng)作的不同階段都發(fā)揮了較大作用。在創(chuàng)作初期,創(chuàng)作者運(yùn)用AIGC汲取音樂(lè)素材以及創(chuàng)作靈感,同時(shí)對(duì)作品的音樂(lè)風(fēng)格進(jìn)行分析和預(yù)測(cè),并進(jìn)行音樂(lè)素材的智能檢索和組織。在創(chuàng)作中期,AIGC技術(shù)為創(chuàng)作者的作品產(chǎn)出提供支撐,更好地輔助音樂(lè)創(chuàng)作,將音樂(lè)作品意圖具像化。在創(chuàng)作后期,AIGC為雛形作品的后期制作提供強(qiáng)大的音頻處理工具,從而使作品的后期制作更加準(zhǔn)確、高效。尤其是某些AI編曲技術(shù)的出現(xiàn),為音樂(lè)創(chuàng)作者帶來(lái)更多靈感的同時(shí),也使創(chuàng)作過(guò)程更加高效。

AI虛擬主播走近大眾。虛擬主播通過(guò)運(yùn)用AI語(yǔ)音合成技術(shù)、自然語(yǔ)言處理技術(shù)、深度學(xué)習(xí)技術(shù)以及計(jì)算機(jī)視覺(jué)技術(shù)走進(jìn)大眾視野。語(yǔ)音合成技術(shù)通過(guò)先進(jìn)的語(yǔ)音合成算法,模仿人類(lèi)的聲音,從而使虛擬主播能夠流暢、自然地表達(dá)交流。計(jì)算機(jī)視覺(jué)技術(shù)在虛擬主播的形象呈現(xiàn)方面發(fā)揮著關(guān)鍵作用。通過(guò)3D建模和渲染技術(shù),可以創(chuàng)建出高度逼真的虛擬人物。同時(shí),通過(guò)面部捕捉和動(dòng)作捕捉技術(shù)使虛擬主播能夠?qū)崟r(shí)模擬真人的表情和動(dòng)作。情感計(jì)算技術(shù)可以分析觀眾的語(yǔ)言和行為,判斷觀眾的情感狀態(tài),據(jù)此及時(shí)調(diào)整虛擬主播的回應(yīng)方式及語(yǔ)氣,進(jìn)而賦予了虛擬主播在交互狀態(tài)下的情感變化。

AI配音應(yīng)用廣泛。AI配音技術(shù)通過(guò)對(duì)大量語(yǔ)音數(shù)據(jù)進(jìn)行學(xué)習(xí),能夠模擬出不同人物、不同情緒的語(yǔ)音特點(diǎn),為AI配音產(chǎn)品提供豐富的角色表現(xiàn)和情感表達(dá)。隨著AI技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等技術(shù)出現(xiàn),“TTS+AI”(從文本到語(yǔ)音+人工智能)的組合使得電子合成語(yǔ)音自然性和準(zhǔn)確性不斷提高。針對(duì)情感起伏、聲線多元、人聲適配度等多樣化需求,目前已有AI語(yǔ)音產(chǎn)品供應(yīng)商提供“情感TTS”定制服務(wù),通過(guò)調(diào)整語(yǔ)音語(yǔ)調(diào)、語(yǔ)速、停連、音高甚至模擬人類(lèi)在不同心情下的語(yǔ)氣變化,使電子合成語(yǔ)音能夠更貼切地適應(yīng)不同的語(yǔ)境和場(chǎng)景,賦予其更為豐富的“情感”表達(dá)。AI配音技術(shù)應(yīng)用場(chǎng)景較為廣泛,對(duì)眾多行業(yè)發(fā)展都有促進(jìn)意義。在電影、電視劇、動(dòng)畫(huà)等影視作品中,AI配音技術(shù)被用于生成角色的語(yǔ)音。通過(guò)模擬不同音色和語(yǔ)言,AI配音技術(shù)可以使角色聲音更加自然、真實(shí),提高觀眾的觀看體驗(yàn)。該技術(shù)在有聲讀物和電子書(shū)領(lǐng)域也應(yīng)用甚廣,為用戶提供更加自然、流暢的語(yǔ)音播報(bào)服務(wù)。AI配音也被應(yīng)用在游戲領(lǐng)域,可以生成自然且更符合角色設(shè)定的聲音,增強(qiáng)了游戲消費(fèi)者的體驗(yàn)。

生成式AI產(chǎn)品優(yōu)勢(shì)明顯

創(chuàng)作成本相對(duì)較低。隨著人工智能技術(shù)的發(fā)展,AI技術(shù)開(kāi)始嘗試應(yīng)用于智能聲音設(shè)計(jì),即自動(dòng)根據(jù)影視內(nèi)容及情感要求生成相應(yīng)音效,這一應(yīng)用大大降低了制作成本。一方面,節(jié)省了聲音類(lèi)產(chǎn)品制作的時(shí)間和人力資源。相較于傳統(tǒng)產(chǎn)品,AI技術(shù)的應(yīng)用可以快速生成出所需聲音,并實(shí)現(xiàn)自動(dòng)化操作,減少了創(chuàng)作過(guò)程所需的人力和時(shí)間。另一方面,傳統(tǒng)聲音類(lèi)產(chǎn)品制作容易受到多種因素影響,例如創(chuàng)作者的狀態(tài)、環(huán)境噪音、設(shè)備操作等,導(dǎo)致創(chuàng)作周期較長(zhǎng),而生成式AI技術(shù)應(yīng)用到聲音類(lèi)產(chǎn)品創(chuàng)作中可以最大限度降低外界因素影響,實(shí)現(xiàn)成本最優(yōu)化。

素材處理精準(zhǔn)高效。AI技術(shù)通過(guò)大量的數(shù)據(jù)學(xué)習(xí),可以對(duì)音頻素材進(jìn)行識(shí)別、分類(lèi)、整理,自動(dòng)識(shí)別音頻中如人聲、音樂(lè)、音效等不同元素,并進(jìn)行快速分類(lèi)和整理,與人工相比大大提高了素材處理的質(zhì)量,降低了數(shù)據(jù)處理的錯(cuò)誤率。AI技術(shù)還可以對(duì)音頻素材進(jìn)行智能剪輯和拼接。此外,在音頻處理過(guò)程中需要經(jīng)過(guò)降噪、增減混響等特殊處理,人工處理可能存在個(gè)體偏差,而AI技術(shù)能最大限度降低錯(cuò)誤出現(xiàn)的概率。

生成內(nèi)容多元新穎。隨著社會(huì)發(fā)展,人們對(duì)聲音類(lèi)產(chǎn)品的需求更加多元化、個(gè)性化。針對(duì)此現(xiàn)狀,生成式AI可以幫助創(chuàng)作者在廣告配音、音樂(lè)制作、虛擬角色聲音等多領(lǐng)域的創(chuàng)作中打破固有思維限制,提供新穎的創(chuàng)作思路。不僅如此,AI能夠通過(guò)分析用戶的喜好、習(xí)慣和交互數(shù)據(jù),了解用戶對(duì)聲音產(chǎn)品如音色、語(yǔ)氣、語(yǔ)調(diào)等方面的具體需求,為創(chuàng)作者個(gè)性化創(chuàng)作提供實(shí)際支撐。

生成式AI產(chǎn)品發(fā)展存在的風(fēng)險(xiǎn)與挑戰(zhàn)

權(quán)益問(wèn)題存在爭(zhēng)議。聲音類(lèi)產(chǎn)品涉及數(shù)據(jù)侵權(quán)風(fēng)險(xiǎn)、版權(quán)主體的權(quán)益以及個(gè)人隱私和人格權(quán)等問(wèn)題。AIGC創(chuàng)作模型大多是由龐大的樣本訓(xùn)練而成的,對(duì)模型選取的素材進(jìn)行反向溯源難以實(shí)現(xiàn),而采用的素材可能未經(jīng)作者授權(quán)。不僅如此,生成式AI的使用者可以在生成的產(chǎn)品上進(jìn)行二度創(chuàng)作,新產(chǎn)品版權(quán)的歸屬問(wèn)題也難以確認(rèn)。AI在生成部分聲音類(lèi)產(chǎn)品時(shí),如使用到未經(jīng)公開(kāi)發(fā)布的普通人的聲音,這類(lèi)聲音屬于個(gè)人隱私信息,在公開(kāi)發(fā)布時(shí)可能存在暴露隱私的風(fēng)險(xiǎn),這將對(duì)個(gè)人隱私權(quán)和人格權(quán)造成侵犯。在當(dāng)前發(fā)展階段,AIGC從組合型內(nèi)容創(chuàng)造轉(zhuǎn)向探索型甚至變革型內(nèi)容創(chuàng)造,其創(chuàng)作過(guò)程中的權(quán)益收益以及可能導(dǎo)致的侵權(quán)責(zé)任如何劃分,目前也處于爭(zhēng)論之中。

藝術(shù)規(guī)范問(wèn)題存在爭(zhēng)議。聲音類(lèi)AI產(chǎn)品涉及音樂(lè)、播音主持等藝術(shù)類(lèi)學(xué)科,這些學(xué)科在其專(zhuān)業(yè)領(lǐng)域也有一定的專(zhuān)業(yè)規(guī)范和藝術(shù)化處理方式,而聲音類(lèi)AI產(chǎn)品在是否符合專(zhuān)業(yè)的藝術(shù)規(guī)范方面存在爭(zhēng)議。以播音主持專(zhuān)業(yè)為例,在不同語(yǔ)境下朗讀時(shí),同一句話所表達(dá)的語(yǔ)氣、情感、停連、重音都是不同的,說(shuō)話時(shí)停連、重音的位置變化也會(huì)影響意思表達(dá)。但目前,生成式AI在配音時(shí)不能根據(jù)文本內(nèi)容識(shí)別具體的語(yǔ)境,同一聲音在不同語(yǔ)境下朗讀方式區(qū)別不大。在情感處理方面,AI與真人相比表達(dá)較為生硬,沒(méi)有情感起伏。因此,在實(shí)際應(yīng)用中,聲音類(lèi)AIGC產(chǎn)品在藝術(shù)規(guī)范方面的問(wèn)題也值得深思。

生成式AI產(chǎn)品對(duì)創(chuàng)作者的啟示

創(chuàng)作者應(yīng)不斷提升自身能力。生成式AI技術(shù)可以實(shí)現(xiàn)一鍵生成,一些簡(jiǎn)單重復(fù)的工作不再需要人工完成,這就使一些創(chuàng)作者面臨失業(yè)風(fēng)險(xiǎn)。當(dāng)然,聲音類(lèi)AI產(chǎn)品存在的固有問(wèn)題也使優(yōu)秀創(chuàng)作者的地位不可撼動(dòng)。例如,AI虛擬主播能夠通過(guò)“克隆”方式模仿規(guī)范的普通話和特定音色,但究其根本也只能模仿聲音的外在形式。實(shí)際上,優(yōu)秀的主播需要在不同情境下采用不同的播報(bào)方式,通過(guò)語(yǔ)氣、語(yǔ)調(diào)、停連等的變化來(lái)表達(dá)不同的情感狀態(tài)。這就要求創(chuàng)作者們不斷提高自身技術(shù)水平,提高專(zhuān)業(yè)能力,綜合學(xué)習(xí)多領(lǐng)域知識(shí),豐富自己的閱歷,擴(kuò)大自己的優(yōu)勢(shì),從容面對(duì)AI產(chǎn)品發(fā)展對(duì)創(chuàng)作者產(chǎn)生的沖擊。

創(chuàng)作者應(yīng)合理利用AI技術(shù)。AIGC技術(shù)發(fā)展到現(xiàn)階段,其在為創(chuàng)作者提供創(chuàng)作靈感、降低創(chuàng)作成本、提高作品產(chǎn)出效率、提升作品質(zhì)量等方面具有一定的優(yōu)勢(shì)。因此,創(chuàng)作者要主動(dòng)了解和學(xué)習(xí)AIGC技術(shù),不能一味地肯定或者抵制,而是要將自身需要與AI技術(shù)相結(jié)合,掌握在AI技術(shù)運(yùn)用當(dāng)中的主動(dòng)權(quán),使其成為輔助作品創(chuàng)作的得力助手,實(shí)現(xiàn)自身與AI技術(shù)雙向融合發(fā)展。同時(shí),因AIGC的使用規(guī)范問(wèn)題還存在爭(zhēng)議,創(chuàng)作者要提高自身法律意識(shí),及時(shí)了解AIGC相關(guān)法律法規(guī),使AI技術(shù)能夠在合理規(guī)范的情況下輔助自身創(chuàng)作,提高作品質(zhì)量,產(chǎn)出更優(yōu)秀的聲音類(lèi)產(chǎn)品。

隨著AIGC技術(shù)的發(fā)展,其在聲音類(lèi)產(chǎn)品方面的應(yīng)用已經(jīng)占據(jù)了一定的位置。其不僅能模擬出接近人類(lèi)的聲音,直接生成聲音產(chǎn)品,而且可以輔助創(chuàng)作者進(jìn)行創(chuàng)作,為創(chuàng)作者提供全新的工具和獨(dú)特的表達(dá)方式。但同時(shí),生成式AI技術(shù)在聲音類(lèi)文藝創(chuàng)作應(yīng)用中仍面臨諸多挑戰(zhàn),我們要在抓住機(jī)遇的同時(shí)正視存在的問(wèn)題,并在實(shí)踐中努力加以改進(jìn),讓生成式AI技術(shù)得到更好更廣泛的應(yīng)用。

(王一然 作者單位:蘇州大學(xué)傳媒學(xué)院)

關(guān)鍵詞:


[責(zé)任編輯:ruirui]





關(guān)于我們| 客服中心| 廣告服務(wù)| 建站服務(wù)| 聯(lián)系我們
 

中國(guó)焦點(diǎn)信息網(wǎng) 版權(quán)所有 滬ICP備2022005074號(hào)-20,未經(jīng)授權(quán),請(qǐng)勿轉(zhuǎn)載或建立鏡像,違者依法必究。