標貝科技推出情感合成TTS 多情感、強表現力聲效讓互動更有溫度

標貝科技推出情感合成TTS 多情感、強表現力聲效讓互動更有溫度

語音合成技術已進入到人們的日常生活,有聲閱讀、智慧客服、智慧家居等場景都已經出現了“它”的身影。有情感的聲音,賦予機器生命感,讓人機互動更美好、簡單。

5月28日,標貝科技重磅推出情感合成方案,主打高音質及高自然度的情感語音合成效果,滿足有聲閱讀、兒童教育、車載、泛娛樂等多場景使用。據悉,標貝科技本次打造情感合成方案,是繼3月成功推出留聲機方案之後,推出的又一全新TTS解決方案,透過整體提高情感合成聲音效果,提升使用者的互動體驗。

標貝科技推出情感合成TTS 多情感、強表現力聲效讓互動更有溫度

AI情感合成讓語音互動更有溫度

聲音的可用性,可以透過自然度、可懂度、識別度等維度來考量。語音技術的進步,讓機器合成的聲音不再頓挫、冰冷,在自然度和可懂度等方面取得了不錯的成績,但當前合成效果在合成音的表現力上,特別是語氣和情感方面,還有不足。缺乏情感的聲音,何談傳遞情感,留住使用者?

情感合成,可以具有更進一步的聲音表現力,傳遞出文字文字之外更多的資訊,做到聲情並茂,以更動聽的聲音,更富有情感地表達內容。

事實上,不同場景及文字型別,對聲音的要求也不同,除了基本的高音質、自然度要求外,讓聲音擁有情感是不可或缺的。同樣的文字內容,用不同情感表達出的傳遞出的意思也不盡相同, 需要“音”景制宜,以增強使用者的融入感、代入感。例如,這句話“為什麼你要這麼問我?” 試想下用生氣、高興、恐懼等情感說出效果與表達的意思。

此外,隨著語音技術推廣應用深入不同的服務場景,使用者對聲音提出了更高的要求。智慧客服場景,需要親和溫暖的聲音來提高使用者的滿意度;有聲閱讀場景,需要根據不同題材搭配出不同聲音,讓使用者感受有聲文字的魅力;智慧生活場景的語音互動,需要有情感的聲音賦予機器生命力,更懂使用者,感受科技生活的美好。

因此,如何進一步提高語音合成的表現力,特別是讓合成語音能夠模擬表達說話人的情感狀態,是語音合成未來發展的趨勢,而這也正是標貝科技一直努力的方向。

打造高音質、高自然度、強表現力的情感合成TTS

據標貝科技語音相關負責人介紹,基於深度學習技術及自有定製情感資料,標貝本次推出情感合成TTS,主打高音質、高自然度與多情感,可以呈現出高興、憤怒、恐懼、哀嘆、悲傷等多種情感聲音,在韻律表現、聲音層次感、情感表達等方面做到更加接近真人情感化表達的語音效果。標貝科技希望透過語音技術的不斷創新,打造出更有表現力、更自然、更動聽的情感合成語音,持續提升使用者互動體驗。

例如有聲閱讀、兒童教育、智慧硬體等場景,高音質、自然度的情感很重要。標貝透過使用情感TTS技術,力求在語氣、語音、語調、情感等方面接近真人說話,與場景匹配,讓使用者在不同場景和碎片化時間,進行有聲聽讀獲取資訊、體驗線上學習教育獲得優質體驗。

以多角色情感合成為例,由於故事、小說等文字素材包含大量角色人物,透過不同情感合成聲音配合文字內容,以展現文學小說人物的的特點,讓AI技術生產的有聲讀物更有“人情味”。

情感合成故事-笨狼撈月亮

情感合成故事-笨狼撈月亮

01:32

來自移動網際網路社群

在故事中,我們可以切實感受到故事中人物情感的變化情況,更能夠吸引少兒聽眾,營造一種引人入勝的沉浸感。

來自易觀釋出《2020年中國音訊產業生態發展分析報告》表示,有聲市場呈現增長的態勢,越來越多的使用者開始接受有聲閱讀這樣的形式來收聽內容。其中,2020年1季度,在某知名有聲書平臺的播放量和收聽人數上都有顯著增長,兩者環比分別增長80。32%和39。82%。此外,使用者在有聲讀物的付費購買上也更加積極,2019年該平臺整體有聲書專輯訂單中過半為付費訂單。

毫無疑問,有聲市場的爆發增長,將誕生大量不同型別的有聲內容,相信情感語音合成能夠帶來更加自然和豐富的語音體驗,為有聲讀物市場提供更有競爭力的差異化產品。

自有資料庫加持 讓情感合成實現“可定製”

事實上,打造自然、高表現力的聲音效果,自然離不開語音情感資料支援。資料庫是語音合成技術的基礎,也是決定語音合成效果的關鍵因素之一。據瞭解,標貝科技本次打造的情感TTS,採用了自有定製的高保真的情感語音庫。

目前,標貝科技自有定製型語音庫已開發出包括中文女聲情感音庫、多語種多音色男女聲音庫、粵語語音庫、兒童語音庫、葡萄牙語音庫、臺灣普通話語音庫、日語音庫、韓語音庫、明星語音庫等數十種類別,IP語音庫還在不斷豐富和積累中。

基於領先語音技術+高質量的資料庫基礎,標貝能夠提供業內優質的情感解決方案,呈現出聲音的多樣性、和個性化的合成效果體驗。這也是因為標貝科技自成立起,將語音互動效果和資料質量放在首位,擁有完整的採標一體化解決方案,能夠實現快速產出高質量的語音合成、語音識別、自然語言處理、計算機視覺等採標服務,為行業提供一站式語音和資料服務。

未來,隨著語音技術不斷髮展,技術與場景的關係變得緊密,而使用者需求變得更加個性化。標貝科技將加大技術創新投入,打造更有溫度的情感聲音,讓語音互動效果更“聲入人心”。