INTERSPEECH2021 | 標貝科技語音論文連續3屆收錄於全頂語音大會

6月8日訊息,2021全球頂級語音大會INTERSPEECH論文投稿收錄結果於日前重磅揭曉。

標貝科技語音技術團隊投遞的語音論文《

PDF:Polyphone Disambiguation by Using FLAT

》(譯為《基於FLAT的多音字消歧系統》,以下簡稱“論文”)受到國際學者專業認可,成功收錄其中。

據瞭解,這也是繼2019和2020兩屆大會入選後,標貝語音論文第三次被大會成功收錄,彰顯不俗的語音科研實力。

INTERSPEECH2021 | 標貝科技語音論文連續3屆收錄於全頂語音大會

INTERSPEECH2021 | 標貝科技語音論文連續3屆收錄於全頂語音大會

一年一度的INTERSPEECH是全球最具影響力的語音行業大會,而語音論文彰顯大會國際化、專業化、前沿化的特點,吸引全球數以千計的科研機構、高校及廠商關注,踴躍參與論文撰寫和投遞,共同見證行業蓬勃發展。

本次標貝科技投遞的“論文”,研究重點為在多音字消歧的系統中引入了FLAT的模型結構。經過研究表明,在建模過程中,句子中多音字字元可以有效與所有的匹配詞彙進行互動,緩解了TTS系統在合成語音時,因分詞錯誤導致的多音字發音錯誤的問題。此外,該模型還引入了中文發音詞典的資訊,賦予帶多音字字元的詞彙中目標多音字的正確發音,由此降低了多音字消歧系統的建模難度以及提升了多音字消歧系統的預測準確率。該模型還引入了中文預訓練語言模型,透過使用了動態詞向量,加強了句子中字元的表徵能力,進一步提升了模型效能。

INTERSPEECH2021 | 標貝科技語音論文連續3屆收錄於全頂語音大會

取得以上成績

與標貝專業、先進的研發技術整體綜合實力密不可分。標貝科技自成立以來,把AI技術創新應用放在首位,以“語音連線場景、資料服務技術”為理念,在技術、資料及應用三端不斷創新,確保在語音和資料領域的領先地位。

在語音合成方面,標貝科技語音技術路徑經歷重要的三個階段,無論是在場景落地還是技術演化方面,均有巨大突破。

1.0階段

注意力機制深度學習首次商用

為了提高語音合成的自然流暢度,標貝科技的語音合成技術在聲學、韻律上採用了基於Attention機制的深度神經網路技術模型,充分利用文字資料,構建前端模組、選擇合適的聲碼器,降低運算量,實現合成語音的發音自然、清晰、韻律感流暢,讓機器與人的互動顯得更親近。

2.0階段

音色擴充套件 個性化合成

為了滿足不同場景的需求,標貝科技在音色和場景豐富度上持續發力。基於海量語音資料的優勢,對音色庫進行充分擴充,推出支援不同年齡、性別、以及語種的多型別音色的TTS2。0解決方案,並支援使用者個性化需求定製,滿足了多場景及多業務的需求。

語音技術方面,標貝打造了支援聲音復刻、情感合成等個性化、差異化的語音技術服務。聲音復刻與情感合成是基於語音技術本身的創新型應用。透過復刻聲音,為聲音注入豐富的情感,深度挖掘合成語音的個性化、定製化價值,更好的匹配有聲閱讀、AI教育等應用場景。

3.0階段

深度學習框架升級,更有表現力更自然的聲音

2021年開年,標貝推出了全新升級的TTS3。0技術採用全新的Transformer機制和GAN聲碼器,升級了全新的模型結構的基礎上,依舊保持了對tts2。0舊模型的全部相容,最大程度地保證無縫升級。同時,新系統使用了高維度的聲學資訊,可以承載更多的聲音細節,顯著提升了現有發音效果。無論是自然講話、情緒講話、還是角色模仿,都大大提升了多場景下角色和情感表達判斷的精確性,同時保障了輸出音質的穩定、清晰、順暢,聲碼器採用GAN結構,不但高效且真實

還原了波形,同時為合成聲音注入了真實質感。

在場景方面,標貝科技基於技術優勢的基礎上,打造能夠覆蓋多場景應用的語音互動方案,包括語音合成、語音識別、聲音復刻、情感合成以及聲音轉換在內的語音技術產品,以有溫度的聲音,提升使用者互動體驗。

值得一提的是,資料為AI應用落地提供堅實基礎。而標貝科技致力於為企業提供專業、高質量的語音資料服務。

在採標能力上,標貝科技基於深度學習以及高精度預處理技術,擁有多語言多型別資料採集製作能力、語音合成技術建模和測試需要的深度標註加工和分析處理等資料服務。

其中,資料採集方面,標貝科技可根據客戶定製化需求,對各類規定文字、指定圖片,各種環境下的語音、影片進行採集;採集過程中可實現對其內容的篩選、文字化等相關任務。

而資料標註方面,在語音方面,支援ASR語音轉寫、音素標註、語音清洗、聲紋識別標註、語音切割、情緒判定等;在自然語言處理方面,支援OCR轉寫、文字資訊抽取、文字富集、詞性標註、槽位提取等;在計算機視覺方面,支援圖片清洗分類、關鍵點標註、3D點雲標註、影象語義分割、目標跟蹤等。

隨著技術不斷進步,將會有越來越多的語音技術產品出現在人們生活和工作之中。未來,標貝科技將加大研發投入力度,與學術界和工業界保持緊密合作,攜手共同推動語音產業的發展。