2024年3月29日,由上海添力網(wǎng)絡(luò)科技有限公司創(chuàng)始人張進申請的語音合成發(fā)明專利正式授權(quán)使用。
早在上世紀90年代,張進根據(jù)在大學(xué)學(xué)習(xí)的語言輸入法,就萌生了通過鍵盤打字發(fā)音的研究興趣。但在隨后的歲月里,張進一直從事平面設(shè)計、印刷、包裝和線上推廣行業(yè),忙于工作沒有機會展開研究。直到2019年,在事業(yè)穩(wěn)定,業(yè)余生活時間相當充裕情況下,張進決定利用業(yè)余時間從事該項語音合成技術(shù)的研究(通過鍵盤輸入,直接發(fā)出語音系統(tǒng))。
在研究過程中張進發(fā)現(xiàn),如果用漢字輸入法打出漢字發(fā)音,并不是一種高效的發(fā)音方式,而需要研發(fā)一種稱為“音碼”的編碼方案,可以更高效地打字發(fā)音,于是“音碼語音合成系統(tǒng)”就這樣問世了。
這套系統(tǒng)只需要敲擊三鍵,就能準確地發(fā)出一個漢字語音。如果跟輸入法一樣,使用聯(lián)想和快捷鍵,可以實現(xiàn)平均1.5鍵發(fā)一個音。我們知道,一般漢語的語速是每分鐘200個漢字,使用者通過打字訓(xùn)練,只要輸入速度可以達到每分鐘300個字母,就能實現(xiàn)正常語速交流。這項研究成果可以應(yīng)用在失語者與正常人交流的場景中。比如,有些中風(fēng)患者失去了語音能力,就可以通過該系統(tǒng)與別人進行語音交流。
音碼語音合成技術(shù)與目前主流的TTS語音合成技術(shù)走的是不同技術(shù)路線,所以有它獨特的優(yōu)勢,今后可以應(yīng)用到更廣泛的領(lǐng)域。添力公司申請的第二項專利就可以應(yīng)用到專業(yè)的自然語音合成領(lǐng)域。
期待添力公司的張進帶領(lǐng)語音技術(shù)團隊開發(fā)出更先進的語音技術(shù),申請到更多的發(fā)明專利。
相關(guān)文章閱讀
音碼語音合成系統(tǒng)SCTS(Speech Code To Speech)
上海添力公司成功發(fā)布音碼語音合成系統(tǒng)-引領(lǐng)智能語音交互新時代