?
在很多行業(yè),對(duì)電話(huà)、無(wú)線(xiàn)電中的雙方通話(huà)以及密閉空間里的會(huì)議、競(jìng)標(biāo)、宣判等場(chǎng)景的說(shuō)話(huà),都會(huì)錄音,存檔做記錄或證據(jù)。
在需要獲取并了解錄音的內(nèi)容時(shí),就需要人工去回放傾聽(tīng),有些場(chǎng)合還需要將內(nèi)容敲打成文字,記錄下來(lái)。在錄音文件比較多的時(shí)候,就需要花費(fèi)很多的人力,而且不可避免的可能會(huì)出現(xiàn)差錯(cuò)。
在計(jì)算機(jī)科技飛速發(fā)展的當(dāng)下,比較合理的解決方法是用自動(dòng)語(yǔ)音識(shí)別(ASR)引擎對(duì)這些錄音文件進(jìn)行自動(dòng)文字識(shí)別并保存下來(lái)。
然而目前的市場(chǎng)現(xiàn)狀是可購(gòu)買(mǎi)的獨(dú)立部署的識(shí)別引擎價(jià)格昂貴且安裝繁瑣,需要廠(chǎng)家到現(xiàn)場(chǎng)去安裝。而用公網(wǎng)上的云平臺(tái)識(shí)別引擎開(kāi)發(fā)的系統(tǒng),按次數(shù)或者年收費(fèi),雖然價(jià)格不算高,但是不保密,數(shù)據(jù)不安全;錄音文件上傳到云平臺(tái)上進(jìn)行識(shí)別,相當(dāng)于數(shù)據(jù)發(fā)給了對(duì)方。對(duì)一些比較敏感的行業(yè)來(lái)講,這是沒(méi)法接受的
在這種情況下,從保密性、成本以及使用便捷這幾個(gè)方面兼顧作為出發(fā)點(diǎn),力盈力泰推出了自己的內(nèi)網(wǎng)里部署的錄音文件自動(dòng)語(yǔ)音識(shí)別(ASR,文字轉(zhuǎn)語(yǔ)音)解決方案。
?
?
目標(biāo)
給本公司或第三方的錄音系統(tǒng)生成的錄音文件,提供一個(gè)安全、便捷、可靠、低成本的自動(dòng)語(yǔ)音識(shí)別(語(yǔ)音轉(zhuǎn)文字)解決方案。
這有助于最終用戶(hù)能夠快速地掌握海量錄音文件的內(nèi)容,或者從中定位一些關(guān)鍵字詞,做后續(xù)處理。
?
實(shí)現(xiàn)方法和網(wǎng)絡(luò)架構(gòu)
?
在內(nèi)網(wǎng)部署一至多臺(tái)力盈力泰語(yǔ)音識(shí)別服務(wù)器;找一臺(tái)windows電腦,運(yùn)行力盈力泰錄音文件提交識(shí)別軟件。
力盈力泰錄音文件提交識(shí)別軟件對(duì)接錄音系統(tǒng)的數(shù)據(jù)庫(kù),從中獲取到錄音文件,自動(dòng)提交給內(nèi)網(wǎng)的力盈力泰語(yǔ)音識(shí)別服務(wù)器,在得到識(shí)別結(jié)果的文字內(nèi)容后,寫(xiě)回到數(shù)據(jù)庫(kù)對(duì)應(yīng)的記錄中。
?

力盈力泰錄音文件自動(dòng)語(yǔ)音識(shí)別(ASR,文字轉(zhuǎn)語(yǔ)音)網(wǎng)絡(luò)結(jié)構(gòu)圖
?
?
優(yōu)勢(shì)
- 1.保密性高。和其他使用云服務(wù)器上的識(shí)別引擎方案相比,本系統(tǒng)在內(nèi)網(wǎng)里運(yùn)行,錄音文件的數(shù)據(jù)是提交到內(nèi)網(wǎng)里所部署的ASR服務(wù)器進(jìn)行識(shí)別。無(wú)需連接到外網(wǎng),不用擔(dān)心網(wǎng)絡(luò)風(fēng)險(xiǎn);錄音文件的語(yǔ)音數(shù)據(jù)不用上傳到外網(wǎng)識(shí)別,不用擔(dān)心數(shù)據(jù)被截留、復(fù)制而泄密。
- 2.錄音識(shí)別準(zhǔn)確率高。采用優(yōu)秀的開(kāi)源識(shí)別引擎,在錄音沒(méi)有太大噪音的情況下,普通話(huà)常用語(yǔ)的識(shí)別準(zhǔn)確率能在90%以上。
- 3.安裝簡(jiǎn)單。將力盈力泰ASR服務(wù)器寄到現(xiàn)場(chǎng)后,只需配置其IP地址就能使用。力盈力泰錄音文件提交識(shí)別軟件是綠色免安裝版,只需拷貝到windows電腦上,配置幾個(gè)參數(shù),對(duì)接錄音系統(tǒng)數(shù)據(jù)庫(kù)后就能正常運(yùn)行。
- 4.成本可控。和外網(wǎng)云平臺(tái)識(shí)別方案一般按次數(shù)或者每年按套餐收費(fèi)不同,本系統(tǒng)一次性采購(gòu)后,后續(xù)沒(méi)有額外費(fèi)用(設(shè)備損壞需要維修或者更換除外),不會(huì)因錄音文件的數(shù)量增多或者年限而增加費(fèi)用。
- 5.支持算力擴(kuò)展。系統(tǒng)支持多臺(tái)SR服務(wù)器并發(fā)運(yùn)行。后期如果增加了更多的錄音通道,有更多的錄音文件需要識(shí)別,到時(shí)可以根據(jù)需要,再增加SR服務(wù)器的數(shù)量。
- 6.可對(duì)接大部分錄音系統(tǒng)。采用數(shù)據(jù)庫(kù)對(duì)接方式,可配置對(duì)接的數(shù)據(jù)庫(kù)字段,除了支持本公司的錄音系統(tǒng)之外,還支持其它采用數(shù)據(jù)庫(kù)方式的第三方錄音系統(tǒng)。
- ...
?
?
關(guān)鍵參數(shù)
- 1.支持對(duì)普通話(huà)和英文的錄音文件進(jìn)行識(shí)別。
- 2.支持常見(jiàn)的錄音文件格式,包括wav和mp3等。
- 3.單個(gè)錄音文件最大可支持80M字節(jié)。
- 4.識(shí)別得到的文字結(jié)果支持多語(yǔ)言,可以保存成簡(jiǎn)體中文、繁體中文和英文。
- 5.識(shí)別得到的文字結(jié)果支持采用UTF-8和GBK這兩種字符集。
?
?
?
相關(guān)內(nèi)容:
力盈力泰內(nèi)網(wǎng)錄音文件自動(dòng)語(yǔ)音識(shí)別解決方案.pdf(約 356K)