
語音轉寫功能需求分析:

系統(tǒng)介紹:
智能語音轉寫系統(tǒng)
? 智能語音轉寫系統(tǒng)提供實時語音識別和錄音文件識別能力。無縫嵌入傳統(tǒng)會議室系統(tǒng),讓會議更高效便捷。
? 適用場景:辦公會議、政府報告、新聞發(fā)布、學術講座等各行業(yè)領域會議場景。
?語音實時轉寫
?實時字幕
?實時上屏
?會議紀要
?角色分離
?錄音轉寫
?紀要導出
……

產(chǎn)品:

硬件:在線版和離線版
在線版:

離線版:

產(chǎn)品特點:
在線版產(chǎn)品特點:
1.高準確性:在線部署,采用云服務器,數(shù)據(jù)更新快,對于網(wǎng)絡詞匯更準確
2.轉寫準確率高:中文普遍話≥95%,Native 英文≥90%
3.翻譯效果佳:智能斷句、先進聲學模型和語言模型訓練
4.處理效率高:實時轉寫,200ms內(nèi)返回結果
5.歷史音頻處理,1小時音頻10分鐘完成
在線版采用科大訊飛的云服務器,他們是按服務量收費的

離線版產(chǎn)品特點:
1.安全性高:離線部署,數(shù)據(jù)安全
2.轉寫準確率高:中文普遍話≥95%,Native 英文≥90%
3.翻譯效果佳:智能斷句、先進聲學模型和語言模型訓練
4.處理效率高:實時轉寫,200ms內(nèi)返回結果
5.歷史音頻處理,1小時音頻10分鐘完成
系統(tǒng)拓撲圖:

界面展示:

功能介紹:

大屏實時字幕:集成會議發(fā)言字幕實時投屏??蓪崿F(xiàn)拓展屏投屏或獨立大屏投屏。優(yōu)質(zhì)的低延時流式語音識別技術,讓實時字幕展示更實時。

角色分離:實現(xiàn)在會議過程中對會議的發(fā)起方、參與方、主席、主持人、秘書等將各方發(fā)言的內(nèi)容進行角色分離并自動實時識別成文字,并把語音轉寫成的文本以字幕的形式投放到大屏顯示。

展板展示轉寫結果:語音轉寫展板展示語音轉寫文本內(nèi)容,可對展板字體進行放大縮小和重點標記。自動同步展板紀要內(nèi)容,實時展示語音轉寫文本。
重點標記:針對一些有疑問的內(nèi)容重點標記高亮顯示,方便會后整理文稿。

禁忌詞屏蔽:可以將不適宜展示的敏感詞添加禁忌詞列表中,屏蔽此禁忌詞,當識別到此類詞匯時,系統(tǒng)提供不顯示、*號和空格三種顯示方式供選擇。

關鍵詞優(yōu)化:針對每場會議需要提高識別效果的關鍵詞,按要求添加入關鍵詞列表中,會議開始前和會議過程中均可進行添加。如添加人名、地名、公司名等。
語氣詞過濾:在實時語音轉寫開始前或者進行文稿整理時,根據(jù)需要選擇是否開啟“語氣詞過濾”功能,若開啟則能可將語氣詞和多余的詞匯去除,以保證文稿的規(guī)整。

編輯會議紀要:會議紀要可對比語音轉寫結果進行編輯會議紀要,復制語音轉寫文本內(nèi)容到會議紀要中,更加高效快捷記錄會議內(nèi)容。
會后紀要歸檔:會議結束后,自動歸檔會議紀要文件。管理人員可前往歷史會議中查看會議紀要文件,下載會議紀要文件;會議紀要可通過二維碼分享。

音頻文件導入轉寫:主要用于對歷史音頻轉寫的場景,用戶可通過錄音設備進行錄音,將音頻數(shù)據(jù)導入錄音整理客戶端后,可進行快速轉寫。系統(tǒng)支持最多每次上傳50條音頻,總大小不超過5GB,單條數(shù)據(jù)時長小于18小時;目前系統(tǒng)支持mp3\wav\pcm\wma\mp4\avi等格式的音頻,上傳成功后點擊開始轉寫即可開始轉寫。

詞匯替換:批量替換音頻導入語音轉寫文本的內(nèi)容,修正轉寫有誤的文本。





功能介紹-用戶管理
人員列表:將參會人員設為默認人員,無需每場會議重復添加。支持批量導入、導出人員。
組織架構:三級組織架構功能,自定義單位、部門、職務。選擇參會人員可按照組織架構排列選擇。

功能介紹-會議管理
會議列表:查看當前已創(chuàng)建的未開始、開會中的會議。
歷史會議:支持克隆歷史會議功能,無需重復配置會議信息,節(jié)省開會效率。

多會議模式:
多會議室時配語音轉寫服務網(wǎng)絡版,統(tǒng)一提供語音轉寫服務能力,支持多達32間會議室同時使用。每間會議室只需配備一臺管理電腦和會議相關設備。

文本分段:
具備智能語義分段、停頓時間、字數(shù)、關鍵字多種組合模式文本分段,配置更靈活。

字音同步:
具備字音對照功能,可對照文字拖動音頻或指定文字跳轉對應音頻進度。

多格式導出:文本導出支持TXT、DOC、LRC、SRT多種格式文件導出。

手動角色分離:綁定音源后,手動操作F1-F12可進行12個角色的手動分離。

優(yōu)勢亮點:

智能斷句:
分段分句:通過提取上下文相關的語義特征,同時結合停頓、基頻信息等語音特征,來進行子句與段落的劃分;綜合運用上下文相關語義特征和語音學特征,解決分句與分段問題。
文本順滑:通過使用泛化特征并結合上下文相關語義特征和語音學特征,剔除轉寫結果中的停頓詞、語氣詞、重復詞,使順滑后的文本更易于閱讀。
適用多種場景:適合辦公會議、政府報告、新聞發(fā)布、學術講座等各行業(yè)領域會議場景。非常適用政府企業(yè)、銀行部門等無法使用公網(wǎng)語音識別服務的行業(yè)。
