語音是人類交流的重要方式,但說話者的健康狀態(tài)(例如神經疾病、癌癥、外傷等原因導致的聲音障礙)和周圍環(huán)境(噪音干擾、傳播介質)往往會影響聲音的傳輸和識別。研究人員一直在改進通用語音識別和交互技術,這些技術可以很好地處理細微的聲音或嘈雜的環(huán)境。多通道聲波傳感器可以提高聲音識別的精度,但因體積較大而無法佩戴。近期,清華大學的研究團隊開發(fā)了一種基于石墨烯的智能可穿戴人工喉(AT),可以實現(xiàn)語音感知和發(fā)聲。研究成果發(fā)表在《Nature Machine Intelligence》期刊,論文的標題“Mixed-modality speech recognition and interaction using a wearable artificial throat”。
該研究團隊通過激光直寫技術在超薄聚酰亞胺薄膜上轉化出基于石墨烯的智能可穿戴人工喉(AT),實現(xiàn)了對聲音信號和機械運動的混合模態(tài)的感知,使AT能夠獲得低基頻信號,同時具有抗噪聲的語音感知能力。實驗結果表明,混合模態(tài)AT能夠檢測基本語音元素(音素、聲調和單詞),平均準確率達到99.05%。此外,通過集成AI模型,AT識別出了喉切除術患者含糊說出的日常詞匯,準確率超過90%。同時,AT還可以通過熱聲效應實現(xiàn)聲音的播放功能,以恢復患者的發(fā)聲能力。
該研究提出的AT具有制作工藝簡單、性能穩(wěn)定、抗噪性強、可集成發(fā)聲等特點,使其成為下一代語音識別和交互系統(tǒng)的有力工具。
注:此研究成果摘自《Nature Machine Intelligence》雜志,文章內容不代表本網(wǎng)站觀點和立場,僅供參考。
知前沿,問智研。智研咨詢是中國一流產業(yè)咨詢機構,十數(shù)年持續(xù)深耕產業(yè)研究領域,提供深度產業(yè)研究報告、商業(yè)計劃書、可行性研究報告及定制服務等一站式產業(yè)咨詢服務。專業(yè)的角度、品質化的服務、敏銳的市場洞察力,專注于提供完善的產業(yè)解決方案,為您的投資決策賦能。
2024-2030年中國語音識別行業(yè)市場現(xiàn)狀分析及投資前景研判報告
《2024-2030年中國語音識別行業(yè)市場現(xiàn)狀分析及投資前景研判報告》共十一章,包含中國語音識別行業(yè)重點企業(yè)研究,中國語音識別行業(yè)投資機會透視和風險分析,研究總結及投資建議等內容。
版權提示:智研咨詢倡導尊重與保護知識產權,對有明確來源的內容注明出處。如發(fā)現(xiàn)本站文章存在版權、稿酬或其它問題,煩請聯(lián)系我們,我們將及時與您溝通處理。聯(lián)系方式:gaojian@chyxx.com、010-60343812。