近日,有消息稱科大訊飛語音識別的正確率有了巨大的提升,此消息一出引發(fā)網(wǎng)友關(guān)注,具體情況快隨小編看看吧!
今天下午,科大訊飛AI研究院常務副院長劉聰發(fā)表了關(guān)于“構(gòu)筑AI科技樹,煥新美好新生活”的主題演講。在演講中,劉聰提到了如何保持AI技術(shù)不斷突破以及如何實現(xiàn)應用落地的問題。
劉聰認為,在人工智能的應用場景中,最重要的一個就是語音交互。他稱語音識別是訊飛的傳統(tǒng)強項。近年來,科大訊飛陸續(xù)推出了方言識別、遠場交互、多麥克風陣列等相關(guān)的功能,將語音聽寫從簡單場景的可用做到了通用。
下一步,科大訊飛將持續(xù)深耕語音識別,去挑戰(zhàn)更加復雜的場景,去實現(xiàn)從語音到聲音,從單純的文字內(nèi)容的識別,到音頻的全場景解析。例如直播場景這樣有游戲、音樂以及笑聲、掌聲等各種音效嘈雜的背景下,如何有針對性地提取想要的聲音。
面對這種復雜的環(huán)境,科大訊飛已經(jīng)有一套全場景音頻解析的整體方案。目前,可達訊飛在直播場景下的識別準確率已經(jīng)從從60%提到了85%。未來,這些相關(guān)技術(shù)會在科大訊飛的開放平臺、訊飛聽見等上線。