訂閱
糾錯(cuò)
加入自媒體

國內(nèi)AI領(lǐng)先技術(shù),語音識別未來的發(fā)展趨勢是怎樣的?

聲明:本文為火石創(chuàng)造原創(chuàng)文章,歡迎個(gè)人轉(zhuǎn)發(fā)分享,網(wǎng)站、公眾號等轉(zhuǎn)載需經(jīng)授權(quán)。

語音識別是發(fā)展未來人工智能(點(diǎn)擊閱讀:我國人工智能產(chǎn)業(yè)現(xiàn)狀及發(fā)展前景分析)的重要組成部分之一,是達(dá)到人機(jī)交互目的第一步,簡單來說,是機(jī)器或程序完成接受口令、解釋聲音含義、理解和執(zhí)行口頭指令所需的技術(shù)。本文將從行業(yè)政策環(huán)境、產(chǎn)業(yè)鏈、行業(yè)競爭格局、投資現(xiàn)狀等角度來剖析語音識別產(chǎn)業(yè)的發(fā)展現(xiàn)狀。

01行業(yè)政策環(huán)境

近年來,隨著科技的進(jìn)步,人工智能這一新興領(lǐng)域取得了快速發(fā)展,相關(guān)政策相繼出臺。

表1:人工智能相關(guān)政策匯總

來源:火石創(chuàng)造根據(jù)公開資料整理

在“十四五”的大背景和智能經(jīng)濟(jì)形態(tài)下,目前已有多個(gè)省市響應(yīng)中央號召,相繼發(fā)布人工智能相關(guān)規(guī)劃或?qū)m?xiàng)政策,以人工智能為技術(shù)手段,發(fā)揮當(dāng)?shù)禺a(chǎn)業(yè)集群優(yōu)勢,促進(jìn)產(chǎn)學(xué)研融合及協(xié)同發(fā)展。同時(shí),語音識別技術(shù)屬于中國AI領(lǐng)域中最為成熟落地的技術(shù)之一,預(yù)計(jì)未來能夠繼續(xù)加速在各垂直行業(yè)進(jìn)行滲透和布局。

02產(chǎn)業(yè)鏈分析

圖1:語音識別產(chǎn)業(yè)圖譜來源:火石創(chuàng)造根據(jù)公開資料整理

中國人工智能語音識別產(chǎn)業(yè)鏈主要分為上游、中游、下游。

上游:基礎(chǔ)層技術(shù)提供算力與數(shù)據(jù)方面的強(qiáng)力支持——包含算力與AI數(shù)據(jù)服務(wù)。語音識別模型在運(yùn)行過程中訓(xùn)練數(shù)據(jù)量和計(jì)算量需求極大,由于傳統(tǒng)的CPU或者單一處理器進(jìn)行語音識別運(yùn)算的處理時(shí)間過長,所以無法滿足海量數(shù)據(jù)計(jì)算的實(shí)時(shí)性需求。目前,主流語音識別公司的模擬訓(xùn)練和語音識別基本都在云端采用GPU等計(jì)算芯片并行架構(gòu)或異構(gòu)計(jì)算方案進(jìn)行。

中游:技術(shù)層提供理論與技術(shù)支撐——包含基礎(chǔ)理論技術(shù)以及算法模型相關(guān)解決方案的形成,升級為相關(guān)軟硬件產(chǎn)品。

下游:應(yīng)用層提供技術(shù)落地應(yīng)用場景——包含企業(yè)端、消費(fèi)端、其他端場景。其中,企業(yè)端主要應(yīng)用于醫(yī)療、公檢法等;消費(fèi)端主要應(yīng)用于智能家居、智慧教育等。

03行業(yè)競爭格局

中國的人工智能語音識別主流廠商大致可分為互聯(lián)網(wǎng)IT廠商、語音技術(shù)廠商兩類。互聯(lián)網(wǎng)IT廠商典型包括阿里巴巴、騰訊、搜狗、百度等。這類廠商重視以流量導(dǎo)向和滿足龐大用戶群體驗(yàn)和創(chuàng)新需求為導(dǎo)向去做AI開發(fā),更多以流量和用戶體驗(yàn)為導(dǎo)向,同時(shí),會(huì)比傳統(tǒng)的語音技術(shù)廠商更加注重創(chuàng)新實(shí)踐。語音技術(shù)廠商典型包括科大訊飛、捷通華聲等擁有自身核心語音芯片以及相關(guān)軟件系統(tǒng)的傳統(tǒng)語音技術(shù)廠商,還有云知聲、思必馳等側(cè)重于某些垂直領(lǐng)域的語音技術(shù)和產(chǎn)品的創(chuàng)業(yè)廠商。在眾多廠商中,科大訊飛、騰訊、百度為典型競爭力代表。

科大訊飛:科大訊飛是國內(nèi)領(lǐng)先的智能語音技術(shù)主要提供商之一,在語音識別等智能語音技術(shù)領(lǐng)域擁有國際先進(jìn)的成果,主要業(yè)務(wù)包含智能語音和語言技術(shù)研究、軟件及芯片產(chǎn)品開發(fā)、語音信息服務(wù)及電子政務(wù)系統(tǒng)集成,為企業(yè)、政府和個(gè)人提供智能應(yīng)用。科大訊飛技術(shù)優(yōu)勢在同行業(yè)中出眾,擁有自主知識產(chǎn)權(quán)的智能語音技術(shù),推出覆蓋大型電信級應(yīng)用到小型嵌入式應(yīng)用以及滿足不同應(yīng)用環(huán)境的軟硬件產(chǎn)品。科大訊飛在中文語音技術(shù)市場和語音合成產(chǎn)品市場都占有較大份額,應(yīng)用于電信、金融、電力、社保等主流行業(yè)?拼笥嶏w結(jié)合自己核心的智能語音技術(shù)和人工智能的研究,已經(jīng)實(shí)現(xiàn)AI產(chǎn)品化的布局。在To B端,科大訊飛面向教育、政法、醫(yī)療、汽車和客服等多個(gè)行業(yè)提供相應(yīng)的解決方案。在To C端,科大訊飛提供面向消費(fèi)者的家庭、汽車、翻譯等個(gè)人消費(fèi)品,包括硬件產(chǎn)品如訊飛學(xué)習(xí)機(jī)、訊飛翻譯機(jī)、智能辦公本等,以及軟件產(chǎn)品如訊飛輸入法、AI電視助手等。

騰訊:騰訊云語音識別目前主要應(yīng)用于微信、王者榮耀、騰訊視頻等內(nèi)部業(yè)務(wù),外部應(yīng)用布局于錄音質(zhì)檢、會(huì)議實(shí)時(shí)轉(zhuǎn)寫、法庭及審訊記錄、語音輸入法等場景。技術(shù)提供主要功能為開放實(shí)時(shí)語音識別、一句話識別和錄音文件識別,支持云端和嵌入式兩種服務(wù)模式。騰訊云語音識別的主要優(yōu)勢在于有大量的用戶基礎(chǔ)和數(shù)據(jù)積累可應(yīng)用于豐富的行業(yè)場景,收費(fèi)價(jià)格較低,自準(zhǔn)率高達(dá)97%,支持多語言識別能力,有領(lǐng)先的算法。

百度:百度在AI開放平臺上提供語音識別的技術(shù),共享AI領(lǐng)域的應(yīng)用場景和解決方案,產(chǎn)品包括短語音識別、實(shí)時(shí)語音識別、遠(yuǎn)場語音識別、音頻文件轉(zhuǎn)寫、語音自訓(xùn)練平臺等,應(yīng)用于手機(jī)應(yīng)用如語音輸入、機(jī)器人對話、語音內(nèi)容分析和實(shí)時(shí)語音轉(zhuǎn)寫等場景。百度的語音識別技術(shù)優(yōu)勢在于領(lǐng)先的語音識別技術(shù),提供自助訓(xùn)練專屬模型,可簡單快速地接入API及多種SDK接口,提供穩(wěn)定性保障,且收取費(fèi)用較低。

04投資現(xiàn)狀

國內(nèi)人工智能產(chǎn)業(yè)發(fā)展較國外發(fā)展較晚,直至2011年方才展露出發(fā)展苗頭。語音識別作為人工智能產(chǎn)業(yè)中極其重要的一個(gè)組成部分,擔(dān)任著人機(jī)交互應(yīng)用時(shí)的輸入和輸出接口,也相應(yīng)地受到產(chǎn)業(yè)風(fēng)口的影響,受到一眾投資機(jī)構(gòu)的追捧。截至2021年2月,語音識別行業(yè)投資事件達(dá)150多件,投資金額達(dá)180億元左右。

圖2:我國語音識別產(chǎn)業(yè)投融資情況

來源:信通院

從投資輪次來看,A輪階段的語音識別企業(yè)更受資本方的青睞,投資額達(dá)50.24億元,投資事件達(dá)65次;其次,B、C、D、E輪次的投資相對平均;值得一提的是,對于早期項(xiàng)目,投資機(jī)構(gòu)雖然單筆投資金額較少,但投資事件相對較高,達(dá)24次。按照語音識別產(chǎn)業(yè)分輪次投融資占比來看,行業(yè)中吸引了絕大部分資金的企業(yè)基本上都聚集在A、B、C輪。

圖3:我國語音識別產(chǎn)業(yè)分輪次投融資情況來源:融中研究

圖4:我國語音識別產(chǎn)業(yè)分輪次投融資占比情況來源:融中研究

從語音識別產(chǎn)業(yè)內(nèi)企業(yè)產(chǎn)品/服務(wù)應(yīng)用方向來看,主要分為技術(shù)服務(wù)、教育、汽車交通、新工業(yè)、智能硬件、醫(yī)療、金融等幾個(gè)分類。其中,最為獲得投資機(jī)構(gòu)青睞的是技術(shù)服務(wù)方向的語音識別企業(yè),占據(jù)了投資金額及投資事件數(shù)的絕大部分,分別為116.49億元、89次投資。值得一提的是,語音識別技術(shù)應(yīng)用于汽車交通行業(yè)所獲得的投資件數(shù)雖然僅有4次,但單筆投資金額卻是最高的。

圖5:我國語音識別產(chǎn)業(yè)分行業(yè)投融資情況來源:融中研究

圖6:我國語音識別產(chǎn)業(yè)分行業(yè)投融資占比情況來源:融中研究

04總結(jié)

我國大力推動(dòng)新基建發(fā)展,其中5G、人工智能、云計(jì)算等作為輔助核心基礎(chǔ)設(shè)施也將得到進(jìn)一步加速發(fā)展,同時(shí)也會(huì)帶動(dòng)語音識別產(chǎn)業(yè)迎來更加廣闊的發(fā)展空間。未來,相信在國家政策的強(qiáng)力扶持與供應(yīng)商和開發(fā)者的共同努力下,語音識別產(chǎn)業(yè)會(huì)加速在垂直行業(yè)進(jìn)行滲透和布局,能夠更好地與其他語音交互技術(shù)及軟件功能融合,為消費(fèi)者提供更優(yōu)質(zhì)的體驗(yàn)。

參考文獻(xiàn)1. 《AI語音識別行業(yè)發(fā)展研究報(bào)告》.融資中國2. 《語音識別技術(shù)市場狀況和發(fā)展歷程》旺龍智能.2021.5.

—END—    作者 | 火石創(chuàng)造 金丹 審核 | 火石創(chuàng)造邵錢、殷莉編輯 | 火石創(chuàng)造 張艷玲運(yùn)營 | 火石創(chuàng)造 黃淑萍

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號