訂閱
糾錯(cuò)
加入自媒體

AI機(jī)器學(xué)習(xí)與智能硬件融合,小度智能音箱如何做到與天貓精靈并駕齊驅(qū)?

2019-03-25 16:54
來源: DoNews

3月8日,阿里宣布自家的智能音箱銷量已經(jīng)超過千萬,成為中國(guó)第一,全球第三的智能手機(jī)廠商。

從Strategy Analytics最新發(fā)布的研究報(bào)告指出,智能音箱是的確是2018年最熱門的消費(fèi)電子產(chǎn)品。

2018年第四季度,全球智能音箱出貨量增長(zhǎng)了95%,達(dá)到3850萬臺(tái)。超過2017年的全年總出貨量,這種增長(zhǎng)率堪比2012年前后的智能手機(jī)。

從市場(chǎng)份額看,國(guó)外的亞馬遜與谷歌還有明顯優(yōu)勢(shì),2018年四季度,亞馬遜的銷量是1350萬,谷歌的銷量是1150萬,而中國(guó)的阿里、百度、小米銷量都在200萬左右。

有意思的是,如果我們把中國(guó)三家廠商每季度的銷量分開來看,就會(huì)發(fā)現(xiàn)中國(guó)智能音箱增長(zhǎng)最快的并不是阿里,而是百度。

百度是全球前五中入場(chǎng)最晚的廠商,到了2018年二季度才開始發(fā)力,但是在短短幾個(gè)月,百度就成為智能音箱的世界級(jí)巨頭,這種增長(zhǎng)速度是爆炸性的。

智能音箱這款產(chǎn)品始于2014年亞馬遜的Echo,國(guó)內(nèi)廠商紛紛仿效,經(jīng)過數(shù)年優(yōu)勝劣汰,阿里和小米到了2018年初已經(jīng)傲視所有國(guó)內(nèi)廠商。

百度真正發(fā)力智能音箱是在2018年中,“小度在家“這款全球首款帶屏智能音箱在2018年4月份才公開招募內(nèi)測(cè)。

而短短幾個(gè)月,百度的智能音箱就如核彈爆炸一般急速增長(zhǎng),到了2018年底,已經(jīng)是三巨頭之一,而且銷量幾乎與阿里和小米持平。

2019年一季度有春晚的加成,百度拿下一季度銷量第一應(yīng)該不是問題。

百度成立已經(jīng)很多年了,但是它最基本不做硬件,從互聯(lián)網(wǎng)跨界智能硬件,百度在幾個(gè)月內(nèi)就從“青銅“一躍成為“王者“,這個(gè)奇跡是如何創(chuàng)造出來的呢?

一、 厚積而薄發(fā)

智能硬件看似是一個(gè)硬件產(chǎn)品,而實(shí)際上它的核心技術(shù)并不是硬件,而是AI的語音識(shí)別與搜索。

語音識(shí)別技術(shù)已經(jīng)存在很久了,但是要讓智能音箱有優(yōu)秀的體驗(yàn),不僅僅是正確識(shí)別語音就夠了,而是要判別說話者的意圖,給予正確的回應(yīng)。

國(guó)內(nèi)很多所謂的智能音箱,只是買了科大訊飛的語音識(shí)別技術(shù),而百度的智能音箱核心技術(shù)是自己研發(fā)的。

百度對(duì)AI的研發(fā),可以追溯到多年之前。

人工智能科技發(fā)展很早,但是一度遇到瓶頸,難以突破;ヂ(lián)網(wǎng)發(fā)展起來之后,人們發(fā)現(xiàn)人工智能科技中深度學(xué)習(xí)技術(shù),可以依靠互聯(lián)網(wǎng)的大數(shù)據(jù)不斷進(jìn)步,同時(shí)硬件的發(fā)展,特別是GPU通用計(jì)算的發(fā)展,讓計(jì)算能力不再是瓶頸,AI有了進(jìn)一步發(fā)展的可能。

于是,百度在硅谷等地成立實(shí)驗(yàn)室,投入重金,招募全球最好的AI專家,搭建百度大腦,開始AI的深度研發(fā)。

早在2014年(亞馬遜推出Echo之前),百度的研發(fā)團(tuán)隊(duì),就利用深度學(xué)習(xí)技術(shù),研發(fā)出Deep Speech系統(tǒng)。

到了2016年,百度的Deep Speech系統(tǒng)已經(jīng)進(jìn)化到第三代。

傳統(tǒng)上,對(duì)語音識(shí)別的人工智能技術(shù)是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))。RNN是在DNN(深度神經(jīng)網(wǎng)絡(luò))的基礎(chǔ)上發(fā)展出時(shí)間戳,發(fā)展出長(zhǎng)短時(shí)記憶單元,可以有解決時(shí)間序列的應(yīng)用。語音識(shí)別是有時(shí)間序列的,所以業(yè)界對(duì)RNN用于語音識(shí)別的研究比較多。

而百度將深層卷積神經(jīng)網(wǎng)絡(luò)技術(shù)(Deep CNN)應(yīng)用于語音識(shí)別聲學(xué)建模中,將其與基于長(zhǎng)短時(shí)記憶單元(LSTM)和連接時(shí)序分類(CTC)的端對(duì)端語音識(shí)別技術(shù)相結(jié)合,大幅度提升語音識(shí)別產(chǎn)品性能。這項(xiàng)技術(shù)借鑒了圖像識(shí)別在近些年的成果,以及語音與圖像在利用 CNN 模型訓(xùn)練的共通性,在語音識(shí)別技術(shù)上取得了革命性的進(jìn)展。

《麻省理工科技評(píng)論》(MIT Technology Review)雜志在2016年度十大突破技術(shù)的榜單中把百度語音識(shí)別技術(shù)列為十大突破技術(shù)。

實(shí)際上早在2016年,百度已經(jīng)有了頂尖的語音識(shí)別技術(shù)。李彥宏在百度科技大會(huì)的上發(fā)言可以由AI同聲傳譯。李彥宏在Tech World大會(huì)上展示了AI與人的多輪對(duì)話。這些展示,遠(yuǎn)遠(yuǎn)超過市面上在售的智能音箱所擁有的水平,百度只是缺少一款轉(zhuǎn)化的產(chǎn)品。

1  2  下一頁(yè)>  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)