品途2018·NBI夏季創(chuàng)新峰會(huì)于8月8日在北京四季酒店舉行,以“AI賦能下的樂享未來新體驗(yàn)”為主題的人工智能圓桌對(duì)話也在Pandaily創(chuàng)始人兼CEO 周恒星的主持下熱烈開始。
聲智科技創(chuàng)始人兼CEO陳孝良,至真互聯(lián)創(chuàng)始人兼CEO代黎明,物靈科技創(chuàng)始人兼CEO顧嘉唯,全域醫(yī)療總裁助理、創(chuàng)新運(yùn)營(yíng)部總經(jīng)理閻俊,清帆科技創(chuàng)始人兼CEO一起圍繞智能音箱,語音交互未來的現(xiàn)象級(jí)產(chǎn)品,以及未來AI新體驗(yàn)展開了深入的討論。
NBI的全稱是New Business Information, Inspirition, Impact, and Innovation,新商業(yè)創(chuàng)新影響力。自創(chuàng)建以來,NBI系列活動(dòng)(NBI Awards、NBI星耀計(jì)劃科創(chuàng)大賽等)吸引了近百家投資機(jī)構(gòu)、千余家創(chuàng)業(yè)企業(yè)參與——引領(lǐng)與創(chuàng)新相關(guān)的聯(lián)想、發(fā)問、觀察、對(duì)話和思考。本次峰會(huì)以與創(chuàng)新節(jié)律同步為主題,旨在讓創(chuàng)業(yè)者、投資人、產(chǎn)業(yè)機(jī)構(gòu)參與到新技術(shù)的誕生和技術(shù)的新突破、發(fā)問創(chuàng)新的可持續(xù)性、觀察產(chǎn)業(yè)變革趨勢(shì)以及思考商業(yè)文明的新價(jià)值。
圓桌會(huì)話開始,主持人Pandaily創(chuàng)始人兼CEO 周恒星向大家介紹五位與會(huì)嘉賓,各位嘉賓各自介紹自家公司以及從事的業(yè)務(wù)領(lǐng)域。聲智科技創(chuàng)始人陳孝良在現(xiàn)場(chǎng)也為向大家介紹了聲智科技。
聲智科技成立于2016年4月,是一家專注聲學(xué)前沿技術(shù)和人工智能交互的科技創(chuàng)新公司,公司目前定位于為企業(yè)提供最好的聲學(xué)語音技術(shù)和語言智能服務(wù)。截止目前,聲智科技已經(jīng)為小米、百度、阿里巴巴、華為、聯(lián)想、360等公司提供了遠(yuǎn)場(chǎng)語音交互技術(shù)和方案。作為小米智能音箱與百度小度智能音箱遠(yuǎn)場(chǎng)語音技術(shù)獨(dú)家提供者,以及阿里天貓精靈、華為的供應(yīng)商,聲智科技已經(jīng)成為眾多頭部大客戶的最佳合作伙伴。不局限于消費(fèi)電子領(lǐng)域規(guī)模上量的智能音箱、智能機(jī)頂盒和平板手機(jī)等產(chǎn)品,聲智科技的語音技術(shù)也在車載前裝、智能安防、智能金融、教育、醫(yī)療和機(jī)器人等行業(yè)得到廣泛應(yīng)用。
主持人:陳總是在智能語音這個(gè)領(lǐng)域,最近的話主要是致力于智能音箱,公司的一些合作伙伴也是國(guó)內(nèi)的互聯(lián)網(wǎng)巨頭公司(BATMH),為什么選擇音箱來作為主要的切入點(diǎn)呢?
陳孝良(聲智科技CEO):從全球市場(chǎng)也可以看出,在消費(fèi)電子領(lǐng)域,無論是從規(guī)模還是影響力來看,智能音箱都是人工智能領(lǐng)域最成功的落地產(chǎn)品。聲智科技從成立開始就在智能音箱領(lǐng)域下了很大的功夫,這也是為什么智能音箱領(lǐng)域,百度、阿里、騰訊、小米、華為五大巨頭都選擇了聲智科技。我們選擇智能音箱作為突破口,主要是出于兩個(gè)方面的考慮。
一個(gè)是從整個(gè)AI的構(gòu)架來說,音箱相對(duì)來說還是簡(jiǎn)單的。不管是前端的聲學(xué)處理、語音識(shí)別、聲紋識(shí)別、語音理解、語音合成,以及后端的內(nèi)容對(duì)接,整個(gè)鏈條基本上是一個(gè)最可控的簡(jiǎn)單系統(tǒng)。另外,智能音箱還最具有代表性。比如,如果我們給智能音箱加上輪子和屏幕,就可以做成一個(gè)機(jī)器人;還可以把智能音箱的系統(tǒng)放到汽車?yán)锩鏉M足交互需求,因?yàn)槲磥砥嚨娜蠹夹g(shù)就是能源、控制和交互。剛才漢能的陳總也提到了,未來我們實(shí)現(xiàn)了智能駕駛之后,我們?cè)谲噧?nèi)的大量時(shí)間要去做什么,這時(shí)候就需要交互技術(shù),而交互的關(guān)鍵還是智能音箱這套核心系統(tǒng)。這個(gè)系統(tǒng)即簡(jiǎn)單,又具有代表性,對(duì)于像我們這樣的創(chuàng)業(yè)公司來說作為突破口是最合適的。
另外一點(diǎn)就是公司的成長(zhǎng),公司的成長(zhǎng)主要就是看速度。智能音箱在全球是一款銷量很高的產(chǎn)品,今年在中國(guó)也快速上量了,也有很多大企業(yè)的參與。其實(shí)兩年前我們公司就預(yù)測(cè)過巨頭公司都會(huì)參與到這個(gè)市場(chǎng),正如現(xiàn)在大家所看到的,現(xiàn)在市場(chǎng)上的智能音箱基本上都是互聯(lián)網(wǎng)的幾大巨頭在玩,國(guó)外也是如此。巨頭的參與可以快速地降低人工智能新品類的市場(chǎng)培育成本,這個(gè)時(shí)候也是很適合創(chuàng)業(yè)公司去切入的。
主持人:正如陳總剛剛說到的,智能音箱領(lǐng)域在中國(guó)主要是一些互聯(lián)網(wǎng)巨頭在參與,而在美國(guó)主要是亞馬遜和谷歌在競(jìng)爭(zhēng),據(jù)我所知,現(xiàn)在智能音箱領(lǐng)域還沒有出現(xiàn)現(xiàn)象級(jí)的產(chǎn)品,可能值得一提的就是亞馬遜的Echo,您覺得亞馬遜為什么能做到這一點(diǎn)呢?
陳孝良:現(xiàn)在大家一提到人工智能,很容易就想到亞馬遜的Echo,國(guó)內(nèi)雖然百度、小米、騰訊、華為等都在參與,但是沒有一個(gè)具有代表性的現(xiàn)象級(jí)產(chǎn)品。從我們行業(yè)內(nèi)的角度來看的話,有兩點(diǎn)可以給大家作為參考。
第一點(diǎn)的話還是時(shí)間窗口的問題,亞馬遜的Echo在2011年就開始研發(fā),2013年就進(jìn)入市場(chǎng),而國(guó)內(nèi)智能音箱真正興起是在去年小米發(fā)布智能音箱的時(shí)候,之后阿里、百度、騰訊等才紛紛介入,比亞馬遜要晚了很多。
這個(gè)時(shí)間上的滯后也帶來了另一個(gè)問題,這也是東西方文化的差異,因?yàn)槲覀兊奈幕容^含蓄一些,在面對(duì)新的事物上可能難以快速認(rèn)可,所以在智能音箱剛剛推入市場(chǎng)的時(shí)候可能會(huì)是懷疑,使用之后可能又是質(zhì)疑,我相信大家對(duì)現(xiàn)在的智能音箱可能還是不滿意。
而且我們東方文化在表達(dá)上可能不像西方文化那樣豁達(dá),這些因素疊加在一起,就導(dǎo)致國(guó)內(nèi)的智能音箱不管是在對(duì)話頻率還是對(duì)話時(shí)長(zhǎng)都要小于國(guó)外,我們對(duì)智能音箱的依賴度顯然也還不像歐美那么高。
另外一點(diǎn)就和國(guó)內(nèi)的市場(chǎng)環(huán)境密切相關(guān)了,如果要產(chǎn)生現(xiàn)象級(jí)產(chǎn)品的話,我們就需要把所有的資源都集中在一兩款產(chǎn)品上。這一點(diǎn)亞馬遜在Echo做的很好,他們基本上把所有的資源、渠道都投入了Echo這款產(chǎn)品。比如我們?yōu)g覽亞馬遜的網(wǎng)站就可以發(fā)現(xiàn),不管什么時(shí)候,都有一個(gè)關(guān)于亞馬遜Echo的banner,而亞馬遜基本上占領(lǐng)了國(guó)外壟斷性的線上渠道。
另一個(gè)國(guó)外巨頭就是谷歌,基本上占據(jù)了國(guó)外廣告的壟斷地位,也是把這個(gè)資源集中投入了Google Home,甚至還投入巨資建設(shè)線下渠道。這兩個(gè)因素都會(huì)讓國(guó)外的智能音箱普及度更高。
而我們國(guó)內(nèi)的參與者喜歡單點(diǎn)突破,有的占據(jù)了線上的主要渠道優(yōu)勢(shì),有的占據(jù)了廣告和百科的一些優(yōu)勢(shì),有的集中在產(chǎn)品優(yōu)勢(shì)上發(fā)力,但這些優(yōu)勢(shì)分散開很難形成一個(gè)集中的點(diǎn),這樣就很難讓廣大用戶對(duì)某一產(chǎn)品有一個(gè)全方位的認(rèn)知,很難產(chǎn)生爆炸性結(jié)果。
當(dāng)然,國(guó)內(nèi)智能音箱的應(yīng)用生態(tài)在早期階段也很難承擔(dān)現(xiàn)象級(jí)產(chǎn)品的重任,這也不用過于擔(dān)心,因?yàn)槲覀兟曋强萍家恢痹诔掷m(xù)研發(fā)應(yīng)用與其他場(chǎng)景的新技術(shù)和新產(chǎn)品。
比如我們正在力推的遠(yuǎn)場(chǎng)智能機(jī)頂盒,若想要讓這款產(chǎn)品成為一個(gè)現(xiàn)象級(jí)產(chǎn)品,首先還是需要技術(shù)上的率先突破。比如聲智科技的OpenAEC技術(shù),主要解決弱參考信號(hào)或者無參考信號(hào)等更為復(fù)雜場(chǎng)景的回聲抵消(自噪聲抑制)問題,可以讓遠(yuǎn)場(chǎng)盒子直接支持所有品牌的電視和喇叭系統(tǒng)并保證極高的交互效率。
現(xiàn)在國(guó)內(nèi)市場(chǎng)上很快可以買到基于聲智科技遠(yuǎn)場(chǎng)語音交互技術(shù)的阿里天貓精靈魔盒,明年這類產(chǎn)品肯定會(huì)有一個(gè)爆發(fā)性,是不是會(huì)成為現(xiàn)象級(jí)的產(chǎn)品,那還要關(guān)注國(guó)內(nèi)一些巨頭的力度,特別是運(yùn)營(yíng)商對(duì)于這種新技術(shù)的推廣力度。
另外還有特別重要一點(diǎn),就是大家對(duì)于遠(yuǎn)場(chǎng)語音交互系統(tǒng)的認(rèn)知,未來這必然是一個(gè)全新的交互系統(tǒng),甚至不需要界面,但是目前來看,除了智能音箱,很多產(chǎn)品還只是把語音交互作為一個(gè)輔助。對(duì)于聲智科技來說,通過技術(shù)和數(shù)據(jù)迭代,持續(xù)研發(fā)和推出新技術(shù)來尋求現(xiàn)象級(jí)人工智能產(chǎn)品,這是我們一直努力的目標(biāo)。
顧嘉唯(物靈科技CEO):我主要談三點(diǎn),首先智能音箱這個(gè)品類,初期階段語音交互可以將智能音箱作為一個(gè)載體,但這個(gè)載體的特性是播音樂,播內(nèi)容,但中國(guó)主體的文化人群的用戶習(xí)慣很少有使用音箱去獲得音樂的,這也是中美在基層上的一個(gè)差異。這一點(diǎn)也說明音箱只是一個(gè)開始,終極形態(tài)的音箱產(chǎn)品現(xiàn)在還沒有定下來。
第二點(diǎn),一個(gè)好的語音交互產(chǎn)品背后有兩個(gè)方面,第一個(gè)是智能家居的控制,第二是有足夠多的內(nèi)容源,但這兩個(gè)生態(tài)系統(tǒng)即便BAT都在猛推,但還是沒有達(dá)到很好的效果。
第三點(diǎn),我認(rèn)為中國(guó)市場(chǎng)還是一個(gè)很不成熟的階段,我們要先激發(fā)用戶的需求。當(dāng)Alexa和Google Assistant已經(jīng)在海外變成一個(gè)千萬級(jí)別的通用方案時(shí),創(chuàng)業(yè)公司尋找的下一個(gè)高頻入口也會(huì)出現(xiàn),無論是機(jī)頂盒還是車載。
主持人:張總對(duì)于智能音箱這一點(diǎn)有什么看法嗎?
張文濤(清帆科技CEO):“有一點(diǎn)很有意思的,我觀察我兒子,因?yàn)樗F(xiàn)在還不識(shí)字,他每天就會(huì)和他的手表對(duì)話,回家練舞的時(shí)候他就跟他的手表說,給我播一首歌,然后就跟著跳舞,他的交互體驗(yàn)就很明顯。
語音交互確實(shí)是人類的天性,或者說人對(duì)聽說的掌握要比文字更自然,我本來不太關(guān)注交互,文字對(duì)我來說更具有私密性,但是對(duì)于我兒子來說,這種交互方式對(duì)他來說是最簡(jiǎn)單的,現(xiàn)在的很多小孩也都已經(jīng)習(xí)慣語音交互了。我覺得智能語音交互的未來是非??善诘摹?rdquo;
顧嘉唯(物靈科技CEO):對(duì),在YouTube上看很多第一次用iPad的小孩,他們會(huì)非常自然,今天語音交互出現(xiàn)后小孩也是最快進(jìn)入的。這里面有幾個(gè)特點(diǎn),第一點(diǎn)是兒童對(duì)語音交互的結(jié)果預(yù)期相對(duì)較低,而成人的預(yù)期很高;
而且兒童相信一切都是可以語音交互的,他們比起大人更愿意去交流。而成人如果受挫,就會(huì)對(duì)這個(gè)產(chǎn)品失去信心,Siri之所以做的不是很好,也是這個(gè)原因。
閻峻(全程醫(yī)域總裁助理):智能音箱的話,其實(shí)我在家里也買了一個(gè)小米的智能音箱?,F(xiàn)在對(duì)于整個(gè)家居互聯(lián)網(wǎng)的人工智能技術(shù)是一個(gè)新的趨勢(shì),也可以說是一種新的發(fā)展,不管是智能音箱還是智能家居,都是出于起步的階段,我希望能看到它在使用過程中不斷的發(fā)展,希望看到人工智能領(lǐng)域的發(fā)展?fàn)顟B(tài),是對(duì)行業(yè)的體會(huì),也是對(duì)生活的體會(huì)。
創(chuàng)新是發(fā)展的第一生產(chǎn)力,而目前這是中國(guó)企業(yè)發(fā)展最薄弱的環(huán)節(jié),雖然在這是一個(gè)全民創(chuàng)新的時(shí)代,但如何用創(chuàng)新創(chuàng)造未來也是一個(gè)重要的問題。創(chuàng)新如何推動(dòng)產(chǎn)業(yè)的發(fā)展,如何帶來價(jià)值,如何用技術(shù)來改變社會(huì)的潮流,這些都是我們科技創(chuàng)新者需要考慮的問題。未來的智能語音交互領(lǐng)域何去何從,現(xiàn)象級(jí)的語音交互產(chǎn)品究竟是什么,聲智科技也會(huì)繼續(xù)努力探索。