科大訊飛股份有限公司副總裁 劉俊峰
尊敬的各位合作伙伴,各位新老朋友,大家下午好!我是科大訊飛劉俊峰,我到科大訊飛已經(jīng)16年了,這也是科大訊飛在汽車語音結(jié)合走的16年,在這里面簡單向大家匯報一下我們的一些想法,以及對于未來我們的一些建議??拼笥嶏w成立于1999年,當前已經(jīng)是亞太地區(qū)最大的智能語音上市企業(yè),我們現(xiàn)在有13000人,現(xiàn)在分成六個大的產(chǎn)業(yè)方向,以及消費者BG,7個業(yè)務方向,這里面的話,我們從后臺的整個技術服用,整個架構(gòu)的共識以及到戰(zhàn)略協(xié)同都已經(jīng)形成了非常緊密的協(xié)同發(fā)展關系。在2010年我們發(fā)布全球第一個以云架構(gòu)為技術傳導方式的訊飛語音云迄今為止上線的應用已經(jīng)有將近60萬個,每一天線上線下的總交互次數(shù)有將近50億次,每一天從各種終端上面?zhèn)鱽淼倪@樣的一些交互數(shù)據(jù),我們有幾十個TB正是這樣的一些積累和這樣一些數(shù)據(jù)迭代,能夠真正形成了訊飛在智能語音方向以及語音交互方向,我們的護城河,以及到現(xiàn)在我們真正可以構(gòu)建起來為汽車行業(yè)提供全鏈智能語音交互解決方案,每一點其實都是關鍵點。在一個車上智能語音,如果是你聽起來不好聽,你的識別率不高,在噪音情況下,有可能會受到路噪胎噪風燥的干擾,以及在后端,比方說我們有一些檢索,有一些自然語言理解的不夠智能,這些情況,如果每一個點都沒有打綠燈,也就是說如果是從整個的這種產(chǎn)品的價值鏈上來說,他有紅燈點存在這樣一個系統(tǒng),就不會成為一個車上真正能夠可用的好系統(tǒng)。也正是基于我們這十幾年在汽車行業(yè)里面深度打磨語音交互這樣的一些積累才真正構(gòu)建起來了!我們現(xiàn)在面向整個行業(yè),從自主品牌到合資品牌到外資品牌的全鏈的智能語音交互的這樣的一個首選的合作伙伴的地位。這只是向大家說一下,我們這十幾年一直在做的一點點的小事。
現(xiàn)在真正到了汽車智能化升級轉(zhuǎn)型的一個關鍵時間點,剛才小鵬董事長也在講整個行業(yè)有一些焦慮。其實這樣的一些焦慮,我認為大可不必,因為一方面從汽車整個發(fā)展過程之中,從它的整車制造體型,車到店到電子電器開始有車上的部署,然后再到聯(lián)網(wǎng)了,然后再到現(xiàn)在算力夠網(wǎng)絡的運算的網(wǎng)絡的傳輸?shù)乃俣葔?,到下一個的信息化到智能化,其實每一個行業(yè)都要跨過一個的鴻溝。這里面自然會涉及到了很多,要有優(yōu)秀的供應商,要有優(yōu)秀的內(nèi)容資源,要有平臺方,我認為正是這樣的行業(yè)組合優(yōu)勢,才能構(gòu)建出來一個又一個面向未來的智能化的好產(chǎn)品?,F(xiàn)在智能網(wǎng)聯(lián),我認為已經(jīng)成為了一個品牌。它的一個基因之一,除了他在頂在前面的logo,除了它的內(nèi)外是和他的動力總成和他的操作調(diào)教。除了這些之外,智能網(wǎng)聯(lián)的特色應該可以成為一個主機廠面向用戶和面向行業(yè)的深度的基因之一。每一個車廠可能它的服務理念都是不一樣的,他要給他的用戶提供了感覺是不一樣的,它的交互特色可能是不一樣的,它的軟件界面可能都是不一樣的。這些不一樣才有了每一個車的深度定制去追求自己的可控,才有為了這樣一些行業(yè)所付出新勤勞動的那些定制者開發(fā)者,我認為這樣的過程也是到了汽車產(chǎn)業(yè)關鍵的這種組合配合戰(zhàn)的關鍵的環(huán)節(jié)里面,他是一個從產(chǎn)業(yè)鏈到數(shù)據(jù)鏈到技術鏈的協(xié)同才能夠真正走出來一個好的人機交互進好的汽車,服務好的汽車,智能化的未來。
我們是做人機交互的,所以在這里重點要調(diào)要提的就是人機交互,首先從交互上,汽車的用戶和汽車的服務平臺。在汽車之內(nèi)的這種兩三個小時的使用過程之中,他可能都是通過這樣的一些交互中介物來實現(xiàn)的,也包括對手機,也包括屏幕,也包括語音,甚至后面還藏著很多像手勢,像腦電波這樣一些新技術的融入,他是構(gòu)建了在智能化和網(wǎng)聯(lián)化對于用戶層表現(xiàn)體驗最關鍵的一點。
真正好的語音交互應該有如下四個特征,第一它是應該簡單的就是一句話能夠說完的事,不要讓他啰嗦兩句,一句話說不完的事,他說兩句三句你自然都能理解;第二,他應該是智能的,就是在這個過程之中,你不說他也知道你想要什么;第三個他應該是安全的,不應該等他講完之后我才能講;第四個它應該是有人性化的,它可以針對女性,針對于孩子,針對于我們的新生的千禧一代,它有不同的表現(xiàn)特色,而且每個人有每個人的交互喜好,他一定要做到千人千面。
我們面向未來,在整個的產(chǎn)業(yè)布局上面我們是這么理解的,在汽車上面這樣一套智能交互系統(tǒng),一方面他要理解人,另外一方面他要理解環(huán)境。所以在四象限里面,我們第一個先解決一個基礎的問題,就是聯(lián)網(wǎng)之后讓用戶在車里面做點什么,所以才有了我們在飛魚2.0上面涉及到了互聯(lián)網(wǎng)的網(wǎng)聯(lián)服務,對外的場景連接,在車內(nèi)的智能交互以及聽覺和視覺融合上面的一些突破。而我們在后期走的主線是往上走,我們走的是理解人的那條鏈,就是要做成在任何的車上都有一個可以懂你跟你能夠去親密交互的這樣的一個虛擬助理。慢慢的它可以更懂車,更懂環(huán)境,結(jié)合自動駕駛的一些特征,可以真正構(gòu)建智能汽車的未來。大家都在談自動駕駛,而且整個智能網(wǎng)聯(lián)在這個過程之中,其實都是以自動駕駛他的技術發(fā)展為一個卷面的!但是我的認為是每一個自動駕駛的狀態(tài)都應該對應著車內(nèi)人在解放雙手解放雙眼釋放駕駛的這種緊張感,能夠讓她安全地從A到B,他在每一個截面都應該有不同的人機交互的特色,從L2到L5車上的人一定是不一樣的。所以在這點上我希望的是真正能夠全面去來思考在一個智能汽車發(fā)展的過程之中,結(jié)合著自動駕駛的狀態(tài),能夠讓車上的人有不同的交互體驗,有不同的智能化的感知。我們?yōu)榱藰?gòu)建后面的一些更智能的車內(nèi)的交互體驗,在語音這一點上其實做了非常強的投入!首先,車內(nèi)的麥克風以后就不是兩個了,有可能是四個,有可能是八個,有可能是12個,甚至更多,為了什么?為了是在車上有更多的人可以加入一個交互的過程。到底是主駕位說的還是我第三排的右手邊的人說的,他真正的要說完之后得到他想要的內(nèi)容和他的反饋,比方說我要開空調(diào)開的是后側(cè)的空調(diào),還是開的是主駕位的空調(diào),比方說我要開我的車窗到底是開我旁邊的車窗還是別的,這樣的一些設置,其實都是因為車上有了一個非常細的非常能夠去理解環(huán)境之中每個人差異化需求的小耳朵,另外一點是我們在車上要做多音區(qū)的音效和識別時音的解決方案。就是真正在車上這四個位置,或者是在六個位置上,每個人聽得和每個人交互所得到的內(nèi)容,它是差異化的,而且不打架。同時車上可能有兩個人,三個人在這個過程之中,大家都在用語音交互,都在獲取到了語音交互之后回來的內(nèi)容。每個人聽到的東西可能都不一樣的,而且不打架,所以在我們下一步當然還有視覺這一塊我就不多講了,真正讓車從交互層面的感知,從能夠聽會說到后面的可以察言觀色。
我們不做自動駕駛,我們現(xiàn)在也沒有去來投入更多的精力去來做L3以上級的自動駕駛,我認為每一個車都需要非常好用的語音交互系統(tǒng),每一個車都需要非常安全的360合約和車內(nèi)的這種DM這樣的一個實時使用者的狀態(tài),雖然講不過別人的故事,但是我相信市場會認可,用戶也一定會接受到。這是我們后期我們希望真正能夠從訊飛這十幾年,以及我們在整個合作鏈上面獲取到的這樣的一些合作資源,為整個汽車行業(yè)推進軟硬分離的一個進程。現(xiàn)在提軟硬分離,現(xiàn)在大家都在說一說而已,我相信這里面有兩個問題,大家必須要認真思考,第一就是現(xiàn)有的供應鏈的問題,現(xiàn)有供應鏈的模式能不能夠解決軟件供應商和服務供應商引入,而且長期合作,協(xié)同創(chuàng)新的這種模式。第二種原來是開發(fā)產(chǎn)品一步到位,到后面可能我們迭代更新不斷完善,這樣的一個節(jié)奏能不能夠可以接受。因為這個是移動互聯(lián)網(wǎng)的方式,但是在車上來講,我們強調(diào)的是安全,強調(diào)的是交付的這種一致性,這個過程讓用戶可能就是在車上,我三年之后還在用,現(xiàn)在的有一套軟件,它自然是過時的,軟件的迭代是兩三個月的,一個車型的迭代是兩三年的,它的節(jié)奏完全不一樣,這個過程是不是可以能夠用一點點的小的冒險,我們用一點點的小的嘗試來去改變,逐漸改變用戶的體驗。
這兩個系統(tǒng)是AIUI的對話交互系統(tǒng)和我們iPhoneIOS的一套底層的云架構(gòu)的操作系統(tǒng)。AIUI是為了解決它的交互體驗的問題,就是它可以能夠跟車的一些交互,更深入的融合,跟人的這種前端交互,更深入的融合。iPhoneIOS它解決的是這種資源和這種SCALE連接的問題。他是一個面向于智能終端智能硬件的一套云端的交互系統(tǒng),可能他原來出現(xiàn)在大家用過的一些音箱用過的一些手表,用過的一些其他的這種家用的智能家居的設備里面,現(xiàn)在我們把它接入進來,真是可以變成一個車場,或者是一個服務商,他想要去做一個運營的時候,我們第一天知道第二天就可以上線,如果是我們從其他的手表,從其他的音箱,有了一些好的技能,車上馬上就可以用到,她就為了達到這樣的一個特征,還有面向未來的面向智能汽車的一個車聯(lián)網(wǎng)平臺系統(tǒng),第一代的車聯(lián)網(wǎng)是記錄,可是阿斯達通過PSTN通過一條電話去完成的,我們打一個電話找一個POA基本上兩分鐘朝上,這個時候其實已經(jīng)錯過了最佳的路徑,選擇時間。第二代車聯(lián)網(wǎng)我認為是現(xiàn)在娛樂信息化的車聯(lián)網(wǎng),在這個時候大家其實更傾向于去選擇好聽的音樂,好用的地圖和更豐富的服務,但是第三代車聯(lián)網(wǎng)我相信以上兩點都需要,但是第三個更重要的是跟車的融合以及跟V2X的融合,以及跟汽車服務深度的融合。我們希望真正能夠通過構(gòu)建這樣一個平臺,通過構(gòu)建這樣一個服務系統(tǒng)的過程之中,能夠覆蓋掉汽車用戶在車上的所有的一些用戶場景。
這里面有五個我們認為自己比較具備特色的服務內(nèi)容,第一個就是利用訊飛在閱讀理解基礎上面國際領先的國際第一的這樣的一個技術積累,我們來拆解五本書。這五本書分別是用戶使用手冊,銷售指南,維修手冊,零部件還有其他沒想起來這樣的一些拆解過程,是為了讓機器真正能夠結(jié)合一個車廠品牌,一個車型平臺以及一個一款車,他做到深度理解整個知識體系。為什么我們的聽見系統(tǒng)在過程之中聽到了專業(yè)詞匯會寫錯,就是因為他不知道這個知識點,因為他沒有專家系統(tǒng),大家貽笑大方對吧?感覺到我們好像什么東西都能寫,而且一寫出來有的東西是遠不著邊的,因為他根本就不知道專業(yè)名詞是什么,同樣問大家一個化學的生物的你也不知道,因為他沒有學過這個過程,讓真正的車上的那臺設備交互端口比你更懂車,而且你隨問隨答,它構(gòu)建起來是一個從車上到線下,從車上到汽車服務的一個一個交互入口。第二個就是我們打破車和家的這種邊界,真正構(gòu)建起來一個從車到家,從車到其他智能硬件的連接。我們不是獨立生態(tài),我們不做垂直,所以我們必須要跟很多具備這樣的一些資源的廠商談融合。第三個是我們讓養(yǎng)護可以更貼心,用主動交互的方式來提醒他,該養(yǎng)戶了,該去換件了!而且旁邊有一些個優(yōu)惠的地方,有一些更便宜的零部件,這個過程其實跟下一個我認為是我們有一個同樣的訴求和夢想,就是能讓信息透明,讓教育公平。很多,我們埋怨4S店埋怨保險埋怨里面一些消費環(huán)節(jié)的過程都是因為信息的不對稱,包括二手車我們是否能構(gòu)建起來以汽車他自己表達,他自己知道他自己有什么樣的一個問題,從車場的角度給一個汽車用戶一個公正的公平的完全可信的這樣的一個信息點,讓用戶可以放心的去消費,去購買,去來尋求他所需要的服務,我認為這兩點是我們一直在追求的。另外,我們的智能客服系統(tǒng)已經(jīng)逐漸開始從汽車行業(yè)里面解決原來傳統(tǒng)的400的問題,因為原來有很多人的意愿問題,人的態(tài)度問題,人的能力問題,造成400電話在過程之中其實總是形同虛設,甚至藏污納垢,甚至信息不透明,導致了一些虛假的和一些錯誤的戰(zhàn)略的發(fā)生,我們播一個音頻大家聽一聽,可能大家每天都能聽到,但是不是這個行業(yè)的。請幫我放一下視頻。
本來每天有可能接到一些騷擾電話。對不起,有一些確確實實是我們系統(tǒng)自動撥出來的,但是這些智能化的一些推廣方案也確確實實解決了很多原來傳統(tǒng)客服以堆人來解決銷售推廣的問題,而且現(xiàn)在在移動在聯(lián)通我們省級的這樣的一些運營商的呼叫平臺里面用訊飛的解決方案基本上是全國性的,每一個呼叫中心我們可以能夠節(jié)省將近40%,40%,每個月的成本可能是大幾百萬。在這個過程一定不能再去用老的想法來解決新的問題,而且根本就解決不掉現(xiàn)在的一些新的問題和矛盾,我們在這里面只是簡單一個呼吁,希望大家能夠多慎重一些,多思考。我們面向開發(fā)者做了一個市場活動,我們在今年也會加入汽車開發(fā)者這樣的一個活動模塊。當然這一頁我們已經(jīng)利用我們的訊飛語音開放將近十年的時間,積累的一些平臺性的合作伙伴,現(xiàn)在已經(jīng)有近50萬已經(jīng)上線的,而且每天的交互次數(shù)源源不斷。好,就講到這里,謝謝大家,再次感謝。
[NextPage]
|