亚洲私人影院无码AV一区二区_亚洲中文字幕无码天然素人_亚洲无码播放国内在线_牲交a欧美牲交aⅴ免费真_无码高清视频

世界最新:大模型、小芯片,端側智聯(lián)夢想如何照進現(xiàn)實?

集微網消息,在日前一次媒體專訪中,“深度學習之父”杰弗里·辛頓曾暢想了ChatGPT等新一代AI大模型被運用于終端家電中的情景:“因此,我認為會有一個階段,一旦某個AI系統(tǒng)訓練完畢,我們會將其運行在非常低功耗的系統(tǒng)上。所以,如果你想讓你的烤面包機能和你對話,你需要一個只花費幾美元的芯片,而且它能運行像ChatGPT這樣的程序?!?


(相關資料圖)

在剛剛結束的中國家電及消費電子博覽會(AWE 2023)上,一家中國芯片企業(yè),已經讓這樣的夢想照進了現(xiàn)實。

在以智能科技為主題的新國際博覽中心W3館,北京探境科技有限公司(簡稱“探境科技”)的展位上人流絡繹不絕,集微網還看到不少家電廠商現(xiàn)場自報家門主動尋求合作?,F(xiàn)場展出的端側AI語音識別芯片解決方案,無需繁瑣的配網和觸控操作,一句指令就能讓空調、風扇、燈具“隨心而動”,特別是其新一代產品Voitist 811(簡稱VOI811),基于ChatGPT同源的語義理解技術,無需記憶命令詞即可準確識別用戶意圖,為參觀者帶來了堪稱驚艷的人機交互體驗,也令人看到了AI“賦智”端側應用的全新可能性。

(2023AWE探境科技展臺)

端側智能化的“第一性原理”

智能家居等端側場景怎樣實現(xiàn)智能化?

很長時間以來,這似乎是一個無需被追問的話題,從系統(tǒng)廠商到上游模組、方案商、芯片供應商,都習慣于因循著既有路徑埋頭奔跑,在WIFI/藍牙、大屏、APP等軟硬件元素上相互“內卷”,實際效果卻差強人意?!爸锌床恢杏谩钡漠a品體驗,也大大抑制了相關產業(yè)鏈的發(fā)育,成為公眾笑料的冰箱大屏廣告,恰是智能家居尷尬現(xiàn)狀的一個縮影。

正如埃隆·馬斯克所言,我們總是傾向于比較,對別人已經做過或者正在做的事情,我們也都跟風去做。這樣發(fā)展的結果,只能產生細小的迭代發(fā)展,甚至不經意間背離使用者的“初心”。

假如端側場景的智能化存在著一個“第一性原理”,那么人機交互的簡單、自然、直接,無疑是其本質要求,面對從2.4G信道到云端疊床架屋的多重技術、商業(yè)模式挑戰(zhàn),產業(yè)界亟待“另辟蹊徑”,探境科技在端側AI語音識別上的實踐,初步展現(xiàn)了令人興奮的前景。

從動物到人類,聲音往往是信息交互的核心載體,智能家居這一場景,顯然也非常適合以語音進行人機交互與控制,不過傳統(tǒng)基于統(tǒng)計學習技術的語音識別模型受算法及端側芯片功耗、算力的約束,往往只能支持有限的命令詞識別,乃至需要聯(lián)網以云端資源提高性能,回到了配網、下載注冊APP的老路,“即插即用”的應用潛力被技術瓶頸所束縛。

探境科技此次展出的新一代芯片VOI811,則突破性地采用了ChatGPT同源的Transformer模型,支持較語音識別更高級的自然語意處理(NLP)功能,且較NLP領域以往的LSTM等模型相比,Transformer以基于位置的自注意機制取代了對時序信息的依賴,從而大幅改善了模型對算力資源的使用效率,已經在不同任務上展現(xiàn)出一系列強悍能力?;赥ransformer模型,搭載VOI811的設備無需用戶記憶特定關鍵詞,其自然敘述的控制意圖即可被準確理解。

(探境科技新一代芯片VOI811)

眾所周知,應用Transformer的大型語言模型(LLM,Large Language Model)訓練推理,動輒需要上萬顆高性能GPU支撐,要在端側實現(xiàn)同源的算法架構絕非易事,探境科技憑借在AI算法和AI芯片上的軟硬件全棧技術能力,最終在業(yè)界領先實現(xiàn)了端側離線部署的“奇跡”。

探境算法專家透露,算法組的同仁為此進行了經年累月的細致打磨,結合智能家居等目標落地場景特點針對性優(yōu)化,并結合了知識圖譜、知識增強等前沿工程技術,而在硬件方面,VOI811采用了自研的SFA(存儲優(yōu)先,Storage First Architecture)架構NPU,針對AI計算“高差異、高并發(fā)、高耦合”特性,以存儲驅動計算,打破存儲墻,在同等條件下數(shù)據(jù)訪問可降低10-100倍,28nm工藝條件下,系統(tǒng)能效比超過4T OPS/W,計算資源利用率超過80%,DDR帶寬占用率降低5倍,支持FFT/MFCC/AEC硬件加速。

值得一提的是,VOI811還可實現(xiàn)多意圖識別,即一句指令可包含雙重意圖,如空調場景下,“調制冷模式,20度”,就可以代替遙控器或APP多個操作動作,交互的靈活性、魯棒性相較以往語音識別芯片解決方案也堪稱顛覆式體驗。

(基于811芯片的NLP方案特點)

在探境芯片專家看來,公司能夠在產品落地上快人一步,主因是算法、算力、數(shù)據(jù)上三位一體的核心能力,除了上文已經談到、業(yè)界少見的軟硬件全棧自研模式,探境科技在場景數(shù)據(jù)的積累上也有著自己的獨到”法寶”,從收集采樣、清洗分類再到訓練,已經形成高效運行的閉環(huán)機制。

基于全棧能力的協(xié)同設計、協(xié)同優(yōu)化,不僅使探境科技產品性能參數(shù)可以做到更優(yōu),也使下游模組、系統(tǒng)廠商少了一分“后顧之憂”,規(guī)避了一些案例中軟硬件供應商相互“甩鍋”的弊病。

逆勢而上何以可能

除了產品技術上的諸多獨到之處,探境科技對應用場景和用戶需求的深刻洞察,也給集微網留下了深刻印象。

當前流行的智能家居藍牙/WIFI SoC產品方案,在終端消費者處實際使用情況普遍不盡如人意,絕大部分產品在入戶后,所謂智能功能就淪為擺設。原因在于用戶側背負了過重的負擔,如要啟用相關功能往往需要用戶主動進行步驟繁瑣的配網操作,“七國八制”的定制APP從用戶體驗角度而言不啻于噩夢,對隱私稍有敏感性的用戶,也很難信任一個個陌生開發(fā)者的APP安裝到自己手機,突兀出現(xiàn)在冰箱、音箱上的所謂“第三屏”、“第四屏”,所提供的內容對用戶來說更是累贅而非收益。

相比之下,基于語音的家居智能化,或許是更優(yōu)選的路徑,作為人工智能賽道里堪稱覆蓋面最廣的一個領域,語音可以廣泛運用于各種智能化的升級場景下,需要通過遙控器、APP或者物理按鍵操作的控制意圖,均可適用于聲控,探境CEO魯勇感言:“從務虛的角度來看這個事情,我們正在經歷一個人類從操縱物體必須要接觸的時代,邁向可以比較遠距離操控,整個生活生產方式會發(fā)生一個巨大的變化”。

而在語音交互產品中,傳統(tǒng)聯(lián)網式產品如智能音箱,在消費者心智中也同樣存在隱私安全顧慮,曾經備受公眾關注的亞馬遜智能音箱Alexa“黑客門”,也佐證了這樣的顧慮并非杞人憂天。魯勇表示:“涉及到語音,這個東西它本身就能聽懂你說話。那么大家很自然地會想到,我在屋里面做的任何事情它都在聽,如果這個東西是聯(lián)網的,我天生就會產生不信任,離線在這里有天然的優(yōu)勢”,而免除了配網操作,從用戶體驗上來說,“插上就能用,打開就能有,這種體驗就是人工智能真正到人身邊了,而且是安全的”。

基于上述洞察所形成的VOI811等產品差異化特性,也的確得到了下游廠商的熱烈反響,筆者在展位現(xiàn)場所見所聞,已然預示了VOI811商業(yè)成功的前景。

據(jù)魯勇介紹,該公司AI語音識別芯片累計出貨量目前已達到千萬量級,覆蓋品類廣泛,在燈具等細分市場已經建立起優(yōu)勢地位,新一代VOI811芯片送樣測試后,下游廠商對這一內部集成了LDO和多種控制通信接口的產品普遍給出了高度評價,其高性能、高靈活性、高集成度的特點,可幫助智能家電、智能車載、智能音箱、人機交互等產品制造商大幅節(jié)約產品開發(fā)周期及研發(fā)、物料成本。

以客戶需求為中心,探境科技還依托其軟硬件全棧研發(fā)能力,配套VOI811打磨了多套Turnkey參考設計模板,使內部技術力量不強的二線乃至白牌廠商,也能夠實現(xiàn)新產品快速上市。

當下的白電、消電產業(yè)周期中,探境科技的高速成長顯得尤為可貴,在筆者看來,這樣的逆勢成長可謂水到渠成。正是因為市場進入存量“內卷”的平臺期,使得供應商在同質化價格戰(zhàn)中“蒙頭狂奔”之外,有更強的緊迫感“抬頭看路”,審視現(xiàn)有主流技術方案和形態(tài)的弊端,尋找差異化的產品賣點和業(yè)務增長點,更積極嘗試不同的技術方案,從而為創(chuàng)新打開機遇窗口。

瞄準未來機遇,探境將始終堅持離線語音控制這一端側設備交互技術路線,進一步完善其針對高、中、低不同層次市場需求的產品線布局,助力上億乃至更大出貨量級的傳統(tǒng)家電產業(yè)智能化升級。

結語

約瑟夫·熊彼特在其“創(chuàng)造性破壞”理論中,曾對經濟周期與創(chuàng)新涌現(xiàn)的鏡像關系做了深刻的總結。而探境科技對端側設備語音人機交互的洞察與探索,以及下游消電、家電廠商的熱烈反響,恰可作為一個有關產業(yè)創(chuàng)新周期的生動注腳。

隨著離線AI語音控制方案可以預見的加速普及,智能家居消費者,也將很快感受到夢想照進現(xiàn)實的驚艷。

關鍵詞:
圖片版權歸原作者所有,如有侵權請聯(lián)系我們,我們立刻刪除。
新化月報網報料熱線:886 2395@qq.com

相關文章

你可能會喜歡

最近更新

推薦閱讀