您的位置:首頁 >聚焦 > 綜合 >

全球速看:混合 AI 時(shí)代將至,這是你從未有過的全新體驗(yàn)

2023-06-30 07:23:45 來源:搜狐號-IT之家

過去這幾年,相信大家都有感觸:我們的工作和生活,正越來越多地因?yàn)?AI 而變得有所不同。

用手機(jī)拍出越來越驚艷的照片、輔助駕駛系統(tǒng)讓開車更安全和簡單、開會(huì)時(shí)用智能錄音筆實(shí)時(shí)錄音、翻譯,還能轉(zhuǎn)寫成文稿,甚至在游戲里越來越擬真的人機(jī)對戰(zhàn)……


【資料圖】

這些都是 AI 讓我們的生活更加美好、便捷的證明。

而最近,隨著 ChatGPT 的火熱,生成式 AI 更是在全球掀起了人工智能的新浪潮。它讓我們看到人工智能變革世界的新方式。

根據(jù)大型聚合網(wǎng)站 THERE"S AN AI FOR THAT 的數(shù)據(jù),目前已有超過 3000 個(gè)可用的生成式 AI 應(yīng)用和特性。人工智能,正迎來一個(gè)新的“爆發(fā)時(shí)刻”。

這樣的“爆發(fā)”,無論對于 AI 自身的發(fā)展,還是對我們的生活,都有著不可忽視的意義。

生成式 AI 快速發(fā)展背后,混合 AI 將成為 AI 的未來

隨著生成式 AI 以極快的速度發(fā)展,眾多大模型應(yīng)用和產(chǎn)品涌現(xiàn),這些擁有數(shù)十億參數(shù)的眾多生成式 AI 模型對計(jì)算基礎(chǔ)設(shè)施提出了極高的需求。換句話說,AI 需要找到一套新的、適合生成式 AI 的發(fā)展模式。

而混合 AI,就是生成式 AI 規(guī)?;瘮U(kuò)展最重要的模式,也是 AI 的未來。

所謂混合 AI,就是終端側(cè) AI 和云端 AI 協(xié)同工作,在適當(dāng)?shù)膱鼍昂蜁r(shí)間下分配 AI 計(jì)算的工作負(fù)載,以提供更好的體驗(yàn),并高效利用資源。

具體來說,在一些場景下,計(jì)算將主要以終端為中心,在必要時(shí)向云端分流任務(wù)。而在以云為中心的場景下,終端將根據(jù)自身能力,在可能的情況下從云端分擔(dān)一些 AI 工作負(fù)載。

這種架構(gòu)和模式,可以說是 AI 發(fā)展過程中必然要走的路。

就像傳統(tǒng)計(jì)算正在從大型主機(jī)和瘦客戶端演變?yōu)楫?dāng)前云端和邊緣終端結(jié)合的模式那樣,AI 計(jì)算必然會(huì)朝著超大規(guī)模和復(fù)雜化的方向發(fā)展,因此 AI 處理也必須同時(shí)分布在云端和終端,才能讓 AI 發(fā)揮最大的潛能。

之所以如此,是因?yàn)榛旌?AI 在成本、能耗、性能、隱私、安全、個(gè)性化等各方面都擁有足夠的優(yōu)勢,能為生成式 AI 在全球范圍內(nèi)大規(guī)模擴(kuò)展普及提供支撐。

比如首先在成本上。據(jù)估計(jì),每一次基于生成式 AI 的網(wǎng)絡(luò)搜索查詢,其成本都是傳統(tǒng)搜索的 10 倍 ,而這只是眾多生成式 AI 的應(yīng)用之一。如果把這些運(yùn)算、處理都放在云端,無論對于規(guī)模大小的搜索引擎企業(yè)來說,都是一筆很不劃算的成本負(fù)擔(dān)。

而混合 AI 架構(gòu)下,將一些處理從云端轉(zhuǎn)移到邊緣側(cè)終端,就可以減輕云基礎(chǔ)設(shè)施的壓力并減少開支?;旌?AI 能夠利用現(xiàn)已部署的、具備 AI 能力的數(shù)十億邊緣側(cè)終端來進(jìn)行運(yùn)算處理,這將很大程度上減輕云端基礎(chǔ)設(shè)施的負(fù)擔(dān)。否則,這數(shù)十億終端的運(yùn)算就都要壓在云端,成本可想而知。

其次是在能耗上,邊緣終端能夠以很低的能耗運(yùn)行生成式 AI 模型,尤其是將處理和數(shù)據(jù)傳輸相結(jié)合時(shí),能夠幫助云服務(wù)提供商顯著降低數(shù)據(jù)中心的能耗。

此外,在混合 AI 架構(gòu)中,終端側(cè) AI 處理也具有更高的可靠性。比如現(xiàn)在大家使用一些大模型產(chǎn)品,在高峰時(shí)段也會(huì)經(jīng)常遇到應(yīng)答很慢、甚至生成失敗的情況。而在混合 AI 架構(gòu)中,由于相當(dāng)一部分的計(jì)算負(fù)載轉(zhuǎn)移到終端側(cè),生成式 AI 查詢對于云的需求時(shí)就有更大的可能避免高峰擁堵,從而有效減少排隊(duì)等待和高時(shí)延、乃至拒絕服務(wù)的情況。

還有,終端側(cè) AI 從本質(zhì)上也有助于保護(hù)用戶隱私,因?yàn)槊舾械臄?shù)據(jù)和信息可以保留在終端上,無論是對企業(yè)用戶還是個(gè)人用戶來說,這一點(diǎn)都是非常重要的。

而隱私安全得到保障后,緊接而來的好處就是個(gè)性化的體驗(yàn)成為可能。因?yàn)榉?wù)提供商能夠在不犧牲用戶隱私的前提下,最大程度根據(jù)用戶的個(gè)性化數(shù)據(jù)提供對應(yīng)的服務(wù),例如我們手機(jī)上的 AI 助手就能更深入地了解我們的習(xí)慣、興趣、需求,從而繪制出更精確的用戶畫像,以提供個(gè)性化的服務(wù)。而這些用戶畫像,都是保留在終端內(nèi)的。

總之,混合 AI 將成為 AI 發(fā)展的必然方向,同時(shí)這種架構(gòu)模式將推動(dòng)生成式 AI 實(shí)現(xiàn)規(guī)?;瘮U(kuò)展和普及,進(jìn)而深刻改變我們生活與生產(chǎn)的方方面面。

混合 AI 怎樣發(fā)展?來看看高通的領(lǐng)導(dǎo)力

從上面的介紹中不難發(fā)現(xiàn),終端側(cè) AI 能力是賦能混合 AI 并讓生成式 AI 實(shí)現(xiàn)全球規(guī)模化擴(kuò)展的關(guān)鍵。但其實(shí),在生成式 AI 出現(xiàn)之前,AI 的處理能力就已經(jīng)在向邊緣側(cè)終端轉(zhuǎn)移了,手機(jī)、筆記本電腦、XR 頭顯、汽車等眾多邊緣側(cè)終端也都展現(xiàn)了出色的 AI 處理能力,并有實(shí)際應(yīng)用,比如在手機(jī)上的暗光拍攝、人臉解鎖等等。

說到這,有一個(gè)不得不提的角色,他一直以來都在致力于推動(dòng)終端側(cè) AI 的發(fā)展,就是高通。

高通在 AI 領(lǐng)域已經(jīng)深耕超過 15 年,并且已經(jīng)面向數(shù)十億手機(jī)、汽車、XR 頭顯與眼鏡、PC 和物聯(lián)網(wǎng)等邊緣終端提供行業(yè)領(lǐng)先的 AI 硬件和軟件解決方案,在終端側(cè) AI 方面擁有相當(dāng)?shù)念I(lǐng)導(dǎo)力。

在軟件方面,高通首先是在終端側(cè)生成式 AI 方面有強(qiáng)大的領(lǐng)導(dǎo)力,他們對生成式 AI 的研究可追溯到生成式對抗網(wǎng)絡(luò)(GAN)和變分自編碼器(VAE),利用 VAE 技術(shù),高通創(chuàng)建了更好的視頻和語音編解碼器,將模型規(guī)模控制在 1 億參數(shù)以下。

幾個(gè)月前,高通還實(shí)現(xiàn)了全球首個(gè) Android 手機(jī)上的 Stable Diffusion 終端側(cè)演示。Stable Diffusion 是一個(gè)參數(shù)超過 10 億的超大神經(jīng)網(wǎng)絡(luò)基礎(chǔ)模型,能夠基于輸入的文本提示生成圖片。這一終端側(cè)演示是在飛行模式下進(jìn)行的,通過高通的全棧 AI 優(yōu)化,這一模型能夠完全在終端側(cè)運(yùn)行,實(shí)現(xiàn)在 15 秒內(nèi)完成 20 步推理,生成飽含細(xì)節(jié)的圖像。

接下來,高通正計(jì)劃未來在終端側(cè)支持參數(shù)高達(dá)數(shù)百億的模型,這也將成為基于高通技術(shù)的產(chǎn)品的一大差異化優(yōu)勢。

此外,如果在云端運(yùn)行一個(gè)超過 10 億參數(shù)的生成式 AI 模型,可能需要數(shù)百瓦的功耗,而高通在終端側(cè)運(yùn)行需要的功耗僅有幾毫瓦。能夠支持終端在既定功耗下完成更多處理工作,這也是他們在生成式 AI 領(lǐng)域的獨(dú)特優(yōu)勢。

高通面向 Stable Diffusion 進(jìn)行了全棧 AI 優(yōu)化。去年 6 月,高通推出了專門面向邊緣側(cè) AI 的領(lǐng)先軟件棧產(chǎn)品,高通 AI 軟件棧,能夠支持從軟件層面進(jìn)行模型優(yōu)化。

例如在算法和模型開發(fā)效率上,之前云端服務(wù)器上訓(xùn)練的模型一般采用 32 位浮點(diǎn)運(yùn)算(FP32),這意味著完成模型推理需要大量的處理工作。而針對 Stable Diffusion,高通采用的是 8 位整數(shù)運(yùn)算(INT8)。去年年底在第二代驍龍 8 移動(dòng)平臺(tái)上,更是進(jìn)一步支持了 4 位整數(shù)運(yùn)算(INT4)能力,這將大大提升 AI 運(yùn)算的效率。

此外,通過高通 AI 引擎 Direct,高通能夠以最高效的方式利用硬件能力,結(jié)合第二代驍龍 8 行業(yè)領(lǐng)先的 Hexagon 處理器,更將在終端上帶來遠(yuǎn)遠(yuǎn)領(lǐng)先于這一用例的生成式 AI 能力。

通過高通 AI 軟件棧,高通已經(jīng)能夠在搭載驍龍計(jì)算平臺(tái)的筆記本電腦上運(yùn)行 Stable Diffusion,并實(shí)現(xiàn)非常出色的表現(xiàn)。憑借行業(yè)領(lǐng)先的高通 AI 引擎,基于驍龍計(jì)算平臺(tái)的筆記本電腦在 MLCommons V3.0 上率先實(shí)現(xiàn)了出色的 MLPerf 基準(zhǔn)測試結(jié)果,這個(gè)成績明顯領(lǐng)先于行業(yè)。

高通 AI 軟件棧面向高通合作伙伴、用戶和開發(fā)人員提供了一個(gè)集成所有 AI 框架、開發(fā)者庫、操作系統(tǒng)的整合平臺(tái),讓他們得以在搭載驍龍平臺(tái)的終端上打造出色體驗(yàn)。與此同時(shí),他們還可以使用 Qualcomm AI Studio 提供的所有工具。

總之,高通 AI 軟件棧的核心優(yōu)勢在于,模型一旦開發(fā)出來,就可以在不同地方使用。它再與混合 AI 部署相結(jié)合,形成殺手級的組合,將幫助生成式 AI 在不同終端上進(jìn)行規(guī)?;瘮U(kuò)展,實(shí)現(xiàn)生成式 AI 的普及。

此外,在硬件方面,高通的硬件能夠提供行業(yè)領(lǐng)先的能效,是移動(dòng)領(lǐng)域競品的近 2 倍。這當(dāng)中,高通 AI 引擎就是由多個(gè)軟硬件組件構(gòu)成,能在驍龍和高通平臺(tái)上實(shí)現(xiàn)終端側(cè) AI 加速。在硬件方面,高通 AI 引擎采用異構(gòu)計(jì)算架構(gòu),包括 Hexagon 處理器、高通 Adreno GPU 和高通 Kryo CPU,全部面向在終端側(cè)快速高效地運(yùn)行 AI 應(yīng)用而打造。通過異構(gòu)計(jì)算的方式,開發(fā)者和 OEM 廠商可以優(yōu)化智能手機(jī)和其他邊緣側(cè)終端上的 AI 用戶體驗(yàn)。

這其中,Hexagon 處理器是高通 AI 引擎最關(guān)鍵的部分,在第二代驍龍 8 移動(dòng)平臺(tái)中,最新的 Hexagon 處理器采用專用供電系統(tǒng),能夠按照工作負(fù)載適配功率。特殊硬件提升了分組卷積、激活函數(shù)加速和 Hexagon 張量加速器的性能。支持微切片推理和 INT4 硬件加速能夠在提供更高性能的同時(shí),降低能耗和內(nèi)存占用。Transformer 加速大幅提升了生成式 AI 中充分使用的多頭注意力機(jī)制的推理速度,在使用 MobileBERT 的特定用例中能帶來高達(dá) 4.35 倍的驚人 AI 性能提升。

簡言之,高通 AI 引擎是高通在終端側(cè) AI 優(yōu)勢的核心,它在驍龍平臺(tái)和其他眾多產(chǎn)品中發(fā)揮了重要作用,是高通多年全棧 AI 優(yōu)化的結(jié)晶,能夠以極低功耗提供業(yè)界領(lǐng)先的終端側(cè) AI 性能,這一點(diǎn)相信大家都比較熟悉。

除了高通 AI 引擎,還有一點(diǎn)不容忽視的,就是高通部署的邊緣側(cè)終端規(guī)模十分龐大,搭載驍龍和高通平臺(tái)的已上市用戶終端數(shù)量已達(dá)到數(shù)十億臺(tái),而且每年有數(shù)億臺(tái)的新終端還在進(jìn)入市場。這些終端覆蓋一系列廣泛的產(chǎn)品,包括手機(jī)、汽車、XR、PC 和物聯(lián)網(wǎng)等等等等。

總而言之,高通憑借行業(yè)領(lǐng)先的硬件,支持在既定功耗下實(shí)現(xiàn)更高性能;行業(yè)領(lǐng)先的高通 AI 軟件棧;以及行業(yè)領(lǐng)先的工具如高通 AI 模型增效工具包(AIMET)等三大關(guān)鍵要素,構(gòu)成了其在全球范圍賦能混合 AI 規(guī)模化擴(kuò)展的獨(dú)特優(yōu)勢。

未來,我們到底可以獲得怎樣創(chuàng)新 AI 應(yīng)用體驗(yàn)?

前面我們講到,生成式 AI 方興未艾,混合 AI 架構(gòu)的時(shí)代正在到來,而高通憑借前瞻性的早期研究和產(chǎn)品開發(fā)投入,加上在邊緣側(cè)廣泛而深入的布局,正成為推動(dòng)生成式 AI 規(guī)?;瘮U(kuò)展的領(lǐng)導(dǎo)者。那么,混合 AI 在未來究竟能為我們帶來怎樣創(chuàng)新的應(yīng)用體驗(yàn)?這里我們不妨也大膽暢想一下,相信會(huì)讓大家對混合 AI 的發(fā)展更加期待。

混合 AI 驅(qū)動(dòng)生成式 AI 的大規(guī)模擴(kuò)展,無疑將驅(qū)動(dòng)新一輪內(nèi)容生成、搜索和生產(chǎn)力相關(guān)應(yīng)用的發(fā)展,具體,則是通過廣泛的邊緣側(cè)終端作為載體,包括智能手機(jī)、筆記本電腦和 PC、汽車、XR 以及廣泛的物聯(lián)網(wǎng)等品類。

首先是大家日常接觸最多、使用最高頻的智能手機(jī)。其實(shí),我們使用手機(jī)最主要的就是搜索信息、獲取服務(wù)。而隨著生成式 AI 的發(fā)展普及,我們在手機(jī)上搜索信息的方式將發(fā)生很大的轉(zhuǎn)變,智能手機(jī)將成為我們真正如影隨形的數(shù)字助手,比如當(dāng)你結(jié)束了一周的工作,周末想放松一下時(shí),只要在手機(jī)上問一下,它就能根據(jù)你的興趣、習(xí)慣給你制定一套完整的周末游玩、飲食和作息的攻略。特別是當(dāng)生成式 AI 能夠支持文字、語音、圖像、視頻等其他輸入模態(tài)時(shí),你和手機(jī)的溝通、交流會(huì)更簡潔和準(zhǔn)確,甚至當(dāng)你外出旅游時(shí),你給它發(fā)一張景點(diǎn)的照片,他就能把景點(diǎn)的背景信息、玩法攻略都告訴你,還能給你推薦最適合你口味的餐廳……

在這個(gè)過程中,智能手機(jī)能掌握到你的用戶畫像以及所有其他敏感信息,都會(huì)保留在終端側(cè),一些基礎(chǔ)的 AI 推理過程也會(huì)發(fā)生在終端側(cè),同時(shí)云端和終端 AI 彼此協(xié)同,實(shí)現(xiàn)上面這些用例。而這一切都將基于高通的驍龍移動(dòng)平臺(tái)的手機(jī)終端來完成。

除了智能手機(jī),還有搭載驍龍計(jì)算平臺(tái)的驍龍筆記本,這主要就是在生產(chǎn)力方面為我們帶來助力。

未來,引入生成式 AI 能力的驍龍本,將能夠基于視頻會(huì)議的語音轉(zhuǎn)錄內(nèi)容,快速幫你制定任務(wù)清單,并自動(dòng)生成完整的演示文稿直接供用戶使用,使生產(chǎn)力能夠成倍增長。

再比如很多人在電腦上都會(huì)用的的 Microsoft Office 365,當(dāng)集成了生成式 AI 能力后,我們的日常工作流將會(huì)大大提速,很多內(nèi)容只需 AI 幫我們完成即可,過去需要數(shù)小時(shí)或數(shù)天的任務(wù),那時(shí)僅需幾分鐘就能完成。

同時(shí)重要的是,驍龍計(jì)算平臺(tái)擁有專用的硬件單元,能夠原生支持生成式 AI 在本地使用,這與目前市場上其他的產(chǎn)品完全不同。

再者就是汽車領(lǐng)域的創(chuàng)新應(yīng)用。未來,生成式 AI 驅(qū)動(dòng)的座艙能夠提供高度個(gè)性化的體驗(yàn),它將能夠幫助你規(guī)劃出行路線。具體來說就是根據(jù)出發(fā)點(diǎn)和目的地信息,結(jié)合汽車的豐富傳感器數(shù)據(jù)制定不同的路線規(guī)劃,找到最佳路線,同時(shí)在去餐廳的路上推薦用餐選項(xiàng),或者在上班途中列出今日的工作事項(xiàng)。

再比如,屆時(shí)汽車還將能夠識別每位駕乘人員并提供定制化的音樂和播客等體驗(yàn)和內(nèi)容,座艙的媒體娛樂體驗(yàn)也將會(huì)變革。隨著車載 AR 應(yīng)用變得更加普遍,數(shù)字助手可以按照駕乘人員的偏好提供定制化的顯示。

還有,汽車的維修保養(yǎng)和服務(wù)也將變得更加自主和無縫。通過分析傳感器輸入、維修保養(yǎng)歷史和駕駛行為等數(shù)據(jù),數(shù)字助手可以預(yù)測何時(shí)需要進(jìn)行保養(yǎng)……

這些每秒的場景,將有賴于高通的驍龍座艙平臺(tái)來實(shí)現(xiàn)。以最新一代驍龍座艙平臺(tái)為例,就能夠提供業(yè)界領(lǐng)先的車內(nèi)用戶體驗(yàn),以及安全性、舒適性和可靠性,成為網(wǎng)聯(lián)汽車時(shí)代為數(shù)字座艙解決方案的全新標(biāo)桿。

在混合 AI 架構(gòu)驅(qū)動(dòng)下,生成式 AI 也能為 XR 帶來巨大的應(yīng)用前景,其中最值得看好的,應(yīng)該是對 3D 內(nèi)容創(chuàng)作的普及。在下一代 AI 渲染工具的加持下,你可以只需輸入文本、語音、圖像或視頻等各種類型的提示,就能生成 3D 物體和場景,并最終創(chuàng)造出完整的虛擬世界。比如當(dāng)你需要給家里設(shè)計(jì)裝修方案時(shí),你只需在 XR 中說出具體的裝修方案,就能渲染出最終的裝修結(jié)果,而你可以置身其中,根據(jù)不同的渲染結(jié)果選擇最優(yōu)的方案。

也許這樣的場景對你來說聽起來還有些遙遠(yuǎn),但對于高通來說,正在一步一步實(shí)現(xiàn)的路上。比如前面我們說到的 Stable Diffusion 等文本生成圖像類的模型,很快將賦能內(nèi)容創(chuàng)作者在 3D 物體上,生成逼真的紋理。根據(jù)高通的估計(jì),一年內(nèi)這些功能將在智能手機(jī)上實(shí)現(xiàn),并延伸到 XR 終端。

而未來幾年,首批文本生成 3D 和圖像生成 3D 類的模型將可能實(shí)現(xiàn)邊緣側(cè)部署,生成高質(zhì)量的 3D 物體點(diǎn)云。幾年后,這些模型將通過提升,達(dá)到能夠從零開始生成高質(zhì)量 3D 紋理物體的水平。在大約十年內(nèi),模型將更進(jìn)一步,支持由文本或圖像生成的高保真完整 3D 空間和場景。

最后是在廣泛的物聯(lián)網(wǎng)領(lǐng)域,生成式 AI 也能夠助力打造面向?qū)I(yè)領(lǐng)域的 GPT 類型模型,以及幫助用戶完成不同任務(wù)的 IoT 助手。比如當(dāng)你來到一個(gè)新的城市,生成式 AI 能夠?yàn)槟闾峁┞眯心康牡赝扑]。此外它還適用于其他的垂直領(lǐng)域,如醫(yī)療、零售、酒店管理等等。

比如在零售領(lǐng)域,未來,商場導(dǎo)購員只需在售貨亭或智能購物車旁,就能基于每周特價(jià)商品、預(yù)算限制和家庭偏好幫助顧客定制帶有菜譜的菜單。商店經(jīng)理可以根據(jù)即將發(fā)生的事件預(yù)測非周期性的促銷機(jī)會(huì),并進(jìn)行相應(yīng)準(zhǔn)備。

他們還可以通過簡單的提示,就讓 AI 輔助重新排列貨架商品,為利潤高的產(chǎn)品騰出空間,或者利用附近連鎖店的數(shù)據(jù),盡可能降低產(chǎn)品缺貨情況的發(fā)生……

總體來說,當(dāng)混合 AI 逐漸發(fā)展成為主流,生成式 AI 就能得到持續(xù)演進(jìn),并帶來越來越多變革性的創(chuàng)新應(yīng)用體驗(yàn),通過搭載高通和驍龍各類平臺(tái)的邊緣側(cè)終端,我們就能切身感受到混合 AI 如何顛覆我們生活、工作以及娛樂的方式。

結(jié)語

混合 AI 的趨勢不可阻擋,從眼下開始,云端和終端側(cè) AI 的協(xié)同將更加緊密,通過強(qiáng)大、高效且高度優(yōu)化的 AI 能力打造下一代用戶體驗(yàn)。而高通在終端側(cè) AI 的強(qiáng)大的領(lǐng)導(dǎo)力將為他們向混合架構(gòu)轉(zhuǎn)型帶來獨(dú)特的優(yōu)勢,他們擁有在 AI 領(lǐng)域超過 15 年的前瞻研究和產(chǎn)品投入,有卓越的終端側(cè) AI 技術(shù)和全棧優(yōu)化的體系,更有廣泛且數(shù)量龐大的全球邊緣側(cè)終端布局和規(guī)模,而接下來,他們要做的則是更緊密地支持開發(fā)者、OEM 廠商和其他生態(tài)系統(tǒng)創(chuàng)新者快速高效地構(gòu)建全新生成式 AI 應(yīng)用和解決方案,讓技術(shù)和生態(tài)有完整的落地。

未來,當(dāng)我們享受著混合 AI 帶來的全方位提升的生活體驗(yàn)時(shí),別忘了高通在背后的推動(dòng)作用。