
From Transformer to Brain-Computer Interface, Apple's press conference reveals much more than just MR.

蘋果或許才是將腦機和 AI 應用結合最好的公司?
被吐槽價格太貴,實用性差,帶着外接電池…但見智研究看來,蘋果昨晚的發佈會,超越預期。
蘋果一直以來引以為傲的並不是炫技,而是把所有黑科技運用於應用,為用户創造最好的交互體驗,這一次在蘋果的 MR 設備 Vision Pro 上,蘋果再次做到了。
無需手柄的空中直接操控,設備間的無縫投屏切換,流暢的 UI 操控實時反饋,3D 攝像機等等,這一切看似簡單的交互組合在一起就不再是簡單,而是真正的軟硬結合的實力。
沒有炫技,卻看到了蘋果把黑科技應用落地
蘋果 WWDC23 大會,沒有主打炫技術,但處處都是黑科技。腦機接口、Transformer AI 模型等應用在了產品的交互體驗中。
其中給見智研究印象最深的要數兩隻手在空中操控而 Vision Pro 得到的及時反饋。有過無線設備使用經驗的朋友一定會對延遲這件事深惡痛絕,但是從蘋果的宣傳中可以看到,這些操作幾乎是完全實時進行。
市場都在認為,這是蘋果在 Vision Pro 前安裝的多顆攝像頭的功勞。
但見智研究從今早蘋果的一位神經功能開發者的推特中獲得了答案,遠不止攝像頭這麼簡單!
根據蘋果神經技術設計師 Sterling Crispin 所述:
這種全新的腦機接口方式已經成為專利技術,對瞳孔變化進行監測,能夠被用來預測之後的行為,並且該技術已經被驗證是有效的,通過這種監測瞳孔的方式來實時進行 UI 創建,這是一種非常酷的體驗。
用户在混合現實或虛擬現實體驗中,AI 模型試圖預測用户是否感到好奇、思維遊離、害怕、注意、回憶過去的經歷,或其他一些認知狀態。
這些可以通過眼球追蹤、大腦中的腦電活動、心臟跳動和節律、肌肉活動、血液密度、血壓、皮膚傳導等測量來推斷,使預判行為成為可能。
與此同時,Sterling Crispin 還提到 Vision Pro 採用了機器學習監測身體和大腦的信號,來預測人類的情緒,從而創建更適合的虛擬環境來增強用户體驗。
由此可見,Vision Pro 的這種腦機預測行為方式,突破了以往交互延遲慢的問題,配合攝像頭,讓 UI 延遲大幅降低,體驗的流暢度達到了全新的高度。
此前 XR 設備的發展路徑一直是拼硬件升級,但最大的問題還是在於交互體驗感、沉浸感難以提高。而蘋果Vision Pro 就很好的解決了這個問題,這正是在此前蘋果硬件規格已經傳遍市場後仍超預期的地方。
蘋果:人與人不應是賽博朋克下的符號
從另外一些細節讓蘋果的理念更加凸顯——不想讓人與人之間變成賽博朋克下的符號。
蘋果創造性的在 Vision Pro 的正面渲染顯示了人的眼睛(一向熱衷黑科技的付鵬老師也在第一時間換了頭像),蘋果強調了在人與人交流時,眼神的互動。

這並不是蘋果第一次強調人與人對話時,眼神交流的重要性。蘋果早在多個版本前的 FaceTime 中,就對視頻時眼球位置進行了 AI 調整,將我們看着屏幕時歪掉的注意力方向調整為注視對方的方向。
而在 Vision Pro 中,蘋果進一步增強了人與人眼神交互,當眼睛和正面走來的人進行交流的時候,透過 MR 設備還能夠直接進行交流,而不需要摘下設備,當瞳孔行為發生變化時,又可再次進入沉浸式虛擬空間。
在使用 Vision Pro 的 FaceTime 功能時,對方會看到一個利用深度學習,渲染出來的實時的你,通過空間操作系統 VisionOS 把數字內容融入真實世界。

蘋果自己的 AI 也來了
市場認為,蘋果此次發佈會沒有任何關於 AI 模型的內容,但這個也是有誤的。
見智研究發現,在最新升級的 iOS17 系統介紹中,蘋果宣佈使用 Transformer 語言模型用於輸入和語音識別文字。
通過 Transformer 模型,蘋果能夠隨着用户每次打字不斷改進體驗與準確度,進行自動語言語法糾正,方便於用户在打字時獲得實時預測文字推薦,只要輕點空格鍵就能添加整個單詞或完成句子,讓文字輸入比以往更加快捷。聽寫功能利用全新語言識別模型,準確度進一步提升。
Transformer 正是 OpenAI 等一系列大模型的基礎。而根據蘋果一向的隱私政策,毫無意外,這項技術也是純本地化運行。
蘋果將語言預測模型引入輸入法和語音傳輸中,是有一次將前沿技術和應用結合的最好案例。Transformer 是人機對話助手最強的底層技術支持,而蘋果是第一個將該技術內嵌在移動端產品系統中的公司,之後 iOS 17 在語音語言輸入體驗上會帶來全新的感受。
同時我們可以期待的是,蘋果明年很可能會給用户帶來本地化 LLM 大模型,本地化的判斷一方面是因為蘋果對用户隱私的關心程度實在太高,另一方面蘋果在處理硬件上已經積累了相當的技術,軟硬一體化的大模型應用會更加有效。
如同 Mac 帶入個人計算時代,iPhone 帶入移動計算,Vision pro 將帶入空間計算時代。
見智研究認為:Vision pro 的出現將真正開啓新的計算時代,而生成式 AI 對蘋果 MR 設備或許也是相互成就,因為此前 MR 的實時渲染對算力的消耗要遠大於生成式 AI。此前我們在AI+XR 將成為下一代移動端戰場一文進行過分析,認為生成式 AI 的快速發展與 MR 的結合將會帶來移動端產品的全面升級,特別是在應用內容創新方面會突破此前的開發方式,極大改善現階段 XR 爆款內容匱乏的問題。
生成式 AI 和蘋果 MR 就是時勢和英雄。
綜上
7 年來,蘋果在用搬山的能力處理 Vision Pro 的每一個細節,這個軟硬結合的能力並不是誰隨便都能模仿的來的;每一個細小的問題都能看出來蘋果是花了非常大的功夫在解決。
這也是發佈會前,即便是蘋果 MR 的硬件 BOM 清單到處流傳,但 Vision Pro 亮相之後還是讓見智研究認為超預期的原因。

