從DeepMind到具身智慧:她為何深信機器人將在3至5年內走入大眾生活?

記者/Linus

AI Women on Point —— 重新定義「先鋒」的坐標

2026 年,人工智慧(AI)已不再僅僅是螢幕上的演算法或對話框中的文字,它開始在物理世界中獲得「身體」。在這個關鍵的轉捩點,我們啟動了全新專欄「AI Women on Point」。

「On Point」這一辭源於軍事術語,指的是在偵查隊伍中位於最前線、負責開路與預警的先鋒哨兵。這個位置代表著最高的風險、最敏銳的直覺與最強大的決策權。我們以此命名,旨在聚焦 AI 產業中最前線、手握核心決策權的女性領導者。在過去的媒體敘事中,女性在科技界的地位常被簡化為「平衡家庭與事業」的受訪對象,或被視為剛硬學科中的軟性點綴。但在本專欄中,我們將摒棄這些刻板提問。我們不談論性別困境,而是直視技術本質。我們關注的是,在摩爾定律失效後的計算時代,她們如何從無窮的概率空間中勾勒出確定的決策?如何在抽象的數學模型與冰冷的硬體馬達之間,取捨出最優的落地路徑?

強調「Women」並非為了製造立場對立,而是一種「方法論」。長期以來,社會對決策者的預設圖像偏向單一。當我們刻意標註女性,是為了打破那層被遺忘的透明天花板,呈現一個客觀事實:AI 產業正由一群極具韌性與前瞻眼光的女性實質塑造。她們不只是參與者,更是規則的制定者。

從天才少女到 DeepMind 的深淵實踐

首期主角王佳楠,其履歷如同精密的程式碼般無懈可擊。她在香港中文大學資訊工程系奠定了扎實的理論基礎,隨後在牛津大學(University of Oxford)取得電腦科學理學碩士學位,畢業後隨即加入當時全球 AI 的最高殿堂——Google DeepMind。在 DeepMind 的三年,是她思維重塑的關鍵期。在那個人才密度極高的環境中,她任職於最為核心的基礎理論研究部門。在那裡,她不只是在做實驗,而是在挑戰「機器如何像人類一樣遷移知識」的底層命題。

「極硬核」的理論邊界:在動態流中捕捉智慧的秩序

在 DeepMind 的科研歲月裡,王佳楠所處的是全球 AI 研究最神聖、也最冷酷的殿堂——基礎理論部。這裡的研究不追求短期的商業變現,而是試圖觸摸人工智慧的底層邊界。她當時主導的兩項核心研究方向:「動態現實場景下的在線學習(Online Learning)」與「組合式知識遷移(Combinatorial Knowledge Transfer)」,在今日看來,幾乎是提前為具身智慧的降臨鋪設了理論地基。傳統的機器學習範式大多建立在「離線訓練(Offline Training)」的基礎上。這意味著 AI 像是一個在圖書館裡閉門造車的學者,在被標註好的、靜態的歷史數據集裡尋找模式。然而,現實世界絕非靜態的快照,而是一場永不停歇、充滿隨機性與雜訊的流動。

王佳楠的工作核心,在於打破這種「訓練與推理」的二元割裂。她所研究的在線學習機制,旨在讓 AI 具備一種「邊走邊學」的能力。這在理論上極其艱深,因為這要求模型在面對全新的、從未見過的分布數據時,既要迅速適應(保持靈敏度),又不能遺忘過去習得的精華(克服災難性遺忘)。她為 AI 建造了一個精密的「動態過濾器」,讓機器能在不間斷的現實流中,精準地提取並保留具備長期價值的特徵。這項工作本質上是在挑戰熵增,試圖在混亂的動態環境中,為機器建立起穩定的認知秩序。

另一項關鍵研究「組合式知識遷移」,則觸及了智慧的最高層級:抽象與類比。人類之所以強大,是因為我們不需要在學習騎腳踏車後,重新學習平衡感才能騎摩托車;我們能將知識拆解為微小的單元,並在不同情境中重新組合。王佳楠試圖在神經網路中實現這種「積木式」的知識流動。她探究如何讓模型將一個任務中習得的子能力(如:物體識別、力覺感知),精準地遷移到另一個完全陌生的場景中。這種理論突破對於具身智慧至關重要——因為一個通用的機器人不可能為每一件家務事從零開始學習,它必須具備在不同任務間自由拆解與組合知識的能力。除了純粹的數學推演,王佳楠更展現了極其罕見的工程實踐能力。她協助建構了大規模 AI 訓練框架工具,這是一項將「數學美學」轉化為「工業動力」的浩大工程。

在 DeepMind 這樣頂尖的環境中,構建訓練框架意味著必須精準調控成千上萬顆 GPU 的協同運作。王佳楠每日對抗的,是極其具象且頑強的工程難題:

• 分散式計算的同步瓶頸: 當數據規模達到海量時,如何在毫秒級的延遲內確保神經網路參數的全局一致性?

• 梯度消失與爆炸(Vanishing/Exploding Gradients): 在極深層的網路結構中,如何確保訊息的能量不會在層層傳遞中湮滅或失控?

• 底層架構的韌性: 在面對隨時可能發生的硬體故障或網路波動時,如何確保訓練任務具備自我修復的穩定性?

這不僅是數學能力的展現,更是對計算資源分配、系統底層架構以及複雜系統工程的高度掌握。她在那段時間,彷彿是一位在極微觀的世界裡修補神經元,同時在極宏觀的機房裡調度鋼鐵洪流的指揮官。然而,當技術的硬度達到極致,內心的質疑往往隨之而來。在 DeepMind,雖然擁有近乎無限的計算資源與純粹的學術自由,但理論研究的循環往往是「從論文到論文,從公式到公式」。王佳楠逐漸感受到一種「離地感」。當她在電腦螢幕前優化著幾千億個參數,解決著深奧的收斂問題時,她開始反思:這些極致優雅的數學公式,何時才能真正與現實世界發生碰撞?這種理論上的純粹,雖然美麗,卻也帶來了一種存在主義式的虛無感——就像是掌握了最先進的飛行理論,卻始終被困在沒有跑道的實驗室裡。這份對「真實感」的渴求,最終成為她告別理論頂峰、推向物理實踐的關鍵動力。

離開深淵:走向具體與真實——從「幽靈思考」到「肉身覺醒」

DeepMind 創辦人 Demis Hassabis 曾提出一個著名的信條:「先解決智慧(Step 1: Solve Intelligence),再用智慧解決其餘的一切(Step 2: Use it to solve everything else)」。在很長一段時間裡,這被視為 AI 研究的至高真理。然而,對於身處其中的王佳楠而言,隨著研究的深入,這種純粹「由上而下」的邏輯開始顯露出某種令人不安的缺失。在 DeepMind 的實驗室裡,智慧被簡化為一種強大的、基於雲端的計算力。它能下圍棋、能預測蛋白質結構、能處理海量的象徵符號,但它始終被困在「數位瓶頸」之中。

王佳楠敏銳地察覺到,如果智慧的進化過程缺乏與物理世界的實時交互(Real-time Interaction),這種智慧就像是一個「在真空中思考的幽靈」。幽靈雖然擁有全知的數據,卻缺乏對「重力」、「摩擦力」或「觸感」的直觀理解。對於一個純粹的演算法而言,拿起一個玻璃杯與拿起一個鐵球,在數學邏輯上可能只是不同的參數輸入;但對於真實世界而言,這涉及到材料力學、空間感知與微妙的力回饋。她深信,真正的通用人工智慧(AGI)不能僅僅停留在邏輯推演,它必須具備「具身性」(Embodiment)。這與認知心理學中的「具身認知」理論不謀而合:人類的智慧並非誕生於大腦的孤立運作,而是誕生於身體與環境的不斷碰撞中。

2021 年底,全球 AI 產業正處於一個巨大變革的前夜。王佳楠觀察到,技術範式正在從「判別式模型」(如分類、標籤、預測)轉向「生成式模型」(如後來的大語言模型 LLM)。判別式 AI 是在做「選擇題」,它試圖在已知的分類中尋找答案;而生成式 AI 則是在做「申論題」,它開始具備創造內容與理解脈絡的潛力。王佳楠意識到,當 AI 具備了生成複雜邏輯的能力後,下一個邏輯演進的終點必然是「生成物理行為」。「理論是灰色的,而生命之樹常青。」歌德的這句名言成為她當時心境的寫照。她意識到,AI 的前沿將不再僅僅存在於虛擬的數位空間或社交媒體的推薦演算法中,它必須「下凡」,進入真實、雜亂且不可預測的物理環境。如果 AI 無法學會掃地、摺衣服或在廚房裡拿取調味料,那麼所謂的 AGI 就永遠只是幻影。

為了打破理論與現實之間的隔閡,王佳楠做出了一個果斷的決定。她選擇加入沈向洋博士創辦的 IDEA 研究院(數位經濟特區研究中心)。這次選擇代表了她職業生涯中最重要的視角轉向:從「純數學的極致優化」轉向「技術與產業的深度耦合」。在 IDEA 研究院期間,她開始頻繁接觸產業落地的真實痛點。她發現,實驗室裡表現完美的演算法,一旦進入充滿光影變化、人員走動與設備損耗的工廠或家庭環境,往往會迅速崩潰。這種「落地之痛」沒有讓她退縮,反而激發了她的興奮感。她開始思考:

• 如何將大模型的「認知能力」轉化為機器人的「操作能力」?

• 如何建立一套能承受現實損耗、具備魯棒性(Robustness)的軟硬體一體化系統?

• 數位經濟的未來,是否就藏在這些能與人協作、具備物理實體的小型設備中?

這一時期的思考與實踐,為她後來加入星塵智能(Astribot)、全面投入具身智慧浪潮埋下了最深沉的伏筆。她不再滿足於做一個觀察智慧進化的科學家,她決定成為那個親手為 AI 打造「肉身」的工程統帥。她要讓智慧走出雲端,在真實世界的泥土與齒輪中運轉。

2024 年,王佳楠加入星塵智能(Astribot)擔任副總裁。這是一家充滿野心的初創公司,其核心目標是打破機器人長達半世紀的「功能隔離」——即工業機器人只能焊接,掃地機器人只能吸塵。星塵智能追求的是「通用具身智慧」。

王佳楠加入星塵後,首要任務是建構「頂尖硬體本體 × 高品質數據採集 × 智慧模型學習」的全棧技術體系。其中,星塵智能最著名的標籤是「全球首家實現繩驅(Cable-driven)AI 機器人量產」。傳統機器人多使用齒輪減速箱,雖精準但剛性過強,與人交互時具備危險性,且動作生硬。繩驅技術則模仿了人類的肌腱,透過高強度纖維繩傳遞力量。這使得機器人具備了極高的靈活性、抗衝擊能力以及最重要的「力控安全性」。王佳楠敏銳地察覺到,硬體的靈活性決定了 AI 學習的「天花板」。如果身體是僵硬的,演算法再強也無法做出細膩的動作(如撥開一粒葡萄或摺疊絲綢)。

王佳楠的激進實務觀:3 至 5 年的落地預言

在具身智慧領域,學術界常對機器人進入家庭持悲觀態度,認為這需要 10 年以上的時間。但王佳楠的觀點極其激進,她認為 3 至 5 年內,具身機器人就能進入真實家庭。她的判斷基於「數據回流(Data Flywheel)」的加速。她認為,機器人不必在一開始就達到 100% 的成功率。只要建立一個足夠安全、具備學習能力的硬體,先讓它進入環境,透過「人機協同」來獲取邊界數據。這是一種「以戰養戰」的策略:從失敗中學習,將每一次交互轉化為可回流的數據資產,最終實現通用能力的湧現。

芙莉蓮的隱喻 —— 隱形的力量與日常的快樂

在硬核的技術對話之外,王佳楠展現了一種獨特的生命節奏。她的社群軟體頭像是日本動畫《葬送的芙莉蓮》中的主角。這不僅是個人愛好,更深植於她的管理與技術哲學。

力量的克制與任務的純粹

芙莉蓮是一位擁有千年以上壽命的精靈魔法使,她最強大的地方不在於戰鬥,而在於她對時間的從容。她會花費幾十年的時間去收集一個看似無用的魔法——例如「讓草地變為花田的魔法」。王佳楠對此深有共鳴。在具身智慧的開發中,很多人執著於「最強演算法」或「最震撼的示範影片」,但王佳楠更願意把精力投入到那些「瑣碎但關鍵」的小事上:數據的精細清洗、馬達電流的微小波動、機器人抓取物件時的柔順度。她認為,正如芙莉蓮把最強的魔法用在日常,真正的 AI 也應該隱形於生活之中,為人們帶來最樸實的便利。

拒絕宏大敘事,聚焦真實影響

在現今充滿泡沫的 AI 市場中,許多領袖熱衷於探討「人類文明的終結」或「矽基生命的崛起」。王佳楠卻呈現出一種罕見的平靜。她的同事形容她「並不刻意製造存在感」。她更關心的是:這台機器人今天能不能安全地幫一位老人家拿穩水杯?這比任何宏大的技術宣言都更具重量。

深度對話 —— 探索通用 AI 的底層邏輯與產業真偽

在與王佳楠的對話中,話題很快從感性的動畫隱喻轉向了極其硬核的 AI 哲學。她對於目前全球 AI 發展的熱潮有著極其冷靜、甚至近乎苛刻的觀察。在她看來,具身智慧(Embodied AI)的成敗,並不取決於機器人動作的多樣性,而取決於其底層邏輯是否具備真正的「通用性」。

AGI 的核心辯證:為何「通用」是唯一的路?

王佳楠多次強調「通用(General Purpose)」的價值,這幾乎成了她的信仰基石。她認為,在 DeepMind 習得最寶貴的資產,並非特定的 Transformer 架構或強化學習演算法,而是一種科學家對問題的「品味(Taste)」。這種品味決定了一個人是選擇去修補一個局部的漏洞,還是去推動一個底層範式的變革。

「高級自動化」與「人工智慧」的鴻溝

「如果我們只是針對每一個特定任務去訓練一個模型,那根本稱不上是 AI,那頂多只能叫作『高級自動化(Advanced Automation)』。」王佳楠一針見血地指出。

在傳統工業機器人的思維中,如果需要機器人學會焊接,工程師就編寫一套焊接的程式;需要搬運,就再寫一套。但在具身智慧的時代,這種「一事一辦」的邏輯已經走到了盡頭。王佳楠認為,真正的智慧必須具備橫向遷移的能力。一個能理解「抓取」邏輯的模型,應該在拿起螺絲起子與拿起雞蛋之間,具備自我適應的能力,而不是依賴人類為其手動調整參數。

隨著大語言模型(LLM)在文字世界的成功,人類第一次看到了「通用」的曙光。王佳楠深信,具身智慧必須遵循與 LLM 同樣的縮放定律(Scaling Laws):透過海量數據的餵養,讓同一個神經網路模型既能掌握廚房裡的炒菜力度,也能處理臥室裡的衣服摺疊。

「世界模型(World Model)」:理解物理法則的暗物質

要實現這種通用性,關鍵在於模型是否建構了強大的「世界模型」。王佳楠解釋,具身 AI 不能只是在模擬器中記憶動作,它必須深刻理解現實世界的規律:

• 物理定律的直覺: 它需要理解重力、流體力學以及不同材質的摩擦係數。

• 因果關係的推斷: 如果水杯傾斜,水會流出;如果玻璃受力過大,會碎裂。

• 人類意圖的解讀: 這種能力甚至包括對人類隱性行為的理解,例如當用戶說「我渴了」,機器人需要自動轉化為「尋找容器—裝水—遞送」的一系列因果決策。

這種對世界運作邏輯的深度模擬,才是 AGI 從數位空間降臨物理世界的唯一門票。

產業的盲點:被高估的繁華與被忽視的基石

在產業觀察的部分,王佳楠的語氣變得更為直接且具批判性。她指出,目前的機器人熱潮中存在大量的「虛假繁榮」,許多大眾眼中的「黑科技」,在專業人士眼中往往只是精巧的視覺欺騙。單一任務的誘惑:警惕「過擬合(Overfitting)」「在展會上看到機器人完美地完成一次疊衣服,或者做出一個後空翻,這確實很吸引眼球,但在技術上這其實是被高估的。」王佳楠解釋道。透過強化學習在特定、封閉的環境中不斷迭代,讓機器人將某個特定動作做到 100% 的成功率,這在現有的工程框架下並不難,但它極大程度地依賴「過擬合」——即模型只學會了在特定的光影、特定的角度、特定的衣物材質下完成動作。一旦場景發生微小的變動,這種「強大的能力」就會瞬間瓦解。

真正被低估的「不性感」細節

王佳楠直言,目前業界最缺乏的是「定義問題的能力」與對產品長期價值的尊重。大眾與投資者往往熱衷於討論演算法的高深,卻忽視了決定機器人能否大規模量產、能否走進千家萬戶的那些「底層雜務」。一家具身智慧公司是否具備「產品靈魂」,體現在這些看似不感興趣的領域:

1. 耐用度與可靠性: 機器人的關節馬達是否能經受住家庭環境中 24/7 的持續運轉?

2. 端側推理(Edge Side Inference): 模型是否能在機器人有限的算力晶片上高效運行,而不依賴昂貴且有延遲的雲端伺服器?

3. 功耗與散熱: 一個滿載運行的具身機器人,是否會因為過熱而頻繁關機?

4. 維修與標準化: 當零件損壞時,它是否具備像家電一樣的模組化維修能力?

「這些細節一點都不性感,甚至聽起來很無聊,但它們才是跨越從『實驗室展示』到『消費級產品』那道深淵的唯一階梯。」王佳楠說道。她正帶領星塵智能,在這些被產業忽視的基石上,一磚一瓦地築起通往未來的路。

領導力與自我和解的旅程

作為一名年輕的女性副總裁,王佳楠的領導風格植根於「慕強」與「直率」。在技術團隊中,最核心的領導力來自於「正確的技術判斷」。「不做決策是最差的事。」王佳楠在面對前沿技術的不確定性時,展現了軍事般的果敢。如果有 60% 的成功機率,她會要求團隊迅速啟動,透過實踐來檢驗理論。如果錯了,就立即調頭。這種「快速失敗、快速迭代(Fail Fast, Learn Fast)」的機制,是星塵智能能在競爭激烈的機器人市場中保持領先的秘訣。

與天才共處:從焦慮到從容

王佳楠也罕見地分享了她在 DeepMind 第一年的心路歷程。在那個群星閃耀的聖地,她曾深陷「冒名頂替症候群(Imposter Syndrome)」。她發現身邊的天才們似乎能輕易洞察宇宙的真理,這讓一向優秀的她感到了前所未有的挫敗。然而,這段經歷最終成為她力量的泉源。她學會了與自己和解,明白到技術的進步不是一場百米衝刺,而是一場人類集體的馬拉松。她不需要成為唯一的救世主,她只需要成為那個「往前多走一步」的探路者。

為下一代鋪設的矽基之路 —— 在不確定性中錨定永恆

在訪談進入尾聲時,會議室外的夕陽餘暉灑在王佳楠身上。她依然保持著那種標誌性的鬆弛感,但眼神中卻透露出一種與年齡不符的、近乎修道者般的堅定。對於王佳楠而言,具身智慧(Embodied AI)早已超越了一個職業階段或是一個商業賽道,這是一場關於「生命本質」與「技術進化」的終極叩問,是一個「一生懸命」的目標。

人機共存的文明構想:從工具到伴侶

在王佳楠構想的未來圖景中,世界將進入一個「碳基與矽基」和諧共存的新紀元。她所追求的機器人,不再是那些躲在工廠黃色圍欄後、只會重複單一動作的冷冰冰工業怪獸。在她的藍圖裡,機器人應該具備「溫度」——這種溫度並非來自電路板的發熱,而是來自於對人類情感的細膩捕捉與對生活需求的深度理解。

她想像中的場景是:機器人能安靜地穿梭在家庭走廊,在清晨為晚起的主人遞上一杯溫度適中的咖啡;在老人孤獨的午後,它能聽懂那些重複了數十遍的往事,並給予恰到好處的點頭回應。這要求 AI 不僅要擁有處理物理世界的硬實力,更要擁有理解人類文明、道德與情感隱喻的軟實力。

長期主義的悲壯與豁達

當被問及如果這個願景在她有生之年無法達成時,王佳楠展現了一種科學家罕見的豁達與悲壯。她深知,要將人類數萬年演化出的「身體智慧」賦予矽基生命,其難度不亞於一場現代版的「巴別塔」工程。「即便這波浪潮我們最終沒能抵達彼岸,我也無怨無悔。」她平靜地說道。在她看來,科學的進步從來不是孤島式的成功,而是無數代人接力傳遞的火炬。如果這一代的探索遭遇了天花板,那麼星塵智能所走過的彎路、所累積的每一兆位元組(Terabyte)底層原始數據、以及在繩驅本體上留下的每一道磨損痕跡,都將化為後來者的養分。

「我要成為那個推到最前面的人。即便這代人倒下了,我們留下的路標、我們建立的數據資產,會告訴下一代人:這裡有坑,那裡有光。」這種將個人價值消融於技術演化史的胸襟,正是「On Point」先鋒位置所賦予她的使命感。

在鋼鐵與魔法之間尋找坐標

這就是王佳楠。她是一位遊走在精密鋼鐵結構、枯燥代碼行與《芙莉蓮》動畫魔法之間的女性先鋒。她用最務實的態度處理關節馬達的扭力分配,卻用最浪漫的想像力去勾勒人類的未來坐標。她正穩穩地站在那個名為「On Point」的位置——那是偵查隊伍中最危險也最迷人的先頭位置。她不再焦慮於與天才的競爭,不再困惑於理論與實踐的裂谷。她只是冷靜、專注地觀察著地平線上那道即將噴薄而出的智慧黎明。在那道光芒中,機器人將不再是人類的工具,而是人類文明向物理世界延伸的一雙手,是我們與未來對話的共同載體。

隨著訪談結束,她起身整理了一下毛衣,馬尾辮隨之晃動。那一刻,她看起來既像是一位即將進入課堂的女大學生,又像是一位正準備指揮一場文明變革的領航員。她步履輕快地走回實驗室,那裡有她的鋼鐵軍隊,也有她尚未完成的、關於改變世界的「魔法」。

分享此新聞: