2022年深度學習發展與未來展望

記者/Howie Su

資料來源:builtin

真的具備智慧?還是只具備部分智慧?

當前正是觀察人工智慧帶來影響的大好時機:2022 年在人工智慧在深度學習方面取得相當進展,特別是在生成模型(Generative Model)方面。然而,隨著深度學習模型功能的增加,相關的質疑與不斷增加。從一方面來看,ChatGPT 和 DALL-E 等高級模型帶來令人驚艷的成果,讓模型進行推理的能力又更上一層樓,但在另一方面,他們經常犯下錯誤,證明他們缺乏人類所擁有的一些基本智力要素,這種「高級智能」卻又犯下「常態錯誤」的模式正讓產官學界思考,人工智慧到底哪一個部分需要調整,對人類的衝擊是比想像中的快或慢?有專業機構認為,不同人工智慧模型未來將產生不同的「個性」,在不同情境產生思考偏誤,另一派則認為,無論是何種模型,將最終具備通用人工智慧(Artificial General Intelligence),但不存在個性問題。

(深度學習當前成為人工智慧熱點。資料來源:IBM

深度學習當前面臨的幾大挑戰

目前推進深度學習的方法仰賴增加訓練數據、建立更大的模型、更有效的coding等方法,但不少專家指出,這樣只會加速這些深度學習模型所犯的錯誤。這個缺陷在 ChatGPT 中相當明顯,它可以生成正確且一致性的語法、但缺乏邏輯與不符合事實現狀的文本。不少使用過該會議的演講者提供此類缺陷的案例,例如大型語言模型無法根據長度對句子進行排序,在簡單的邏輯問題上會犯嚴重錯誤,以及做出錯誤和不一致的陳述。主要原因在於模型並未加入語言和思想、對常識的一般認知、人類是什麼這類問題,甚至是任何其他幻想與想像力。整體而言,我們可以歸納出數個缺陷,第一為推理與答案互斥,大型語言模型無法推理基本事物,例如將對象放入模型中,模型可以回答問題,但使用者可能無法指望得到答案;第二是事實性不足,模型不能透過倒入他們新的事實來逐步更新,這些模型通常需要接受再訓練以吸收新知識,因此顯得笨拙。

深度學習平台需要時間來發現模式、分析數據並得出可應用於現實世界的結論。AI 平台正在不斷發展以滿足不斷成長的模型訓練需求,因此這些平台將與數據分析一樣成熟,而不是需要數週的學習時間才能開始工作。資料集的規模不斷擴大,深度學習模型不斷變得更加資源密集——它們需要更多的處理能力來預測、驗證和重新校準數千次,而圖形處理單元 (GPU) 正在不斷進步以應對這些強烈的需求。同時,深度學習工作負載越來越容器化,。這些技術幫助公司在 MLOps 中具有隔離、無限可擴展性、可移植性和動態行為。人工智慧基礎設施的管理現在更加自動化和業務友好。以容器化為核心,Kubernetes 能協助雲原生 MLOps 與其他更成熟的技術,使得公司在整合 Kubernetes 時能在更加靈活的雲端環境中展開 AI 各種專案部署。

當前專家對於未來人工智慧的期望

簡單來說,我們所謂的「常識」對人工智慧而言相當困難,常識對於人類來說幾乎是無需思考,而對於機器來說卻很難,因為顯而易見的事情永遠人們不會說出來並視為理所當然,而且常識性的事情沒有普遍的真理,有些隱性的現象,比如人際關係、社會互動、企業文化等,常識是透過感官經驗獲得的,並且這些知識存儲在感知和運動系統中,模型可能無法透過「感知」這些情境來做出適合的推演。部分業界專家也提出觀點與期望,Elemental Cognition的創始人、IBM Watson 的前成員大衛·費魯奇 (David Ferrucci) 認為,如果人類無法讓機器「解釋為什麼它們會產生它們正在產生的輸出」,我們就無法實現我們對 AI 普及化的的願景,費魯奇的公司正在設計一種架構,該架構可以解釋其推論和因果模型,這是當前 AI 中缺少的兩個功能。

AI 科學家 Ben Goertzel 則指出「目前主導當前商業 AI 領域的深度神經網路不會在構建真正的 AGI取得太大進展。」Goertzel 以創造 AGI 一詞而聞名,他認為以事實檢查核措施強化 GPT-3 等現有模型不會解決深度學習面臨的問題,也不會使它們能夠像人類思維一樣思考。瑞士人工智慧實驗室 IDSIA 的科學主任兼現代深度學習技術的先驅之一 Jürgen Schmidhuber 表示,當前人工智慧的許多問題已在過去幾十年中被解決。Schmidhuber 建議解決這些問題是運算成本的問題,未來人類需持續建立深度學習系統,進行元學習並找到新的更好的學習演算法。

分享此新聞: