少兒編程 > 文章資訊 > 機器人 > 蘋果AI總監談人工智能:對強化學習很感興趣
蘋果AI總監談人工智能:對強化學習很感興趣
童程童美 2017-03-31
雖然人工智能在圖像識別和產品推薦等方面取得了巨大的進步,但是這項技術仍然面臨諸多挑戰,特別是如何讓AI系統擁有“記憶功能”依然是一個難題。
摘要雖然人工智能在圖像識別和產品推薦等方面取得了巨大的進步,但是這項技術仍然面臨諸多挑戰,特別是如何讓AI系統擁有“記憶功能”依然是一個難題。
本周二(3月28日),蘋果的AI研究部門的總監Ruslan Salakhutdinov在MIT Technology Review會議上探討了人工智能的局限性,不過他并未提及蘋果是怎樣將人工智能整合到Siri等產品中的。
Salakhutdinov于去年10月加入蘋果,他稱自己對強化學習(Reinforcement Learning)非常感興趣, 利用這種技術可以教會計算機通過反復優化決策來獲取最好的結果。例如,谷歌就使用了強化學習來幫助數據中心達到最佳的散熱和操作配置,從而使其更加節能。
卡耐基梅隆大學(Salakhutdinov是該大學的副教授)的研究人員最近也在做這方面的研究:使用強化學習訓練計算機玩上世紀90年代的視頻游戲“Doom”。很快,計算機就學會了如何快速并準確地射擊外星人,而且還發現閃避能夠躲開敵人的火力。但是,它并不擅長記憶,比如記不住迷宮的布局,這使得它無法事先規劃和制定游戲策略。
Salakhutdinov的研究涉及到一種AI軟件,它能夠記錄“Doom”中的虛擬迷宮布局以及各個參考點,以便定位特定塔樓的位置。在游戲過程中,該軟件首先會判斷火炬的顏色(紅色或者綠色),然后根據火炬的顏色定位相應顏色的塔樓。
最終,這個軟件學會了如何在迷宮中找到正確的塔樓。而且當它發現自己找到的是錯誤的塔樓的時候,還會原路返回,尋找正確的塔樓。特別值得注意的是,該軟件在每次發現塔樓時都能夠回憶起火炬的顏色,Salakhutdinov解釋道。
不過,Salakhutdinov表示,這種類型的AI軟件需要“很長的訓練時間”,而且還需要強大的計算能力,因此難以擴大規模。
此外, Salakhutdinov想要探索的另一個領域是:教會AI軟件通過“更少的樣本和經驗”達到更快的學習速度。盡管沒有在演講中提及,但是他的這一設想顯然有利于蘋果在更短的時間內創造更好的產品。
一些AI專家和分析師認為,由于蘋果公司的隱私規則更加嚴格,限制了可用于訓練AI系統的數據量,因此蘋果的AI技術不如谷歌和微軟等競爭對手。Fortune認為,如果蘋果一直使用較少的數據來訓練AI系統,那么它或許能在滿足隱私要求的同時,仍然能夠像競爭對手那樣快速對軟件進行改進。