托卡馬克內(nèi)部的等離子體。圖片來源:“深度思維”公司
“這是強化學習在現(xiàn)實世界系統(tǒng)中最具挑戰(zhàn)性的應用之一,”深度思維研究員馬丁·利德米勒表示。而“人工智能,特別是強化學習,特別適合解決托卡馬克中控制等離子體的復雜問題。”所謂托卡馬克,是一種可以容納核聚變反應的容器,其內(nèi)部呈現(xiàn)出一種特殊且混亂的狀態(tài):氫原子在極端高溫下“擠作一團”,產(chǎn)生旋轉(zhuǎn)著、翻滾著、比太陽表面還要熾熱的等離子體湯,而磁場線圈會限制等離子體粒子,以使等離子體達到聚變所需的條件。換句話說,控制和約束這種等離子體的方法,就是核聚變邁向成功的關(guān)鍵,也將是人類社會未來清潔能源的源泉。
在最新論文中,“深度思維”詳細介紹了可自主控制等離子體的AI??刂频入x子體需要不斷監(jiān)測和操縱磁場,團隊訓練其強化學習算法在模擬中執(zhí)行此操作,一旦它學會了如何控制和改變虛擬反應堆內(nèi)等離子體的形狀,研究人員就讓它控制了托卡馬克中的磁體,他們發(fā)現(xiàn),人工智能無需任何額外的微調(diào)就能控制真正的反應堆。
研究人員表示,使用AI算法控制等離子體,將使在反應堆內(nèi)進行不同條件的實驗變得更加容易,并可能加快商業(yè)核聚變的發(fā)展。AI在這其中學會了通過以人類以前從未嘗試過的方式,調(diào)整磁鐵來控制等離子體,這意味著,也可能會有一種新的反應堆配置可供探索。
總編輯圈點
在地球上控制核聚變很難。但現(xiàn)在,經(jīng)過訓練的AI神經(jīng)網(wǎng)絡(luò),可以每秒接收90次不同的測量值來描述等離子體的形狀和位置,并相應地調(diào)整磁體中的電壓。這個強化學習算法,處理速度比以往任何方式都要快得多。對科學家來說,這是朝著一個非常令人興奮的方向邁出的重要的第一步,因為如果確定有一個控制系統(tǒng)可以讓我們?nèi)绱私咏鼧O限但又不會超出極限,那么,人類就有了探索更多可能性的平臺,也有了更強的信心,將AI用于推動人類文明的進步。