本報記者 劉霞

科研過程可以完全自動化嗎?一個研究機器學習的國際團隊正在勇闖“無人區”。

據《自然》網站近日報道,日本SakanaAI公司和加拿大、英國科學家攜手,創建了一種基于大語言模型的“人工智能(AI)科學家”。從閱讀文獻到提出新假設,再到嘗試各種解決方案并撰寫論文,整個研究周期,“AI科學家”能一氣呵成。

Sakana公司在其官網表示,這位科研“新星”是首個用于自動化科研和開放式發現的綜合AI系統,標志著科學發現新時代的開始。盡管它展現出非凡的潛力,但目前并不完美,應警惕“AI科學家”被濫用的風險。

推進流程行云流水

AI技術不斷進步,讓科學家能借助一些模型來集思廣益或編寫代碼。然而,這些模型仍然需要大量人工監督,或僅囿于執行特定任務。

那么,能否利用基礎模型將整個科研過程自動化呢?包括加拿大不列顛哥倫比亞大學機器學習專家在內的團隊,成功創建出首位“AI科學家”。

在想法生成階段,該“AI科學家”基于一個起始模板,先進行“頭腦風暴”,提出多個不同研究方向,并進行廣泛搜索,以確保某些想法是新穎且有趣的;在實驗迭代階段,對于第一階段提出的某個想法,“AI科學家”會先開展實驗,然后生成圖表可視化結果,并給每個圖表添加注釋;在論文寫作階段,它會模仿標準機器學習會議的風格,撰寫出一份文字簡練、內容豐富的論文,并自主查找相關論文進行引用;在自動化同行評審階段,研究團隊開發出一個自動化的“AI審稿人”,其評估生成論文的準確性堪與人類相媲美。評估結果和建議可用于改進該項目,實現持續的反饋循環,使“AI科學家”能夠迭代改進其研究成果。

在最初的演示中,該“AI科學家”針對擴散模型、Transformer模型(一種用于處理語言數據的神經網絡模型),以及AI“領悟”(grokking)等機器學習子領域進行了深入研究,總共生成了10篇論文,每篇論文的成本約15美元。

美國華盛頓大學計算社會科學家杰文·韋斯特表示,該“AI科學家”行云流水般完成了整個科研流程,令人印象深刻,有望加速科學發現的步伐。

功能遠非盡善盡美

盡管這位“AI科學家”潛能巨大,但它遠非盡善盡美。

SakanaAI公司指出,“AI科學家”目前還不具備視覺功能,因此無法修復論文中出現的圖表問題。例如,它生成的圖表有時無法讀取,表格有時會超出頁面范圍,頁面布局也并不美觀。

此外,該“AI科學家”有時會出現想法正確但執行錯誤的情況,也會因比較不當而生成誤導性的結果。在撰寫論文和評估結論時,它還可能會犯嚴重錯誤。例如,它很難比較兩個數字的大小,這是大語言模型的“通病”。為了部分解決這個問題,研究團隊確保所有實驗結果都可以重復,并存儲了所有執行文件。

研究人員預計,未來多模態模型“加入戰局”,將助該“AI科學家”一臂之力。

另外,該“AI科學家”只能開展機器學習領域的研究,且缺乏科研過程的關鍵部分:動手進行實驗的能力。

艾倫人工智能研究所計算機科學家湯姆·霍普表示,目前該大語言模型“仍無法提出并制定新穎有用的科學方向”。勞倫斯伯克利國家實驗室材料科學家赫布蘭德·希德則認為,即使該系統在短期內無法完成更具創造性的工作,仍可將科研過程中一些重復性內容自動化。

SakanaAI也強調,此類系統能否提出真正的變革型想法仍未有定論。未來的“AI科學家”能否發明出像人工神經網絡或信息論一樣的概念也還是個未知數。

能力越強越需慎用

研究人員表示,為擴大該“AI科學家”的能力,讓其能夠研究更抽象的領域,如純數學領域,可能需要調遣語言模型之外的其他技術。

例如,解決數學問題需要邏輯推理,而目前大多數AI模型都不擅長邏輯推理。鑒于此,谷歌深度思維公司開發出AlphaGeometr,將語言模型與符號引擎(使用符號和邏輯規則進行推理)相結合,構建出一種神經—符號混合系統。在今年的奧林匹克數學競賽中,升級后的AlphaGeometry2在19秒內就解答出一道題,令人類選手望塵莫及。

研究人員堅信,目前的迭代只是個開始。“AI科學家”就像AI科研自動化領域的GPT-1。隨著不斷迭代,它將如目前的GPT-4一樣,引發新的科研革命。

不過,與許多新技術一樣,“AI科學家”也打開了“潘多拉魔盒”,甚至可能被濫用。

譬如,“AI科學家”能自動創建論文并提交,這將顯著增加審稿人的工作量,可能阻礙科學質量控制,并給學術進步帶來壓力。而且,“AI科學家”還可能被用來制造危險的病毒,給人類社會帶來潛在危害。

編輯:張圣琪
更多精彩資訊請在應用市場下載“央廣網”客戶端。歡迎提供新聞線索,24小時報料熱線400-800-0088;消費者也可通過央廣網“啄木鳥消費者投訴平臺”線上投訴。版權聲明:本文章版權歸屬央廣網所有,未經授權不得轉載。轉載請聯系:cnrbanquan@cnr.cn,不尊重原創的行為我們將追究責任。
長按二維碼
關注精彩內容