英偉達推出通用深度研究係統,可接入任何LLM,支持個人定製

不圓 發自 凹非寺量子位 | 公眾號 QbitAI

英偉達也做深度研究智能體了。

最新論文介紹了英偉達的通用深度研究(UDR)係統,該係統支持個人定製,可接入任何大語言模型(LLM)。

這意味著它能夠圍繞任何語言模型運行,用戶可以完全自定義深度研究策略,並交給智能體實現。

為展示其通用性,英偉達還為UDR配備了帶用戶界麵的研究演示原型,可在GitHub上下載。

網友認為,它使智能體的自主性得到了突破,非常適合企業工作。

自帶模型和策略

論文介紹,以往推出的所有深度研究智能體,都采用硬編碼方式,僅能通過固定的工具選擇來執行特定研究策略。

而英偉達的UDR係統能夠圍繞任何LLM運行。

還能使用戶能夠在無需額外訓練或微調的情況下,創建、編輯和優化他們完全自定義的深度研究策略。

上圖呈現的是一個典型深度研究工具(DRT)的組成部分,與普通的對話式LLMs不同,DRTs在生成報告之前傾向於持續向用戶更新其進度。

一個DRT由兩部分組成:

一個簡單的用戶界麵:用於接收研究提示,持續向用戶更新研究進度,並顯示研究報告;代理邏輯:代碼代理(通過代碼協調大語言模型與工具的組合運用)或LLM代理(直接利用模型自身的推理和工具調用能力)。

無論是Gemini、Perplexity還是OpenAI,現有的DRTs主要采用僵化的研究策略,除研究提示詞外幾乎不留用戶定製空間;而在具有LLM代理的DRTs中,往往存在底層模型選擇單一、或僅使用訓練後行為特征相同的同係列模型的問題。

雖然這個問題並不是阻礙DRTs廣泛流行的障礙,但它從三個方麵限製了它們的實用性:

1、用戶既不能自主設置資源優先級,也無法自動驗證信息的權威性,更無法控製搜索成本。2、現有的DRTs做不出高價值行業需要的專業文檔分析方案。3、現有的DRTs使用的模型是不可換的——用戶不能隨意將最新或最強大的模型與深度研究智能體組合起來,以產生一個更強大的DRT。

而英偉達的UDR係統提出了一種通用的解決方案來解決上述問題。

簡單地說,與專門的DRT不同,UDR從用戶那裏接收研究策略和研究提示,允許更高的定製程度。

UDR能夠將策略從自然語言編譯成可執行的研究編排代碼片段,然後執行策略,並將最終報告交付給用戶。

其最顯著的創新特性包括:

通過自然語言定製研究策略。UDR支持用戶用自然語言定義和編程自己的研究工作流,係統會將其轉換為可執行、可審計的代碼。

這意味著用戶自己設計的智能操作流程,不需要重新訓練AI模型或進行複雜調試,就能直接投入實際使用。

與模型無關的研究工具架構。UDR將研究邏輯與語言模型解耦,使開發者能夠將任何大語言模型——無論供應商或架構如何——封裝成功能完整的深度研究工具。

這樣一來,產品設計就有了更大發揮空間:既能選用最先進的AI模型,又能搭配量身定製的研究方案,實現靈活組合的創新應用。

用戶可控的策略驅動研究界麵。下圖的原型展示了四大實用功能:實時修改研究策略、選擇預設策略庫、接收進度通知、查看分析報告。

UDR通過區分控製邏輯和語言模型推理來提升計算效率:整個深度研究流程的調度由生成的代碼全權負責,這些代碼直接在CPU上運行,避免了成本高出數十倍的語言模型推理開銷。

係統僅在用戶自定義研究策略明確要求時才會調用LLM,且每次調用僅處理代碼變量中存儲的精簡定向文本片段。

這種雙重高效設計——將流程調度交給CPU執行邏輯,同時將LLM的使用嚴格限定在精準高效的調用中——不僅能夠降低GPU資源消耗,還可以顯著減少深度研究任務的總體執行延遲和成本。

仍需進一步探索

不過,這項工作目前還存在一定的局限性。

一方麵,UDR係統執行研究策略的準確度,完全取決於底層AI模型生成代碼的質量。雖然研究人員通過強製要求代碼添加注釋來減少錯誤,但當策略表述模糊或不夠具體時,係統偶爾還是會產生理解偏差或邏輯錯誤。

另一方麵,UDR默認用戶設計的研究策略本身是合理且可執行的。係統隻會做基礎檢查,不會判斷策略步驟是否真正有效。如果策略設計得不好,最終生成的報告可能質量低下、內容不全,或者根本生成不出報告。

此外, 還有一點在於,雖然UDR會實時顯示研究進度,但當前版本在執行過程中不支持用戶幹預(隻能停止任務),也無法根據實時反饋調整研究方向。

所有決策都需要在研究開始前就預先設定好,這使得長時間或探索性的研究任務缺乏靈活性。

針對上述問題,研究人員也提出了進一步的解決方案——或者說改進方案:

比如配備可修改定製的研究策略庫、進一步探索如何讓用戶控製語言模型的自由推理過程、將大量用戶提示自動轉化為確定性控製的智能體等。

目前英偉達的UDR係統還隻是原型階段,並未正式推出,但或許可以期待一下。

期待一個功能完整的正式版本。

參考鏈接:[1]https://x.com/rohanpaul_ai/status/1964689864244203596[2]http://research.nvidia.com/labs/lpr/udr/[3]http://github.com/NVlabs/UniversalDeepResearch

漯河
上一篇:{loop type="arclist" row=1 }{$vo.title}