智東西作者 王涵編輯 漠影
智東西9月9日報道,今天上午,在百度Wave Summit深度學習開發者大會上,百度正式發布深度思考模型文心大模型X1.1、大模型開發框架飛槳框架V3.2、智能代碼助手文心快碼3.5S以及一係列開發組件更新。
相比於深度思考模型文心X1,文心大模型X1.1的事實性能力提升34.8%,指令遵循能力提升12.5%,智能體能力提升9.6%,在多項基準測試中超越DeepSeek-R1-0528。
目前,用戶可以在文心一言官網、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上線百度智能雲千帆平台,對企業客戶及開發者全麵開放使用。
一、超越DeepSeek,對標GPT-5!百度文心大模型X1.1多項基準測試獲SOTA
會上,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰正式發布了文心大模型X1.1深度思考模型。
據王海峰分享,文心大模型X1是基於文心大模型4.5訓練而來的深度思考模型,相比文心X1,文心大模型X1.1的事實性提升34.8%,指令遵循能力提升12.5%,智能體能力提升9.6%。
在權威基準評測中,文心大模型X1.1在多個任務上超越DeepSeek-R1-0528,取得第一名的成績。同時,與國際頂尖模型GPT-5和Gemini 2.5 Pro相比,效果基本持平。
文心大模型X1.1主要采用了迭代式混合強化學習訓練框架,一方麵通過混合強化學習,同時提升通用任務和智能體任務的效果;另一方麵通過自蒸餾數據的迭代式生產及訓練,不斷提升模型整體效果。
在客服場景,文心大模型X1.1可以識別用戶客訴的情緒和需求,通過思考和調用後台多個工具,自動完成客訴處理的服務流程。
基於文心大模型X1.1的基礎,百度開發劇本驅動多模協同的數字人技術,可以通過大語言模型生成劇本,驅動語音語調和數字人的形象,最終形成完善的數字人。
百度集團副總裁、深度學習技術應用及國家工程研究中心副主任吳甜透露,今年6月15日,在百度電商平台,羅永浩數字人直播的GMV已經超過其本人直播的GMV表現。
數字人主播的問答轉化率和問答接待率都可以超越真人,其超長待機能力在70分鍾以上的場直播中優勢明顯。
二、飛槳文心生態開發者超2千萬,百度內部45%新代碼由AI生成
文心大模型的能力拓展和效率提升,得益於飛槳文心的聯合優化。
大會現場,百度發布了飛槳核心框架3.2版本,該版本在大模型訓練、硬件適配和生態支持上全麵升級。
百度飛槳同步升級了大模型開發套件ERNIEKit和高效部署套件FastDeploy,還發布了AI科學套件,包括智能流體力學開發套件和智能材料科學開發套件,以及大規模計算圖數據集GraphNet。
據最新數據披露,飛槳文心生態開發者達到2333萬位,服務企業達到76萬家。
AI編程方麵,百度還發布了文心快碼3.5S,新版本的代碼生成準確率提升26%,其中複雜場景提升38%。可以駕馭更複雜的任務。
據悉,目前,百度中有45%的新增代碼是AI生成的,文心快碼已累計服務超過1000萬位開發者與上千家企業。
結語:飛槳文心聯合優化,降低開發與技術落地門檻
飛槳與文心的深度聯合優化,持續推動著文心大模型能力的拓展與效率的提高。文心快碼3.5S的發布進一步降低了AI編程的門檻,為開發者與企業帶來了高效且強大的工具。
在產業落地層麵,無論是數字人直播還是文心快碼的落地,這些實踐為AI與實體經濟融合提供了具體參考路徑,在電商、編程開發等領域對行業智能化轉型產生了實際影響。