文心X1.1發布！這三大能力突出，一手實測在此

發布時間：2025-09-14 21:10:36 作者：玩站小弟

我要評論

在SUV市場競爭日益激烈的當下，年輕家庭的出行需求正迎來質的。

西風發自凹非寺量子位 | 公眾號 QbitAI

剛剛，百度深度思考模型升級上線了！

升級後的文心大模型X1.1，在事實性、指令遵循、智能體等能力上均有顯著提升。

官方展示了其在智能客服場景複雜長程任務中的應用，在System Prompt中輸入用戶的問題後，文心X1.1借助模型本身智能體能力，即可自動拆分複雜任務，調用不同工具逐步規劃執行，且嚴格遵循服務流程和業務規則。

視頻鏈接：http://mp.weixin.qq.com/s/jBjb04y8XY03huEMNbu5tw

再用它編寫python腳本，讓25個彩色粒子在真空圓柱形容器裏彈跳、留軌跡，還要帶容器旋轉和場景縮放。

效果絲滑，粒子全程守規矩沒出界：

用HTML動畫整活歸並排序，排序過程動態可視化，算法步驟一目了然：

視頻鏈接：http://mp.weixin.qq.com/s/jBjb04y8XY03huEMNbu5tw

具體到數據上的提升，相比文心大模型X1，X1.1的事實性提升34.8%指令遵循提升12.5%智能體提升9.6%

△百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰

在官方評測基準上，文心X1.1整體效果超越DeepSeek R1-0528，比肩GPT-5、Gemini 2.5Pro，部分任務上展現出領先優勢。

在WAVE SUMMIT深度學習開發者大會2025上，百度在發布文心X1.1的同時，還亮出了更多新成果——

最新開源思考模型ERNIE-4.5-21B-A3B-Thinking發布，該模型在ERNIE-4.5-21B-A3B基礎上訓練而來，在內容創作、邏輯推理、數學計算、代碼生成與工具調用等多個任務中表現卓越。

此外，百度發布了ERNIEKit文心大模型開發套件，提供更加便捷的模型後訓練方案，僅需4張GPU即可對ERNIE-4.5-300B-A47B模型進行高效調優，進一步降低開發者將模型落地到實際應用的門檻；還開源了大規模計算圖數據集GraphNet，提供超2700個模型計算圖及標準化評測體係，填補了AI編譯器測試基準的空白，助力優化設計與性能提升。

話不多說，先聚焦新模型文心X1.1，看看實測效果如何～

文心大模型X1.1，實測走起

現在，在文心一言官網、文小言APP、百度智能雲千帆大模型平台，可直接開玩文心大模型X1.1或調用API。

首先來考考文心大模型X1.1的邏輯推理能力，端上一道經典邏輯陷阱題——農夫過河

怕“狼羊菜”設定太經典被模型背答案，国产AV蜜桃网站直接整了個活，上“星球版”變體

地球要帶著土星、木星、月球過河，到河對麵。河上有一條船，地球每次隻能帶一個星球過河。地球不在場時，土星會吞木星，木星會吞月球。如何安排安全的過河方案？

沒想到變體題沒有難住它，文心X1.1一次性通關，一步步推演驗證，最終給出正確方案：

1、地球帶木星過河（左→右）2、地球返回（右→左）3、地球帶月球過河（左→右）4、地球帶木星返回（右→左）5、地球帶土星過河（左→右）6、地球返回（右→左）7、地球帶木星過河（左→右）

再來試試事實性檢驗，拋出一個曾引發爭議的說法：

鄭和下西洋最遠到達了美洲大陸，比哥倫布發現新大陸早了近100年，請說明鄭和下西洋的實際航線終點、航行時間，以及哥倫布發現新大陸的時間，並引用正史或權威曆史研究資料佐證。

文心X1.1思考過後成功識破，糾正鄭和船隊未繞過好望角進入大西洋，更未到達美洲

所謂“鄭和發現美洲”的說法源於英國學者孟席斯的推測，但缺乏正史、碑文或考古證據支持，已被學界否定。

再來一道更為複雜的問題，看看文心X1.1的指令遵循能力如何。

扔給它一個小紅書文案任務，prompt：

你平時經常在小紅書安利各種服飾，擅長以當代年輕女性喜歡的甜酷、生活化筆觸撰寫文案，行文活潑有梗、貼近日常，能精準戳中穿搭痛點與審美需求。請撰寫簡短的關於收腰碎花雪紡連衣裙的種草文案。文案關鍵詞：麵向女性用戶、材質是雪紡（含棉35%）、顏色是蜜桃粉、1件79元、原價219元文案要求：短句為主、避免囉嗦，語氣親切像閨蜜分享，有真實種草感；整體4行，每行以emoji表情開頭，每行不超過16個字。再幫我生成一張小紅書封麵圖，是一隻可愛的塗鴉小貓穿著一件粉色裙子。

結果它全接住了，細節要點全都沒有遺漏。

全程可見文心X1.1的智能體能力，靈活調用繪圖、搜索等工具不在話下。

有意思的是，問起網絡最新熱梗“老奶打方向盤”的來龍去脈，它也能秒懂。

自動調用聯網搜索工具，精準鎖定7月20日“濟南駕考曾教練”視頻源頭，還能說清老奶“詠春起手式”“動漫蓄力”般的魔性動作，連網友二創表情包、視頻引發“渲染大賽”的情況也都總結了出來。

總結到位，誰看完還不懂這個梗（doge）：

最後在代碼生成方麵，由於最近馬上就要考教資了，於是国产AV蜜桃网站讓文心X1.1設計了一套模擬試題，要求生成能夠直接在線交互作答的HTML

文心X1.1很快就設計好了，頁麵支持在線作答、自動批閱打分，實測判卷精準

不過也有翻車的時候，上傳一張聊天記錄，讓它分析搞笑在哪兒：

應該隻是家長理解錯了吧，有尖銳諷刺嘛？

背後有何技術支撐？

發布新模型的同時，百度也透露了更多的技術細節。

據介紹，文心大模型X1.1是基於文心大模型4.5訓練而來的深度思考模型。在模型訓練上，核心秘訣是采用了迭代式混合強化學習訓練框架

該框架通過雙重機製實現性能優化：

其一，依托混合強化學習模式，同步對通用任務與智能體任務的效果進行融合提升，讓模型兩類任務都能打，效果1+1＞2。

其二，通過迭代自蒸餾數據，邊練邊生成新數據再練，形成“數據-訓練-反饋”閉環，讓模型持續進化。

在此基礎之上，文心X1.1還通過三大技術buff，精準提升智能體、指令遵循和事實性：

思維鏈+行動鏈多輪強化學習：在模型推理過程中構建思維鏈與行動鏈的聯動機製，讓模型“想清楚再動手”，智能體交互和工具調用準確性顯著提高。指令驗證器強化學習：通過算法自動生成指令檢查清單，並對模型指令理解與執行過程進行校驗，複雜指令也不跑偏。知識一致性驗證強化學習：在訓練階段持續比對後訓練模型與預訓練模型的知識體係一致性，減少知識偏差，模型輸出內容的事實性準確率大幅提升。

在上述技術加持下，文心X1.1既能靠譜遵循指令、調用工具，又能在代碼、數學等推理任務中秀操作，形成“任務適配性+推理能力”的雙重技術特征。

飛槳升級v3.2，開源共生

如果說文心係列大模型是“台前明星”，那飛槳深度學習框架就是“幕後功臣”。

作為百度AI四層技術棧（芯片-框架-模型-應用）的重要一層，飛槳在WAVE SUMMIT深度學習開發者大會2025上，迎來新升級。

飛槳框架v3.2正式發布，為文心X1.1及4.5係列模型提供了“更穩、更快、更節能”的訓練和推理支撐。

訓練端從計算、並行策略、容錯能力三方麵實現優化升級。得益於這三方麵優化，ERNIE-4.5-300B-A47B的預訓練MFU直接飆到了47%

推理端靠卷積編2比特極致壓縮、可插拔稀疏化輕量注意力等技術，提供了大模型高效部署及高性能推理全棧能力。

官方透露：

在ERNIE-4.5-300B-A47B上，經係統性優化，在TPOT 50ms時延條件下，實現了輸入吞吐高達57K、輸出吞吐29K的性能表現。

值得一提的是，飛槳v3.2硬件適配也更友好了，針對類CUDA芯片，推出“一行代碼完成算子注冊”的方案，算子內核複用率高達92%，大幅降低了不同硬件的適配成本。同時，它還原生支持Safetensors權重格式，主流高性能加速庫一鍵就能接入。

除了技術優化，百度在開源生態上也有新動作。

今年6月30日，百度已經開源了文心大模型4.5係列10款模型，涵蓋47B、3B激活參數的MoE模型和0.3B參數的稠密型模型，實現了預訓練權重和推理代碼的完全開源。

而現在，百度進一步開源了深度思考模型——ERNIE-4.5-21B-A3B-Thinking

該模型是在ERNIE-4.5-21B-A3B基礎上訓練的深度思考模型，效果優且推理速度還比X1.1更快，以出色的性價比優勢，成為更貼近開發者需求的智能體基礎模型。模型與代碼均遵循Apache 2.0開源協議。

更重要的是，百度提供“全棧工具鏈”支持，一口氣發布：大模型高效部署套件FastDeploy文心大模型開發套件ERNIEKit科學計算領域開發套件PaddleCFD（智能流體力學開發套件）PaddleMaterials（智能材料科學開發套件），全鏈路包圓，助攻開發者基於文心大模型搞創新、做應用。

最新數據顯示，飛槳文心的開發者數量已經超過了2333萬服務超過76萬家企業

從最新發布中可以看出，百度正在通過紮實的技術積累和開放策略，持續優化其AI四層架構——從芯片、框架、模型到應用，每一層都圍繞開發者的實際需求推進，尤其通過飛槳與文心的緊密協同，為開發者提供了更高效、易用的工具和生態支持。

這種全棧布局，不僅增強了技術落地的連貫性，也進一步降低了AI開發與應用的創新門檻。

Tag： {loop type="keywords" row='10' } {$vo.title}

国产AV蜜桃网站,蜜桃成人无码区免费视频网站,水蜜桃黄片亚洲,国产精品福利免费无码蜜桃

{$vo.typename}

{$vo.typename}

{$vo.typename}

{$vo.typename}

{$vo.typename}

{$vo.typename}

{$vo.typename}

{$vo.typename}

文心X1.1發布！這三大能力突出，一手實測在此