Warning: mkdir(): No space left on device in /www/wwwroot/New.4.com/func.php on line 127

Warning: file_put_contents(./cachefile_yuan/tsxingyuan.com/cache/7c/5231e/90abc.html): failed to open stream: No such file or directory in /www/wwwroot/New.4.com/func.php on line 115
賽道Hyper | 通義千問萬億模型的戰略突圍解析

立足之地網

  湖北恩施大峽穀景區裏,遊客在僅1.8公斤重的外骨骼機器人

賽道Hyper | 通義千問萬億模型的戰略突圍解析

作者:周源/華爾街見聞

9月6日淩晨,阿裏巴巴旗下通義千問(Qwen)在其官網發布Qwen3-Max-Preview(Instruct)——一款參數量超過1萬億的預覽版超大型模型。

阿裏對外稱,該模型在中英文理解、複雜指令遵循、工具調用(RAG/Tool-calling)等維度有明顯提升,並在設計上減少了知識幻覺現象;同時,Preview版本已在Qwen Chat與阿裏雲的模型平台上提供試用與API調用。

這個模型到底是什麽

阿裏官方表述把Qwen3-Max-Preview定位為Qwen3係列中“迄今為止最大且麵向指令任務”的模型,並強調兩件事:一是將“指令遵循與工具調用”作為主要優化目標;二是部署通道同時開放給自家產品(Qwen Chat)與商業開發者(阿裏雲模型服務/百煉平台)。

這兩個動作說明,這個超大模型既是產品宣稱,也是阿裏推動模型即服務化的操作說明。

這個模型的亮點,集中在三個層麵可被核驗的事實:參數規模(超過1萬億)、可通過雲平台與聊天產品調用、以及在若幹公開或私有基準上取得的比較性優勢。

通義千問最近推出了多個不同側重的大模型,背後的思考是什麽?

阿裏巴巴CEO吳泳銘(Eddie Wu)此前曾對外公開表示:“公司現在的主要目標,是構建一個最終能超越人類智能能力的——‘人工通用智能’(AGI:Artificial General Intelligence)係統。所有Qwen3模型均為開源,這體現了国产AV蜜桃网站對開放社區與產業創新的長期承諾。”

這次,阿裏為什麽把“指令+工具”放在首位?

通義團隊過去在Qwen3技術報告中提出的框架(如思考/非思考模式、混合密集與MoE架構、可控的思考預算機製)為Max版的演進提供了方法論基礎。

Qwen3的技術路線不是簡單追參數,而是把“模式切換”“預算分配”“多模態兼容”作為可控變量,這使得放大到萬億參數時能更快麵向實際任務做出靈活調整。

在Max-Preview的具體描述中,阿裏把減少“知識幻覺”與增強“工具調用”並列為核心改進點:前者指向輸出可信度與事實性(對企業級應用至關重要),後者則直接關係到把大模型嵌入企業流程、調用檢索/數據庫/執行工具時的可靠性。

換言之,產品化路徑從“更會說”轉向“更會做”(actionable),這是阿裏把模型作為平台化產品推向市場的技術邏輯。

華爾街見聞注意到,近期,國內外多個廠商都推出了超大規模,或麵向AI Agent的模型:比如Moonshot(月之暗麵)的Kimi K2、DeepSeek的V3.1,以及國外的Anthropic(Claude Opus)等。

這些模型在架構選擇(MoE vs Dense)、實際激活參數與峰值參數(Activated vs Total)、以及對Agent/工具的內建支持等維度,都存在明顯差異。

Kimi與若幹國產團隊采取MoE路線以降低推理成本並提高單模型覆蓋麵;DeepSeek 則強調混合推理模式(thinking/non-thinking)與國內生態的快速迭代;Anthropic 則把 AI Agent 與長期推理能力作為差異點。

對比之下,阿裏這次選擇將Max以“Instruct +工具調用優化+可商用平台”的方式先行投放,是一種強調可用性與生態接入的打法。

值得注意的是,參數的絕對值並不自動等同為產品優勢:MoE類模型在“總參數”上能達到極大規模,但實際推理時的激活參數更小,成本結構不同——此次阿裏沒有披露這個超大模型的參數激活量數據。

此外,開放策略(開源、預覽、閉源商用)會直接影響社區生態與二次創新速度。阿裏在過去兩年裏已有Qwen3係列的開源實踐與社區積累,這決定了Max麵向用戶與開發者的出發點,與完全閉源的競品路徑存在本質差別。

阿裏在賭實務可集成價值?

一個萬億級模型以Preview形式,在Qwen Chat與阿裏雲平台上線,意味著阿裏將該模型當作“平台能力”來推:企業可通過API、RAG流程與工具鏈把模型嵌進已有的比如客服、知識庫檢索、企業內網搜索和自動化代理等業務係統。

這一路徑的商業價值不在於單筆模型銷售,而在於通過平台帶來的長期黏性與增值服務,比如檢索、定製化fine-tune、工具鏈托管和合規治理。

目前,阿裏已有電商、金融、企業服務等場景可供切入,Max作為“更能調用工具、少幻覺”的能力自有明確落地場景。

對於開發者與第三方廠商來說,Preview版既是試金石也是門檻:試金能驗證Max在真實數據與業務流程中的表現;門檻則來自成本、接入複雜度與合規要求。

阿裏若能在工具鏈穩定性、檢索可信度和接入模板上提供低成本的工程化支撐,便可把技術優勢轉化為生態優勢。

從近期業界的整體動態來看,大模型之爭,已從單個模型轉向整體係統的競爭。

阿裏推出的Qwen3-Max-Preview,實際上就是阿裏在將“大模型變成企業可用能力”這一賽道上的一次明顯加壓。

9月5日,華爾街見聞從國內一家服裝巨頭公司的CIO和HR總監處了解到,該公司已在阿裏釘釘平台上,以釘釘自帶的GenAI全套工具,快速重構該公司的服裝從潮流趨勢確定到設計、到生產、到陳列、到銷售、到反饋、到售後等一係列業務流程。

這與阿裏定位將GenAI技術以不同形式去重塑B端公司實務,達成吳泳銘所稱的“產業創新”策略,一脈相承。

這次推出的這個超大模型,也承襲了同樣的思路或策略:將焦點從單純的參數規模,轉向“指令遵循、工具調用與降低幻覺”的工程化可用性;同時通過Qwen Chat與阿裏雲兩條通道快速聚攏用戶與付費場景。

與此並行,業內以Kimi、DeepSeek、Anthropic為代表的不同路線,也在試圖用各自的架構、開放策略與商用策略占據位置。

最終的優勝者,將不是參數最大者,而是能把模型能力在合規、工程化、生態與成本間實現平衡的一方。

若進一步檢驗Qwen3-Max的價值,需要時間與第三方評測來驗證其在複雜企業場景(長期對話、工具鏈調用、知識閉環)中的穩定性與成本效益。

同時,監管和平台治理將決定這類超大模型能否在更大規模的公眾與行業應用中長期存在。阿裏這一步是加注,也是試探;真正的變量,在於生態能否被轉化為可持續的商業與治理能力。

訪客,請您發表評論:

網站分類
熱門文章
友情鏈接
網站地圖