Warning: mkdir(): No space left on device in /www/wwwroot/New.4.com/func.php on line 127

Warning: file_put_contents(./cachefile_yuan/tsxingyuan.com/cache/70/f9764/0c010.html): failed to open stream: No such file or directory in /www/wwwroot/New.4.com/func.php on line 115
悉尼科技大學:當AI學會分辨"共同喜好"與"獨特品味"

白日做夢網白日做夢網

悉尼科技大學:當AI學會分辨"共同喜好"與"獨特品味"

這項由悉尼科技大學的馬守星、湖南大學的曾雅文、澳門城市大學的吳世清以及香港教育大學的許冠東共同完成的研究,發表在2025年10月的第33屆ACM國際多媒體會議上。完整論文可通過DOI:http://doi.org/10.1145/3746027.3755779獲取,代碼也已公開發布供研究者使用。

當你在購物網站瀏覽商品時,係統總是能神奇地猜出你可能喜歡什麽。這些推薦係統就像是一位貼心的店員,不僅知道商品的外觀,還能讀懂商品描述,然後根據你的曆史購買記錄為你推薦心儀的物品。然而,現有的推薦係統麵臨著一個關鍵挑戰:如何在理解用戶共同喜好的同時,又不忽略每個人的獨特品味?

就如同兩個人都喜歡某件襯衫,一個人可能被其時尚的扭結設計吸引,另一個人則看重商品描述中提到的口袋功能。傳統的推薦係統往往隻關注兩人的共同點,卻忽略了這些重要的個性化差異。研究團隊發現,現有方法存在兩個主要問題:簡單的多模態特征對比會產生噪聲並丟失有價值的獨特信息;對用戶興趣和商品共現關係的挖掘不夠充分。

為了解決這些問題,研究團隊開發了一個名為REARM的新框架,這個名稱來源於"REfining multi-modAl contRastive learning and hoMography relations"。該框架的核心理念是教會AI係統既要識別用戶的共同喜好,又要保留每個人的獨特品味,同時更深入地挖掘用戶興趣和商品關聯模式。

一、破解多模態推薦的雙重挑戰

想象你正在為朋友挑選生日禮物,你需要同時考慮商品的外觀和功能描述。傳統的推薦係統就像是一個隻看表麵的購物助手,它會注意到你和朋友都喜歡某種風格的商品,但卻忽略了你們各自的獨特偏好。

研究團隊深入分析了現有多模態推薦係統的局限性。第一個問題類似於"一刀切"的服務方式。當係統發現兩個用戶都對某件商品感興趣時,它會簡單地認為兩人的喜好完全一致,忽略了個體差異。比如說,兩個人都購買了同一件女孩襯衫,係統會重點關注"女孩襯衫"這個共同標簽,但可能忽略了其中一人真正看重的是圖像中展現的時尚扭結設計,另一人更關注的是文字描述中的"大童款"標識。

第二個問題則像是缺乏社交洞察的推薦員。現有係統雖然會分析用戶的共同購買行為和商品的語義相似性,但卻忽略了更深層的關聯模式。它們沒有充分探索用戶興趣圖譜和商品共現關係之間的相互作用,就如同一個推薦員隻知道客戶買了什麽,卻不理解客戶為什麽買,也不知道不同商品之間的潛在聯係。

為了應對這些挑戰,研究團隊提出了一個創新的解決方案。他們認為,理想的推薦係統應該像一位經驗豐富的個人購物顧問,既能識別客戶群體的共同趨勢,又能敏銳捕捉每個人的獨特需求。這位顧問不僅要看懂商品的外觀和描述,還要深入理解客戶的興趣網絡和商品之間的複雜關聯。

研究團隊的理論基礎建立在對多模態對比學習的深刻理解上。他們發現,傳統方法假設不同模態之間存在高度冗餘,即大部分有用信息都是共享的,獨特信息很少。但在實際的推薦場景中,這個假設並不總是成立。每種模態都可能包含獨特且有價值的信息,同時共享信息中也可能存在與推薦任務無關的噪聲。

二、構建更智能的特征提取機製

研究團隊開發的REARM框架采用了一種類似精密篩選器的工作方式。這個篩選器不僅能夠過濾掉無關信息,還能保留對推薦有價值的獨特特征。

整個框架的工作流程可以比作一個三步驟的精煉過程。首先是同質關係學習,就像是構建一張詳細的關聯地圖,展示用戶之間和商品之間的各種聯係。接著是異質關係學習,類似於分析用戶與商品之間的互動模式。最後是精煉對比學習,就像是用高級過濾器處理信息,保留有價值的內容,去除噪聲。

在同質關係學習部分,研究團隊創新性地構建了用戶興趣圖和商品共現圖。用戶興趣圖就像是繪製每個用戶的興趣地圖,不僅記錄用戶購買了什麽,還分析用戶的興趣偏好模式。商品共現圖則像是商品之間的關聯網絡,記錄哪些商品經常被同一用戶購買,反映商品之間的潛在聯係。

這種方法的巧妙之處在於,它不是簡單地將所有用戶或商品一視同仁,而是根據不同的關係類型構建不同的連接。比如,兩個用戶可能因為有相似的購買曆史而建立共現關係,同時又因為興趣偏好的相似性建立另一種語義關係。係統會智能地平衡這兩種關係,就像一位經驗豐富的社交網絡分析師,既關注表麵行為的相似性,又深入挖掘內在興趣的一致性。

在處理商品信息時,係統首先會將不同模態的原始特征轉換為統一的表示空間,就像是將不同語言的描述翻譯成同一種語言。然後通過圖神經網絡進行信息傳播,讓每個節點不僅包含自身信息,還融合了鄰居節點的相關信息。這個過程就像是讓每個商品不僅了解自己,還了解與自己相關的其他商品的特點。

為了進一步提升特征質量,研究團隊引入了注意力機製。自注意力模塊就像是一個內部調節器,幫助係統調整各個維度特征的重要性權重。交叉注意力模塊則像是一個跨模態的溝通橋梁,讓圖像特征和文本特征能夠相互影響和補充。這種設計確保了係統不會簡單地將不同模態的信息機械式地組合,而是讓它們進行更深層的交流和整合。

三、精煉對比學習的創新突破

研究團隊在對比學習方麵的創新可以比作開發一套精密的質量控製係統。傳統的對比學習就像是用粗糙的篩子過濾信息,容易讓有價值的獨特信息流失,同時讓無關噪聲混入結果中。而REARM的精煉對比學習則像是配備了兩套精密過濾器的高級處理係統。

第一套過濾器是元網絡係統,專門處理模態共享特征中的噪聲問題。這個元網絡就像是一位經驗豐富的質檢員,能夠從共享特征中識別出哪些信息真正與推薦任務相關,哪些隻是表麵的巧合。比如,當係統發現某件商品的圖像和文字都提到"女孩"時,元網絡會進一步分析這個共同特征是否真的對推薦有幫助,還是隻是一個可能誤導係統的標簽。

元網絡的工作原理類似於一個智能的知識提取器。它不是簡單地接受所有共享信息,而是學習如何從這些信息中提取真正有價值的知識。係統會根據具體的推薦上下文,動態生成定製化的變換矩陣,就像是為每種情況量身定製一套處理規則。這種自適應的處理方式確保了係統能夠根據不同的商品和用戶特點,靈活調整信息處理策略。

第二套過濾器是正交約束機製,專門負責保護模態獨特特征。這個機製就像是一個獨特性保護器,確保每種模態的獨特價值信息不會在融合過程中丟失。正交約束的數學原理是通過限製不同模態特征之間的重疊度,鼓勵每種模態保持自己的獨特貢獻。

這種設計的智慧在於它認識到,真正優秀的推薦係統不應該試圖將所有信息都標準化為相同的形式,而應該讓不同類型的信息在保持各自特色的同時協同工作。就像一個優秀的團隊,每個成員都有自己的專長,團隊的力量來自於這些專長的互補,而不是所有人都變得完全相同。

在實際應用中,這兩套過濾器協同工作。當係統處理一個用戶對商品的偏好時,元網絡會從共享特征中提取可靠的共同偏好信息,過濾掉可能的噪聲幹擾。同時,正交約束確保每種模態的獨特貢獻得到保留,讓係統能夠捕捉到用戶可能被商品的某個特定方麵吸引的細微差別。

四、實驗驗證與性能表現

研究團隊在三個真實的電商數據集上進行了全麵的性能測試,這些數據集分別來自嬰兒用品、體育用品和服裝類別。這種選擇很有代表性,因為這三個類別的商品都具有豐富的視覺和文字信息,同時用戶的購買決策往往受到多種因素的影響。

實驗結果就像是一場令人驚喜的性能提升展示。在所有測試的數據集和評估指標上,REARM都顯著超越了現有的最先進方法。以Recall@20指標為例,REARM在嬰兒用品數據集上達到了0.1105,相比之前最好的方法MIG-GT的0.1021有了明顯提升。在體育用品數據集上,性能提升更為顯著,從之前最好的0.1139提升到了0.1231。

這些數字背後的意義可以用一個具體的例子來理解。假設傳統方法能夠在20個推薦商品中準確命中11個用戶真正感興趣的商品,那麽REARM能夠命中12個以上。這個看似微小的提升在實際應用中意味著顯著的用戶體驗改善和商業價值提升。

更有趣的是研究團隊進行的消融實驗,這就像是逐個拆解機器的零件來驗證每個部分的作用。當他們移除同質關係學習模塊時,係統性能出現了明顯下降,證明了深度挖掘用戶和商品關係的重要性。當移除精煉對比學習的任一組件時,性能同樣下降,驗證了噪聲過濾和獨特特征保護的必要性。

研究團隊還專門測試了不同模態的貢獻。他們發現,單獨使用視覺模態或文本模態都無法達到最佳效果,這證實了多模態融合的價值。同時,文本模態在服裝類商品上表現更好,這符合常識,因為服裝的尺寸、材質等重要信息往往更多地體現在文字描述中。

為了直觀展示係統的改進效果,研究團隊製作了一個交互概率差異熱力圖。這個圖像就像是係統決策過程的可視化窗口,顏色越深的區域表示REARM相比傳統方法預測出更高的交互可能性。令人興奮的是,這些高預測區域中的許多在測試集中確實被驗證為真實的用戶興趣,證明了係統預測的準確性。

五、超參數調優與模型穩健性

研究團隊對REARM進行了細致的參數調優分析,這個過程就像是為一台精密儀器尋找最佳工作狀態。他們測試了多個關鍵參數對係統性能的影響,發現了一些有趣的規律。

用戶共現圖的權重調節就像是平衡兩種不同信息源的重要性。研究發現,純粹的用戶共現信息(權重為1)並不總是最優的,適當融入用戶興趣信息往往能帶來更好的效果。這個發現符合直覺:僅僅因為兩個用戶購買了相同的商品並不意味著他們的興趣完全一致,了解他們的深層興趣偏好能夠提供更準確的推薦。

商品共現圖的權重調節顯示了類似的模式。不同數據集的最優權重設置有所不同,這反映了不同商品類別的特性差異。體育用品數據集需要更高的權重設置,可能因為體育用品的搭配購買模式更加明顯,用戶往往會一次性購買多個相關商品。

元網絡中變換矩陣的秩參數調節就像是控製信息壓縮的程度。研究發現,體育用品數據集需要最大的矩陣秩(7),這可能因為該數據集擁有最多的交互數據,需要更大的模型容量來捕捉豐富的用戶行為模式。這個發現為實際應用提供了有價值的指導:數據越豐富的場景可能需要更複雜的模型結構。

圖神經網絡的層數選擇也展現了有趣的特點。與傳統研究中常用的2層設置不同,REARM在所有數據集上都需要3層以上的網絡深度才能達到最佳性能。研究團隊認為這與注意力機製的引入有關,注意力機製保留了更多有價值的信息,使得更深層的網絡能夠有效利用這些信息進行更複雜的推理。

六、理論基礎與技術創新

REARM的理論基礎建立在對多模態冗餘假設的深刻反思上。傳統的多模態對比學習基於這樣的假設:不同模態之間存在高度冗餘,大部分任務相關信息都是共享的,獨特信息很少且不重要。但研究團隊通過理論分析和實驗驗證發現,這個假設在推薦係統中往往不成立。

他們提出了一個新的理論框架,將任務相關信息分解為共享信息和獨特信息兩個部分,並分別進行優化。這種分解並非簡單的技術操作,而是基於對推薦任務本質的深入理解。在真實的購物場景中,用戶的決策往往既受到商品共同特征的影響(比如品牌聲譽、基本功能),也受到獨特特征的驅動(比如特殊的設計細節、個性化的功能)。

正交約束的理論基礎來自線性代數中的正交矩陣性質。當兩個矩陣正交時,它們的內積為零,這意味著它們包含的信息沒有重疊。研究團隊巧妙地將這個數學概念應用到特征學習中,通過軟正交約束來鼓勵不同模態保持信息的獨特性,同時允許一定程度的靈活性以適應實際應用的需要。

元網絡的設計靈感來自元學習的思想,即"學會如何學習"。在REARM中,元網絡不是學習固定的特征變換,而是學習如何根據不同的輸入動態生成最適合的變換規則。這種自適應性使得係統能夠處理各種不同類型的商品和用戶,而不需要為每種情況手動設計特定的處理策略。

七、實際應用價值與未來展望

REARM的技術創新在實際應用中具有廣泛的價值。對於電商平台來說,更準確的推薦能夠直接轉化為更高的用戶參與度和銷售轉化率。研究顯示的性能提升意味著用戶能夠更快找到心儀的商品,平台能夠更好地匹配用戶需求和商品供給。

從用戶體驗角度來看,REARM解決了傳統推薦係統的一個重要痛點:推薦結果的同質化。傳統係統往往傾向於推薦相似的商品,用戶容易感到推薦缺乏新意。而REARM通過保護模態獨特特征,能夠發現用戶可能感興趣但不太明顯的商品特點,從而提供更多樣化和個性化的推薦。

技術實現方麵,REARM的計算複雜度與傳統的圖神經網絡相當,這得益於元網絡中較小的矩陣秩設置和高效的圖結構處理。這種設計使得該方法在保持高性能的同時,具備了實際部署的可行性。

研究團隊在論文中也誠實地指出了當前方法的局限性。首先,REARM主要針對視覺和文本兩種模態進行了優化,對於音頻、視頻等其他模態的擴展還需要進一步研究。其次,該方法在冷啟動場景(新用戶或新商品)下的表現還有待驗證,這是推薦係統領域的共同挑戰。

未來的研究方向包括幾個有趣的方向。一是探索更多模態的融合,特別是在短視頻電商興起的背景下,如何有效利用視頻信息將成為重要課題。二是研究動態推薦場景,考慮用戶興趣和商品特征隨時間的演變。三是將REARM的理念擴展到其他需要多模態信息融合的任務中,如內容創作、智能客服等。

從更廣闊的視角來看,REARM代表了AI係統設計哲學的一種演進。它不再追求將所有信息標準化為統一形式,而是學會在保持多樣性的同時實現協同。這種思路不僅適用於推薦係統,也可能為其他AI應用領域提供啟發。

研究團隊已經將REARM的代碼開源,這為學術界和工業界的進一步研究和應用奠定了基礎。開源代碼的發布也體現了研究團隊對推動整個領域發展的責任感和貢獻精神。

總的來說,REARM不僅在技術上實現了突破,更重要的是提供了一種新的思考框架:如何在AI係統中平衡統一性和多樣性,如何在追求共性的同時保護個性。這種平衡藝術可能正是未來AI係統需要掌握的核心能力之一。對於希望深入了解這項研究的讀者,完整論文和實現代碼都可以通過前麵提到的鏈接獲取,為進一步的學習和實踐提供了寶貴資源。

Q&A

Q1:REARM框架主要解決了推薦係統的什麽問題?

A:REARM主要解決了傳統多模態推薦係統的兩大痛點:一是簡單的特征對比會引入噪聲並丟失有價值的獨特信息,就像隻看商品的共同標簽而忽略了個性化特點;二是對用戶興趣和商品關聯關係挖掘不充分,缺乏深層的行為模式分析。

Q2:元網絡和正交約束在REARM中起什麽作用?

A:元網絡就像一個智能質檢員,專門從模態共享特征中過濾噪聲,提取真正與推薦相關的信息。正交約束則像一個獨特性保護器,確保每種模態(如圖像、文本)的獨特價值信息在融合過程中不會丟失,讓係統既能識別共同喜好又能保留個性化偏好。

Q3:REARM相比其他推薦方法有多大的性能提升?

A:實驗顯示REARM在三個電商數據集上都顯著超越了現有最佳方法。例如在體育用品數據集上,Recall@20從之前最好的0.1139提升到0.1231,這意味著在20個推薦商品中,用戶真正感興趣的商品數量從約11個提升到超過12個,顯著改善了用戶體驗。

讚(2742)
未經允許不得轉載:>白日做夢網»悉尼科技大學:當AI學會分辨"共同喜好"與"獨特品味"