【論文閱讀】Equivariant Contrastive Learning for Sequential Recommendation
1. 來源
- 2023-RecSys
- https://github.com/Tokkiu/ECL
2. 介紹
對比學(xué)習(xí)(CL)有利于對具有信息性自我監(jiān)督信號的順序推薦模型的訓(xùn)練。
- 現(xiàn)有的解決方案應(yīng)用一般的順序數(shù)據(jù)增強策略來生成正對,并鼓勵它們的表示是不變的。
- 然而,由于用戶行為序列的固有屬性,一些增強策略,如項目替代,可能會導(dǎo)致用戶意圖的改變。對所有增強策略學(xué)習(xí)不加選擇的不變表示可能是次優(yōu)的。
因此,作者提出了順序推薦的等變對比學(xué)習(xí)(ECL-SR),它賦予SR模型具有強大的鑒別能力,使學(xué)習(xí)到的用戶行為表征對侵入性增強(例如,項目替代)敏感,而對輕度增強(例如,特征水平的退出掩蔽)不敏感。詳細(xì)地說,作者使用條件鑒別器來捕獲由于項目替代而導(dǎo)致的行為差異,這鼓勵了用戶行為編碼器與侵入性增強是等變的。在四個基準(zhǔn)數(shù)據(jù)集上的綜合實驗表明,所提出的ECL-SR框架與最先進的SR模型相比,具有具有競爭力的性能。
順序推薦的目的是通過從用戶與項目的交互序列中了解用戶的動態(tài)偏好,來預(yù)測給定用戶可能感興趣的下一個項目。順序推薦作為一種重要的推薦范式,在電子商務(wù)、社交媒體、視頻網(wǎng)站等多個Web服務(wù)領(lǐng)域中發(fā)揮著至關(guān)重要的作用。盡管近年來有了廣泛的研究和重大的進展,但順序推薦仍然面臨著一個重大的挑戰(zhàn):
- 數(shù)據(jù)的稀疏性。
這個問題的出現(xiàn)是因為,作為順序推薦基礎(chǔ)的用戶-項目交互數(shù)據(jù),與大量的用戶和項目,即數(shù)百萬個用戶或項目相比,通常是有限的。為了解決這一挑戰(zhàn),自監(jiān)督學(xué)習(xí)(SSL)近年來通過從原始用戶-項交互數(shù)據(jù)中挖掘自監(jiān)督信號來緩解數(shù)據(jù)稀疏性問題,從而引起了越來越多的關(guān)注。因此,近年來,各種研究通過將SSL納入順序推薦來開發(fā)更準(zhǔn)確的順序推薦系統(tǒng)。這些研究一般都集中于探索各種數(shù)據(jù)增強策略,以豐富和增強推薦系統(tǒng)的輸入數(shù)據(jù),從而提高其推薦性能。例如,
- S3Rec 是第一個利用項目掩蔽和裁剪技術(shù)來增強用戶的順序交互數(shù)據(jù),并為順序的模型預(yù)訓(xùn)練設(shè)計相應(yīng)的借口任務(wù)推薦。
- CL4SRec 應(yīng)用三種基于序列的操作來進行數(shù)據(jù)增強,以提高順序推薦的性能:項屏蔽、序列重新排序和序列裁剪。
- DuoRec 進一步結(jié)合了無監(jiān)督和有監(jiān)督的數(shù)據(jù)增強方法,以減輕順序推薦中的表示退化。
根據(jù)增強對象,現(xiàn)有的增強策略可以分為兩類:
- 序列級增強(如圖1(a)所示的項目裁剪)
- 特征級增強(如圖1(b)所示的輟學(xué))
前者直接作用于用戶-項目交互序列,而后者作用于潛在特征空間。直觀地說,序列級別上的增強更有可能導(dǎo)致顯著的語義轉(zhuǎn)移,即導(dǎo)致與原始用戶行為的意外偏差,因此作者將它們定義為“侵入性的”增強。相比之下,與序列級的增強相比,特征級別的增強對語義的影響更容易控制,因此特征級的增強被認(rèn)為是“溫和的”。這兩類增強在現(xiàn)有的對比學(xué)習(xí)框架中被不加區(qū)分地使用,它鼓勵學(xué)習(xí)到的用戶行為表示對增強策略引起的變化是不變的。在這里,“不變”是指從原始實例中學(xué)習(xí)到的代表,以及通過對比學(xué)習(xí)從相應(yīng)的增強實例中學(xué)習(xí)到的代表是相似的。然而,這種順序推薦的不變對比學(xué)習(xí)范式的基本原理仍需進一步研究。事實上,作者觀察到,使用侵入性增強策略從相同的原始實例中產(chǎn)生的不同的積極實例在語義上可能不是“相同的”。其主要原因是,
- 侵入性的增強方法,如項目裁剪、插入和替換,可能會打破原始用戶-項目交互序列中存在的項目之間的關(guān)鍵關(guān)聯(lián)。
- 例如,如圖1 (a)所示,當(dāng)作者將隨機項目裁剪應(yīng)用于用戶行為序列(即“智能手機耳機、口紅、襯衫、襪子、運動鞋”),這兩個產(chǎn)生了積極的實例(“智能手機、耳機、口紅”和“口紅、襯衫、襪子、運動鞋”)沒有相同的語義。前者主要關(guān)注數(shù)字產(chǎn)品,而后者主要關(guān)注服裝。由于短的交互序列的更脆弱,這個問題可能會變得更糟。
為了實證驗證上述觀察結(jié)果,作者研究了一種典型的不變對比學(xué)習(xí)(ICL),稱為CL4SRec 的方法,它的主要目的是學(xué)習(xí)由不同的增強策略生成的積極實例的不變表示。使用 CL4SRec 為骨干,作者比較了不同序列級(侵入性)增強和特征級(輕度)增強的不變對比學(xué)習(xí)的性能。
- 關(guān)于增強功能的詳細(xì)介紹可以在Sec 2.2中找到。
- 如圖1 ?所示,帶有附加特征級增強(黃條)的CL4SRec [50]的性能始終優(yōu)于基本模型(用虛線表示)。然而,當(dāng)CL4SRec中使用的特性級增強被序列級增強所取代時,性能(綠條)就不那么令人滿意了1。序列級的增強不能持續(xù)地提高推薦性能,有時甚至?xí)档屯扑]性能。實證研究表明,當(dāng)前的不變對比學(xué)習(xí)范式更適合于在特征水平上進行的輕度增強。
因此,一個自然的問題出現(xiàn)了:
- 作者如何構(gòu)建一個更可靠的對比學(xué)習(xí)框架,受益于溫和的特征級增強和侵入性的序列級增強,以進一步提高順序推薦的性能?
為了彌補這一重大差距,本文提出了一個新的框架,稱為順序推薦的等變對比學(xué)習(xí)(ECL-SR)。ECL-SR 能夠基于溫和的特征級增強和侵入性的序列級增強構(gòu)建強大的對比學(xué)習(xí),以學(xué)習(xí)更多的信息表示。ECL-SR 背后的核心思想是學(xué)習(xí)序列表示,可以識別侵入性序列級增強引起的差異的不變性,同時保留不變性學(xué)習(xí)。在數(shù)學(xué)上,ECL-SR 在一個統(tǒng)一的框架內(nèi)利用溫和的和侵入性的增強,以鼓勵對比學(xué)習(xí)的不變性和等方差特性來學(xué)習(xí)信息更豐富的表示。不變性使表征對非必要的變化不敏感,而等方差則鼓勵表征在響應(yīng)增強時發(fā)生可預(yù)測的變化。具體來說,ECL-SR分別通過對輕度增強和侵襲性增強采用對比性損失等預(yù)測損失來學(xué)習(xí)不變性和等方差。圖2說明了等變對比學(xué)習(xí)和不變約束學(xué)習(xí)之間的聯(lián)系。事實上,不變約束學(xué)習(xí)可以看作是等變對比學(xué)習(xí)的一種特殊情況,作者在第3.1節(jié)對此進行詳細(xì)討論。
在四個基準(zhǔn)數(shù)據(jù)集上的實驗表明,ECL-SR 有效地利用了溫和增強和等變對比學(xué)習(xí)的侵入性增強之間的互補性,優(yōu)于基本SR模型和基于不變對比學(xué)習(xí)的SR模型。此外,作者還探討了各種增強策略的有效性,以及ECL-SR中成分和超參數(shù)的影響。
作者的主要貢獻可以總結(jié)如下:
- 作者提出了ECL-SR框架,它有效地利用溫和和侵入性的增強來豐富用戶的行為表示。
- 作者進一步實例化了ECL-SR框架,將退出作為輕度增強,將掩蓋項目替代作為侵入性增強,說明了這兩種增強之間的協(xié)同效應(yīng)。
- 作者使用了一種生成器-鑒別器架構(gòu)來實現(xiàn)屏蔽項替代,并捕獲原始交互序列與其增強的對應(yīng)序列之間的用戶行為差異,從而促進了侵入性增強的等方差的學(xué)習(xí)。
- 作者在4個基準(zhǔn)SR數(shù)據(jù)集上進行了全面的實驗,證明了ECL-SR比經(jīng)典SR模型和最先進的基于對比學(xué)習(xí)的SR模型的優(yōu)勢。
3. 前置工作
3.1 序列推薦的目標(biāo)
3.2 數(shù)據(jù)增強策略
1)給定原始用戶序列 S u S_u Su?,可以采用幾種隨機序列級(侵入性)增強策略:
- 插入
- 它首先在
S
u
S_u
Su? 中隨機選擇一個位置,然后將從其他用戶的交互歷史中隨機選擇的一個項目插入到該位置中。該策略在序列上執(zhí)行多次,以生成一個增強版本。增強的例子可以表示為:
- 它首先在
S
u
S_u
Su? 中隨機選擇一個位置,然后將從其他用戶的交互歷史中隨機選擇的一個項目插入到該位置中。該策略在序列上執(zhí)行多次,以生成一個增強版本。增強的例子可以表示為:
- 刪除
- 它隨機刪除原始序列中的一個項目,并重新運行該操作,形成一個增廣序列:
- 它隨機刪除原始序列中的一個項目,并重新運行該操作,形成一個增廣序列:
- 替換
- 它從
S
u
S_u
Su? 中隨機選擇一部分項目被替換為 ????。???? 中的項目是從
S
u
S_u
Su? 的所有陰性樣本中隨機選擇的。替代比率根據(jù)經(jīng)驗設(shè)置為0.2。被替換序列的一個例子如下:
- 它從
S
u
S_u
Su? 中隨機選擇一部分項目被替換為 ????。???? 中的項目是從
S
u
S_u
Su? 的所有陰性樣本中隨機選擇的。替代比率根據(jù)經(jīng)驗設(shè)置為0.2。被替換序列的一個例子如下:
- 裁剪
- 它從
S
u
S_u
Su? 中隨機選擇一個從位置 ?? 到 ??+???? 的連續(xù)子序列,并刪除它。作物長度(????)由 ???? = ?? |
S
u
S_u
Su?| 定義,其中經(jīng)驗為??= 0.8。裁剪序列的一個例子如下所示:
- 它從
S
u
S_u
Su? 中隨機選擇一個從位置 ?? 到 ??+???? 的連續(xù)子序列,并刪除它。作物長度(????)由 ???? = ?? |
S
u
S_u
Su?| 定義,其中經(jīng)驗為??= 0.8。裁剪序列的一個例子如下所示:
- 重新排序
- 它從
S
u
S_u
Su? 的 ?? 到 ??+???? 位置隨機選擇一個連續(xù)的子序列,并對其進行洗牌。重排序的長度(????)由 ???? = ?? |
S
u
S_u
Su?| 定義,其中經(jīng)驗為??= 0.2。重新排序序列的一個例子如下圖所示:
- 它從
S
u
S_u
Su? 的 ?? 到 ??+???? 位置隨機選擇一個連續(xù)的子序列,并對其進行洗牌。重排序的長度(????)由 ???? = ?? |
S
u
S_u
Su?| 定義,其中經(jīng)驗為??= 0.2。重新排序序列的一個例子如下圖所示:
2)給定用戶表示 ???,可以應(yīng)用以下溫和的增強策略:
-
擾動
- 根據(jù)表示 ??? 得到隨機噪聲進行增強。形式上,給定在??維嵌入空間中的 ???,擾動操作可以通過以下方式實現(xiàn):
噪聲向量Δ受以下約束條件:
正如在SimGCL 中所闡述的,這些約束有助于控制 Δ 的大小和偏差 ???,這有助于保留來自原始表示的大部分信息,同時保持一些方差。注意,對于每一種表示,添加的隨機噪聲是不同的。
- 根據(jù)表示 ??? 得到隨機噪聲進行增強。形式上,給定在??維嵌入空間中的 ???,擾動操作可以通過以下方式實現(xiàn):
-
規(guī)范化
- 它直接在???上應(yīng)用規(guī)范化操作。該操作保留了原始表示的大部分信息,同時也以一種溫和的方式調(diào)整了整個表示空間,以生成正樣本。與此同時,它有助于減輕人氣流行偏見,正如之前的 NISER 所示。該操作的實施方式如下:
- 它直接在???上應(yīng)用規(guī)范化操作。該操作保留了原始表示的大部分信息,同時也以一種溫和的方式調(diào)整了整個表示空間,以生成正樣本。與此同時,它有助于減輕人氣流行偏見,正如之前的 NISER 所示。該操作的實施方式如下:
3.3 序列推薦的不變對比學(xué)習(xí)
在本節(jié)中,作者將描述現(xiàn)有的工作如何將不變對比學(xué)習(xí)應(yīng)用于順序推薦。這些方法背后的基本思想是引入一個輔助任務(wù)和一個CL損失(例如,InfoNCE 損失)來幫助挖掘自我監(jiān)督信號。具體來說,如圖2所示,不同的數(shù)據(jù)增強方法(侵入性或輕度,如Sec 1)應(yīng)用于原始序列以生成正視圖2。相應(yīng)地,來自不同序列的視圖被認(rèn)為是負(fù)的。然后,利用CL損失將正視圖拉近,將負(fù)視圖與嵌入空間分開。這從本質(zhì)上鼓勵了用戶序列編碼器對各種數(shù)據(jù)增強方法不敏感,從而導(dǎo)致更一般化的用戶行為表示。推薦任務(wù)和輔助任務(wù)通常聯(lián)合訓(xùn)練如下:
4. 方法介紹
4.1順序推薦的等變對比學(xué)習(xí)
基于不變對比學(xué)習(xí)的SR方法鼓勵所有對用戶序列增強方法不敏感的表示。其有效性的一個關(guān)鍵前提是,所選擇的增強方法只在原始序列中引入非必要的變化,而不改變語義。
- 然而,一些侵入性增強方法,如隨機作物和替代,容易違反這一前提,從而影響不變對比學(xué)習(xí)對SR的有效性。
在本文中,作者提出訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)來敏感地檢測由侵入性增強引起的差異。為了實現(xiàn)這一點,作者將不變對比學(xué)習(xí)推廣到SR的等變對比學(xué)習(xí)(ECL)中。作者在圖2中展示了該框架的高級結(jié)構(gòu)。上部用于學(xué)習(xí)輕度增強的不變性,下部分用于預(yù)測學(xué)習(xí)等方差的侵入性增強。
等變的概念可以定義為:
??∈??是一組侵入性數(shù)據(jù)增強方法,T??(????)表示的函數(shù)??增強輸入用戶交互序列????,????用戶行為編碼器編碼動態(tài)用戶興趣行為表示????(????),和T??”表示一個固定的轉(zhuǎn)換3。值得注意的是,ICL方法本質(zhì)上是ECL-SR的一個子例,其中標(biāo)識函數(shù)用于T??‘,因此,
最后,ECL-SR對用戶序列????的優(yōu)化目標(biāo)如下4:
其中,???1??和???2??是使用溫和增強方法生成的兩個積極視圖;??從侵入性增強方法中采樣;????(·)表示識別侵入性增強的預(yù)測頭;??和??是平衡超參數(shù)的。L??????的目標(biāo)是使用預(yù)測頭部輸出????(????(T??(????)))來預(yù)測侵入性增強??,這鼓勵共享編碼器與侵入性增強等變。
在下面的章節(jié)中,作者將詳細(xì)解釋ECL-SR框架以及如何實現(xiàn)它。圖3顯示了實例化的ECL-SR的總體結(jié)構(gòu),它由三個主要組件組成:
- 用戶行為編碼器(UBE)
- 生成器(G)
- 條件鑒別器(CD)。
UBE的主要目標(biāo)是從用戶交互中捕獲關(guān)鍵模式,并向用戶推薦最合適的項目。
- 作者在UBE中引入了ICL,它有助于學(xué)習(xí)不變的特征以進行溫和的增強。鼓勵使用G和CD來學(xué)習(xí)等方差。
- 在實現(xiàn)中,作者用SASRec(分別為????(·)和??D(·))實例化 UBE 和 CD,G與BERT4Rec(分別為??G(·)),它由幾個堆疊的自注意塊組成。
- 基于之前的研究,作者分別選擇退出掩蔽和項目替代作為輕度和侵入性增強的例子。
- 作者還進行了綜合性的實驗,并分析該框架中更多的增強組合。
4.2 輕度增強的學(xué)習(xí)不變性
為了鼓勵從 UBE 生成的表征對輕度增強不敏感,作者對UBE采用了不變對比學(xué)習(xí),如圖3的左分支所示。具體來說,作者通過應(yīng)用特征級的輟學(xué)屏蔽作為默認(rèn)的輕度增強來生成正實例 ??+??。該批次中的其他樣品被視為陰性實例。首先,利用用戶行為序列 ???? 的潛在表示 h????=????({??????}????=1),受前人的啟發(fā),作者取最后一個??表示的平均值,得到一個聚合表示h??與窗口大小??如下:
類似地,作者使用相同的策略來獲得 ??+?? 的聚合表示 h+??。然后采用InfoNCE損失將正實例更近,將負(fù)實例推到語義空間中,可以表示為:
其中,??(??)為包含??的小批處理中的用戶,??????(·,·)為余弦相似度函數(shù),??為溫度。
4.3 侵入式增強的學(xué)習(xí)等變性
預(yù)測侵入性增強的一個簡單解決方案是在方程3中使用一個簡單的線性層作為預(yù)測頭????(·),當(dāng)被破壞的序列容易重構(gòu)時,這可能是次優(yōu)的。為了提高模型學(xué)習(xí)等方差的能力,作者采用了一種受啟發(fā)的生成器-鑒別器結(jié)構(gòu)來獲得硬侵入性增廣視圖。
生成器的目標(biāo)是產(chǎn)生“硬”正序列,與原始序列相比有微小的差異,而鑒別器的目標(biāo)是準(zhǔn)確地檢測到由生成器引入的最輕微的變化。為此,采用替換項目檢測損失(RIDL)作為預(yù)測損失關(guān)于掩碼項目的替代,以促進等方差的學(xué)習(xí)。下面是一個如何學(xué)習(xí)使用生成器-鑒別器結(jié)構(gòu)的項目替換的等方差的例子:
- 給定一個用戶行為序列 ????=[????1,????2,……,??????],作者首先用掩碼比率 ?? 隨機屏蔽 ???? 的幾個項目。掩蔽的交互序列可以表示為??‘??=????·????,其中 ???? =[????1,????2,…,??????]和 ?????? ∈{0,1}。
- 然后,作者使用 BERT4Rec [40]作為生成器 ??G(·),恢復(fù)??‘?? 中的隨機掩碼項,以獲得部分替換的用戶交互序列 ????’‘=??G(??’??)。利用該方法,作者構(gòu)造了具有較小語義擾動的假交互序列,這對鑒別器正確識別被替代的條目提出了挑戰(zhàn)。生成器接受的訓(xùn)練帶有以下?lián)p失:
其中,?????? 是??‘??中的掩蔽項集合,????* 表示掩蔽項 ???? 的地面真實項,??(·)是與式1相同的函數(shù)。 - 條件鑒別器(CD)的目的是針對UBE h????=????({??????}????=1)的輸出表示作為條件,執(zhí)行替換項目檢測(RID)任務(wù)。通過這種方式,CD的梯度傳播回UBE,這鼓勵UBE生成更多信息的用戶行為表示,因此CD可以區(qū)分????和????之間的微小差異。在作者的實現(xiàn)中,作者使用SASRec [24]塊和一個額外的MLP層來實例化CD(表示為??D(·))。作者使用連接等聚合函數(shù)將條件信息注入到區(qū)分建模過程中。對于用戶序列中的每個項,CD需要預(yù)測它是否已被替換。作者計算交叉熵?fù)p失如下:
其中,w是一個可學(xué)習(xí)的參數(shù)矩陣,??表示s型函數(shù),??????‘’∈????‘’。
為什么所提出的ECL-SR可以實現(xiàn)等方差?
- 等變性是當(dāng)一個群變換T??應(yīng)用于輸入序列????時,得到的輸出特征也經(jīng)過相應(yīng)的變換T??‘。
- 在ECL-SR,等變性是因為設(shè)計生成器和條件鑒別器可以鼓勵用戶行為編碼器檢測語義變化(即區(qū)別T??(????)和原始序列????)造成的侵入性增強而不是忽略它們,理論上支持最近的工作在計算機視覺。需要注意的是,我們提出的 ECL-SR 不同于之前關(guān)于變性的工作,因為它只通過選擇損失函數(shù)RIDL來鼓勵等變性質(zhì),而不是強制執(zhí)行嚴(yán)格的等變性。為此,ECL-SR將每種類型的侵入性增強視為一個組,并使用一個條件鑒別器來預(yù)測輸入序列中的增強(例如,項目替代)的存在。
4.4 優(yōu)化
4.4.1 模型訓(xùn)練和推理
-
在訓(xùn)練階段,項目嵌入是跨所有三個模塊共享的。用戶行為編碼器和鑒別器的參數(shù)(除了RID的額外線性層外)也被共享,以避免過擬合。ECL-SR模型的所有組件都以端到端的方式進行訓(xùn)練。因此,對整個ECL-SR框架采用組合損失函數(shù)進行了優(yōu)化:
其中,??·控制每個輔助損失的貢獻。 -
在推理階段,作者同時去除生成器和條件鑒別器,只使用UBE來完成下一個項目預(yù)測任務(wù)。
4.4.2 模型復(fù)雜度
模型復(fù)雜度實例化的ECLSR的復(fù)雜性來自于3個部分:
- 用戶行為編碼器(UBE)
- 生成器(G)
- 條件鑒別器(CD)。
它們都共享相同的嵌入表,其中包含了大部分參數(shù)。UBE+CD的復(fù)雜性接近于SASRec,因為它們的參數(shù)被共享,以提高訓(xùn)練的穩(wěn)定性和效率。G的復(fù)雜性仍然接近于BERT4Rec 。因此,ECL-SR的整體復(fù)雜性與SASRec結(jié)合BERT4Rec(共享嵌入表)的復(fù)雜性相當(dāng)。為了確保與SASRec相似的計算效率,作者保持UBE和G的總層數(shù)與實驗中使用的其他自注意方法相同。此外,為了最小化計算開銷,作者固定了10個時代訓(xùn)練后G的參數(shù)。在推理過程中,ECL-SR的速度與SASRec相當(dāng),因為只使用了UBE。作者在Tab 4中總結(jié)了模型復(fù)雜度的比較。
5. 實驗
5.1 數(shù)據(jù)集
5.2 總的結(jié)果
5.3 時間復(fù)雜度分析
更多實驗參考原文。文章來源:http://www.zghlxwxcb.cn/news/detail-799714.html
6. 總結(jié)
在本文中,作者提出了ECL-SR框架,它有效地利用溫和的和侵入性的增強來增強用戶的行為表示。具體地說,作者引入了一個條件鑒別器來捕獲原始交互序列與其編輯版本之間的用戶行為差異,這已被證明是一個有用的目標(biāo),鼓勵用戶行為編碼器是等變的屏蔽項目替代增強。作者在四個基準(zhǔn)SR數(shù)據(jù)集上的實驗證明了ECL-SR的有效性,與經(jīng)典SR模型和基于不變對比學(xué)習(xí)的SR模型相比,它具有良好的性能。在未來,作者計劃探索更多使用ECL-SR框架的數(shù)據(jù)增強方法的組合。文章來源地址http://www.zghlxwxcb.cn/news/detail-799714.html
到了這里,關(guān)于【論文閱讀】Equivariant Contrastive Learning for Sequential Recommendation的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!