国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì)

這篇具有很好參考價(jià)值的文章主要介紹了京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

導(dǎo)讀

搜索系統(tǒng)中容易存在頭部效應(yīng),中長尾的優(yōu)質(zhì)商品較難獲得充分的展示機(jī)會(huì),如何破除系統(tǒng)的馬太效應(yīng),提升展示結(jié)果的豐富性與多樣性,助力中長尾商品成長是電商平臺(tái)搜索系統(tǒng)的一個(gè)重要課題。其中,搜索EE系統(tǒng)在保持排序結(jié)果基本穩(wěn)定的基礎(chǔ)上,通過將優(yōu)質(zhì)中長尾商品穿插至排序結(jié)果中將優(yōu)質(zhì)商品動(dòng)態(tài)展示給用戶,提升用戶體驗(yàn)與搜索結(jié)果豐富性,是破除馬太效應(yīng)的一大助力。

本文將從搜索EE近期的全量迭代出發(fā),展現(xiàn)其鏈路演進(jìn)的整體脈絡(luò),包含:EE自適應(yīng)動(dòng)態(tài)探測(cè)模型——EE場(chǎng)景建模方式升級(jí)——打分與穿插兩階段一致性升級(jí)——探測(cè)與自然流量全局聯(lián)動(dòng)優(yōu)化四個(gè)階段,梳理對(duì)搜索EE的思考與下一步迭代方向。

全文目錄:

1. EE自適應(yīng)動(dòng)態(tài)探測(cè)模型

2. EE場(chǎng)景建模方式升級(jí)

3. 打分與穿插兩階段一致性升級(jí)

4. 感知上下文的品牌店鋪維度探測(cè)

5. 總結(jié)與展望

一、EE自適應(yīng)動(dòng)態(tài)探測(cè)模型

傳統(tǒng)EE模型從商品曝光置信度、打分置信度等角度出發(fā),決策EE商品的展示位置以及穿插位置,較少從用戶瀏覽意圖與探索意愿的差異化角度,來考量探測(cè)力度。其可能導(dǎo)致用戶在寬泛瀏覽與挑選商品時(shí),缺少豐富的商品選擇,在決策購買時(shí)反而穿插了探索商品的誤判情景,影響用戶的搜索體驗(yàn),不能充分發(fā)揮搜索EE系統(tǒng)的探索和利用(Explore & Exploit)兩大能力。

針對(duì)以上探測(cè)錯(cuò)配情況,可嘗試在EE模型中顯式建模用戶的“逛”、“買”探索偏好,進(jìn)一步結(jié)合偏好,自適應(yīng)調(diào)整搜索EE的利用與探索力度。對(duì)于偏“逛”用戶增強(qiáng)EE探索力度,提供更豐富的探索展示;對(duì)于購買意愿明顯的用戶,提供更直接的購買選擇。通過對(duì)用戶探索偏好的顯式建模,能夠在提升用戶的轉(zhuǎn)化效率的同時(shí)提升搜索結(jié)果豐富性。

1.自適應(yīng)探索模型優(yōu)化

相較于原有EE模型,自適應(yīng)探索對(duì)EE模型的自適應(yīng)探索能力進(jìn)行了升級(jí),主要體現(xiàn)在如下三點(diǎn):(1)對(duì)用戶探索偏好進(jìn)行差異化建模:“逛” "買"用戶提供動(dòng)態(tài)差異化探測(cè)力度,在轉(zhuǎn)化效率和搜索豐富性中取得平衡。(2)以用戶瀏覽深度為子任務(wù)建模到EE模型中:以瀏覽深度作為用戶意愿的重要指標(biāo),并建模到EE模型中,顯式增強(qiáng)模型對(duì)用戶瀏覽意愿的感知。(3)提升模型對(duì)探索性特征利用性:對(duì)探索偏好的顯式建模,提升探索性特征在模型中的學(xué)習(xí)權(quán)重,在EE過程中對(duì)探索特征進(jìn)行充分利用。

2.方案實(shí)踐

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

為了增強(qiáng)EE模型的自適應(yīng)探索能力,針對(duì)原有EE模型進(jìn)行如下升級(jí):

(1)探索偏好網(wǎng)絡(luò)Explore-Net

在保持原有的EE模型主網(wǎng)絡(luò)Exploit-Net基礎(chǔ)上,添加了探索偏好網(wǎng)絡(luò)Explore-Net(圖中左下綠色部分),提升模型對(duì)用戶探索意圖的差異化建模。

①輸入特征優(yōu)化

考慮到用戶的探索意圖只與個(gè)人特性、搜索詞相關(guān),因此Explore-Net的輸入特征僅使用用戶側(cè)、Query側(cè)中相關(guān)特征。

為進(jìn)一步度量特征與探索偏好的關(guān)聯(lián)性,統(tǒng)計(jì)不同瀏覽深度下各特征的分布差異,剔除了未與瀏覽深度明顯相關(guān)特征,如搜索詞長度等,精簡(jiǎn)特征空間提升預(yù)估精度。

②模型顯性建模

EE原模型的輸入中包含探索性特征,但在進(jìn)行搜索排序任務(wù)中易被其他特征掩蓋導(dǎo)致利用率不強(qiáng),在探索偏好建模中顯式構(gòu)建了探索偏好網(wǎng)絡(luò)Explore-Net,對(duì)用戶探索意圖進(jìn)行獨(dú)立建模構(gòu)建,增強(qiáng)探索性特征的重要性。

優(yōu)化后的EE模型具有Exploit-Net與Explore-Net雙塔結(jié)構(gòu),Exploit-Net對(duì)商品進(jìn)行精準(zhǔn)化打分,對(duì)候選商品進(jìn)行充分利用;Explore-Net對(duì)用戶探索意愿進(jìn)行建模,根據(jù)用戶偏好動(dòng)態(tài)調(diào)整探索力度,共同構(gòu)成商品探索與利用的完整機(jī)制。

(2)用戶瀏覽深度回歸任務(wù)構(gòu)建

在原有的訓(xùn)練過程基礎(chǔ)上,添加了用戶瀏覽深度回歸任務(wù)(圖中左上紅色部分),提升模型對(duì)用戶瀏覽意愿的感知性,增強(qiáng)EE模型的自適應(yīng)探索能力。

①輔助任務(wù)選擇

瀏覽深度作為用戶瀏覽意愿的直觀體現(xiàn),表現(xiàn)了用戶的探索意愿,因此使用瀏覽深度預(yù)估任務(wù)作為模型訓(xùn)練的輔助任務(wù),對(duì)用戶偏好進(jìn)行顯式建模。

在輔助任務(wù)類型的考量上,綜合考慮了將瀏覽深度劃分不同區(qū)間進(jìn)行預(yù)測(cè)的分類任務(wù),以及對(duì)瀏覽深度的回歸任務(wù)。在實(shí)驗(yàn)中分類任務(wù)體現(xiàn)出較為明顯的頭尾傾向性,輸出值分布不均勻,實(shí)踐中最終選用了回歸任務(wù)作為輔助任務(wù)。

②回歸任務(wù)設(shè)計(jì)

在樣本數(shù)據(jù)分析中,發(fā)現(xiàn)用戶的瀏覽深度差異化極大。為了平衡瀏覽深度的差異,保障模型輸出值的均勻性與差異性,對(duì)瀏覽深度標(biāo)簽進(jìn)行了log平滑放縮,并選用RMSE-loss作為輔助任務(wù)的損失函數(shù)對(duì)瀏覽深度任務(wù)進(jìn)行構(gòu)建。

在模型訓(xùn)練中頭尾樣本相對(duì)較少,對(duì)過淺和過深的兩類樣本預(yù)測(cè)準(zhǔn)確性偏低。為平衡樣本間差異,在損失函數(shù)的樣本權(quán)重設(shè)計(jì)中,對(duì)由淺到深相應(yīng)樣本,其權(quán)重為先減小后增大的 “凹形”權(quán)重,平衡頭尾和腰部樣本的準(zhǔn)確性。

(3)Explore-Net與主網(wǎng)絡(luò)的二次融合

Explore-Net 和 Exploit-Net 進(jìn)行了融合(圖中中上紅色部分),增強(qiáng)模型整體對(duì)探索性特征的利用,提升EE隱層embedding豐富性,對(duì)探索偏好較強(qiáng)的用戶提升了不確定性打分,提升探索商品的范圍和豐富度。

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

①特征融合

由于在用戶瀏覽深度回歸任務(wù)上對(duì)用戶的探索偏好進(jìn)行了顯式建模,Explore-Net的輸出embedding對(duì)探索性特征進(jìn)行了高維抽取,能夠?qū)τ脩羝眠M(jìn)行自適應(yīng)建模。

為讓探索偏好特征更好地參與到整體任務(wù)訓(xùn)練中,平衡打分的精準(zhǔn)性與差異化,將Explore-Net的深層表征與Exploit-Net的深層表征進(jìn)行拼接融合,提升EE模型隱層embedding的豐富性和表征能力,提升模型打分能力。

②不確定性預(yù)估融合

用戶的探索偏好與商品的不確定性預(yù)估有直接的相關(guān)關(guān)聯(lián)。對(duì)于探索意圖較強(qiáng)的用戶,提升商品打分的不確定性,助力更豐富的商品穿插到搜索結(jié)果中,反之亦如此。因此在不確定性預(yù)估模塊中,設(shè)計(jì)在探索表征層面進(jìn)行融合。

在不確定性預(yù)估(SVGP)模塊中,將瀏覽深度回歸網(wǎng)絡(luò)輸出值與方差預(yù)估部分進(jìn)行了二次融合,對(duì)于探索偏好較強(qiáng)的用戶,顯式強(qiáng)化了商品不確定性打分,提升探索力度。

3.升級(jí)效果

(1)探索利用效果分析

①EE模型打分結(jié)果分析:

在相同的預(yù)測(cè)集上,統(tǒng)計(jì)了平均打分探測(cè)力度隨瀏覽深度變化情況

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

結(jié)論:相比原模型,自適應(yīng)探索模型的平均探測(cè)力度,隨瀏覽深度增大而逐漸增大,體現(xiàn)出session維度的顯著差異化。

②EE實(shí)驗(yàn)位下穿插商品位置分析:

在各實(shí)驗(yàn)位下,統(tǒng)計(jì)平均插入位置與瀏覽深度的變化情況。

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

結(jié)論:Test桶結(jié)果,隨著瀏覽深度增大,商品的平均插入位置相比原模型有所前移,探索力度增強(qiáng)。

核心結(jié)論:通過以上對(duì)探索利用的效果分析,自適應(yīng)探索模型符合設(shè)計(jì)預(yù)期,在瀏覽深度較低的session下插入商品較少,探索力度較弱;在瀏覽深度較深的session下,EE模型的探索意愿更強(qiáng),模型探索力度更大,穿插商品位置有所前移。

(2)線上效果

保持搜索效率持平的情況下,EE核心指標(biāo)提升明顯并全量上線,流動(dòng)性、探索成功率提升近 0.5%。

商品建模方式思考:

差異化建模用戶探索意圖后,EE模塊實(shí)現(xiàn)了對(duì)不同用戶自適應(yīng)調(diào)整探索并取得了一定收益。用戶側(cè)建模方式優(yōu)化后,對(duì)商品側(cè)建模方式進(jìn)行升級(jí)改造,將是進(jìn)一步提升EE探測(cè)模型的合理切入點(diǎn)。

二、EE場(chǎng)景建模方式升級(jí)

原主網(wǎng)絡(luò)建模方式為點(diǎn)擊率單任務(wù),點(diǎn)擊作為轉(zhuǎn)化的前置行為,建模點(diǎn)擊行為實(shí)現(xiàn)對(duì)潛力中長尾的探索助力。同時(shí)在實(shí)踐中,通過樣本label進(jìn)行動(dòng)態(tài)權(quán)重調(diào)整,隱式建模轉(zhuǎn)化屬性,兼顧轉(zhuǎn)化效率。

僅建模點(diǎn)擊對(duì)高轉(zhuǎn)化屬性商品并不友好,同時(shí)是對(duì)標(biāo)題黨行為的潛在鼓勵(lì),和EE模塊優(yōu)化整體生態(tài)環(huán)境、打造搜索長期價(jià)值的初衷有所偏差。因此升級(jí)思路不再局限于僅關(guān)注曝光后獲得點(diǎn)擊這一前置鏈路行為,而是對(duì)整體轉(zhuǎn)化鏈路進(jìn)行建模,關(guān)注商品的多維度屬性。

1.EE場(chǎng)景建模方式優(yōu)化

在原有基礎(chǔ)上引入轉(zhuǎn)化行為的顯式建模任務(wù),將主網(wǎng)絡(luò)結(jié)構(gòu)從點(diǎn)擊單任務(wù)升級(jí)為點(diǎn)擊轉(zhuǎn)化多任務(wù),以多任務(wù)方式增強(qiáng)不同行為的建模質(zhì)量,實(shí)現(xiàn)對(duì)商品的更全面、更準(zhǔn)確建模。

2.方案實(shí)踐

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

在EE自適應(yīng)探索機(jī)制基礎(chǔ)上,EE場(chǎng)景建模方式升級(jí)對(duì)原有模型進(jìn)行了如下優(yōu)化與升級(jí):

(1)SVGP模塊交互方案設(shè)計(jì)

原模型中主網(wǎng)絡(luò)和輔助模塊在SVGP模塊中交互,新版方案中輔助任務(wù)是否需要與SVGP模塊進(jìn)行交互? 即隨機(jī)高斯過程是否需要同樣作用于建模轉(zhuǎn)化任務(wù),是方案設(shè)計(jì)首要考慮的問題。

具體實(shí)驗(yàn)中,發(fā)現(xiàn)SVGP會(huì)導(dǎo)致收斂后AUC指標(biāo)在千分位級(jí)別降低,即其在引入不確定性功能的同時(shí),會(huì)輕微降低模型效果??紤]到目前SVGP模塊已帶來所需的探索能力,難以通過多SVGP堆疊方式帶來收益。因此升級(jí)方案選擇將輔助任務(wù)構(gòu)建成純凈任務(wù),其僅建模商品屬性而不構(gòu)建對(duì)應(yīng)的SVGP模塊。

(2)多任務(wù)網(wǎng)絡(luò)框架實(shí)現(xiàn)

EE探測(cè)線上耗時(shí)較低,建模方式升級(jí)后需延續(xù)這一目標(biāo)。雖然主流多任務(wù)結(jié)構(gòu)MMOE性能更為優(yōu)越,但線上耗時(shí)將有增加風(fēng)險(xiǎn),因此選擇更輕量級(jí)的share bottom方式,在基本不增加線上耗時(shí)的情況下完成多任務(wù)建模。升級(jí)方案把多任務(wù)被設(shè)計(jì)為雙任務(wù)模型,使用低層網(wǎng)絡(luò)進(jìn)行表征抽取,在高層維度使用兩個(gè)tower分別建模主任務(wù)和輔助任務(wù)。

①任務(wù)組合選取

選擇雙任務(wù)為ctr任務(wù)+ctcvr任務(wù),考慮到點(diǎn)擊樣本比訂單樣本更豐富, ctr正樣本更多,對(duì)于需要大量引導(dǎo)點(diǎn)的SVGP模塊更為友好。同時(shí)點(diǎn)擊相對(duì)購買行為的不確定性更高,在點(diǎn)擊預(yù)測(cè)上引入不確定性打分更為合理,因此將ctr作為主任務(wù)、ctcvr為輔助任務(wù)進(jìn)行配置。

②模型結(jié)構(gòu)迭代

前述迭代過程中模型結(jié)構(gòu)如圖中間所示,低層網(wǎng)絡(luò)編碼輸入信息后使用兩個(gè)淺層tower分別學(xué)習(xí)不同任務(wù), 該結(jié)構(gòu)潛在缺點(diǎn)為一方面可能導(dǎo)致低層網(wǎng)絡(luò)梯度被某個(gè)任務(wù)主導(dǎo)(例如ctr任務(wù)),另一方面上層tower過淺可能導(dǎo)致任務(wù)學(xué)習(xí)不夠充分。

進(jìn)一步探索僅共享特征、增加任務(wù)tower深度的網(wǎng)絡(luò)結(jié)構(gòu)。在多任務(wù)分?jǐn)?shù)融合方式相同的情況下,新結(jié)構(gòu)線上表現(xiàn)更佳,因此最終結(jié)構(gòu)如上圖最右所示,使用較深的tower head建模各自任務(wù),彼此間僅共享特征。

③融合方式迭代

上述模型在離線指標(biāo)上取得了不錯(cuò)的收益且線上表現(xiàn)更優(yōu),但遇到了大盤效率和EE相關(guān)指標(biāo)無法同時(shí)提升的問題。分析梳理現(xiàn)有方案實(shí)驗(yàn)后,認(rèn)為目前多任務(wù)融合方式相對(duì)樸素、存在改善提升空間。

選取帶權(quán)相加、直接相乘和冪次指數(shù)相乘三種方式。由于缺乏合適的理論量化分析工具,因此選擇從實(shí)驗(yàn)結(jié)果出發(fā)選取最優(yōu)融合方式和融合系數(shù),為此開發(fā)了離線融合尋參模塊,將predict時(shí)各head打分結(jié)果保存后,通過網(wǎng)格搜索方式選取最優(yōu)參數(shù)。

通過在多組數(shù)據(jù)上遍歷尋優(yōu)確定不同融合方式的最優(yōu)系數(shù),并基于此開展線上實(shí)驗(yàn)選取表現(xiàn)最優(yōu)方式,最終我們選取帶權(quán)相加方式,在EE指標(biāo)提升的同時(shí)保持大盤效率指標(biāo)持平。

3.升級(jí)效果

(1)模型建模升級(jí)效果分析

①EE模型打分區(qū)分度分析:

在相同的預(yù)測(cè)集上,統(tǒng)計(jì)了離線打分分布情況

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

結(jié)論:分布由橙色線條(原版)變?yōu)樗{(lán)色線條(升級(jí)后版本),整體更加平緩,保證不同商品彼此更具備區(qū)分度。

②EE探測(cè)次數(shù)分析:

統(tǒng)計(jì)線上打分分布情況,對(duì)線上探測(cè)情況進(jìn)行分析

結(jié)論:橫軸為曝光數(shù)量大于等于N,縱軸為distinct sku數(shù)量,下圖表明模型升級(jí)后在僅探索一次的dst sku數(shù)量上有所下降,減少偏隨機(jī)的一次性探測(cè),但在多次探索商品上有所提升,表明test更傾向于探索中腰部商品。

(2)線上效果

搜索效率持平情況下,流動(dòng)性指標(biāo)、探索成功率提升顯著并全量上線。

鏈路一致性思考:

完成EE打分模型優(yōu)化后,能夠一定程度實(shí)現(xiàn)探索力度隨用戶探索意愿的動(dòng)態(tài)調(diào)整。但從整體EE鏈路上看 (候選集生成 → EE打分 → 動(dòng)態(tài)展示),EE動(dòng)態(tài)穿插決策與打分階段相互獨(dú)立,其結(jié)果由一個(gè)xgb回歸模型決定,兩個(gè)階段的聯(lián)動(dòng)關(guān)系和一致性程度弱。如何跟隨用戶瀏覽意愿,將 EE打分→ 動(dòng)態(tài)展示 兩個(gè)環(huán)節(jié)能夠同步、一致性地調(diào)整,是進(jìn)一步的優(yōu)化方向。

三、打分與穿插端到端一致性升級(jí)

打分與穿插展示兩個(gè)階段一致性未能對(duì)齊,可能導(dǎo)致激進(jìn)的模型打分無法匹配上豐富的穿插展示,無法同步放大EE的探測(cè)效果。此外,兩個(gè)階段分別由兩個(gè)模型獨(dú)立控制,也增加了維護(hù)和迭代成本。

面對(duì)此一致性問題,升級(jí)了端到端打分與穿插方案。EE模型中建模的用戶瀏覽意圖,不僅影響EE探測(cè)的力度大小,也同時(shí)決定動(dòng)態(tài)穿插展示的策略強(qiáng)弱。兩階段的決策過程端到端實(shí)現(xiàn),將流量進(jìn)行更合理分配,寬泛意圖的用戶能夠達(dá)到探測(cè)更激進(jìn)、穿插更多的共振。

1.端到端動(dòng)態(tài)穿插機(jī)制優(yōu)化點(diǎn)

端到端動(dòng)態(tài)穿插機(jī)制在原有自適應(yīng)探索基礎(chǔ)上,升級(jí)點(diǎn)主要體現(xiàn)在如下三點(diǎn):

(1)瀏覽深度預(yù)估精準(zhǔn)度升級(jí):在EE探索偏好建模網(wǎng)絡(luò)Explore-net基礎(chǔ)上,提升瀏覽深度預(yù)測(cè)精準(zhǔn)度。

(2)EE流量精準(zhǔn)化分配:根據(jù)session瀏覽深度分布,動(dòng)態(tài)分配各深度下穿插商品量,提升EE穿插商品占比調(diào)控可操作性。

(3)模型打分與動(dòng)態(tài)穿插數(shù)量端到端一致性增強(qiáng):采用EE主模型的瀏覽深度,映射得到當(dāng)前session下穿插商品數(shù)量,端到端解決EE穿插商品數(shù)量與EE商品打分兩個(gè)任務(wù),提升兩階段一致性。

2.方案實(shí)踐

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

在EE自適應(yīng)探索機(jī)制基礎(chǔ)上,端到端動(dòng)態(tài)穿插機(jī)制對(duì)原有動(dòng)態(tài)穿插機(jī)制進(jìn)行了如下優(yōu)化與升級(jí):

(1)動(dòng)態(tài)穿插機(jī)制端到端建模

①瀏覽深度預(yù)估任務(wù)優(yōu)化

瀏覽深度代表了用戶在session下的瀏覽意愿,是EE流量進(jìn)行合理分配的基礎(chǔ)性指標(biāo)。在不同瀏覽深度的session下,匹配適合數(shù)量的EE商品能在保障效率的前提下提升搜索結(jié)果豐富性。

進(jìn)一步優(yōu)化了自適應(yīng)探索模型中Explore-Net對(duì)瀏覽深度預(yù)估子任務(wù)的準(zhǔn)確性,對(duì)其輸出的瀏覽深度預(yù)估值進(jìn)行評(píng)估,其準(zhǔn)度明顯高于原有xgb模型,可以對(duì)原有xgb模型進(jìn)行替換。

②端到端建模瀏覽深度與模型打分

自適應(yīng)探索實(shí)驗(yàn)中使用Explore-Net對(duì)模型打分進(jìn)行差異化探索,其中的瀏覽深度預(yù)估任務(wù)可以沿用到穿插商品數(shù)量任務(wù)中,使模型具有端到端建模兩個(gè)子任務(wù)的能力。

(2)合理設(shè)計(jì)瀏覽深度與穿插商品數(shù)量映射

在準(zhǔn)確預(yù)估瀏覽深度的情況下,通過將瀏覽深度預(yù)估值映射到穿插數(shù)量中,保障穿插數(shù)量與模型打分一致性,在更深的session下有更多的商品穿插數(shù)量和更強(qiáng)的探測(cè)力度。

3.升級(jí)效果

(1)動(dòng)態(tài)穿插效果分析

①瀏覽深度預(yù)測(cè)準(zhǔn)度分析:

對(duì)比兩模型的瀏覽深度預(yù)估準(zhǔn)確性,使用均方根對(duì)數(shù)誤差(Root Mean Squared Logarithmic Error, RMSLE)指標(biāo)進(jìn)行衡量

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

結(jié)論:在同樣的驗(yàn)證集下,Explore-net模型的預(yù)估精度明顯優(yōu)于原模型。

②探索打分、動(dòng)態(tài)穿插一致性效果分析:

檢查各瀏覽深度下base與test兩個(gè)機(jī)制下各瀏覽深度下預(yù)設(shè)的插入商品曲線和穿插商品數(shù)量分布圖。

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

結(jié)論:

  • 比較藍(lán)色(test)與黃色(base)兩根實(shí)線,在較淺的session下,新舊機(jī)制穿插商品數(shù)量基本持平;在較深的session下,新機(jī)制相較于舊機(jī)制插入商品數(shù)量更多,體現(xiàn)了探索較強(qiáng)時(shí)新的穿插機(jī)制會(huì)探索更多商品。
  • 通過藍(lán)色實(shí)線與虛線,黃色實(shí)線與虛線兩組曲線對(duì)比,新穿插機(jī)制下預(yù)期插入數(shù)量曲線與實(shí)際插入數(shù)量曲線更貼合,說明穿插數(shù)量設(shè)定更為合理,新的穿插機(jī)制與商品打分一致性更強(qiáng)。

(2)線上效果

搜索效率持平情況下,EE核心指標(biāo)有一定提升并全量上線。

流量整體聯(lián)動(dòng)優(yōu)化思考:

在對(duì)EE流量進(jìn)行整體優(yōu)化后,商品探索力度與EE流量分配能夠隨用戶瀏覽意愿進(jìn)行自適應(yīng)調(diào)整,但從全局商品展示結(jié)果中看,EE探測(cè)流量與自然流量相互獨(dú)立,兩者之間并未建立充分的聯(lián)動(dòng)與結(jié)合。

將視角逐漸放寬到整個(gè)排序鏈路,如何做好EE流量與自然流量的聯(lián)動(dòng),發(fā)揮EE在搜索排序鏈路后置位的優(yōu)勢(shì)充分補(bǔ)充與優(yōu)化自然流量是下一個(gè)關(guān)心的問題。

四、感知上下文的品牌店鋪維度探測(cè)

在搜索鏈路中,EE處于相對(duì)后置的位置,然而原EE系統(tǒng)未充分利用這一感知優(yōu)勢(shì),對(duì)前序排序結(jié)果感知能力較弱。在一些強(qiáng)勢(shì)品牌、店鋪主導(dǎo)的關(guān)鍵詞下,存在頭部品牌、店鋪扎堆現(xiàn)象,優(yōu)質(zhì)新品、中長尾商品無法露出,馬太效應(yīng)明顯。

對(duì)此問題,嘗試跳出僅考慮商品維度探測(cè)的局限,從更高的品牌、店鋪維度視角,對(duì)排序結(jié)果進(jìn)行全局性聯(lián)動(dòng)優(yōu)化,建立感知上下文的多維度探測(cè)能力。其設(shè)計(jì)旨在增強(qiáng)對(duì)上下文排序結(jié)果的感知能力,并在自然流量中對(duì)商品分布進(jìn)行聯(lián)動(dòng)優(yōu)化,系統(tǒng)性緩解排序鏈路的馬太效應(yīng)。

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

1.感知上下文的多維度探測(cè)機(jī)制優(yōu)化點(diǎn)

感知上下文的多維度探測(cè)機(jī)制在原有EE探測(cè)能力基礎(chǔ)上,進(jìn)行了如下三個(gè)方面的優(yōu)化:

(1)新增EE探測(cè)系統(tǒng)對(duì)上下文感知能力:對(duì)EE前的排序上下文結(jié)果進(jìn)行充分的感知,對(duì)自然流量下原有搜索排序結(jié)果進(jìn)行自適應(yīng)的穿插優(yōu)化。

(2)實(shí)現(xiàn)EE探測(cè)維度的擴(kuò)展:除了現(xiàn)有支持的商品粒度探測(cè),從更宏觀的品牌、店鋪等維度視角對(duì)排序生態(tài)進(jìn)行優(yōu)化。

(3)EE流量與自然流量聯(lián)動(dòng)全局性優(yōu)化:緩解部分詞下頭部品牌和店鋪扎堆現(xiàn)象,提升排序多樣性,避免對(duì)頭部品牌、店鋪商品進(jìn)行更多探測(cè)、加劇馬太效應(yīng)。

2.方案實(shí)踐

本次升級(jí)在原有的搜索EE穿插機(jī)制下進(jìn)行了如下能力的增強(qiáng)與優(yōu)化:

(1)新增上下文感知能力

在原有搜索EE穿插機(jī)制基礎(chǔ)上,新增加上下文感知能力,對(duì)搜索詞屬性和上下文排序結(jié)果的商品分布進(jìn)行計(jì)算,指導(dǎo)后續(xù)的穿插過程

①感知query詞屬性

為保障搜索排序結(jié)果合理性,避免產(chǎn)生體驗(yàn)性問題,感知上下文能力將判斷query詞是否是品牌詞(如:華為)或型號(hào)詞(如:iphone),決定是否開啟品牌維度探測(cè);判斷query詞是否是精準(zhǔn)店鋪詞,決定是否開啟店鋪維度探測(cè)。

②排序結(jié)果商品分布

新增上下文排序結(jié)果感知能力,通過統(tǒng)計(jì)上鏈路搜索結(jié)果排名前k的商品中的品牌和店鋪的分布情況,判斷是否存在品牌或店鋪的集中現(xiàn)象,進(jìn)而決定是否開啟多維度探測(cè)能力。

(2)優(yōu)化原有穿插機(jī)制

在感知能力作為多維度探測(cè)啟動(dòng)開關(guān)基礎(chǔ)上,優(yōu)化了原有的穿插機(jī)制,通過EE展示效果與自然流量結(jié)果聯(lián)動(dòng)提升搜索結(jié)果豐富性與多樣性,對(duì)搜索結(jié)果進(jìn)行直接高效的影響。

①由感知能力模塊判斷用戶搜索意圖和商品分布,決定是否進(jìn)行多維度探測(cè)

對(duì)用戶搜索意圖直接的搜索詞動(dòng)態(tài)開啟多維度探測(cè)功能,如query為品牌詞或型號(hào)詞則不應(yīng)進(jìn)行品牌維度探測(cè),如query為店鋪詞則不進(jìn)行店鋪維度探測(cè),避免影響搜索結(jié)果的準(zhǔn)確性??剂克阉鹘Y(jié)果的前k個(gè)商品的品牌/店鋪分布,判斷是否存在頭部品牌/店鋪扎堆的問題,當(dāng)同一品牌/店鋪下商品占比超過p%后,不再插入該類型EE商品。

②穿插結(jié)果優(yōu)化

如不再插入該類型EE商品,在候選商品中剔除該類型,其余商品按照EE打分結(jié)果插入到排序結(jié)果中,不影響EE穿插過程與穿插數(shù)量,保障EE穿插位置和展現(xiàn)效果合理性。

3.升級(jí)效果

(1)多維度探測(cè)效果分析

①EE穿插曝光占比分析:

在EE穿插過程中,由于部分EE模型打分較高的頭部品牌/店鋪的商品在EE候選商品中被剔除,剩余商品模型打分稍低導(dǎo)致穿插位置發(fā)生后移或無法穿插進(jìn)排序結(jié)果中,為了避免EE穿插曝光占比降低,提升了各瀏覽深度下EE穿插商品的配額。實(shí)驗(yàn)期間EE曝光占比base與test基本持平。

②多維度探測(cè)體驗(yàn)分析:

下面對(duì)比了多款熱詞下EE穿插商品情況。

京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì),硬核干貨,算法,京東云,搜索推薦系統(tǒng),推薦算法,搜推,后端

結(jié)論:在多組query詞下,test機(jī)制相較于base機(jī)制在穿插的過程中減少了頭部品牌/店鋪的插入,增強(qiáng)了展示結(jié)果的豐富性,緩解馬太效應(yīng);同時(shí)注意到test機(jī)制由于部分頭部品牌/店鋪商品被濾除,穿插位置相對(duì)有所后移,在排序靠后的位置受配額影響多插入1-2個(gè)商品,整體曝光量與base基本一致,與分析一的結(jié)論一致。

(2)線上效果

在保持搜索效率持平的情況下,多樣性指標(biāo)大幅提升并全量上線。

五、總結(jié)與展望

本文重點(diǎn)闡述了在搜索EE機(jī)制迭代過程中的思考與演進(jìn)歷程,搜索EE作為優(yōu)化搜索生態(tài)與緩解搜索馬太效應(yīng)的重要工具,在演進(jìn)過程中也圍繞搜索結(jié)果豐富性和體驗(yàn)性進(jìn)行了系統(tǒng)性優(yōu)化。

在優(yōu)化思路上,不斷尋找EE系統(tǒng)的瓶頸問題,在自適應(yīng)探索機(jī)制和建模方式升級(jí)提供差異化商品探索力度;將商品打分與穿插商品個(gè)數(shù)進(jìn)行聯(lián)動(dòng),端到端優(yōu)化EE流量分配問題;之后將視野擴(kuò)展到全局流量,通過多維度探索機(jī)制聯(lián)動(dòng)自然流量,使EE流量作為自然流量的互相補(bǔ)充。整體思路體現(xiàn)出從商品間探索打分優(yōu)化——EE流量個(gè)性化分配——與自然流量全局優(yōu)化的迭代進(jìn)程。

搜索EE后續(xù)還將面臨更多的問題和挑戰(zhàn),后續(xù)會(huì)繼續(xù)沿用這樣的迭代思路在更多方面進(jìn)行探索與深入:

  • 擴(kuò)展EE模型的訓(xùn)練樣本空間,優(yōu)化現(xiàn)有任務(wù)建模方案。
  • 搜索EE向更廣鏈路輻射,打造全鏈路EE探索能力。
  • EE覆蓋更廣商品建模,打造更完善的中長尾商品泛化表征。

今天的分享就到這里,謝謝大家。

作者:京東零售 才子嘉,趙恒

來源:京東云開發(fā)者社區(qū) 轉(zhuǎn)載請(qǐng)注明來源文章來源地址http://www.zghlxwxcb.cn/news/detail-694587.html

到了這里,關(guān)于京東搜索EE鏈路演進(jìn) | 京東云技術(shù)團(tuán)隊(duì)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Spring源碼核心剖析 | 京東云技術(shù)團(tuán)隊(duì)

    Spring源碼核心剖析 | 京東云技術(shù)團(tuán)隊(duì)

    SpringAOP作為Spring最核心的能力之一,其重要性不言而喻。然后需要知道的是AOP并不只是Spring特有的功能,而是一種思想,一種通用的功能。而SpringAOP只是在AOP的基礎(chǔ)上將能力集成到SpringIOC中,使其作為bean的一種,從而我們能夠很方便的進(jìn)行使用。 1.1 使用場(chǎng)景 當(dāng)我們?cè)谌粘I(yè)

    2024年02月10日
    瀏覽(23)
  • 定時(shí)任務(wù)原理方案綜述 | 京東云技術(shù)團(tuán)隊(duì)

    定時(shí)任務(wù)原理方案綜述 | 京東云技術(shù)團(tuán)隊(duì)

    本文主要介紹目前存在的定時(shí)任務(wù)處理解決方案。業(yè)務(wù)系統(tǒng)中存在眾多的任務(wù)需要定時(shí)或定期執(zhí)行,并且針對(duì)不同的系統(tǒng)架構(gòu)也需要提供不同的解決方案。京東內(nèi)部也提供了眾多定時(shí)任務(wù)中間件來支持,總結(jié)當(dāng)前各種定時(shí)任務(wù)原理,從定時(shí)任務(wù)基礎(chǔ)原理、單機(jī)定時(shí)任務(wù)(單線

    2024年02月09日
    瀏覽(54)
  • 事務(wù),不只ACID | 京東物流技術(shù)團(tuán)隊(duì)

    事務(wù),不只ACID | 京東物流技術(shù)團(tuán)隊(duì)

    1. 什么是事務(wù)? 應(yīng)用在運(yùn)行時(shí)可能會(huì)發(fā)生數(shù)據(jù)庫、硬件的故障,應(yīng)用與數(shù)據(jù)庫的網(wǎng)絡(luò)連接斷開或多個(gè)客戶端端并發(fā)修改數(shù)據(jù)導(dǎo)致預(yù)期之外的數(shù)據(jù)覆蓋問題,為了提高應(yīng)用的可靠性和數(shù)據(jù)的一致性, 事務(wù) 應(yīng)運(yùn)而生。 從概念上講,事務(wù)是 應(yīng)用程序?qū)⒍鄠€(gè)讀寫操作組合成一個(gè)邏

    2024年02月13日
    瀏覽(16)
  • 618技術(shù)揭秘:探究競(jìng)速榜頁面核心前端技術(shù) | 京東云技術(shù)團(tuán)隊(duì)

    618技術(shù)揭秘:探究競(jìng)速榜頁面核心前端技術(shù) | 京東云技術(shù)團(tuán)隊(duì)

    H5頁面作為移動(dòng)端Web應(yīng)用的重要形式之一,已經(jīng)成為了現(xiàn)代Web開發(fā)的熱門話題。在H5頁面的開發(fā)過程中,前端技術(shù)的應(yīng)用至關(guān)重要。本文將探究京東競(jìng)速榜H5頁面的核心前端技術(shù),包括動(dòng)畫、樣式配置化、皮膚切換、海報(bào)技術(shù)、調(diào)試技巧等方面,希望能夠?yàn)閺V大前端開發(fā)者提供

    2024年02月12日
    瀏覽(21)
  • 楠姐技術(shù)漫話:圖計(jì)算的那些事 | 京東云技術(shù)團(tuán)隊(duì)

    不知道大家在平時(shí)的工作中 有沒有聽說過“圖計(jì)算”這個(gè)名詞 但大家一定在各工作匯報(bào),技術(shù)分享中聽說過“智能化”,“人工智能”這樣的字眼 而我們今天要嘮的這個(gè)圖計(jì)算 就是人工智能領(lǐng)域內(nèi)近幾年炙手可熱的前沿寵兒 也是我們風(fēng)控反欺詐中常用的“大殺器” 在了解

    2024年02月05日
    瀏覽(28)
  • 插件化工程R文件瘦身技術(shù)方案 | 京東云技術(shù)團(tuán)隊(duì)

    隨著業(yè)務(wù)的發(fā)展及版本迭代,客戶端工程中不斷增加新的業(yè)務(wù)邏輯、引入新的資源,隨之而來的問題就是安裝包體積變大,前期各個(gè)業(yè)務(wù)模塊通過無用資源刪減、大圖壓縮或轉(zhuǎn)上云、AB實(shí)驗(yàn)業(yè)務(wù)邏輯下線或其他手段在降低包體積上取得了一定的成果。 在瘦身的過程中我們關(guān)注

    2024年02月08日
    瀏覽(28)
  • 實(shí)踐指南-前端性能提升 270% | 京東云技術(shù)團(tuán)隊(duì)

    實(shí)踐指南-前端性能提升 270% | 京東云技術(shù)團(tuán)隊(duì)

    當(dāng)我們疲于開發(fā)一個(gè)接一個(gè)的需求時(shí),很容易忘記去關(guān)注網(wǎng)站的性能,到了某一個(gè)節(jié)點(diǎn),猛地發(fā)現(xiàn),隨著越來越多代碼的堆積,網(wǎng)站變得越來越慢。 本文就是從這樣的一個(gè)背景出發(fā),著手優(yōu)化網(wǎng)站的前端性能,并總結(jié)出一套開發(fā)習(xí)慣,讓我們?cè)谌粘i_發(fā)時(shí),也保持高性能,而

    2024年02月13日
    瀏覽(24)
  • React請(qǐng)求機(jī)制優(yōu)化思路 | 京東云技術(shù)團(tuán)隊(duì)

    React請(qǐng)求機(jī)制優(yōu)化思路 | 京東云技術(shù)團(tuán)隊(duì)

    說起數(shù)據(jù)加載的機(jī)制,有一個(gè)繞不開的話題就是前端性能,很多電商門戶的首頁其實(shí)都會(huì)做一些垂直的定制優(yōu)化,比如讓請(qǐng)求在頁面最早加載,或者在前一個(gè)頁面就進(jìn)行預(yù)加載等等。隨著react18的發(fā)布,請(qǐng)求機(jī)制這一塊也是被不斷談起,并且在后續(xù)其實(shí)也給出了明確的方向。

    2024年02月12日
    瀏覽(18)
  • 淺析Redis大Key | 京東云技術(shù)團(tuán)隊(duì)

    淺析Redis大Key | 京東云技術(shù)團(tuán)隊(duì)

    在京東到家購物車系統(tǒng)中,用戶基于門店能夠?qū)ι唐愤M(jìn)行加車操作。用戶與門店商品使用Redis的Hash類型存儲(chǔ),如下代碼塊所示。不知細(xì)心的你有沒有發(fā)現(xiàn),如果單門店加車商品過多,或者門店過多時(shí),此Key就會(huì)越來越大,從而影響線上業(yè)務(wù)。 2.1、BigKey的界定 BigKey稱為大Key,

    2024年02月06日
    瀏覽(17)
  • SpringIoc容器之Aware | 京東云技術(shù)團(tuán)隊(duì)

    SpringIoc容器之Aware | 京東云技術(shù)團(tuán)隊(duì)

    Aware是Spring提供的一個(gè)標(biāo)記超接口,指示bean有資格通過回調(diào)樣式的方法由Spring容器通知特定的框架對(duì)象,以獲取到容器中特有對(duì)象的實(shí)例的方法之一。實(shí)際的方法簽名由各個(gè)子接口確定,但通常只包含一個(gè)接受單個(gè)參數(shù)的void返回方法。 9個(gè)內(nèi)置實(shí)現(xiàn)又分兩類,前三個(gè)為直接調(diào)

    2024年02月13日
    瀏覽(13)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包