国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷

這篇具有很好參考價(jià)值的文章主要介紹了斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

原文鏈接:https://www.techbeat.net/article-info?id=4583
作者:seven_

隨著以ChatGPT等大型語言模型(large language models,LLMs)的爆火,學(xué)界和工業(yè)界目前已經(jīng)開始重視這些模型的安全性,由于ChatGPT強(qiáng)大的知識(shí)存儲(chǔ)和推理能力,其目前可以針對(duì)各種各樣的用戶輸入來產(chǎn)生非常流暢和完整的回答,甚至在一些專業(yè)領(lǐng)域以及公共討論話題中,它也可以從容應(yīng)對(duì)。例如,一些學(xué)生可能會(huì)使用LLMs來幫助他們完成書面作業(yè),使老師無法準(zhǔn)確的判斷學(xué)生的學(xué)習(xí)效果,這也的的確確是LLMs帶來的負(fù)面影響。
斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷

論文鏈接:
https://arxiv.org/abs/2301.11305
項(xiàng)目主頁:
https://ericmitchell.ai/detectgpt/

近日,來自斯坦福大學(xué)的研究團(tuán)隊(duì)發(fā)布了一個(gè)名為DetectGPT的檢測(cè)模型來判斷一個(gè)文本段落是否是由機(jī)器生成的。作者首先觀察了LLMs的運(yùn)行機(jī)制,他們發(fā)現(xiàn)LLM生成的文本往往占據(jù)模型的對(duì)數(shù)概率函數(shù)的負(fù)曲率區(qū)域。根據(jù)這一現(xiàn)象,作者提出想法,能夠基于概率函數(shù)的曲率標(biāo)準(zhǔn)來對(duì)文本進(jìn)行判定呢?

實(shí)驗(yàn)結(jié)果表明,這種想法完全可行,DetectGPT不需要專門訓(xùn)練一個(gè)單獨(dú)的分類器,也不需要額外收集真實(shí)場(chǎng)景中或者機(jī)器生成的文本段落數(shù)據(jù),它只需要對(duì)當(dāng)前模型計(jì)算其對(duì)數(shù)概率并與另外一個(gè)通用的預(yù)訓(xùn)練語言模型(例如T5)的段落隨機(jī)擾動(dòng)進(jìn)行比較,即可得出結(jié)論。作者發(fā)現(xiàn)DetectGPT比現(xiàn)有的zero-shot文本檢測(cè)方法更具有鑒別能力。

一、 引言

如果我們仔細(xì)推敲ChatGPT等LLMs生成出的文本回答,會(huì)發(fā)現(xiàn)它們的答案仍然有明顯的機(jī)器翻譯痕跡。但是這種生成技術(shù)確實(shí)在一些領(lǐng)域能夠以假亂真,甚至取代人工勞動(dòng),特別是在學(xué)生的論文寫作和記者的新聞寫作中,這都會(huì)帶來很大的風(fēng)險(xiǎn),例如影響學(xué)生的學(xué)習(xí)積極性,也有可能會(huì)因?yàn)樘摷傩侣剬?dǎo)致公眾獲得錯(cuò)誤的信息。但是幸運(yùn)的是,目前機(jī)器模型生成的文本與人類編寫出的文字相比仍然有不小的差距,這使得我們及時(shí)開發(fā)文本檢測(cè)方法和工具成為可能。之前已經(jīng)有很多工作將機(jī)器生成的文本檢測(cè)任務(wù)看做是一個(gè)二分類問題[1],具體來說,這些方法的目標(biāo)是對(duì)一個(gè)候選文本段落的來源進(jìn)行分類,其中這些文本來源是預(yù)定義的類別。但是這種方法有幾個(gè)明顯的缺點(diǎn),例如它們會(huì)非常傾向于參與訓(xùn)練的那些文本來源,并且不具備增量學(xué)習(xí)功能,如果想要使模型能夠識(shí)別未知來源的文本,就需要對(duì)模型整體重新訓(xùn)練。因此考慮開發(fā)具有zero-shot功能的模型才更符合現(xiàn)實(shí)場(chǎng)景,即根據(jù)文本源模型本身來進(jìn)行開發(fā),不進(jìn)行任何形式的微調(diào)或適應(yīng),來檢測(cè)它自己生成的樣本。

zero-shot文本檢測(cè)任務(wù)最常見的方法就是對(duì)生成文本的平均token對(duì)數(shù)概率進(jìn)行評(píng)估,并設(shè)置閾值進(jìn)行判斷。本文作者針對(duì)此提出了一個(gè)簡(jiǎn)單的假設(shè):機(jī)器對(duì)自己生成的文本進(jìn)行改動(dòng)時(shí)往往會(huì)比原始樣本的對(duì)數(shù)概率低,而人類對(duì)自己所寫文本的改動(dòng)會(huì)遠(yuǎn)超過原本文本的對(duì)數(shù)概率。換句話說,與人類寫的文本不同,模型生成的文本往往位于對(duì)數(shù)概率函數(shù)具有負(fù)曲率的區(qū)域(例如,對(duì)數(shù)概率的局部最大值),如下圖所示。
斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷
作者基于這一假設(shè)設(shè)計(jì)了DetectGPT,為了測(cè)試一個(gè)段落是否來自一個(gè)源模型 p θ p_{\theta} pθ? ,DetectGPT將與 p θ p_{\theta} pθ? 相關(guān)候選段落的對(duì)數(shù)概率與對(duì) p θ p_{\theta} pθ? 進(jìn)行隨機(jī)擾動(dòng)生成的段落的平均對(duì)數(shù)概率(例如用T5參與擾動(dòng))進(jìn)行比較。如果被擾動(dòng)的段落的平均對(duì)數(shù)概率比原始段落低一些,那么候選段落很可能來自于 p θ p_{\theta} pθ? , 這一過程的具體運(yùn)行如下圖所示。
斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷

二、本文方法

對(duì)于機(jī)器生成的zero-shot文本檢測(cè)任務(wù)設(shè)置,即檢測(cè)一段文本或候選段落 x x x 是否是源模型 p θ p_{\theta} pθ? 的樣本,在模型訓(xùn)練時(shí)無需加入外部數(shù)據(jù),其呈現(xiàn)“白盒設(shè)置”的特點(diǎn),模型中的檢測(cè)器可以評(píng)估當(dāng)前樣本對(duì) p θ p_{\theta} pθ? 的對(duì)數(shù)概率情況。此外“白盒設(shè)置”也不限制對(duì)模型架構(gòu)和參數(shù)規(guī)模的選擇,因此作者在對(duì)DetectGPT的性能評(píng)估中也選用了目前通用的預(yù)訓(xùn)練Masked模型,用來生成與當(dāng)前段落比較接近的候選文本,但是這些段落的生成不會(huì)經(jīng)過任何形式的微調(diào)和域適應(yīng)。

2.1 模型擾動(dòng)假設(shè)

上文提到,DetectGPT基于這樣一個(gè)假設(shè):來自源模型 p θ p_{\theta} pθ? 的樣本通常位于 p θ p_{\theta} pθ? 的對(duì)數(shù)概率函數(shù)的負(fù)曲率區(qū)域。如果我們對(duì)一段話 x ~ p θ x \sim p_{\theta} xpθ? 施加一個(gè)小的擾動(dòng),產(chǎn)生 x ~ \tilde{x} x~ ,那么與人類編寫的文本相比,機(jī)器生成的樣本的對(duì)數(shù)值 log ? p θ ( x ) ? log ? p θ ( x ~ ) \log p_{\theta}(x)-\log p_{\theta}(\tilde{x}) logpθ?(x)?logpθ?(x~) 應(yīng)該是比較大的。基于這一假設(shè),作者首先考慮了一個(gè)擾動(dòng)函數(shù) q ( ? ∣ x ) q(\cdot \mid x) q(?x) ,它會(huì)先在 x ~ \tilde{x} x~ 上給出一個(gè)分布,代表意義相近的略微修改過的 x x x 的版本。使用擾動(dòng)函數(shù)的概念,我們可以q輕松的定義出擾動(dòng)差異指標(biāo) d ( x , p θ , q ) \mathbfn5n3t3z\left(x, p_{\theta}, q\right) d(x,pθ?,q)
斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷
對(duì)上述假設(shè)更為正式的定義如下:如果 q q q 在數(shù)據(jù)流形分布上產(chǎn)生樣本,對(duì)于樣本 x ~ p θ x \sim p_{\theta} xpθ? 來說, d ( x , p θ , q ) \mathbfn5n3t3z\left(x, p_{\theta}, q\right) d(x,pθ?,q) 大概率為正,而對(duì)于人類編寫文本, d ( x , p θ , q ) \mathbfn5n3t3z\left(x, p_{\theta}, q\right) d(x,pθ?,q) 對(duì)所有 x x x 都趨向于0

如果此時(shí)將擾動(dòng)函數(shù) q ( ? ∣ x ) q(\cdot \mid x) q(?x) 定義為來自T5等預(yù)訓(xùn)練模型生成的擾動(dòng)樣本,而不是人類改寫的樣本,就可以以一種自動(dòng)的、可擴(kuò)展的方式對(duì)上述假設(shè)進(jìn)行經(jīng)驗(yàn)性測(cè)試。對(duì)于機(jī)器生成樣本,這里作者使用了四個(gè)不同的LLM進(jìn)行輸出,例如使用T5-3B模型來產(chǎn)生擾動(dòng),對(duì)于給定樣本,按照2個(gè)字的跨度進(jìn)行隨機(jī)擾動(dòng),直到文本中15%的字被覆蓋。隨后使用經(jīng)過T5處理的100個(gè)樣本按照假設(shè)進(jìn)行近似計(jì)算,發(fā)現(xiàn)擾動(dòng)差異的分布對(duì)于人類編寫文本和機(jī)器生成樣本是明顯不同的,機(jī)器樣本往往有較大的擾動(dòng)差異
斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷
上圖展示了來自GPT-2、GPT-Neo-2.7B、GPT-J和GPT-NeoX 四個(gè)模型與人類樣本擾動(dòng)后的分布對(duì)比,其中藍(lán)色區(qū)域?yàn)槿祟惥帉懳谋镜姆植?,橙色為機(jī)器生成文本的分布。

2.2 將擾動(dòng)差異解釋為曲率

通過上圖,只能看出擾動(dòng)差異在鑒別文本是否來自人類還是機(jī)器方面是有效的,但是其衡量的理論指標(biāo)還不夠清晰。因而作者進(jìn)一步為擾動(dòng)差異尋找到了理論依據(jù),作者表明擾動(dòng)差異近似于候選段落附近對(duì)數(shù)概率函數(shù)的局部曲率的度量,更具體地說,它與對(duì)數(shù)概率函數(shù)的Hessian 矩陣的負(fù)跡成正比。為了處理離散數(shù)據(jù)的不可微性,作者在這里僅考慮了在潛在語義空間中的候選段落,其中的小擾動(dòng)對(duì)應(yīng)于保留與原始相似含義的文本編輯過程。因?yàn)楸疚倪x用的擾動(dòng)函數(shù) (T5) 是經(jīng)過大量自然文本語料預(yù)訓(xùn)練的,所以這里的擾動(dòng)可以被粗略地認(rèn)為是對(duì)原始段落的有效修改,而不是隨意編輯。

作者首先利用Hutchinson提出的跡估計(jì)器[3]給出矩陣 A A A 跡的無偏估計(jì):
斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷
隨后使用有限差分來近似這個(gè)表達(dá)式:
斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷
聯(lián)立上述兩式子并使用 h = 1 h = 1 h=1 進(jìn)行簡(jiǎn)化,就可以得到負(fù)Hessian矩陣的跡估計(jì):
斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷
作者觀察到上式其實(shí)對(duì)應(yīng)于擾動(dòng)差異 d ( x , p θ , q ) \mathbfn5n3t3z\left(x, p_{\theta}, q\right) d(x,pθ?,q) ,其中擾動(dòng)函數(shù) q ( ? ∣ x ) q(\cdot \mid x) q(?x) 可以使用Hutchinson跡估計(jì)器中使用的分布 q z ( z ) q_{z}(z) qz?(z) 代替。這里, x ~ \tilde{x} x~ 是一個(gè)高維的token序列,而 q z q_{z} qz? 是一個(gè)嵌入語義空間中的向量。由于擾動(dòng)文本模型生成的句子與 x x x 相似,語義變化較小,因此可以將擾動(dòng)文本模型視為與當(dāng)前采樣相似的語義嵌入 ( z ~ ~ q z ) \left(\tilde{z} \sim q_{z}\right) (z~qz?) ,然后將其映射到token序列中 ( z ~ ? x ~ ) (\tilde{z} \mapsto \tilde{x}) (z~?x~) 。 這樣做,可以保證語義空間中的采樣都保持在數(shù)據(jù)流形附近,當(dāng)隨機(jī)擾動(dòng)發(fā)生后,對(duì)數(shù)概率就會(huì)產(chǎn)生明顯下降,這樣就可以將擾動(dòng)差異解釋為近似限制在數(shù)據(jù)流形上的曲率。

三、實(shí)驗(yàn)效果

本文的實(shí)驗(yàn)部分作者使用了六個(gè)數(shù)據(jù)集,涵蓋了各種日常領(lǐng)域,例如使用XSum數(shù)據(jù)集中的新聞文章來進(jìn)行假新聞檢測(cè)實(shí)驗(yàn),使用SQuAD上下文中的維基百科段落來表示機(jī)器編寫的學(xué)術(shù)論文,以及使用Reddit WritingPrompts數(shù)據(jù)集來表示機(jī)器生成的創(chuàng)意寫作。此外,為了評(píng)估分布變化的穩(wěn)健性,作者還使用了WMT16的英語和德語部分以及人類專家在PubMedQA數(shù)據(jù)集中編寫的標(biāo)準(zhǔn)答案。

作者首先對(duì)DetectGPT的zero-shot文本檢測(cè)能力進(jìn)行評(píng)估,實(shí)驗(yàn)結(jié)果如下表所示,可以看出,DetectGPT在所有15種數(shù)據(jù)集和模型組合中的14種實(shí)驗(yàn)組合上都得到了最準(zhǔn)確的檢測(cè)性能。尤其是DetectGPT最大程度地提高了XSum數(shù)據(jù)集的平均檢測(cè)精度(0.1 AUROC 改進(jìn)),在SQuAD維基百科上下文數(shù)據(jù)集上也有明顯的性能提升(0.05 AUROC 改進(jìn))。
斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷
此外,作者還選取了一部分監(jiān)督學(xué)習(xí)訓(xùn)練的檢測(cè)器進(jìn)行對(duì)比。作者著重探索了幾個(gè)領(lǐng)域,或者說幾種語境,對(duì)比結(jié)果如下圖所示。例如在英語新聞數(shù)據(jù)上,監(jiān)督檢測(cè)器可以達(dá)到與 DetectGPT 接近的檢測(cè)性能,但在英語科學(xué)寫作數(shù)據(jù)下,其性能明顯低于本文方法。而在德語寫作中監(jiān)督學(xué)習(xí)方法會(huì)完全失敗。相比之下,以DetectGPT為代表的零樣本方法更容易泛化到新的語言和領(lǐng)域中。
斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷

四、總結(jié)

隨著LLMs的不斷發(fā)展和改進(jìn),我們應(yīng)該一方面對(duì)它們?cè)谠絹碓蕉嗟念I(lǐng)域中減輕人類工作者的創(chuàng)作壓力感到高興,另一方面也更應(yīng)該同步發(fā)展針對(duì)它們的安全檢測(cè)技術(shù),這對(duì)于這一領(lǐng)域未來的健康發(fā)展至關(guān)重要。本文從這些大模型本身的運(yùn)行機(jī)制出發(fā)設(shè)計(jì)了DetectGPT方法,DetectGPT通過一個(gè)簡(jiǎn)單的數(shù)據(jù)分布特點(diǎn)即可判斷出文本的來源,此外作者還對(duì)本文方法進(jìn)行了詳盡的理論推導(dǎo),這使得DetectGPT具有更高的可信度和可解釋性。此外DetectGPT的zero-shot特性使它相比那些使用數(shù)百萬數(shù)據(jù)樣本定制訓(xùn)練的檢測(cè)模型更具有競(jìng)爭(zhēng)力。此外作者在文章的最后還談到了DetectGPT的未來計(jì)劃,他們會(huì)進(jìn)一步探索對(duì)數(shù)概率曲率屬性是否在其他領(lǐng)域(音頻、視頻或圖像)的生成模型中也能起到很好的檢測(cè)作用,這一方向也具有非常重要的現(xiàn)實(shí)意義,讓我們一起期待吧。

參考文獻(xiàn)

[1] Jawahar, G., Abdul-Mageed, M., and Lakshmanan, L. V. S. Automatic detection of machine generated text: A critical survey. In International Conference on Computational Linguistics, 2020.
[2] Narayan, S., Cohen, S. B., and Lapata, M. Don’t give me the details, just the summary! Topic-aware convolutional neural networks for extreme summarization. In Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing, Brussels, Belgium, 2018.
[3] Hutchinson, M. A stochastic estimator of the trace of the influence matrix for laplacian smoothing splines. Communications in Statistics - Simulation and Computation, 19(2):433–450, 1990. doi: 10.1080/ 03610919008812866. URL https://doi.org/10. 1080/03610919008812866.

Illustration by Bittu Designs from IconScout

-The End-

關(guān)于我“門”

將門是一家以專注于發(fā)掘、加速及投資技術(shù)驅(qū)動(dòng)型創(chuàng)業(yè)公司的新型創(chuàng)投機(jī)構(gòu),旗下涵蓋將門創(chuàng)新服務(wù)、將門-TechBeat技術(shù)社區(qū)以及將門創(chuàng)投基金。
將門成立于2015年底,創(chuàng)始團(tuán)隊(duì)由微軟創(chuàng)投在中國的創(chuàng)始團(tuán)隊(duì)原班人馬構(gòu)建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術(shù)型創(chuàng)業(yè)公司。
如果您是技術(shù)領(lǐng)域的初創(chuàng)企業(yè),不僅想獲得投資,還希望獲得一系列持續(xù)性、有價(jià)值的投后服務(wù),歡迎發(fā)送或者推薦項(xiàng)目給我“門”:
bp@thejiangmen.com文章來源地址http://www.zghlxwxcb.cn/news/detail-493887.html

到了這里,關(guān)于斯坦福大學(xué)團(tuán)隊(duì)提出AI生成文本檢測(cè)器DetectGPT,通過文本對(duì)數(shù)概率的曲率進(jìn)行可解釋判斷的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 十分鐘讀完「斯坦福提出的革新AI訓(xùn)練的新算法DPO」論文

    引言:探索無監(jiān)督語言模型的可控性挑戰(zhàn) 在人工智能領(lǐng)域,無監(jiān)督語言模型(Language Models, LMs)的發(fā)展已經(jīng)達(dá)到了令人驚嘆的水平,這些模型能夠在廣泛的數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,學(xué)習(xí)到豐富的世界知識(shí)和一定的推理能力。然而,如何精確控制這些模型的行為,使其按照人類的

    2024年02月20日
    瀏覽(30)
  • 上海交大 AI4S 團(tuán)隊(duì)提出「智能化科學(xué)設(shè)施」構(gòu)想,建立跨學(xué)科 AI 科研助手

    上海交大 AI4S 團(tuán)隊(duì)提出「智能化科學(xué)設(shè)施」構(gòu)想,建立跨學(xué)科 AI 科研助手

    作者:李寶珠 編輯:三羊 上海交大人工智能研究院 AI for Science 團(tuán)隊(duì)楊小康教授等人,提出一種智能化科學(xué)設(shè)施的建設(shè)構(gòu)想,形成科學(xué)領(lǐng)域大模型、生成式模擬與反演、自主智能無人實(shí)驗(yàn)及大規(guī)??尚趴蒲袇f(xié)作等創(chuàng)新功能。 近年來,人工智能在科研中的應(yīng)用持續(xù)向縱深發(fā)展,

    2024年02月22日
    瀏覽(92)
  • 如何去推動(dòng)自己團(tuán)隊(duì)所提出的需求

    自己團(tuán)隊(duì)所提出的需求是指性能優(yōu)化、技術(shù)棧升級(jí)、架構(gòu)調(diào)整等需求,偏向于技術(shù)范疇。 要推動(dòng)這類需求,除了自己團(tuán)隊(duì)的努力之外,還需要一些外在的輔助因素。 對(duì)于我們自己團(tuán)隊(duì)內(nèi)部就能消化的需求,主要的問題就是人員,只要人員充足,那么就能慢慢推進(jìn)。 而對(duì)于那

    2023年04月10日
    瀏覽(18)
  • 斯坦福聯(lián)合Meta提出多模態(tài)模型RA-CM3,檢索增強(qiáng)機(jī)制或成文本圖像領(lǐng)域新制勝法寶

    斯坦福聯(lián)合Meta提出多模態(tài)模型RA-CM3,檢索增強(qiáng)機(jī)制或成文本圖像領(lǐng)域新制勝法寶

    原文鏈接:https://www.techbeat.net/article-info?id=4403 作者:seven_ 論文鏈接: https://arxiv.org/abs/2211.12561 相信目前很多AI大模型研究者都會(huì)遇到一個(gè)非常困難的問題,那就是 很難控制的模型參數(shù)和容量 ,由于參與模型訓(xùn)練的數(shù)據(jù)量非常龐大,如果模型參數(shù)太少會(huì)導(dǎo)致過擬合,參數(shù)量過

    2024年02月09日
    瀏覽(22)
  • Dynamic Routing Between Capsules——黃海波團(tuán)隊(duì)的論文,提出了一個(gè)膠囊網(wǎng)絡(luò)的改進(jìn)

    作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 在深度學(xué)習(xí)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)(NN)已經(jīng)成為一個(gè)非常有效、普遍且廣泛應(yīng)用的機(jī)器學(xué)習(xí)技術(shù)。而最近,隨著大數(shù)據(jù)、計(jì)算能力的提升以及深度學(xué)習(xí)模型的性能指標(biāo)的提高,神經(jīng)網(wǎng)絡(luò)已逐漸成為解決各種各樣的問題的利器。近年來,膠囊網(wǎng)絡(luò)(CapsNe

    2024年02月08日
    瀏覽(18)
  • 小鵬團(tuán)隊(duì)提出Anything in Any Scene,超真實(shí)的視頻模擬框架,圖像增強(qiáng)的未來?

    小鵬團(tuán)隊(duì)提出Anything in Any Scene,超真實(shí)的視頻模擬框架,圖像增強(qiáng)的未來?

    你能找出哪個(gè)物體是假的么? 項(xiàng)目demo效果非常驚艷,仔細(xì)看了之后又發(fā)現(xiàn)工作量很大,Pipeline很復(fù)雜,即使Supplementary Material中補(bǔ)充了很多信息,但具體細(xì)節(jié)估計(jì)需要詳細(xì)看代碼才能清楚了??次恼碌呐虐婧蛼斓絘rxiv的時(shí)間,應(yīng)該是投CVPR2024了,可以期待一下完整代碼。 摘要

    2024年02月20日
    瀏覽(21)
  • 體驗(yàn)百度文心一言AI大模型生產(chǎn)生成河南大學(xué)、太原理工大學(xué)、哈爾濱工程大學(xué)和青島大學(xué)簡(jiǎn)介

    體驗(yàn)百度文心一言AI大模型生產(chǎn)生成河南大學(xué)、太原理工大學(xué)、哈爾濱工程大學(xué)和青島大學(xué)簡(jiǎn)介

    河南大學(xué)(Henan University),簡(jiǎn)稱“河大”,坐落于中國河南省,是河南省人民政府與中華人民共和國教育部共建高校,國家“雙一流”建設(shè)高校,入選國家“111計(jì)劃”、中西部高?;A(chǔ)能力建設(shè)工程、卓越醫(yī)生教育培養(yǎng)計(jì)劃、卓越法律人才教育培養(yǎng)計(jì)劃、卓越教師培養(yǎng)計(jì)劃、

    2024年02月11日
    瀏覽(27)
  • NIPS2022|南京大學(xué)提出基于點(diǎn)擊后行為的廣義延遲反饋模型

    NIPS2022|南京大學(xué)提出基于點(diǎn)擊后行為的廣義延遲反饋模型

    Generalized Delayed Feedback Model with Post-Click Information in Recommender Systems Jia-Qi Yang De-Chuan Zhan Nanjing University https://proceedings.neurips.cc/paper_files/paper/2022/file/a7f90da65dd41d699d00e95700e6fa1e-Paper-Conference.pdf 轉(zhuǎn)化率預(yù)估(比如預(yù)測(cè)某個(gè)用戶購買某個(gè)商品的概率)在機(jī)器學(xué)習(xí)推薦系統(tǒng)中是一個(gè)基本問

    2024年02月05日
    瀏覽(99)
  • 體驗(yàn)文心一言AI大模型生成伊利諾伊大學(xué)香檳分校、復(fù)旦大學(xué)、上海交通大學(xué)、東南大學(xué)和加州伯克利大學(xué)簡(jiǎn)介

    體驗(yàn)文心一言AI大模型生成伊利諾伊大學(xué)香檳分校、復(fù)旦大學(xué)、上海交通大學(xué)、東南大學(xué)和加州伯克利大學(xué)簡(jiǎn)介

    UIUC(University of Illinois at Urbana-Champaign)是美國伊利諾伊大學(xué)香檳分校的簡(jiǎn)稱。該學(xué)校成立于1868年,位于美國伊利諾伊州香檳市,是一所公立研究型大學(xué)。UIUC是美國著名的常春藤盟校之一,在多個(gè)學(xué)科領(lǐng)域享有聲譽(yù),包括工程、商科、建筑、心理學(xué)、法學(xué)、醫(yī)學(xué)、農(nóng)學(xué)等。

    2024年02月11日
    瀏覽(39)
  • 體驗(yàn)文心一言AI大模型生成淄博和山東理工大學(xué)簡(jiǎn)介

    體驗(yàn)文心一言AI大模型生成淄博和山東理工大學(xué)簡(jiǎn)介

    淄博,簡(jiǎn)稱“淄”,位于中國華東地區(qū)、山東省中部,北緯35°55′20″~37°17′14″,東經(jīng)117°32′15″~118°31′00″,市域面積為5965平方公里。淄博市地處黃河三角洲高效生態(tài)經(jīng)濟(jì)區(qū)、山東半島藍(lán)色經(jīng)濟(jì)區(qū)兩大國家戰(zhàn)略經(jīng)濟(jì)區(qū)與山東省會(huì)城市群經(jīng)濟(jì)圈交匯處,南依沂蒙山區(qū)與

    2024年02月15日
    瀏覽(21)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包