国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

OpenAI Embedding:基于人工智能的搜索新篇章

這篇具有很好參考價值的文章主要介紹了OpenAI Embedding:基于人工智能的搜索新篇章。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。


theme: orange

本文正在參加「金石計劃」

Embedding模型在許多應(yīng)用場景中都有廣泛的應(yīng)用。在OpenAI中,文本嵌入技術(shù)主要用于衡量文本字符串之間的相關(guān)性。

什么是Embedding

嵌入(Embeddings)是一種將離散變量表示為連續(xù)向量的方法。它在機(jī)器學(xué)習(xí)中起到了不可或缺的作用。例如,在機(jī)器翻譯中的詞嵌入和分類變量中的實體嵌入都是嵌入的成功應(yīng)用。

OpenAI Embedding:基于人工智能的搜索新篇章

嵌入的本質(zhì)是“壓縮”,用較低維度的k維特征去描述有冗余信息的較高維度的n維特征,也可以叫用較低維度的k維空間去描述較高維度的n維空間。在思想上,與線性代數(shù)的主成分分析PCA,奇異值分解SVD異曲同工,事實上,PCA和SVD也可以叫做Embedding方法。

OpenAI 早先提供了第一代模型(在模型ID中用-001表示),包括text-similarity-davinci-001和davinci-001嵌入等等,而后在2022年12月將嵌入模型更新為text-embedding-ada-002(在模型ID中用-002表示)。新模型擁有較小的嵌入大小,新嵌入只有1536維,并且提供:

  • 價格降低了90%-99.8%
  • 嵌入維度大小減少了1/8,降低了向量數(shù)據(jù)庫成本
  • 端點統(tǒng)一,便于使用
  • 在文本搜索、代碼搜索和句子相似性方面具有最先進(jìn)的性能
  • 上下文窗口從2048增加到8192

總的來說,建議對幾乎所有用例使用text-embedding-ada-002。它更好,更便宜,更簡單使用。

Embedding 應(yīng)用場景

Embedding模型在許多應(yīng)用場景中都有廣泛的應(yīng)用。在OpenAI中,文本嵌入技術(shù)主要用于衡量文本字符串之間的相關(guān)性。以下是一些常見的應(yīng)用場景:?

  1. 搜索(Search):根據(jù)與查詢字符串的相關(guān)性對搜索結(jié)果進(jìn)行排序。
  2. 聚類(Clustering):將文本字符串按照相似性進(jìn)行分組。
  3. 推薦(Recommendations):推薦與給定文本字符串相關(guān)的項目。
  4. 異常檢測(Anomaly Detection):識別與其他文本字符串相關(guān)性較低的異常值。
  5. 多樣性測量(Diversity Measurement):分析文本字符串之間相似性的分布。
  6. 分類(Classification):根據(jù)文本字符串與各標(biāo)簽的相似性進(jìn)行分類。?

嵌入模型將文本字符串轉(zhuǎn)換為浮點數(shù)向量(列表),向量之間的距離衡量它們的相關(guān)性。較小的距離表示高相關(guān)性,而較大的距離表示低相關(guān)性。?

需要特別注意的是,Embedding模型是基于包含一些關(guān)于現(xiàn)實世界事件的信息的數(shù)據(jù)集進(jìn)行訓(xùn)練的,直到2020年8月為止。您需要處理涉及最近事件的任務(wù),模型可能無法表現(xiàn)出最佳效果。

下面是一種常見的應(yīng)用場景,將知識數(shù)據(jù)通過嵌入模型查詢出向量,并映射保存,然后在應(yīng)用時將問題也轉(zhuǎn)換成嵌入式,通過相似度算法(比如余弦相似度)對比前期保存的向量,找出TopN的數(shù)據(jù),即得到與問題最關(guān)聯(lián)的內(nèi)容。

OpenAI Embedding:基于人工智能的搜索新篇章


接下來的文章,我將通過代碼構(gòu)建一個基于OpenAI 嵌入(Embeddings)模型實現(xiàn)的應(yīng)用場景,請持續(xù)關(guān)注!文章來源地址http://www.zghlxwxcb.cn/news/detail-442459.html

到了這里,關(guān)于OpenAI Embedding:基于人工智能的搜索新篇章的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • AI+低代碼:開啟普惠人工智能時代的新篇章

    AI+低代碼:開啟普惠人工智能時代的新篇章

    ???? 博主貓頭虎 帶您 Go to New World.??? ?? 博客首頁——貓頭虎的博客?? ??《面試題大全專欄》 文章圖文并茂??生動形象??簡單易學(xué)!歡迎大家來踩踩~?? ?? 《IDEA開發(fā)秘籍專欄》學(xué)會IDEA常用操作,工作效率翻倍~?? ?? 《100天精通Golang(基礎(chǔ)入門篇)》學(xué)會Golang語言

    2024年02月15日
    瀏覽(26)
  • 實在智能RPA亮相2023全球人工智能技術(shù)博覽會,“能對話的數(shù)字員工”引領(lǐng)智能自動化新篇章

    實在智能RPA亮相2023全球人工智能技術(shù)博覽會,“能對話的數(shù)字員工”引領(lǐng)智能自動化新篇章

    隨著ChatGPT火爆全網(wǎng),人工智能再次成為學(xué)術(shù)界和科技領(lǐng)域“新寵”,一場“智能革命”的序幕悄然掀開。 6月13日,“智能驅(qū)動 砥礪前行”為主題的2023全球人工智能技術(shù)博覽會在杭州未來科技城學(xué)術(shù)交流中心圓滿落下帷幕。此次博覽會以展示智能科技創(chuàng)新前沿為目標(biāo),集合了

    2024年02月10日
    瀏覽(41)
  • 人工智能的新篇章:深入了解大型語言模型(LLM)的應(yīng)用與前景

    人工智能的新篇章:深入了解大型語言模型(LLM)的應(yīng)用與前景

    項目設(shè)計集合(人工智能方向):助力新人快速實戰(zhàn)掌握技能、自主完成項目設(shè)計升級,提升自身的硬實力(不僅限NLP、知識圖譜、計算機(jī)視覺等領(lǐng)域) :匯總有意義的項目設(shè)計集合,助力新人快速實戰(zhàn)掌握技能,助力用戶更好利用 CSDN 平臺,自主完成項目設(shè)計升級,提升自

    2024年02月04日
    瀏覽(33)
  • ChatGPT——OpenAI推出的人工智能聊天機(jī)器人

    ChatGPT——OpenAI推出的人工智能聊天機(jī)器人 [ 編輯] ChatGPT 全稱為“chat Generative Pre-trained Transformer”,翻譯成中文就是生成型預(yù)訓(xùn)練變換模型。它是美國公司OpenAI在2022年11月30日發(fā)布研發(fā)的聊天機(jī)器人程序,能用于問答、文本摘要生成、機(jī)器翻譯、分類、代碼生成和對話AI。 [1

    2024年02月04日
    瀏覽(27)
  • 怎么獲取OpenAI的api-key【人工智能】

    怎么獲取OpenAI的api-key【人工智能】

    2024-4-11 11:32:06 以下內(nèi)容源自《【人工智能】》 僅供學(xué)習(xí)交流使用 禁止其他平臺發(fā)布時刪除以下此話 本文首次發(fā)布于CSDN平臺 作者是CSDN@日星月云 博客主頁是https://jsss-1.blog.csdn.net 禁止其他平臺發(fā)布時刪除以上此話 小白如何設(shè)置openai api key的環(huán)境變量 https://platform.openai.com/do

    2024年04月27日
    瀏覽(19)
  • OpenAI的人工智能語音識別模型Whisper詳解及使用

    OpenAI的人工智能語音識別模型Whisper詳解及使用

    ????????擁有ChatGPT語言模型的OpenAI公司,開源了 Whisper 自動語音識別系統(tǒng),OpenAI 強(qiáng)調(diào) Whisper 的語音識別能力已達(dá)到人類水準(zhǔn)。 ????????Whisper是一個通用的語音識別模型,它使用了大量的多語言和多任務(wù)的監(jiān)督數(shù)據(jù)來訓(xùn)練,能夠在英語語音識別上達(dá)到接近人類水平的魯

    2024年02月09日
    瀏覽(95)
  • 搭建Gpt OpenAI 人工智能寫作助手和內(nèi)容創(chuàng)SaaS系統(tǒng)

    搭建Gpt OpenAI 人工智能寫作助手和內(nèi)容創(chuàng)SaaS系統(tǒng)

    該源碼是一個SaaS平臺,允許你的用戶使用OpenAI人工智能技術(shù)來生成獨特的內(nèi)容和圖像。它可以生成新的無抄襲內(nèi)容,并以多種語言改進(jìn)現(xiàn)有內(nèi)容。用戶還可以通過OpenAI DALL-E和穩(wěn)定擴(kuò)散,通過描述圖像來生成圖像。用戶還可以通過OpenAi Whisper模型,用語音轉(zhuǎn)文本功能創(chuàng)建音頻和

    2024年02月15日
    瀏覽(28)
  • OpenAI的新語言模型升級是否會改變?nèi)斯ぶ悄茴I(lǐng)域的格局?

    OpenAI的新語言模型升級是否會改變?nèi)斯ぶ悄茴I(lǐng)域的格局?

    近年來,人工智能領(lǐng)域取得了巨大的進(jìn)展,其中語言模型的發(fā)展尤為引人注目。而在這個領(lǐng)域的重要參與者之一,OpenAI近期宣布了其大型語言模型API的重大升級,引發(fā)了業(yè)界的廣泛關(guān)注。隨著GPT-4和gpt-3.5-turbo等新版本的推出,一個重要的問題浮現(xiàn):OpenAI的新語言模型升級是否

    2024年02月13日
    瀏覽(28)
  • 探索OpenAI-Unity:融合人工智能與游戲開發(fā)的新紀(jì)元

    項目地址:https://gitcode.com/srcnalt/OpenAI-Unity OpenAI-Unity 是一個激動人心的開源項目,它將OpenAI Gym的機(jī)器學(xué)習(xí)環(huán)境與Unity游戲引擎相結(jié)合,為開發(fā)者和研究者提供了一個在虛擬世界中訓(xùn)練和測試人工智能模型的強(qiáng)大平臺。通過這個項目,您可以利用Unity的強(qiáng)大圖形渲染能力和物理模

    2024年04月28日
    瀏覽(24)
  • 人工智能在法律智能搜索中的應(yīng)用

    作者:禪與計算機(jī)程序設(shè)計藝術(shù) 《人工智能在法律智能搜索中的應(yīng)用》 1.1. 背景介紹 隨著人工智能技術(shù)的快速發(fā)展,自然語言處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)已經(jīng)在人們的生活中發(fā)揮了越來越重要的作用。在法律領(lǐng)域,人工智能技術(shù)可以高效地幫助律師和法律從業(yè)人員進(jìn)

    2024年02月09日
    瀏覽(32)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包