国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Azure Machine Learning - Azure AI 搜索中的集成數(shù)據(jù)分塊和嵌入

這篇具有很好參考價值的文章主要介紹了Azure Machine Learning - Azure AI 搜索中的集成數(shù)據(jù)分塊和嵌入。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

在基于索引器的索引編制中,Azure AI _集成矢量化_將數(shù)據(jù)分塊和文本到矢量嵌入添加到技能中,它還為查詢添加文本到矢量的轉(zhuǎn)換。

關注TechLead,分享AI全維度知識。作者擁有10+年互聯(lián)網(wǎng)服務架構、AI產(chǎn)品研發(fā)經(jīng)驗、團隊管理經(jīng)驗,同濟本復旦碩,復旦機器人智能實驗室成員,阿里云認證的資深架構師,項目管理專業(yè)人士,上億營收AI產(chǎn)品研發(fā)負責人。文章來源地址http://www.zghlxwxcb.cn/news/detail-752662.html

Azure Machine Learning - Azure AI 搜索中的集成數(shù)據(jù)分塊和嵌入,azure,人工智能,microsoft,機器學習,深度學習

一、組件圖

下圖顯示了集成矢量化的組件。

Azure Machine Learning - Azure AI 搜索中的集成數(shù)據(jù)分塊和嵌入,azure,人工智能,microsoft,機器學習,深度學習

下面是負責集成矢量化的組件清單:

  • 基于索引器的索引編制支持的數(shù)據(jù)源。
  • 一個用于指定矢量字段的索引,以及一個分配到矢量字段的矢量化器定義。
  • 一個用于為數(shù)據(jù)分塊提供文本拆分技能的技能組,以及一個矢量化技能(AzureOpenAiEmbedding 技能,或指向外部嵌入模型的自定義技能)。
  • (可選)用于將分塊數(shù)據(jù)推送到次要索引的索引投影(也在技能組中定義)
  • 一個嵌入模型,部署在 Azure OpenAI 上或通過 HTTP 終結點提供。
  • 一個用于端到端驅(qū)動流程的索引器。 索引器還指定用于進行更改檢測的計劃、字段映射和屬性。

此清單主要與集成矢量化有關,但你的解決方案并不局限于此列表。 可以添加其他 AI 擴充技能、創(chuàng)建知識存儲、添加語義排名、添加相關性優(yōu)化和其他查詢功能。

二、可用性和定價

集成矢量化可用性基于嵌入模型。 如果使用的是 Azure OpenAI,請查看區(qū)域可用性。

如果使用的是自定義技能和 Azure 托管機制(例如 Azure 函數(shù)應用、Azure Web 應用和 Azure Kubernetes),請查看各區(qū)域上市的產(chǎn)品頁以了解功能可用性。

數(shù)據(jù)分塊(文本拆分技能)是免費的,已在所有區(qū)域的所有 Azure AI 服務中提供。

三、集成矢量化支持哪些方案?

  • 將大型文檔劃分為塊,這對于矢量和非矢量方案很有用。 對于矢量方案,塊可幫助你滿足嵌入模型的輸入約束。 對于非矢量方案,你可能會使用一個聊天式搜索應用,其中的 GPT 從編制了索引的塊中組合響應。 可以使用矢量化塊或非矢量化塊進行聊天式搜索。

  • 生成一個矢量存儲,其中的所有字段都是矢量字段,只有文檔 ID(搜索索引所需)是字符串字段。 查詢矢量索引以檢索文檔 ID,然后將文檔的矢量字段發(fā)送到另一個模型。

  • 組合矢量和文本字段來執(zhí)行提供或不提供語義排名的混合搜索。 集成矢量化簡化了[矢量搜索支持的所有方案]

四、何時使用集成矢量化

我們建議使用 Azure AI Studio 的內(nèi)置矢量化支持。 如果此方法不能滿足你的需求,你可以創(chuàng)建索引器和技能組,以便使用 Azure AI 搜索的編程接口調(diào)用集成矢量化。

五、如何使用集成矢量化

對于僅限查詢的矢量化:

  1. 將一個[矢量化器添加]到索引。 它應該與用于在索引中生成矢量的嵌入模型相同。
  2. 將[矢量化器分配]到矢量字段。
  3. [構建矢量查詢],用于指定要矢量化的文本字符串。

更常見的方案 - 在索引編制期間進行數(shù)據(jù)分塊和矢量化:

  1. 與支持的數(shù)據(jù)源[建立數(shù)據(jù)源連接],以進行基于索引器的索引編制。
  2. [創(chuàng)建一個技能組],用于調(diào)用[文本拆分技能]進行分塊,并調(diào)用 [AzureOpenAIEmbeddingModel]或自定義技能來將塊矢量化。
  3. [創(chuàng)建一個索引]用于指定查詢時間的[矢量化器],并將其分配到矢量字段。
  4. [創(chuàng)建一個索引器]以驅(qū)動從數(shù)據(jù)檢索到技能組執(zhí)行,再到索引編制的整個流程。

六、限制

確保了解[嵌入模型的 Azure OpenAI 配額和限制]。 Azure AI 搜索具有重試策略,但如果配額耗盡,重試會失敗。

Azure OpenAI 每分鐘令牌數(shù)限制是按模型、按訂閱計算的。 如果對查詢和索引編制工作負載使用嵌入模型,請記住這一點。 在可能的情況下[遵循最佳做法]。 為每個工作負載提供一個嵌入模型,并嘗試將其部署在不同的訂閱中。

請記住,在 Azure AI 搜索中,存在按層和按工作負載規(guī)定的[服務限制]。

最后,目前不支持以下功能:

  • [客戶托管的加密密鑰]
  • 與矢量化器的[共享專用鏈接連接]
  • 目前,不提供對集成數(shù)據(jù)分塊和矢量化進行批處理的功能

七、集成矢量化的優(yōu)勢

下面是集成矢量化的一些重要優(yōu)勢:

  • 沒有單獨的數(shù)據(jù)分塊和矢量化管道。 代碼更易于編寫和維護。

  • 自動進行端到端索引編制。 當源(例如 Azure 存儲、Azure SQL 或 Cosmos DB)中的數(shù)據(jù)發(fā)生更改時,索引器可以在整個管道中傳遞這些更新(從檢索到文檔破解,再到可選的 AI 擴充、數(shù)據(jù)分塊、矢量化和索引編制)。

  • 將分塊的內(nèi)容投影到次要索引。 次要索引的創(chuàng)建方式與創(chuàng)建任何搜索索引(包含字段和其他構造的架構)一樣,但索引器會將它們與主要索引一起填充。 在同一索引編制運行期間,每個源文檔的內(nèi)容都會流向主要和次要索引中的字段。

    次要索引適用于數(shù)據(jù)分塊和檢索增強生成 (RAG) 應用。 假設將一個大型 PDF 文件用作源文檔,主要索引可能包含基本信息(標題、日期、作者、描述),而次要索引則包含內(nèi)容塊。 借助數(shù)據(jù)塊級別的矢量化,可以更輕松地查找相關信息(每個塊均可搜索)并返回相關響應,尤其是在聊天式搜索應用中。

八、分塊索引

分塊是將內(nèi)容劃分為可獨立處理的較小可管理部分(塊)的過程。 如果源文檔太大,以至超過了嵌入或大型語言模型的最大輸入大小,那么就需要進行分塊,但你可能發(fā)現(xiàn),分塊能夠為 [RAG 模式]和聊天式搜索提供更好的索引結構。

下圖顯示了分塊索引編制的組件。

Azure Machine Learning - Azure AI 搜索中的集成數(shù)據(jù)分塊和嵌入,azure,人工智能,microsoft,機器學習,深度學習

關注TechLead,分享AI全維度知識。作者擁有10+年互聯(lián)網(wǎng)服務架構、AI產(chǎn)品研發(fā)經(jīng)驗、團隊管理經(jīng)驗,同濟本復旦碩,復旦機器人智能實驗室成員,阿里云認證的資深架構師,項目管理專業(yè)人士,上億營收AI產(chǎn)品研發(fā)負責人。

到了這里,關于Azure Machine Learning - Azure AI 搜索中的集成數(shù)據(jù)分塊和嵌入的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • Azure Machine Learning - 聊天機器人構建

    Azure Machine Learning - 聊天機器人構建

    本文介紹如何部署和運行適用于 Python 的企業(yè)聊天應用示例。 此示例使用 Python、Azure OpenAI 服務和 Azure AI 搜索中的檢索擴充生成(RAG)實現(xiàn)聊天應用,以獲取虛構公司員工福利的解答。 關注TechLead,分享AI全維度知識。作者擁有10+年互聯(lián)網(wǎng)服務架構、AI產(chǎn)品研發(fā)經(jīng)驗、團隊管理

    2024年01月19日
    瀏覽(25)
  • Azure Machine Learning - 使用 Azure OpenAI 服務生成圖像

    Azure Machine Learning - 使用 Azure OpenAI 服務生成圖像

    在瀏覽器/Python中使用 Azure OpenAI 生成圖像,圖像生成 API 根據(jù)文本提示創(chuàng)建圖像。 關注TechLead,分享AI全維度知識。作者擁有10+年互聯(lián)網(wǎng)服務架構、AI產(chǎn)品研發(fā)經(jīng)驗、團隊管理經(jīng)驗,同濟本復旦碩,復旦機器人智能實驗室成員,阿里云認證的資深架構師,項目管理專業(yè)人士,上

    2024年02月05日
    瀏覽(29)
  • Azure Machine Learning - Azure OpenAI GPT 3.5 Turbo 微調(diào)教程

    Azure Machine Learning - Azure OpenAI GPT 3.5 Turbo 微調(diào)教程

    本教程將引導你在Azure平臺完成對 gpt-35-turbo-0613 模型的微調(diào)。 關注TechLead,分享AI全維度知識。作者擁有10+年互聯(lián)網(wǎng)服務架構、AI產(chǎn)品研發(fā)經(jīng)驗、團隊管理經(jīng)驗,同濟本復旦碩,復旦機器人智能實驗室成員,阿里云認證的資深架構師,項目管理專業(yè)人士,上億營收AI產(chǎn)品研發(fā)負

    2024年02月04日
    瀏覽(24)
  • Azure云工作站上做Machine Learning模型開發(fā) - 全流程演示

    Azure云工作站上做Machine Learning模型開發(fā) - 全流程演示

    關注TechLead,分享AI全維度知識。作者擁有10+年互聯(lián)網(wǎng)服務架構、AI產(chǎn)品研發(fā)經(jīng)驗、團隊管理經(jīng)驗,同濟本復旦碩,復旦機器人智能實驗室成員,阿里云認證的資深架構師,項目管理專業(yè)人士,上億營收AI產(chǎn)品研發(fā)負責人。 了解如何在 Azure 機器學習云工作站上使用筆記本開發(fā)訓

    2024年02月08日
    瀏覽(25)
  • Azure Machine Learning - Azure OpenAI 服務使用 GPT-35-Turbo and GPT-4

    Azure Machine Learning - Azure OpenAI 服務使用 GPT-35-Turbo and GPT-4

    通過 Azure OpenAI 服務使用 GPT-35-Turbo and GPT-4 Azure 訂閱 - 免費創(chuàng)建訂閱 已在所需的 Azure 訂閱中授予對 Azure OpenAI 服務的訪問權限。 目前,僅應用程序授予對此服務的訪問權限。 可以填寫 https://aka.ms/oai/access 處的表單來申請對 Azure OpenAI 服務的訪問權限。 Python 3.7.1 或更高版本。

    2024年02月05日
    瀏覽(57)
  • 機器學習中的 Transformation Pipelines(Machine Learning 研習之十)

    機器學習中的 Transformation Pipelines(Machine Learning 研習之十)

    Transformation Pipelines 有許多數(shù)據(jù)轉(zhuǎn)換步驟需要以正確的順序執(zhí)行。幸運的是, Scikit-Learn 提供了 Pipeline 類來幫助處理這樣的轉(zhuǎn)換序列。下面是一個用于數(shù)值屬性的小管道,它首先對輸入特性進行歸并,然后對輸入特性進行縮放: Pipeline 構造函數(shù)采用名稱/估算器對(2元組)的列表,

    2024年02月04日
    瀏覽(28)
  • Spark Machine Learning進行數(shù)據(jù)挖掘的簡單應用(興趣預測問題)

    數(shù)據(jù)挖掘任務主要分為以下六個步驟: 1.數(shù)據(jù)預處理 2.特征轉(zhuǎn)換 3.特征選擇 4.訓練模型 5.模型預測 6.評估預測結果 這里準備了20條關于不同地區(qū)、不同性別、不同身高、體重…的人的興趣數(shù)據(jù)集(命名為hobby.csv): 任務分析 通過sex,address,age,height,weight這五個特征預測一個人的

    2024年02月03日
    瀏覽(21)
  • (3)【Python數(shù)據(jù)分析進階】Machine-Learning模型與算法應用-線性回歸與邏輯回歸

    (3)【Python數(shù)據(jù)分析進階】Machine-Learning模型與算法應用-線性回歸與邏輯回歸

    目錄 一、Linear Regression線性回歸應用 一元一次線性回歸公式及解析 應用案例(一)——自定義數(shù)據(jù)(Custom data) 1、下載安裝sklearn庫 2、導入庫函數(shù) 3、加載數(shù)據(jù)集 4、創(chuàng)建線性回歸對象 5、模型訓練 6、預測結果 7、繪制模型圖像 8、應用模型進行預測 9、評估指標 應用案例(

    2024年01月24日
    瀏覽(28)
  • 《斯坦福數(shù)據(jù)挖掘教程·第三版》讀書筆記(英文版)Chapter 12 Large-Scale Machine Learning

    《斯坦福數(shù)據(jù)挖掘教程·第三版》讀書筆記(英文版)Chapter 12 Large-Scale Machine Learning

    來源:《斯坦福數(shù)據(jù)挖掘教程·第三版》對應的公開英文書和PPT Algorithms called “machine learning” not only summarize our data; they are perceived as learning a model or classifier from the data, and thus discover something about data that will be seen in the future. The term unsupervised refers to the fact that the input data does

    2024年02月10日
    瀏覽(26)
  • 【Machine Learning】Supervised Learning

    本筆記基于清華大學《機器學習》的課程講義監(jiān)督學習相關部分,基本為筆者在考試前一兩天所作的Cheat Sheet。內(nèi)容較多,并不詳細,主要作為復習和記憶的資料。 f ( x ) = s i g n ( w ? x + b ) f(x)=sign(w^top x+b) f ( x ) = s i g n ( w ? x + b ) convergence output probability instead of labels. Loss

    2024年01月20日
    瀏覽(24)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包