国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<strong id="8np1f"></strong>

<bdo id="8np1f"></bdo>

<option id="8np1f"><rt id="8np1f"><pre id="8np1f"></pre></rt></option>

英特爾集成顯卡+ChatGLM3大語言模型的企業(yè)本地AI知識(shí)庫部署

1年前作者：英特爾開發(fā)人員專區(qū)分類：Toy博客閱讀(33)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了英特爾集成顯卡+ChatGLM3大語言模型的企業(yè)本地AI知識(shí)庫部署。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

作者：
英特爾創(chuàng)新大使劉力
英特爾開發(fā)者技術(shù)推廣經(jīng)理李翊瑋

1.?前言

?

??在當(dāng)今的企業(yè)環(huán)境中，信息的快速獲取和處理對(duì)于企業(yè)的成功至關(guān)重要。為了滿足這一需求，我們可以將RAG技術(shù)與企業(yè)本地知識(shí)庫相結(jié)合，以提供實(shí)時(shí)的、自動(dòng)生成的信息處理和決策支持。這將有助于企業(yè)更好地應(yīng)對(duì)快速變化的市場(chǎng)環(huán)境，提高企業(yè)的競爭力和創(chuàng)新能力。

??企業(yè)本地知識(shí)庫是一個(gè)集中存儲(chǔ)和管理企業(yè)內(nèi)部知識(shí)的系統(tǒng)。它包含了企業(yè)的歷史數(shù)據(jù)、經(jīng)驗(yàn)教訓(xùn)、最佳實(shí)踐、流程文檔、產(chǎn)品信息等。企業(yè)本地知識(shí)庫是企業(yè)智慧的結(jié)晶，對(duì)于企業(yè)的運(yùn)營和發(fā)展具有重要意義。

將RAG技術(shù)與企業(yè)本地知識(shí)庫相結(jié)合，可以為企業(yè)帶來以下幾個(gè)方面的優(yōu)勢(shì)：

實(shí)時(shí)性：RAG技術(shù)可以實(shí)時(shí)地從企業(yè)本地知識(shí)庫中提取相關(guān)信息，并生成用戶所需的內(nèi)容。這意味著用戶可以快速地獲取到最新的知識(shí)和信息，而不需要花費(fèi)大量時(shí)間去查找和整理。
自動(dòng)化：RAG技術(shù)可以自動(dòng)地處理和生成內(nèi)容，減少了人工干預(yù)的需求。這不僅可以提高企業(yè)的效率，還可以減少人為錯(cuò)誤的發(fā)生。
個(gè)性化和定制化：RAG技術(shù)可以根據(jù)用戶的需求和偏好，生成個(gè)性化的內(nèi)容。通過與企業(yè)本地知識(shí)庫的結(jié)合，可以提供更加精準(zhǔn)和有針對(duì)性的信息，滿足不同用戶的需求。
知識(shí)共享和傳承：企業(yè)本地知識(shí)庫是一個(gè)集中存儲(chǔ)和共享知識(shí)的平臺(tái)。通過與RAG技術(shù)的結(jié)合，可以將這些知識(shí)快速地傳遞給需要的用戶，促進(jìn)知識(shí)的共享和傳承。

2. RAG簡介

? ? RAG - Retrieval-Augmented Generation（檢索增強(qiáng)生成）是一種先進(jìn)的自然語言處理（NLP）技術(shù)，它結(jié)合了信息檢索（Retrieval）和神經(jīng)網(wǎng)絡(luò)生成（Generation）兩種方法，以提升模型在生成文本時(shí)的準(zhǔn)確性和相關(guān)性。在傳統(tǒng)的生成模型中，模型依據(jù)自身學(xué)習(xí)到的知識(shí)庫生成文本。然而，這種方法受限于模型訓(xùn)練時(shí)所接觸到的數(shù)據(jù)范圍，特別是在處理未見的、需要實(shí)時(shí)查找新信息的場(chǎng)景時(shí)，可能無法生成最新或最準(zhǔn)確的內(nèi)容。

? RAG模型通過引入一個(gè)檢索組件，在接收到輸入問題或任務(wù)后，首先從大規(guī)模預(yù)定義的知識(shí)庫（如網(wǎng)頁、文檔集合或其他結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)源）中檢索與任務(wù)相關(guān)的信息片段。然后，檢索到的信息作為額外的上下文輸入，與原始輸入一起傳遞給生成模型。生成模型在此基礎(chǔ)上，利用檢索到的信息以及自身的語言模型能力，生成更為精確、詳盡且與現(xiàn)實(shí)世界信息保持同步的回答或文本內(nèi)容。

? 簡單來說，RAG模型就是在傳統(tǒng)生成模型的基礎(chǔ)上增加了一個(gè)動(dòng)態(tài)獲取外部知識(shí)的能力，這樣既保留了大模型生成連貫文本的優(yōu)點(diǎn)，又解決了由于模型記憶限制導(dǎo)致的知識(shí)更新和準(zhǔn)確性不足的問題，尤其適用于問答系統(tǒng)、對(duì)話系統(tǒng)及需要實(shí)時(shí)更新信息的自然語言處理任務(wù)。

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

3.? OpenVINO Notebook簡介

?OpenVINO Notebooks是一套以Jupyter Notebook為載體的開源交互式編程教程和示例代碼合集，由英特爾公司開發(fā)和維護(hù)。這套資源專為使用 OpenVINO 工具套件的開發(fā)者設(shè)計(jì)，旨在幫助他們更快地理解和掌握如何利用 OpenVINO 進(jìn)行深度學(xué)習(xí)模型的優(yōu)化與推理及實(shí)際部署AI在各式業(yè)務(wù)應(yīng)用場(chǎng)景里面。本文使用的OpenVINO 版本為2023.3。安裝教程請(qǐng)參考https://github.com/openvinotoolkit。

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

4. 部署平臺(tái)簡介：

? 算力魔方是一款可以DIY的迷你主機(jī)，采用了抽屜式設(shè)計(jì)，后續(xù)組裝、升級(jí)、維護(hù)只需要拔插模塊。通過選擇計(jì)算模塊的版本，再搭配不同額 IO 模塊可以組成豐富的配置，適應(yīng)不同場(chǎng)景。性能不夠時(shí)，可以升級(jí)計(jì)算模塊提升算力, 如需要顯卡可加上顯卡， IO 接口不匹配時(shí)，可以更換 IO 模塊調(diào)整功能，而無需重構(gòu)整個(gè)系統(tǒng)。本文在帶有英特爾12代酷睿i7-1265U芯片組里的銳炬? Xe集成顯卡+RAM 32GB的算力魔方上完成驗(yàn)證。

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

5.? 在集成顯卡上部署RAG

5.1 搭建OpenVINO Notebooks開發(fā)環(huán)境

第一步：請(qǐng)使用下面的命令克隆存儲(chǔ)庫創(chuàng)建并激活名為“openvino_env”的虛擬環(huán)境

git clone https://github.com/openvinotoolkit/openvino_notebooks.git

cd openvino_notebooks

conda create -n openvino_env python=3.9

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

第二步：請(qǐng)使用下面的命令激活虛擬環(huán)境并安裝依賴包，并啟動(dòng)Jupyter Notebooks

conda activate openvino_env

pip install -r requirements.txt

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

jupyter lab notebooks

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

5.2? 下載模型到本地

請(qǐng)使用命令將ChatGLM3 6B和text2vec模型下載到本地

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

git clone https://www.modelscope.cn/Jerry0/text2vec-large-chinese.git

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

5.3?運(yùn)行254-rag-chatbot程序

請(qǐng)運(yùn)行Notebooks里面的代碼模塊, 注意!! 國內(nèi)用戶請(qǐng)勿運(yùn)行模塊1，從模塊2開始一步步運(yùn)行代碼到NNCF模塊，模型壓縮選擇int4并按照下圖一及二圖修改notebooks 254里的代碼引導(dǎo)程序指定對(duì)應(yīng)的模型路徑完成ChatGLM3-6b模型int 4量化及部署

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

圖一

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

圖二

text2vec-large-chinese 模型部署

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

運(yùn)行結(jié)果，如下所示：本地知識(shí)庫已成功加入ChatGLM 6B模型里并精確回答問題

英特爾集成顯卡部署chatglm3,英特爾開發(fā)套件,OpenVINO,人工智能,英特爾顯卡,ChatGLM3,人工智能

運(yùn)行視頻.avi

6.? 總結(jié)

??將RAG技術(shù)與企業(yè)本地知識(shí)庫相結(jié)合，可以為企業(yè)提供實(shí)時(shí)、自動(dòng)化、個(gè)性化和定制化的信息處理和決策支持。這將有助于企業(yè)更好地應(yīng)對(duì)快速變化的市場(chǎng)環(huán)境，提高企業(yè)的競爭力和創(chuàng)新能力。

? 利用OpenVINO工具套件簡單易用，僅需三步即可在算力魔方完成開發(fā)環(huán)境搭建及模型的INT4量化且在英特爾集成顯卡上的部署實(shí)現(xiàn)RAG企業(yè)本地知識(shí)庫部署。

作者介紹：

劉力，深圳市鉑盛科技有限公司的創(chuàng)始人。帶領(lǐng)團(tuán)隊(duì)成功設(shè)計(jì)了多種計(jì)算機(jī)系統(tǒng)，并申請(qǐng)了多項(xiàng)專利和軟件著作，鉑盛科技為國家高新技術(shù)企業(yè)，深圳市專精特新企業(yè)。鉑盛通過整合算力和算法，打造軟硬件一體化的AIPC解決方案，目前產(chǎn)品已在工業(yè)控制、智能機(jī)器人、教育、醫(yī)療、金融等多個(gè)邊緣計(jì)算領(lǐng)域得到廣泛應(yīng)用。

聯(lián)系方式

電話：13537819699

Email：leo.liu@pasuntech.com

英特爾創(chuàng)新大使劉力

英特爾開發(fā)者技術(shù)推廣經(jīng)理李翊瑋文章來源地址http://www.zghlxwxcb.cn/news/detail-858901.html

到了這里，關(guān)于英特爾集成顯卡+ChatGLM3大語言模型的企業(yè)本地AI知識(shí)庫部署的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

如何在Linux系統(tǒng)下安裝英特爾 Arc系列獨(dú)立顯卡驅(qū)動(dòng)以及進(jìn)行AI推理性能測(cè)試
作者：??周兆靖 ????????目前，英特爾?推出了包括了Arc?家族A770，A750在內(nèi)的多個(gè)桌面版本的獨(dú)立顯卡（discrete Graphic Processing Unit，簡稱dGPU）供玩家與開發(fā)者進(jìn)行選擇。鑒于很多消費(fèi)者都是初次體驗(yàn)Intel?的獨(dú)立顯卡，在Linux * 系統(tǒng)下對(duì)于顯卡驅(qū)動(dòng)的下載與安裝并不熟悉，
2024年02月05日
瀏覽(57)
Python 獲取windows下硬件數(shù)據(jù)信息(CPU,內(nèi)存,英特爾、英偉達(dá)、AMD顯卡使用率及詳細(xì)信息)
前言：最近一直在做關(guān)于顯卡數(shù)據(jù)采集的調(diào)研工作,也在github上看到了一些三方庫比如Python和golang的psutil, python: gpustart,再或者通過wmi或者windowsApi等底層接口但是都只能獲取到顯卡的名稱以及廠家信息等無法真正意義上獲取到顯卡占用率等數(shù)據(jù) 在或者只能獲取到英偉達(dá)的顯卡
2024年02月16日
瀏覽(33)
第三代英特爾至強(qiáng) 可擴(kuò)展處理器（Ice Lake）和英特爾深度學(xué)習(xí)加速助力阿里巴巴 Transformer 模型性能提升
第三代英特爾? 至強(qiáng)? 可擴(kuò)展處理器采用了英特爾10 納米 + 制程技術(shù)。相比于第二代英特爾? 至強(qiáng)? 可擴(kuò)展處理器，該系列處理器內(nèi)核更多、內(nèi)存容量和頻率更高。阿里巴巴集團(tuán)和英特爾的技術(shù)專家共同探索了這些能力對(duì)人工智能應(yīng)用的意義，特別是在與英特爾? 深度學(xué)習(xí)加
2024年02月16日
瀏覽(19)
英特爾開始加碼封裝領(lǐng)域 | 百能云芯
? 在積極推進(jìn)先進(jìn)制程研發(fā)的同時(shí)，英特爾正在加大先進(jìn)封裝領(lǐng)域的投入。在這個(gè)背景下，該公司正在馬來西亞檳城興建一座全新的封裝廠，以加強(qiáng)其在2.5D/3D封裝布局領(lǐng)域的實(shí)力。據(jù)了解，英特爾計(jì)劃到2025年前，將其最先進(jìn)的3D Foveros封裝產(chǎn)能擴(kuò)增至目前的四倍，同時(shí)還向客
2024年02月11日
瀏覽(19)
英特爾? NUC迷你電腦設(shè)置帶電自啟
連接電源后英特爾? NUC迷你電腦可以自動(dòng)啟動(dòng)嗎？ (intel.cn)? ? 想死的風(fēng)還是吹到了公司 | ?????喂，勞動(dòng)仲裁嗎？這里有人強(qiáng)迫貓咪打工！?? ?
2024年02月07日
瀏覽(28)
在英特爾 CPU 上加速 Stable Diffusion 推理
前一段時(shí)間，我們向大家介紹了最新一代的英特爾至強(qiáng) CPU (代號(hào) Sapphire Rapids)，包括其用于加速深度學(xué)習(xí)的新硬件特性，以及如何使用它們來加速自然語言 transformer 模型的分布式微調(diào) 和推理。英特爾至強(qiáng)處理器: https://www.intel.com/content/www/us/en/products/details/processors/xeon/scal
2024年02月09日
瀏覽(27)
在英特爾 CPU 上微調(diào) Stable Diffusion 模型
擴(kuò)散模型能夠根據(jù)文本提示生成逼真的圖像，這種能力促進(jìn)了生成式人工智能的普及。人們已經(jīng)開始把這些模型用在包括數(shù)據(jù)合成及內(nèi)容創(chuàng)建在內(nèi)的多個(gè)應(yīng)用領(lǐng)域。Hugging Face Hub 包含超過 5 千個(gè)預(yù)訓(xùn)練的文生圖模型。這些模型與 Diffusers 庫結(jié)合使用，使得構(gòu)建圖像生成工作流
2024年02月15日
瀏覽(19)
聯(lián)手英特爾，釋放星飛分布式全閃存儲(chǔ)潛能
近日，英特爾官網(wǎng)發(fā)布了與 XSKY 星辰天合聯(lián)手打造的解決方案，即 XSKY 的新一代全閃分布式存儲(chǔ)系統(tǒng) XINFINI，該存儲(chǔ)系統(tǒng)采用英特爾 QAT 加速數(shù)據(jù)壓縮/解壓縮，從而大幅度提升存儲(chǔ)系統(tǒng)性能。全閃存儲(chǔ)系統(tǒng)面臨的解壓縮挑戰(zhàn) 在存儲(chǔ)系統(tǒng)的數(shù)據(jù)服務(wù)層中，通常需要進(jìn)行一定的壓
2024年02月01日
瀏覽(17)
AMD出招，英特爾最不想看到的對(duì)手來了
前段時(shí)間的CES上，AMD正式發(fā)布Ryzen 7000的3D緩存版，對(duì)于游戲玩家來說，Ryzen 7000 3D緩存版算是今年最期待的CPU。上一代的Ryzen7 5800X3D憑借超強(qiáng)的游戲性能和性價(jià)比，在德國最大的PC硬件零售商的統(tǒng)計(jì)中，甚至成為2022年最暢銷的高性能處理器。有著Ryzen 5000 3D緩存版的珠玉在前，
2024年02月10日
瀏覽(18)
解決英特爾無線網(wǎng)卡WiFi或者藍(lán)牙突然消失問題
win+R，輸入“devmgmt.msc”，檢查設(shè)備管理器中的無線網(wǎng)卡驅(qū)動(dòng)是否安裝好。訪問https://www.intel.cn/content/www/cn/zh/download/19351/windows-10-and-windows-11-wi-fi-drivers-for-intel-wireless-adapters.html下載對(duì)應(yīng)系統(tǒng)版本的英特爾無線網(wǎng)卡WiFi驅(qū)動(dòng)后安裝。訪問https://www.intel.cn/content/www/cn/zh/download/18649
2024年01月17日
瀏覽(26)

<tbody id="qyio6"><rt id="qyio6"><pre id="qyio6"></pre></rt></tbody>

<option id="qyio6"><pre id="qyio6"><table id="qyio6"></table></pre></option>

<strong id="qyio6"><div id="qyio6"></div></strong>