国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<progress id="8dlwc"><pre id="8dlwc"><pre id="8dlwc"></pre></pre></progress>

<strong id="8dlwc"><center id="8dlwc"></center></strong>

<strong id="8dlwc"><center id="8dlwc"></center></strong>

<form id="8dlwc"><ruby id="8dlwc"><tbody id="8dlwc"></tbody></ruby></form>

【deepseek】（1）：12月1日新大模型deepseek發(fā)布！使用3080顯卡，運(yùn)行deepseek-7b模型，可以正常運(yùn)行WebUI了，速度9 words/s。

2年前作者：fly-iot分類：Toy博客閱讀(132)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了【deepseek】（1）：12月1日新大模型deepseek發(fā)布！使用3080顯卡，運(yùn)行deepseek-7b模型，可以正常運(yùn)行WebUI了，速度9 words/s。。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1，演示視頻

https://www.bilibili.com/video/BV1364y157EA/

【deepseek】（1）：12月1日新大模型deepseek發(fā)布！使用3080顯卡，運(yùn)行7b模型，可以正常運(yùn)行WebUI了，速度9 words/s。

2，關(guān)于RTX 3080 Ti * 1卡，2021年的顯卡

RTX 3080 Ti 擁有 34 TFLOPS 的著色器性能、67 TFLOPS 的光追性能、以及 273 TFLOPS 的 Tensor（Sparsity）性能。該卡的外形設(shè)計(jì)，依然類似于現(xiàn)有的 RTX 3080 FE 公版顯卡（雙槽雙面風(fēng)冷散熱器），但沒有 RTX 3090 那樣笨重（BFG），側(cè)邊仍是 12-pin 的 Microfit 輔助供電接口。

3，關(guān)于 deepseek-llm-7b-chat 的模型，12月1日上傳

只有關(guān)于代碼生成的部分：
https://zhuanlan.zhihu.com/p/666077213

https://www.modelscope.cn/models/deepseek-ai/deepseek-llm-7b-chat/summary
deepseek 模型下載,大模型,autodl,chatgpt,大模型,deepseek,webui,fastchat

關(guān)于 DeepSeek
DeepSeek 致力于探索 AGI 的本質(zhì)，不做中庸的事，帶著好奇心，用最長期的眼光去回答最大的問題。

DeepSeek Coder 是深度求索發(fā)布的第一代大模型，在不久的將來，我們還將呈現(xiàn)給社區(qū)更多更好的研究成果。讓我們?cè)谶@個(gè)激動(dòng)人心的時(shí)代，共同推進(jìn) AGI 的到來！

https://github.com/lm-sys/FastChat/blob/main/docs/model_support.md

deepseek 模型下載,大模型,autodl,chatgpt,大模型,deepseek,webui,fastchat

3，使用autodl創(chuàng)建環(huán)境，安裝最新的 fastchat

需要選擇 python3.10 的鏡像，否則會(huì)執(zhí)行報(bào)錯(cuò)：
Miniconda conda3
Python 3.10(ubuntu22.04)
Cuda 11.8

deepseek 模型下載,大模型,autodl,chatgpt,大模型,deepseek,webui,fastchat

apt update && apt install -y git-lfs net-tools
# 一定要保證有大磁盤空間：
cd /root/autodl-tmp
git clone https://www.modelscope.cn/deepseek-ai/deepseek-llm-7b-chat.git

# 最后安裝 
pip3 install "fschat[model_worker,webui]"

安裝完成之后就可以使用fastchat啟動(dòng)了。

4，使用 fastchat 啟動(dòng) deepseek-llm-7b-chat 模型

啟動(dòng)腳本：

# run_all_deepseek.sh

# 清除全部 fastchat 服務(wù)
ps -ef | grep fastchat.serve | awk '{print$2}' | xargs kill -9
sleep 3

rm -f *.log

# 首先啟動(dòng) controller ：
nohup python3 -m fastchat.serve.controller --host 0.0.0.0 --port 21001 > controller.log 2>&1 &

# 啟動(dòng) openapi的 兼容服務(wù) 地址 8000
nohup python3 -m fastchat.serve.openai_api_server --controller-address http://127.0.0.1:21001 \
  --host 0.0.0.0 --port 8000 > api_server.log 2>&1 &

# 啟動(dòng) web ui
nohup python -m fastchat.serve.gradio_web_server --model-list-mode reload \
  --controller-url http://127.0.0.1:21001 \
  --host 0.0.0.0 --port 6006 > web_server.log 2>&1 &

## 啟動(dòng) worker 
nohup python3 -m fastchat.serve.model_worker  --load-8bit --model-names deepseek-7b \
  --model-path ./deepseek-llm-7b-chat --controller-address http://127.0.0.1:21001 \
  --worker-address http://127.0.0.1:8080 --host 0.0.0.0 --port 8080 > model_worker.log 2>&1 &

sleep 2

tail -f model_worker.log

解決：內(nèi)存不夠，增加參數(shù) --load-8bit 解決：

2023-12-08 23:01:38 | ERROR | stderr |     return t.to(device, dtype if t.is_floating_point() or t.is_complex() else None, non_blocking)
2023-12-08 23:01:38 | ERROR | stderr | torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 32.00 MiB (GPU 0; 11.76 GiB total capacity; 11.48 GiB already allocated; 27.19 MiB free; 11.49 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.  See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

啟動(dòng)成功：

2023-12-08 23:03:00 | INFO | model_worker | args: Namespace(awq_ckpt=None, awq_groupsize=-1, awq_wbits=16, controller_address='http://127.0.0.1:21001', conv_template=None, cpu_offloading=False, debug=False, device='cuda', dtype=None, embed_in_truncate=False, enable_exllama=False, enable_xft=False, exllama_gpu_split=None, exllama_max_seq_len=4096, gptq_act_order=False, gptq_ckpt=None, gptq_groupsize=-1, gptq_wbits=16, gpus=None, host='0.0.0.0', limit_worker_concurrency=5, load_8bit=True, max_gpu_memory=None, model_names=['deepseek-7b'], model_path='./deepseek-llm-7b-chat', no_register=False, num_gpus=1, port=8080, revision='main', seed=None, ssl=False, stream_interval=2, worker_address='http://127.0.0.1:8080', xft_dtype=None, xft_max_seq_len=4096)
2023-12-08 23:03:00 | INFO | model_worker | Loading the model ['deepseek-7b'] on worker c48d8d3f ...
  0%|                                                                                                                               | 0/2 [00:00<?, ?it/s]
 50%|███████████████████████████████████████████████████████████▌                                                           | 1/2 [00:09<00:09,  9.91s/it]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:36<00:00, 19.43s/it]
100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:36<00:00, 18.01s/it]
2023-12-08 23:03:36 | ERROR | stderr | 
2023-12-08 23:03:36 | INFO | model_worker | Register to controller
2023-12-08 23:03:36 | ERROR | stderr | INFO:     Started server process [1864]
2023-12-08 23:03:36 | ERROR | stderr | INFO:     Waiting for application startup.
2023-12-08 23:03:36 | ERROR | stderr | INFO:     Application startup complete.
2023-12-08 23:03:36 | ERROR | stderr | INFO:     Uvicorn running on http://0.0.0.0:8080 (Press CTRL+C to quit)

測(cè)速，反而提速了：

python3 -m fastchat.serve.test_throughput --controller-address http://127.0.0.1:21001 --model-name deepseek-7b --n-thread 1

Models: ['deepseek-7b']
worker_addr: http://127.0.0.1:8080
thread 0 goes to http://127.0.0.1:8080
Time (POST): 32.48344707489014 s
Time (Completion): 32.483508586883545, n threads: 1, throughput: 9.820367745890861 words/s.

測(cè)試中文輸出正常：

curl http://localhost:8000/v1/chat/completions   -H "Content-Type: application/json"   -d '{
     "model": "deepseek-7b",
     "messages": [{"role": "user", "content": "北京景點(diǎn)"}],
     "temperature": 0.7
   }'

webui 啟動(dòng)正常了：

5，總結(jié)

終于解決了webui的啟動(dòng)問題。模型發(fā)展的速度真的快。速度越來越快了。
deepseek的模型使用起來還可以?？梢赃\(yùn)行7b的模型了。
測(cè)試了幾個(gè)簡單的問題，還可以。7B模型經(jīng)過 int8 量化，可以在 12G的3080TI 上面運(yùn)行。文章來源地址http://www.zghlxwxcb.cn/news/detail-814075.html

到了這里，關(guān)于【deepseek】（1）：12月1日新大模型deepseek發(fā)布！使用3080顯卡，運(yùn)行deepseek-7b模型，可以正常運(yùn)行WebUI了，速度9 words/s。的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

使用autodl服務(wù)器，兩個(gè)3090顯卡上運(yùn)行， Yi-34B-Chat-int4模型，并使用vllm優(yōu)化加速，顯存占用42G，速度23 words/s
https://www.bilibili.com/video/BV1Hu4y1L7BH/ 使用autodl服務(wù)器，兩個(gè)3090顯卡上運(yùn)行， Yi-34B-Chat-int4模型，用vllm優(yōu)化，增加 --num-gpu 2，速度23 words/s https://blog.csdn.net/freewebsys/article/details/134698597 安裝軟件：先安裝最新的torch版本安裝完成之后就可以使用fastchat啟動(dòng)了。只限制在內(nèi)蒙古機(jī)房
2024年02月04日
瀏覽(31)
使用autodl服務(wù)器，在A40顯卡上運(yùn)行， Yi-34B-Chat-int4模型，并使用vllm優(yōu)化加速，顯存占用42G，速度18 words/s
https://www.bilibili.com/video/BV1gu4y1c7KL/ 使用autodl服務(wù)器，在A40顯卡上運(yùn)行， Yi-34B-Chat-int4模型，并使用vllm優(yōu)化加速，顯存占用42G，速度18 words/s 2020年，英偉達(dá)發(fā)布 A40 專業(yè)顯卡，配備 48GB 顯存。采用了 GA102 GPU，擁有 10752 個(gè) CUDA 核心。而 A40 是用于服務(wù)器的。A40 都配備了四個(gè) DP
2024年02月04日
瀏覽(24)
K8S部署后的使用：dashboard啟動(dòng)、使用+docker鏡像拉取、容器部署（ubuntu環(huán)境+gpu3080+3主機(jī)+部署深度學(xué)習(xí)模型）
0、k8s安裝、docker安裝參考：前兩步Ubuntu云原生環(huán)境安裝，docker+k8s+kubeedge（親測(cè)好用）_愛吃關(guān)東煮的博客-CSDN博客_ubantu部署kubeedge ?配置節(jié)點(diǎn)gpu： K8S調(diào)用GPU資源配置指南_思影影思的博客-CSDN博客_k8s 使用gpu 1、重置和清除舊工程：每個(gè)節(jié)點(diǎn)主機(jī)都要運(yùn)行 2、部署新的k8s項(xiàng)目：
2023年04月20日
瀏覽(28)
Ｗindows 下 AMD顯卡訓(xùn)練模型有救了：pytorch_directml 下運(yùn)行Transformers
Windows 下ａｍｄ顯卡訓(xùn)練transformer 模型。安裝方法參見：?Windows下用amd顯卡訓(xùn)練： Pytorch-directml 重大升級(jí)，改為pytorch插件形式，兼容更好_amd顯卡 pytorch_znsoft的博客-CSDN博客? 注意，如果直接使用pipeline可能會(huì)有問題，應(yīng)該是pipeline不兼容導(dǎo)致的。只需要自己編寫具體代碼，避
2024年02月12日
瀏覽(28)
Linux Ubuntu查看正在使用的顯卡：運(yùn)行命令 lspci -nnk | grep -i vga -A3 | grep ‘in use‘
在Pop!_OS中，可以通過以下命令來查看當(dāng)前正在使用的顯卡：這個(gè)命令會(huì)列出所有的VGA設(shè)備，并顯示當(dāng)前正在使用的設(shè)備。輸出的結(jié)果可能類似于：這表示當(dāng)前正在使用的是NVIDIA顯卡驅(qū)動(dòng)程序。如果輸出為空，則表示當(dāng)前系統(tǒng)沒有啟用任何顯卡驅(qū)動(dòng)程序。另外，如果你使用的
2024年02月06日
瀏覽(26)
【持續(xù)更新】1996-2023歷代AMD Radeon桌面顯卡列表，Radeon顯卡發(fā)布日期
顯卡名稱發(fā)行日期工藝(nm) 核心頻率(Mhz) 顯存頻率 Rage 系列 3D Rage，1996/4/1，500，40，40 3D Rage II，1996/9/1，500，60，83 Rage Pro，1997/3/1，350，75，75 Rage XL，1998/8/1，250，83，125 Rage 128 VR，1998/8/1，250，80，120 Rage 128 GL，1998/8/1，250，103，103 Rage 128 Pro，1999/8/1，250，125，143 Rage 128 Ult
2024年02月06日
瀏覽(1066)
重磅！蘋果官方發(fā)布大模型框架：一個(gè)可以充分利用蘋果統(tǒng)一內(nèi)存的新的大模型框架MLX，你的MacBook可以一鍵運(yùn)行LLaMA了
本文來自DataLearnerAI官方網(wǎng)站：重磅！蘋果官方發(fā)布大模型框架：一個(gè)可以充分利用蘋果統(tǒng)一內(nèi)存的新的大模型框架MLX，你的MacBook可以一鍵運(yùn)行LLaMA了 | 數(shù)據(jù)學(xué)習(xí)者官方網(wǎng)站(Datalearner) https://www.datalearner.com/blog/1051701871117729 蘋果剛剛發(fā)布了一個(gè)全新的機(jī)器學(xué)習(xí)礦機(jī)MLX，這是一個(gè)
2024年02月04日
瀏覽(27)
使用FastDeploy在英特爾CPU和獨(dú)立顯卡上端到端高效部署AI模型
目錄 1.1?產(chǎn)業(yè)實(shí)踐中部署AI模型的痛點(diǎn) 1.1.1??部署模型的典型流程 1.1.2 端到端的AI性能 1.1.3 部署模型的難點(diǎn)和痛點(diǎn) 1.2 FastDeploy簡介 1.3 英特爾獨(dú)立顯卡簡介 1.4 使用FastDeploy在英特爾CPU和獨(dú)立顯卡上部署模型的步驟 1.4.1 搭建FastDeploy開發(fā)環(huán)境 1.4.2 下載模型和測(cè)試圖處 1.4.3 三行代
2024年02月01日
瀏覽(31)
【持續(xù)更新】2000-2023年英偉達(dá)歷代桌面Quadro顯卡列表，Quadro顯卡發(fā)布日期
顯卡名稱發(fā)行日期核心頻率(Mhz) 顯存頻率(Mhz) Quadro AGP 系列 Quadro，2000-01-01，135，166 Quadro2 Pro，2000-07-25，250，400 Quadro2 MXR，2000-07-25，200，183 Quadro2 MXR LP，2000-07-25，200，183 Quadro DCC，2001-03-14，200，230 Quadro4 500 XGL，2002-02-19，250，166 Quadro4 550 XGL，2002-02-19，270，400 Quadro4 700 XGL，
2024年02月08日
瀏覽(223)
使用Uniapp運(yùn)行、打包、發(fā)布微信小程序
1、HBuilder X 打開項(xiàng)目，運(yùn)行到微信開發(fā)者工具，此時(shí)會(huì)喚起微信開發(fā)者工具 2、打包，運(yùn)行------小程序-微信，打包中 ?打包后的文件 3、打包完成后，在小程序開發(fā)工具中點(diǎn)擊右上角------點(diǎn)擊上傳點(diǎn)擊上傳 ? 4、到小程序后臺(tái)就可以看到了。測(cè)試需要設(shè)為體驗(yàn)版，然后測(cè)試后
2024年02月16日
瀏覽(103)