?
為了滿足企業(yè)在數(shù)字化轉(zhuǎn)型過(guò)程中對(duì)更新迭代生產(chǎn)力工具的需求,靈雀云近日推出了云原生 MLOps 解決方案,幫助企業(yè)快速落地AI技術(shù)、實(shí)現(xiàn)智能化應(yīng)用和服務(wù)。
為什么要打造云原生MLOps解決方案?
隨著信息化技術(shù)的不斷發(fā)展,企業(yè)在數(shù)字化轉(zhuǎn)型的過(guò)程中,需要不斷地更新迭代生產(chǎn)力工具,從最早的將物理世界的主要業(yè)務(wù)數(shù)據(jù)使用信息化方式代替,到后來(lái)的利用大數(shù)據(jù)平臺(tái)將沉淀的數(shù)據(jù)轉(zhuǎn)化為企業(yè)的數(shù)據(jù)資產(chǎn),再到現(xiàn)在的利用人工智能和機(jī)器學(xué)習(xí)技術(shù)將數(shù)據(jù)資產(chǎn)進(jìn)一步轉(zhuǎn)化為模型資產(chǎn),實(shí)現(xiàn)智能化應(yīng)用和服務(wù)。
?
在這個(gè)演進(jìn)過(guò)程中,作為AI時(shí)代的DevOps,MLOps成為不可或缺的基礎(chǔ)平臺(tái)能力,為企業(yè)提供從模型開(kāi)發(fā)、訓(xùn)練、部署、管理到優(yōu)化的全流程支持,助力企業(yè)快速實(shí)現(xiàn)AI落地和創(chuàng)造價(jià)值。
然而,目前市場(chǎng)上的MLOps開(kāi)源工具多數(shù)存在著部署復(fù)雜、運(yùn)維困難、功能不完善、易用性差等問(wèn)題,企業(yè)落地AI機(jī)器學(xué)習(xí)技術(shù)依然面臨著很多挑戰(zhàn)和高昂的成本。為了解決這些問(wèn)題,靈雀云作為云原生領(lǐng)域領(lǐng)軍企業(yè),近日推出了企業(yè)級(jí)云原生 MLOps 解決方案以及其開(kāi)源版本 kubeflow-chart,致力于最大程度地降低企業(yè)應(yīng)用 AI 能力的門檻,使企業(yè)獲得高效、低成本、規(guī)范化、可追溯的 AI 應(yīng)用開(kāi)發(fā)以及上線流程,幫助企業(yè)快速應(yīng)用云原生機(jī)器學(xué)習(xí)技術(shù),構(gòu)建高效、穩(wěn)定、可擴(kuò)展的MLOps平臺(tái)。
開(kāi)源版本kubeflow-chart:解決云原生工具kubeflow部署難、使用難的困境
靈雀云自主研發(fā)的開(kāi)源 MLOps 工具 Kubeflow-chart,旨在簡(jiǎn)化在 Kubernetes 上部署開(kāi)源 Kubeflow 的步驟,免去企業(yè)調(diào)研、部署、運(yùn)維、應(yīng)用遷移和適配的成本,大幅降低了企業(yè)應(yīng)用 Kubeflow 的成本。
Kubeflow-chart 使用 Helm Chart 方式定制了 Kubeflow 的安裝方式,只需運(yùn)行一個(gè)命令(helm install),即可輕松完成 Kubeflow 及其依賴組件(如 dex、cert-manager、istio、knative-serving 等)的安裝。
此外,Kubeflow-chart 提供了常見(jiàn)的配置項(xiàng)抽出,如鏡像地址、認(rèn)證配置信息、默認(rèn)賬戶、依賴組件安裝開(kāi)關(guān)等,只需修改 values.yaml 文件,即可輕松在不同的 Kubernetes 環(huán)境中部署 Kubeflow。同時(shí),還提供了 values-cn.yaml 文件,解決了國(guó)內(nèi)開(kāi)發(fā)者在鏡像下載方面的困擾。Kubeflow-chart 讓開(kāi)發(fā)者能夠輕松快速地在 Kubernetes 上部署、學(xué)習(xí)、使用和管理目前最流行的機(jī)器學(xué)習(xí)軟件。
Alauda MLOps:更完善、更先進(jìn)、更易用、更強(qiáng)大
與此同時(shí),為了為企業(yè)用戶提供更便捷的云原生 MLOps 體驗(yàn),靈雀云在開(kāi)源版本的Kubeflow-chart 之上,推出了更完善、更先進(jìn)、更易用、更強(qiáng)大的企業(yè)級(jí) MLOps 解決方案Alauda MLOps(以下簡(jiǎn)稱AML)。
相較于現(xiàn)有的開(kāi)源 MLOps 方案,AML在以下方面具有顯著優(yōu)勢(shì):
1. ? 非侵入開(kāi)發(fā)模式:支持非侵入式的可視化工作流編排開(kāi)發(fā)環(huán)境,無(wú)需修改原有工程代碼即可應(yīng)用 MLOps 能力。
2. ? 可視化分布式:在可視化工作流開(kāi)發(fā)時(shí),直接配置多種形式的分布式訓(xùn)練。
3. ? 多租戶和配額:與ACP聯(lián)動(dòng),實(shí)現(xiàn)可視化多租戶資源配額管理(如 CPU、GPU、vGPU)。
4. ? 虛擬 GPU:支持使用 GPUManager 管理的虛擬 GPU 資源。
5. ? 調(diào)度器:利用 Volcano 強(qiáng)化分布式訓(xùn)練任務(wù)的調(diào)度器,支持 TFJob、PytorchJob、MPIJob 和通用 Argo 工作流。
6. ? 實(shí)驗(yàn)追蹤:集成 MLFlow,代替 Kubeflow 實(shí)驗(yàn)追蹤,并提供可視化實(shí)驗(yàn)比對(duì)功能。
7. ? 數(shù)據(jù)標(biāo)注:集成 Label Studio,與 S3 存儲(chǔ)聯(lián)動(dòng),完成可視化數(shù)據(jù)標(biāo)注。
8. ? SQL 訓(xùn)練:集成 SQLFlow,使用 SQL 語(yǔ)言完成模型訓(xùn)練和預(yù)測(cè)。
9. ? 大模型:在數(shù)據(jù)存儲(chǔ)、分布式訓(xùn)練、模型存儲(chǔ)等 MLOps 關(guān)鍵環(huán)節(jié),支持大模型的存儲(chǔ)和調(diào)用。
10. ? 中文界面:提供中文界面支持。
11. ? 國(guó)產(chǎn)硬件支持:支持各種國(guó)產(chǎn) CPU 和部分國(guó)產(chǎn) GPU 的 arm64 架構(gòu)。
12. ? 案例教程:內(nèi)置大量中文案例和教程 Notebook,助力快速上手。
13. ? 高性能:內(nèi)置 Intel TensorFlow、NeralCompressor、GPUManager、Triton 等工具,充分發(fā)揮訓(xùn)練和推理的性能。
14. ? 高可用:支持平臺(tái)和發(fā)布的推理服務(wù)的高可用性。
?
AML涵蓋數(shù)據(jù)集管理、機(jī)器學(xué)習(xí)開(kāi)發(fā)、模型訓(xùn)練、模型/推理服務(wù)四大功能模塊,無(wú)論是傳統(tǒng)數(shù)據(jù)挖掘機(jī)器學(xué)習(xí),還是深度學(xué)習(xí)和超大規(guī)模語(yǔ)言模型、對(duì)話 AI 等應(yīng)用方向,都能充分發(fā)揮其強(qiáng)大功能。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-509752.html
靈雀云此次推出的云原生 MLOps 解決方案將為企業(yè)提供一個(gè)全流程支持的平臺(tái),幫助企業(yè)實(shí)現(xiàn)快速的 AI 落地和價(jià)值創(chuàng)造。無(wú)論是想要簡(jiǎn)化 Kubeflow 的部署難題還是追求更完善、先進(jìn)、易用、強(qiáng)大的 MLOps 功能,靈雀云都將成為您不可或缺的合作伙伴。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-509752.html
到了這里,關(guān)于AIGC時(shí)代,基于云原生 MLOps 構(gòu)建屬于你的大模型(上)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!