一、相關(guān)背景介紹
在 2023 年,人工智能技術(shù)得到了廣泛的應(yīng)用和發(fā)展,不僅在互聯(lián)網(wǎng)行業(yè),還在醫(yī)療、金融、教育等領(lǐng)域都有了重大突破。在互聯(lián)網(wǎng)行業(yè),AI
技術(shù)被廣泛應(yīng)用于搜索引擎優(yōu)化、推薦系統(tǒng)、智能客服等方面,為用戶提供更加個(gè)性化、智能化的服務(wù)。在醫(yī)療領(lǐng)域,AI
技術(shù)被用于輔助醫(yī)生診斷、藥物研發(fā)等方面,大大提高了醫(yī)療效率和質(zhì)量。在金融領(lǐng)域,AI
技術(shù)被應(yīng)用于風(fēng)險(xiǎn)控制、客戶畫像等方面,為金融機(jī)構(gòu)提供更加精準(zhǔn)的服務(wù)。在教育領(lǐng)域,AI
技術(shù)被用于個(gè)性化教學(xué)、智能教育管理等方面,為學(xué)生提供更加有效的學(xué)習(xí)方式。
另外,2023年還涌現(xiàn)了許多新型的 AI
應(yīng)用,比如基于大模型的語音助手、智能家居控制系統(tǒng)、智能交通管理系統(tǒng)等,這些應(yīng)用在各個(gè)領(lǐng)域都得到了廣泛的應(yīng)用和認(rèn)可??梢哉f,2023年是人工智能技術(shù)蓬勃發(fā)展的一年,為各行各業(yè)帶來了巨大的變革和創(chuàng)新。相信在未來,人工智能技術(shù)將繼續(xù)發(fā)揮重要作用,為社會帶來更多的便利和進(jìn)步。
但是同時(shí),數(shù)據(jù)分析應(yīng)用在互聯(lián)網(wǎng)商用領(lǐng)域、醫(yī)療、政府和公共服務(wù)等眾多領(lǐng)域都有不可替代的地位。通過對海量數(shù)據(jù)的深入挖掘和分析,企業(yè)可以更好地理解市場趨勢、客戶需求和競爭對手的動(dòng)態(tài)。數(shù)據(jù)分析可以幫助企業(yè)進(jìn)行精準(zhǔn)的市場定位,優(yōu)化產(chǎn)品和服務(wù),提高客戶滿意度和忠誠度。此外,數(shù)據(jù)分析還可以為企業(yè)提供預(yù)測和規(guī)劃的依據(jù),幫助企業(yè)更好地把握市場機(jī)會和風(fēng)險(xiǎn)。通過數(shù)據(jù)分析,企業(yè)可以實(shí)現(xiàn)運(yùn)營流程的優(yōu)化和成本的降低,提高效率和經(jīng)營效益??傊瑪?shù)據(jù)分析不僅可以幫助企業(yè)做出明智的決策,還可以為企業(yè)創(chuàng)造更多商機(jī)和競爭優(yōu)勢,因此在當(dāng)今市場中具有不可忽視的重要性。
而今天我要介紹的就是在 11月21日九章云極 DataCanvas 剛剛發(fā)布的新星產(chǎn)品——TableAgent
;它是一個(gè)在DataCanvas Alaya
九章元識大模型基礎(chǔ)上開發(fā)的 能夠?qū)崿F(xiàn)私有化部署的企業(yè)級數(shù)據(jù)分析的智能體,有非常強(qiáng)大的意圖理解能力、分析建模能力和洞察力。 TableAgent
在充分的理解用戶意圖后,自主的利用統(tǒng)計(jì)科學(xué)、機(jī)器學(xué)習(xí)、因果推斷等高級建模技術(shù)從數(shù)據(jù)中挖掘價(jià)值,進(jìn)而提供分析觀點(diǎn)和指導(dǎo)行動(dòng)的深刻見解。
二、產(chǎn)品介紹及體驗(yàn)
首先值得一說的是,參加這次活動(dòng)主要是在11月21號下午摸魚的時(shí)候看到了九章云極 DataCanvas大模型
系列成果的發(fā)布會,從楊總那里得知?jiǎng)倓偵暇€了一個(gè)他們的新產(chǎn)品,TableAgent
,并且這是一個(gè)大模型和數(shù)據(jù)分析的結(jié)合體;很早之前,接觸 Canvas
大數(shù)據(jù)類型的產(chǎn)品還是在2021年底體驗(yàn)的 SageMaker Canvas
這個(gè)產(chǎn)品,但是兩者在交互上有著天壤之別,一個(gè)是傳統(tǒng)的點(diǎn)點(diǎn),框框,然后生成想要的 Canvas
數(shù)據(jù)展現(xiàn)。然而 TableAgent
的交互方式卻很特別,屬于類似即時(shí)聊天這種方式,交互更加便捷,使用方式門檻更低。
好了,話不多說,我們來體驗(yàn)一下這個(gè)產(chǎn)品。我們來個(gè)手把手帶你沉浸式體驗(yàn) TableAgent
。
- TableAgent公測地址
https://tableagent.DataCanvas.com
打開公測地址后,首先映入眼簾的是一個(gè)非常簡介風(fēng)的頁面。主頁部分沒有太多常規(guī)網(wǎng)站那樣對產(chǎn)品的一頓海吹,我們直接點(diǎn)擊立即體驗(yàn)即可;下面黑色部分則是公眾號和核心產(chǎn)品以及九章云極 DataCanvas 的開源項(xiàng)目貢獻(xiàn)(可以看到都是目前比較火的技術(shù))
登錄完成后,會有一個(gè)過渡頁面,應(yīng)該是初始化模型和模型部署啟動(dòng)的一個(gè)過程。
加載完畢后,我們進(jìn)入了操作主頁面(默認(rèn)是白色主題的,可以選擇切換黑色主題)其他操作點(diǎn)也一目了然。整體的功能模塊分布可以看下面的圖能非常清晰的感知。(如圖所示)
由于個(gè)人喜歡黑色,所以我打算換成黑色主題,然后選擇一個(gè)開源的數(shù)據(jù)集后,與AI進(jìn)行交互體驗(yàn);順便把所有功能都進(jìn)行體驗(yàn)體驗(yàn),最后我們再來進(jìn)行總結(jié)。
(一)使用預(yù)設(shè)數(shù)據(jù)集進(jìn)行體驗(yàn)
首先我們換成黑色的主題,然后選擇預(yù)設(shè)的數(shù)據(jù)集,目前預(yù)設(shè)的數(shù)據(jù)集總共有9類,我們選擇“Airbnb民宿價(jià)格&評價(jià)”
數(shù)據(jù)集。
接下來,我們使用自然語言與AI智能體
進(jìn)行交流,看看我們提出的數(shù)據(jù)分析的問題是否能夠非常效率的得到解答。
我們加載了“Airbnb民宿價(jià)格&評價(jià)”
數(shù)據(jù)集后,AI
會自動(dòng)回復(fù),我們可能關(guān)心的問題,展開詳情后是該數(shù)據(jù)集的字段及對應(yīng)的部分?jǐn)?shù)據(jù)示例(如下圖)。
雖然我們通過AI的自動(dòng)回復(fù)基本可以了解數(shù)據(jù)集的基本情況了,我們試試,他是否能夠進(jìn)一步的為我們解釋數(shù)據(jù)集概況。
【提問1】幫我描述一下這個(gè)數(shù)據(jù)集的內(nèi)容、字段以及數(shù)量,我想了解一下這個(gè)數(shù)據(jù)集
【AI回答1】
可以看到,它告訴了我們數(shù)據(jù)的總量,以及數(shù)據(jù)的9個(gè)字段,并且分別做了中文解釋,同時(shí)告訴我們可以關(guān)心哪些數(shù)據(jù)分析的問題,最后也給出了幾條可以查詢的建議。接下來我們繼續(xù)提問一個(gè)統(tǒng)計(jì)分析。
【提問2】幫我統(tǒng)計(jì)一下住宿評分最高和最低的它們價(jià)格的平均值是多少?
我們可以看到AI的整個(gè)執(zhí)行過程和它的分析思路都展現(xiàn)在我們的面前,它分別通過調(diào)用兩個(gè)函數(shù) df['Rating'].max()
和 df['Rating'].min()
先得到評分最高的住宿房源以及最低的住宿房源是5.0和3.67。(通過上面字段介紹我們知道,Rating
是住宿評分的字段)
# 獲取評分最高的住宿評分值
# 通過調(diào)用df['Rating'].max()獲取數(shù)據(jù)集中的最高評級。
highest_rating = df['Rating'].max()
# Observation 5.0
# 獲取評分最低的住宿評分值
# 通過調(diào)用df['Rating'].min()獲取這個(gè)值
lowest_rating = df['Rating'].min()
# Observation 3.67
然后再根據(jù) df[df['Rating'] == highest_rating]['Price(in dollar)'].mean()
和 df[df['Rating'] == lowest_rating]['Price(in dollar)'].mean()
獲得我們想要的答案。
# 首先從數(shù)據(jù)集df中選出評分等于最高評分的房源,然后對這些房源的price列求平均值。
highest_rating_price = df[df['Rating'] == highest_rating]['Price(in dollar)'].mean()
# Observation 209.7608695652174
# 首先從數(shù)據(jù)集df中選出評分等于最低評分的房源,然后對這些房源的price進(jìn)行平均值計(jì)算。
lowest_rating_price = df[df['Rating'] == lowest_rating]['Price(in dollar)'].mean()
# Observation 80.0
最高評分的房源平均價(jià)格是209.76$
,最低的評分的房源平均價(jià)格是80.00$
,由此我們基本可以得知,房源的價(jià)格與服務(wù)質(zhì)量、舒適度、顧客的感受是有直接的關(guān)系的,這也導(dǎo)致了最終的評分差異。
【AI回答2】
從完整的回答截圖中,我們可以看到,其實(shí)AI也根據(jù)這一結(jié)果分析了房源評價(jià)與價(jià)格的一個(gè)可能關(guān)系;接下來我們繼續(xù)深挖一下住宿價(jià)格與評分的相關(guān)性的分析。
【提問3】幫我分析一下2023年度所有住宿的價(jià)格與評分之間的關(guān)系,并分析價(jià)格對住宿評分的影響。
【AI回答3】
從回答中我們可以看到,AI
首先是對相關(guān)性的指數(shù)進(jìn)行了科普,然后告訴了我們最終結(jié)論:有一定相關(guān)性,但并不強(qiáng)烈。同時(shí)為了讓我們有一個(gè)更加直觀的感受,還繪制了一個(gè)散點(diǎn)圖進(jìn)行展現(xiàn)從散點(diǎn)圖中我們可以看到評分主要還是匯集在 50-400$
的區(qū)間內(nèi)的,其他的價(jià)格區(qū)間也有零零散散的一些評分而且這些費(fèi)用在 400$
以上的評分也基本上在 4.6
,但是由于 50-400$
區(qū)間的評分基數(shù)非常大,并且也存在很多高分評價(jià),所以價(jià)格和評分的關(guān)系并沒有那么明顯。
最后我們再問一個(gè)預(yù)測分析相關(guān)的問題。
【提問4】基于住宿屬性,比如價(jià)格、床的數(shù)量和評分,建立一個(gè)預(yù)測模型來預(yù)測住宿的評論數(shù)量。
【AI回答4】
經(jīng)過三次的嘗試 AI
終于給出了最終的預(yù)測結(jié)果,根據(jù)下面的公式以及四個(gè)需要學(xué)習(xí)的參數(shù)得出了我們最終詢問的結(jié)果,根據(jù)價(jià)格、床的數(shù)量和評分預(yù)測出了評論數(shù)量的結(jié)果。并且在最后內(nèi)容塊里告訴我們是通過哪個(gè)庫來實(shí)現(xiàn)這個(gè)預(yù)測分析的。
好了,預(yù)設(shè)的模型我們先體驗(yàn)到這里,通過上面一系列的操作,由淺入深,我們基本上可以感受到 TableAgent
在產(chǎn)品介紹中的部分特性實(shí)質(zhì)性的體現(xiàn)。
(二)導(dǎo)入B站《王者榮耀》相關(guān)高播放量視頻數(shù)據(jù)集進(jìn)行體驗(yàn)
1、數(shù)據(jù)介紹
這是一份來自于 阿里云天池 的b站《王者榮耀》相關(guān)視頻,播放量最高的 1000 個(gè)視頻數(shù)據(jù) 數(shù)據(jù)集,大小432.60KB
。
共包含9個(gè)字段:
標(biāo)題 、視頻地址、圖片 視頻時(shí)長 關(guān)鍵詞 播放量 發(fā)布時(shí)間 up主鏈接 up主
標(biāo)題 | 視頻地址 | 圖片 | 視頻時(shí)長 | 關(guān)鍵詞 | 播放量 | 發(fā)布時(shí)間 | up主鏈接 | up主 |
---|
這里解釋一下,由于這個(gè)數(shù)據(jù)集的時(shí)間格式不太規(guī)范,導(dǎo)致比較中報(bào)的發(fā)布時(shí)間在下面的示例中無法使用。
拖入文件加載完畢后,可以看到AI已經(jīng)識別并將數(shù)據(jù)的結(jié)構(gòu)和部分?jǐn)?shù)據(jù)已經(jīng)反饋出來了。
接下來我們進(jìn)行第一個(gè)預(yù)測需求提問.
【提問1】視頻時(shí)長對播放量是否有影響,長視頻和短視頻在播放量上有何不同表現(xiàn)?
【AI回答1】
經(jīng)過三次嘗試,AI成功完成分析結(jié)果。
從回答中我們可以得知,視頻的長短與播放量有一定關(guān)系,但這種關(guān)系并不強(qiáng)烈。長短視頻的播放量表現(xiàn)也只是長視頻略高于短視頻。OK,那我們進(jìn)一步深挖!
【提問2】分析不同視頻的播放量變化趨勢,了解哪些視頻受歡迎,哪些視頻的播放量呈現(xiàn)下降趨勢,最后以圖表呈現(xiàn)。
【AI回答2】
最受歡迎的視頻排名
播放量下降的視頻排名
這里非常清晰的列舉出了數(shù)據(jù),并且最后以表的方式呈現(xiàn)了一個(gè)視頻和播放量的對比圖。
【提問3】播放量與其他變量之間是否存在非線性關(guān)系。
【AI回答3】
最終的回答是,UP主ID
與播放量
存在完全的正想關(guān)系,這也非常符合現(xiàn)實(shí)情況,一些知名的、粉絲量高的UP主
,肯定對視頻的播放量起著至關(guān)重要的作用。
(三)體驗(yàn)后的小結(jié)
好了,通過分別的2個(gè)數(shù)據(jù)集(自帶數(shù)據(jù)集,導(dǎo)入的自定義數(shù)據(jù)集)TableAgent
都能夠很好,并且非常快捷的完成各方面的數(shù)據(jù)分析相關(guān)的工作;而且在交互過程中我們發(fā)現(xiàn),在數(shù)據(jù)分析相關(guān)的自然語言需求中,它也能夠非常好的理解你的語言意圖,比如在上述的提問2中,我既要受歡迎的視頻數(shù)據(jù),也要呈現(xiàn)下降趨勢的視頻數(shù)據(jù),并且最后還要求它以圖表的方式呈現(xiàn)出來,結(jié)果大家也看到了,它都做到了;再一個(gè)就是大家伙可能都發(fā)現(xiàn)了,那就是數(shù)據(jù)分析的使用門檻降到了極地的程度,真的可以說是在推文中提到的人人都是數(shù)據(jù)分析師。
三、綜合各方面的對比
(一)縱向?qū)Ρ取c目前互聯(lián)網(wǎng)傳統(tǒng)數(shù)據(jù)方式對比
作為互聯(lián)網(wǎng)人,大多數(shù)公司其實(shí)目前主流的數(shù)據(jù)分析方式,還是依賴于BI系統(tǒng)
和BI團(tuán)隊(duì)
的方式來做各種業(yè)務(wù)所需的數(shù)據(jù)分析需求。然而讓我們看看,我在做完體驗(yàn)之后的一個(gè)直觀感受對比,主要對比目前大多數(shù)互聯(lián)網(wǎng)企業(yè)目前做分析的方式,可以一目了然的發(fā)現(xiàn)TableAgent 智能體的獨(dú)特優(yōu)勢??傊畬Ρ瓤偨Y(jié)如下圖所示,灰常的清晰!
(二)橫向?qū)Ρ取c其他數(shù)據(jù)分析產(chǎn)品對比
產(chǎn)品間的比較,我就拿去年我在AWS體驗(yàn)的數(shù)據(jù)分析產(chǎn)品來說——Amazon SageMaker Canvas
來對比分析分析。
首先 Amazon SageMaker Canvas
是一個(gè)AWS
一直在強(qiáng)推的一個(gè)集機(jī)器學(xué)習(xí)、算法/模型、低代碼融合一身的數(shù)據(jù)分析云產(chǎn)品;當(dāng)初體驗(yàn)這個(gè)產(chǎn)品我可是寫了兩篇的教學(xué)性的技術(shù)博文,為什么是兩篇,一篇是《【無門檻】機(jī)器學(xué)習(xí)——Amazon SageMaker Canvas 【實(shí)驗(yàn)配置篇】》,另一篇是《【無門檻】機(jī)器學(xué)習(xí)——Amazon SageMaker Canvas 【供應(yīng)鏈準(zhǔn)時(shí)交付(場景)】》這個(gè)相當(dāng)于某個(gè)數(shù)據(jù)集的應(yīng)用了,具體的實(shí)驗(yàn)過程我不再在本篇文章里贅述了。
其實(shí)肯定有小伙伴問為什么是寫兩篇,其實(shí)就是因?yàn)闇?zhǔn)備工作(配置),與使用流程(操作)都具有一定的復(fù)雜性,并不是開箱即用,包括國外產(chǎn)品的后付費(fèi)方式,也讓國內(nèi)大多數(shù)開發(fā)者都不太習(xí)慣(創(chuàng)建后,不關(guān)閉會繼續(xù)扣費(fèi))。
首先就使用流程上來說,Amazon SageMaker Canvas的步驟大概如下:
1、創(chuàng)建Amazon SageMaker Canvas
環(huán)境
- 設(shè)置
SageMaker
域 -
Create a new role
(創(chuàng)建新角色)
2、啟動(dòng)應(yīng)用(Launch app
)
3、添加IAM
信任策略
- 這里是一系列的權(quán)限與策略配置
4、創(chuàng)建S3
并設(shè)置S3
存儲桶CORS
跨域策略
- 這里也是一步步的設(shè)置跨域策略的配置步驟
5、將數(shù)據(jù)集上次到S3存儲桶(Amazon SageMaker Canvas
僅支持訪問S3上的數(shù)據(jù)集)
6、在Amazon SageMaker Canvas
中導(dǎo)入數(shù)據(jù)集
7、開始構(gòu)建與模型訓(xùn)練(Quick build
)
8、分析自定義預(yù)測結(jié)果
雖然用也非常好用,但是整體下來的感覺就是比較繁瑣,各種配置,各種關(guān)聯(lián)產(chǎn)品的配置與權(quán)限、策略的設(shè)置。
其次我們來看看TableAgent 的使用步驟大概如下:
1、選擇或上傳自定義數(shù)據(jù)集
2、提問相關(guān)數(shù)據(jù)分析訴求
3、呈現(xiàn)預(yù)測結(jié)果
直觀來看就是這樣的。
所以單純就操作門檻和操作簡介程度上來說,肯定是 TableAgent
更勝一籌,整體感受上也更加人性化,并且從產(chǎn)品架構(gòu)上來說 TableAgent
也是創(chuàng)新化的在數(shù)據(jù)分析產(chǎn)品中融入了AI智能體,這一創(chuàng)新理念,也讓 TableAgent
在數(shù)據(jù)分析垂直領(lǐng)域占據(jù)了不少優(yōu)勢。
所以,就我個(gè)人感受 TableAgent
和 Amazon SageMaker Canvas
后,TableAgent
優(yōu)勢有一下幾點(diǎn):
1、AI智能體在數(shù)據(jù)分析產(chǎn)品領(lǐng)域的融入,讓產(chǎn)品各方面能力都得到了非常大的增強(qiáng),讓數(shù)據(jù)分析形成了互動(dòng)方式;
2、超便捷的使用方式,沒有各種復(fù)雜的環(huán)境配置、權(quán)限配置準(zhǔn)備工作,上手門檻極低,真正的做到人人都可做數(shù)據(jù)分析師;
3、透明化的分析過程呈現(xiàn),讓人可以一目了然了解整個(gè)數(shù)據(jù)預(yù)測/分析的過程來源是怎么樣的;
4、企業(yè)擔(dān)心數(shù)據(jù)安全風(fēng)險(xiǎn)支持私有化部署,個(gè)人用戶每天都有免費(fèi)的使用次數(shù),各方面都考慮得畢竟充足。
站在客觀層面來看,并不是說 Amazon SageMaker Canvas
有多么不好,只不過是 TableAgent
相比較它是新時(shí)代的產(chǎn)物,結(jié)合了更多的先進(jìn)技術(shù),成就了它出世即不凡,即超越了非常多的老牌數(shù)據(jù)分析產(chǎn)品,這也是新產(chǎn)品的優(yōu)勢所在。相信大家通過我橫向和縱向的對比也對TableAgent
有了一個(gè)基本的認(rèn)識了吧,如果讀到這里,你也可以去試試 TableAgent 。
四、Alaya開源項(xiàng)目
另外值得一提的是,九章云極 DataCanvas 公司除了在發(fā)布會上發(fā)布了商用的 TableAgent
以外,還開源了“白盒”模型 Alaya
以及LMS
模型運(yùn)行工具、LMPM
提示詞管理工具。國內(nèi)目前開源且支持商用的大模型好像比較出名的就是清華大學(xué)大模型,目前現(xiàn)在又多了一個(gè)非常Nice的大模型開源產(chǎn)品了,而且通過查看開源項(xiàng)目的開源協(xié)議我們可以看到是 Apache-2.0 license
,也許很多朋友還不清楚Apache-2.0 license
支持哪些?總之它是一個(gè)非常包容和自由的協(xié)議,一會展示一個(gè)以前整理的開源筆記的圖你們就知道了。(有空了一定要部署試試!)
下面是開源協(xié)議非常直觀的一個(gè)展示。(有興趣的可以收藏)
五、個(gè)人總結(jié)
整體體驗(yàn)下來還是非常棒的,作為一個(gè)剛剛發(fā)布的產(chǎn)品,已經(jīng)做得比較優(yōu)秀了,而且技術(shù)團(tuán)隊(duì)和公司的開源精神非常值得我們技術(shù)人學(xué)習(xí)。
TableAgent 的優(yōu)勢:
1、結(jié)合AI大模型的接入,順帶的這種會話式的交互,脫離了原有的數(shù)據(jù)分析交互方式,是一個(gè)比較創(chuàng)新的想法。
2、使用門檻是真的低,不用各種配置、各種設(shè)置,確實(shí)做到了是一個(gè)人人可用的數(shù)據(jù)分析產(chǎn)品。
3、透明化數(shù)據(jù)分析過程與審計(jì)監(jiān)督讓過程可追溯,結(jié)果信任度更高。
個(gè)人建議:
一方面是數(shù)據(jù)集類型以及大小的支持希望可以進(jìn)一步支持,另一方面是希望后續(xù)的迭代版中有有Win&Mac應(yīng)用版。文章來源:http://www.zghlxwxcb.cn/news/detail-756296.html
【補(bǔ)充說明】
TableAgent 可以免費(fèi)體驗(yàn),注冊后可以免費(fèi)使用5次,次數(shù)使用完了,可以認(rèn)證申請?jiān)黾哟螖?shù)(每天15次)
【TableAgent公測地址】https://tableagent.DataCanvas.com文章來源地址http://www.zghlxwxcb.cn/news/detail-756296.html
到了這里,關(guān)于【玩轉(zhuǎn)TableAgent數(shù)據(jù)智能分析】沉浸式體驗(yàn)數(shù)智結(jié)合AI智能體的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!