国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【數(shù)據(jù)分析入門】人工智能、數(shù)據(jù)分析和深度學習是什么關系?如何快速入門 Python Pandas?

這篇具有很好參考價值的文章主要介紹了【數(shù)據(jù)分析入門】人工智能、數(shù)據(jù)分析和深度學習是什么關系?如何快速入門 Python Pandas?。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。


本文詳細介紹了人工智能、數(shù)據(jù)分析和深度學習之間的關系,并就數(shù)據(jù)分析所需的Pandas庫做了胎教般的入門引導。祝讀得開心!

一、前言

??本文是原 《數(shù)據(jù)分析大全》、現(xiàn)改名為 《數(shù)據(jù)分析》 專欄的第二篇,我在寫這篇文章的時候突然意識到——單靠我是不可能把數(shù)據(jù)分析的方方面面都講得明明白白,只是是我自己知道什么,然后再輸出我所明白的知識罷了。所以《數(shù)據(jù)分析大全》的“大全”兩個字還真是擔不起,就改成 《數(shù)據(jù)分析》 了。
??本篇主要介紹數(shù)據(jù)分析中 Python Pandas 相關知識點,打算通過這一篇幫助大家順利入門Python Pandas,掌握基本的用法和思想。
??上一期《數(shù)據(jù)分析大全》——Numpy基礎可能講的太過側重代碼而忽略了講解,如果是還未入門的小白可能看完都不知道講了啥、為什么要講這些。
??實用性強和門檻低才是好文章的必要因素,像之前的那一篇就太過強調實用了。結果文章是簡短了,可除了已經(jīng)入門或從事相關工作的同行外,沒幾個能明白講了啥的。因此,本篇吸取之前的教訓,在交稿前又認真地完善了文章的措辭,加上段落間的銜接和引例等語句,方便小白也能看懂。
??讓我先來填一下上期的坑,聊聊數(shù)據(jù)分析和深度學習都有什么區(qū)別和聯(lián)系。


二、數(shù)據(jù)分析和深度學習的區(qū)別

??數(shù)據(jù)分析也好,深度學習也罷,都是一種新的技術,而新技術的產(chǎn)生則是為了解決現(xiàn)實中遇到的問題。我們可以姑且把現(xiàn)實問題分為簡單問題復雜問題簡單問題,只需要簡單分析,我們使用數(shù)據(jù)分析就夠了。而復雜問題,則需要復雜分析,我們這才使用機器學習
??——那什么是簡單問題,什么是復雜問題呢?
??簡單問題就比如是今年學院獎學金的評選情況、今天公司的業(yè)績這類問題,數(shù)據(jù)量不是很大,我們就用數(shù)據(jù)分析。
??而我們天天使用的某寶、某東這類購物APP,它會根據(jù)你的歷史購物習慣(這里面有著海量的數(shù)據(jù)),來給推薦你可能感興趣的商品。那是如何做到的呢?對于這種復雜問題,這類APP背后使用的就是機器學習以及相應的推薦算法。


三、人工智能

??人工智能的范圍很廣,廣義上的人工智能泛指通過計算機(機器)實現(xiàn)人的頭腦思維,使機器像人一樣去決策。
??機器學習是實現(xiàn)人工智能的一種技術。在機器學習分很多方法(算法),不同的方法解決不同的問題深度學習是機器學習中的一個分支方法。
??總結一下:人工智能、機器學習和深度學習的關系是:人工智能包含機器學習,機器學習包含深度學習(方法),即數(shù)據(jù)分析>機器學習>深度學習>機器學習


四、深度學習

??深度學習在圖像,語音等富媒體的分類和識別上取得了非常好的效果,所以各大研究機構和公司都投入了大量的人力做相關的研究和開發(fā)。
??舉個眾人皆知的例子,那就是2016年谷歌旗下DeepMind公司開發(fā)的阿爾法圍棋(AlphaGo)戰(zhàn)勝人類頂尖圍棋選手。阿爾法圍棋的主要工作原理就是“深度學習”。
【數(shù)據(jù)分析入門】人工智能、數(shù)據(jù)分析和深度學習是什么關系?如何快速入門 Python Pandas?,數(shù)據(jù)分析,數(shù)據(jù)分析,python,pandas,人工智能,機器學習,數(shù)據(jù)挖掘,深度學習


五、Pandas

??咳咳,扯遠了,本篇文章要講的Pandas還沒說呢。
??在學習任何東西之前,我們都應該明白兩個問題——它能干什么?我能用它做什么?
我相信肯定有人和我在入門數(shù)據(jù)結構時一樣,對這個叫“Pandas”的庫有很多問題——Pandas是什么?Pandas一詞是怎么來的?Pandas是做什么的?…讓我們來一起解決這些困惑。
??首先,Pandas是什么?是Panda→熊貓嗎?
【數(shù)據(jù)分析入門】人工智能、數(shù)據(jù)分析和深度學習是什么關系?如何快速入門 Python Pandas?,數(shù)據(jù)分析,數(shù)據(jù)分析,python,pandas,人工智能,機器學習,數(shù)據(jù)挖掘,深度學習

這聽起來很Cool…但很顯然我們不可能用熊貓來幫助我們進行數(shù)據(jù)分析的工作。其實,Pandas 是一個開放源碼、BSD 許可的庫,提供高性能、易于使用的數(shù)據(jù)結構和數(shù)據(jù)分析工具。

??那么,Pandas 一詞是怎么來的呢?

Pandas 名字的由來衍生自術語 “panel data”(面板數(shù)據(jù))和 “Python data analysis”(Python 數(shù)據(jù)分析??偟膩碚f,Pandas 是一個強大的分析結構化數(shù)據(jù)的工具集,基礎是 Numpy(提供高性能的矩陣運算)。

??聽起來明白點了,讓我們再來看看 Pandas 究竟是干什么用的。

Pandas 可以從各種文件格式比如 CSV、JSON、SQL、Microsoft Excel 導入數(shù)據(jù)。
Pandas 可以對各種數(shù)據(jù)進行運算操作,比如歸并、再成形、選擇,還有數(shù)據(jù)清洗和數(shù)據(jù)加工特征。
Pandas 廣泛應用在學術、金融、統(tǒng)計學等各個數(shù)據(jù)分析領域。

??讓我們來總結一下:Pandas 是基于 Numpy 創(chuàng)建的 Python 庫,為 Python 提供了易于使用的數(shù)據(jù)結構和數(shù)據(jù)分析工具只需要記住這句話,就可以繼續(xù)進行我們接下來的學習了!
【數(shù)據(jù)分析入門】人工智能、數(shù)據(jù)分析和深度學習是什么關系?如何快速入門 Python Pandas?,數(shù)據(jù)分析,數(shù)據(jù)分析,python,pandas,人工智能,機器學習,數(shù)據(jù)挖掘,深度學習
??在Python中,我們可以使用以下語句導入 Pandas 庫

>>> import pandas as pd

六、Pandas數(shù)據(jù)結構

6.1 Series - 序列

??首先我們來看看序列,Pandas Series 類似表格中的一個列(column),類似于一維數(shù)組,可以保存任何數(shù)據(jù)類型。Series 由索引(index)和列組成,函數(shù)如下:

pandas.Series( data, index, dtype, name, copy)

??讓我們對上的參數(shù)進行簡單的說明
??data:一組數(shù)據(jù)(ndarray 類型)。
??index:數(shù)據(jù)索引標簽,如果不指定,默認從 0 開始。
??dtype:數(shù)據(jù)類型,默認會自己判斷。
??name:設置名稱。
??copy:拷貝數(shù)據(jù),默認為 False。
??想想看,要是實現(xiàn)存儲任意類型數(shù)據(jù)的一維數(shù)組(如下圖),應該怎么實現(xiàn)呢?
【數(shù)據(jù)分析入門】人工智能、數(shù)據(jù)分析和深度學習是什么關系?如何快速入門 Python Pandas?,數(shù)據(jù)分析,數(shù)據(jù)分析,python,pandas,人工智能,機器學習,數(shù)據(jù)挖掘,深度學習
??這邊附上了實現(xiàn)代碼:

>>> s = pd.Series([3, -5, 7, 4], index=['a', 'b', 'c', 'd'])

6.2 DataFrame - 數(shù)據(jù)框

??DataFrame 是一個表格型的數(shù)據(jù)結構,它含有一組有序的列,每列可以是不同的值類型(比如數(shù)值、字符串、布爾型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個索引)
【數(shù)據(jù)分析入門】人工智能、數(shù)據(jù)分析和深度學習是什么關系?如何快速入門 Python Pandas?,數(shù)據(jù)分析,數(shù)據(jù)分析,python,pandas,人工智能,機器學習,數(shù)據(jù)挖掘,深度學習
??我們要是想實現(xiàn)上方的存儲不同類型數(shù)據(jù)的二維數(shù)組,可以這么實現(xiàn):

>>> data = {'Country': ['Belgium', 'India', 'Brazil'], 'Capital': ['Brussels', 'New Delhi', 'Brasília'],'Population': [11190846, 1303171035, 207847528]}

>>> df = pd.DataFrame(data, columns=['Country', 'Capital', 'Population'])

七、輸入、輸出

7.1 讀取/寫入CSV

??在解決這個問題前先來了解一下,什么是CSV:

CSV(Comma-Separated Values,逗號分隔值,有時也稱為字符分隔值,因為分隔字符也可以不是逗號),其文件以純文本形式存儲表格數(shù)據(jù)(數(shù)字和文本)。
CSV 是一種通用的、相對簡單的文件格式,被用戶、商業(yè)和科學廣泛應用。

??Pandas 可以很輕松地處理CSV文件

>>> pd.read_csv('file.csv', header=None, nrows=5)
>>> df.to_csv('myDataFrame.csv')

7.2 讀取/寫入Excel

??在解決問題時,往往涉及到從Excel讀取或寫入數(shù)據(jù),以下給出了相關的代碼實現(xiàn)。也有讀取內含多個表的Excel中數(shù)據(jù)的代碼實現(xiàn):

>>> pd.read_excel('file.xlsx')
>>> pd.to_excel('dir/myDataFrame.xlsx', sheet_name='Sheet1')
# 讀取內含多個表的Excel
>>> xlsx = pd.ExcelFile('file.xls')
>>> df = pd.read_excel(xlsx, 'Sheet1')

7.3 讀取和寫入 SQL 查詢及數(shù)據(jù)庫表

??關于讀取和寫入 SQL 查詢及數(shù)據(jù)庫表的代碼如下:

>>> from sqlalchemy import create_engine
>>> engine = create_engine('sqlite:///:memory:')
>>> pd.read_sql("SELECT * FROM my_table;", engine)
>>> pd.read_sql_table('my_table', engine)
>>> pd.read_sql_query("SELECT * FROM my_table;", engine)

read_sql()是 read_sql_table() 與 read_sql_query() 的便捷打包器

>>> pd.to_sql('myDf', engine)

八、調用幫助

??當然,在開發(fā)過程中遇到的問題肯定是千奇百怪的。除了在技術論壇上發(fā)帖求問求助師兄師姐,我們也要學會自己查看幫助文檔
【數(shù)據(jù)分析入門】人工智能、數(shù)據(jù)分析和深度學習是什么關系?如何快速入門 Python Pandas?,數(shù)據(jù)分析,數(shù)據(jù)分析,python,pandas,人工智能,機器學習,數(shù)據(jù)挖掘,深度學習
??調用幫助的代碼如下:

>>>help(pd.Series.loc)

九、選擇(這里可以參考上一篇文章的 Numpy Arrays 相關部分)

9.1 取值

??在取值時,我們可以取序列的值,也可以取數(shù)據(jù)框的值。以下是取序列值和取數(shù)據(jù)框子集的代碼實現(xiàn),可以參考一下:

# 取序列的值
>>> s['a']
-5

# 取數(shù)據(jù)框的子集
>>> df[1:]
 Country Capital Population
 1 India New Delhi 1303171035
 2 Brazil Brasília 207847528

9.2 選取、布爾索引及設置值

9.2.1 按位置

??在我們根據(jù)需求選擇某些數(shù)據(jù)時,往往涉及到按行與列的位置選擇某值,以下給出了具體的代碼:

# 按行與列的位置選擇某值
>>> df.iloc[[0],[0]]
'Belgium'
>>> df.iat([0],[0])
 'Belgium'

9.2.2 按標簽

??按行與列的名稱選擇某值的代碼實現(xiàn)如下:

# 按行與列的名稱選擇某值
>>> df.loc[[0], ['Country']]
 'Belgium'
 >>> df.at([0], ['Country']) 
 'Belgium'

9.2.3 按標簽/位置

??我們也可以選擇某行或者選擇某列

# 選擇某行
>>> df.ix[2] 
 Country Brazil 
 Capital Brasília 
 Population 207847528

# 選擇某列
>>> df.ix[:,'Capital']
 0 Brussels
 1 New Delhi
 2 Brasília 
 >>> df.ix[1,'Capital']
 'New Delhi'

9.2.4 布爾索引

??Pandas支持物理順序進行選取,也支持通過邏輯進行取值。下面給出了幾個例子:

>>> s[~(s > 1)] # 序列 S 中沒有大于1的值
>>> s[(s < -1) | (s > 2)] # 序列 S 中小于-1或大于2的值
>>> df[df['Population']>1200000000] # 序列 S 中小于-1或大于2的值

9.2.5 設置值

??還可以設置索引項的值

>>> s['a'] = 6 # 將序列 S 中索引為 a 的值設為6

十、刪除數(shù)據(jù)

??按索引刪除序列的值

>>> s.drop(['a', 'c']) # 按索引刪除序列的值 (axis=0) 
>>> df.drop('Country', axis=1) # 按索引刪除序列的值 (axis=0) 

十一、排序

??基本的增刪查改都介紹完了,這里再介紹以下排序。下面給出了按索引排序、按某列的值排序、按某列的值排序的另解的代碼:

>>> df.sort_index() # 按索引排序
>>> df.sort_values(by='Country') # 按某列的值排序
>>> df.rank() # 按某列的值排序

十二、查詢序列與數(shù)據(jù)框的信息

12.1 基本信息

??排序也介紹完了,再來說說查詢吧。這里給出了獲取行、列索引和獲取數(shù)據(jù)框基本信息的兩種方法:

>>> df.shape # (行,列))
>>> df.index # 獲取索引
>>> df.columns # 獲取索引
>>> df.info() # 獲取數(shù)據(jù)框基本信息
>>> df.count() # 獲取數(shù)據(jù)框基本信息

12.2 匯總

??常見的功能實現(xiàn)函數(shù)匯總如下:

>>> df.sum() # 合計  
>>> df.cumsum() # 合計 
>>> df.min()/df.max() # 最小值除以最大值
>>> df.idxmin()/df.idxmax() # 最小值除以最大值
>>> df.describe() # 基礎統(tǒng)計數(shù)據(jù)
>>> df.mean() # 平均值
>>> df.median() # 中位數(shù)

十三、應用函數(shù)

??這里給出了幾個常用的函數(shù)的調用方法:

>>> f = lambda x: x*2 # 應用匿名函數(shù)lambda
>>> df.apply(f) # 應用函數(shù)
>>> df.applymap(f)  # 應用函數(shù)

十四、數(shù)據(jù)對齊

14.1 內部數(shù)據(jù)對齊

??如有不一致的索引,則使用NA值:

>>> s3 = pd.Series([7, -2, 3], index=['a', 'c', 'd'])
>>> s + s3
 a 10.0
 b NaN
 c 5.0
 d 7.0

14.2 使用 Fill 方法運算

??還可以使用 Fill 方法進行內部對齊運算

>>> s.add(s3, fill_value=0)
 a 10.0
 b -5.0
 c 5.0
 d 7.0
>>> s.sub(s3, fill_value=2)
>>> s.div(s3, fill_value=4)
>>> s.mul(s3, fill_value=3)

十五、后記

??本期關于人工智能、數(shù)據(jù)分析和深度學習的關系人工智能、深度學習的相關內容也介紹完了,本文的重點放在了 Pandas 的快速入門方面,如果能在科研項目、工程開發(fā)和日常學習方面幫到大家,就最好不過了!下期會接著介紹Pandas進階方向的知識(因為這篇寫得太多了,就拆成兩篇發(fā)了)。
??非常感謝大家的閱讀,也歡迎大家提出寶貴的建議!我們下周見!文章來源地址http://www.zghlxwxcb.cn/news/detail-628319.html

到了這里,關于【數(shù)據(jù)分析入門】人工智能、數(shù)據(jù)分析和深度學習是什么關系?如何快速入門 Python Pandas?的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 人工智能在物流數(shù)據(jù)分析中的應用:基于人工智能的物流智能監(jiān)控與分析

    作者:禪與計算機程序設計藝術 引言 1.1. 背景介紹 隨著全球經(jīng)濟的快速發(fā)展和物流行業(yè)的不斷壯大,對物流管理的效率與質量的要求也越來越高。傳統(tǒng)的物流管理手段已經(jīng)難以滿足現(xiàn)代物流行業(yè)的需要,人工智能技術在物流管理中的應用顯得尤為重要。 1.2. 文章目的 本文旨

    2024年02月08日
    瀏覽(23)
  • 數(shù)據(jù)分析:人工智能篇

    數(shù)據(jù)分析:人工智能篇

    3.1 matplotlib基本繪圖操作 3.2 plot的線條和顏色 線條形狀設置 字符 線條類型 字符 線條類型 ‘-’ 實線 ‘–’ 虛線 ‘-.’ 虛點線 ‘:’ 點線 ‘.’ 點 ‘,’ 像素點 ‘o’ 圓點 ‘v’ 下三角點 ‘^’ 上三角形 ‘’ 左三角形 ‘’ 右三角形 ‘1’ 下三叉點 ‘2’ 上三叉點 ‘3’

    2024年02月06日
    瀏覽(28)
  • 數(shù)據(jù)分析、大數(shù)據(jù)分析和人工智能之間的區(qū)別

    數(shù)據(jù)分析、大數(shù)據(jù)分析和人工智能近年來十分熱門,三者之間看起來有相似之處,也有不同之處。今天就來談談三者間的區(qū)別。 數(shù)據(jù)分析 數(shù)據(jù)分析是指對數(shù)據(jù)進行分析,從中提取有價值的信息,以支持企業(yè)或組織的決策制定。數(shù)據(jù)分析可以針對不同的數(shù)據(jù)來源和類型,包括

    2024年02月06日
    瀏覽(21)
  • 人工智能安全的數(shù)據(jù)治理和數(shù)據(jù)分析

    作者:禪與計算機程序設計藝術 隨著人工智能的普及和應用,越來越多的個人和組織使用基于機器學習、深度學習等技術進行各種各樣的業(yè)務決策、工作指導和服務推薦。然而,隨之而來的安全問題也逐漸顯現(xiàn)出來,尤其是在對模型訓練、模型部署、模型迭代、模型交付等環(huán)

    2024年02月09日
    瀏覽(18)
  • 人工智能:數(shù)據(jù)分析之數(shù)據(jù)預處理、分析模型與可視化

    在人工智能和數(shù)據(jù)科學領域,數(shù)據(jù)分析是一種核心過程,它幫助我們從大量的數(shù)據(jù)中提取有價值的信息。數(shù)據(jù)分析的質量和結果直接影響到?jīng)Q策的效率和準確性。在這篇博客中,我們將詳細探討數(shù)據(jù)分析的關鍵步驟,包括數(shù)據(jù)預處理、分析模型和可視化,并通過實際應用案例

    2024年03月10日
    瀏覽(99)
  • 【展望】多方計算展望:基于人工智能的數(shù)據(jù)分析平臺

    作者:禪與計算機程序設計藝術 當前,隨著人類對社會生活的依賴程度越來越高、信息化水平越來越高,越來越多的個人消費行為被計算機和智能手機等各種設備所代替。而數(shù)字經(jīng)濟也正在以驚人的速度發(fā)展。盡管如此,人工智能技術在數(shù)據(jù)驅動下對實體經(jīng)濟產(chǎn)生的深遠影響

    2024年02月13日
    瀏覽(20)
  • 數(shù)據(jù)分析的未來:機器學習和人工智能的革命

    數(shù)據(jù)分析是現(xiàn)代科學和工業(yè)的核心技術,它涉及到大量的數(shù)據(jù)收集、存儲、處理和分析。隨著數(shù)據(jù)的增長和復雜性,傳統(tǒng)的數(shù)據(jù)分析方法已經(jīng)不能滿足需求。機器學習和人工智能技術正在革命化數(shù)據(jù)分析領域,為我們提供了更高效、準確和智能的解決方案。 在本文中,我們將

    2024年02月20日
    瀏覽(28)
  • 探索人工智能在健康數(shù)據(jù)分析中的新領域:智能醫(yī)療咨詢

    作者:禪與計算機程序設計藝術 隨著全球數(shù)字化進程的加快、互聯(lián)網(wǎng)行業(yè)的蓬勃發(fā)展、數(shù)字健康產(chǎn)品和服務的不斷涌現(xiàn),人工智能(AI)作為一種高技術含量的新興產(chǎn)業(yè)正在引爆全新的經(jīng)濟增長點。而如何利用人工智能技術幫助醫(yī)療機構進行健康管理,則是一個亟待解決的問

    2024年02月07日
    瀏覽(18)
  • 解鎖數(shù)據(jù)分析的神器:ChatGPT引領人工智能革命

    解鎖數(shù)據(jù)分析的神器:ChatGPT引領人工智能革命

    ?? 個人網(wǎng)站:【 海擁】【神級代碼資源網(wǎng)站】【辦公神器】 ?? 基于Web端打造的:??輕量化工具創(chuàng)作平臺 ?? 想尋找共同學習交流的小伙伴,請點擊【全棧技術交流群】 在當今數(shù)字化時代,數(shù)據(jù)分析成為決策制定和問題解決的關鍵工具。隨著人工智能(AI)的迅猛發(fā)展,C

    2024年02月05日
    瀏覽(22)
  • 數(shù)據(jù)分析的未來:人工智能和自動化的融合

    數(shù)據(jù)分析是現(xiàn)代科學和工業(yè)中不可或缺的一部分,它涉及到大量的數(shù)據(jù)處理、分析和挖掘。隨著數(shù)據(jù)的增長和復雜性,數(shù)據(jù)分析的需求也在不斷增加。人工智能(AI)和自動化技術在數(shù)據(jù)分析領域的應用也在不斷增加,它們?yōu)閿?shù)據(jù)分析提供了更高效、更準確的解決方案。在這篇文

    2024年02月19日
    瀏覽(28)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包