国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Python 機器學(xué)習(xí)入門:數(shù)據(jù)集、數(shù)據(jù)類型和統(tǒng)計學(xué)

這篇具有很好參考價值的文章主要介紹了Python 機器學(xué)習(xí)入門:數(shù)據(jù)集、數(shù)據(jù)類型和統(tǒng)計學(xué)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

機器學(xué)習(xí)是通過研究數(shù)據(jù)和統(tǒng)計信息使計算機學(xué)習(xí)的過程。機器學(xué)習(xí)是邁向人工智能(AI)的一步。機器學(xué)習(xí)是一個分析數(shù)據(jù)并學(xué)會預(yù)測結(jié)果的程序。

數(shù)據(jù)集

在計算機的思維中,數(shù)據(jù)集是任何數(shù)據(jù)的集合。它可以是從數(shù)組到完整數(shù)據(jù)庫的任何東西。

數(shù)組的示例:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

數(shù)據(jù)庫的示例:

Carname  Color  Age  Speed  AutoPass
BMW  red  5  99  Y
Volvo  black  7  86  Y
VW  gray  8  87  N
VW  white  7  88  Y
Ford  white  2  111  Y
VW  white  17  86  Y
Tesla  red  2  103  Y
BMW  black  9  87  Y
Volvo  gray  4  94  N
Ford  white  11  78  N
Toyota  gray  12  77  N
VW  white  9  85  N
Toyota  blue  6  86  Y

通過查看數(shù)組,我們可以猜測平均值可能在80到90之間,我們還能夠確定最高值和最低值,但我們還能做什么?

通過查看數(shù)據(jù)庫,我們可以看到最受歡迎的顏色是白色,而最老的車輛為17歲,但如果我們能夠通過查看其他值來預(yù)測車輛是否具有AutoPass呢?

這就是機器學(xué)習(xí)的用途!分析數(shù)據(jù)并預(yù)測結(jié)果!

在機器學(xué)習(xí)中,通常需要處理非常大的數(shù)據(jù)集。在本教程中,我們將盡量讓您盡可能容易地理解機器學(xué)習(xí)的不同概念,并使用易于理解的小型數(shù)據(jù)集。

數(shù)據(jù)類型

要分析數(shù)據(jù),重要的是要知道我們正在處理的數(shù)據(jù)類型。

我們可以將數(shù)據(jù)類型分為三個主要類別:

  • 數(shù)值
  • 分類
  • 順序

數(shù)值數(shù)據(jù)是數(shù)字,并且可以分為兩個數(shù)值類別:

  1. 離散數(shù)據(jù) - 限制為整數(shù)的數(shù)字。示例:汽車經(jīng)過的數(shù)量。
  2. 連續(xù)數(shù)據(jù) - 有無限值的數(shù)字。示例:物品的價格或大小。

分類數(shù)據(jù)是不能相互比較的值。示例:顏色值或任何是/否值。

順序數(shù)據(jù)類似于分類數(shù)據(jù),但可以相互比較。示例:學(xué)校成績,其中A好于B等等。

通過了解數(shù)據(jù)源的數(shù)據(jù)類型,您將能夠知道在分析數(shù)據(jù)時使用哪種技術(shù)。

您將在接下來的章節(jié)中了解更多有關(guān)統(tǒng)計學(xué)和數(shù)據(jù)分析的內(nèi)容。

機器學(xué)習(xí) - 均值、中位數(shù)、眾數(shù)

在觀察一組數(shù)字時,我們可以學(xué)到什么?

在機器學(xué)習(xí)(以及數(shù)學(xué))中,通常有三個值引起我們的興趣:

  • 均值 - 平均值
  • 中位數(shù) - 中間值
  • 眾數(shù) - 出現(xiàn)最頻繁的值

示例:我們已經(jīng)記錄了13輛車的速度:

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

這些速度的平均值、中間值和最常見的速度值是多少呢?

均值

均值是平均值。

要計算均值,找到所有值的總和,并將總和除以值的數(shù)量:

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

NumPy模塊有一個用于此目的的方法。了解有關(guān)NumPy模塊的信息,請查看我們的NumPy教程。

示例:使用NumPy的mean()方法找到平均速度:

import numpy

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

x = numpy.mean(speed)

print(x)

中位數(shù)

中位數(shù)是排列所有值后位于中間的值:

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

在找到中位數(shù)之前,需要確保對數(shù)字進行排序。

NumPy模塊有一個用于此目的的方法:

示例:使用NumPy的median()方法找到中間值:

import numpy

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

x = numpy.median(speed)

print(x)

如果中間有兩個數(shù)字,將這些數(shù)字的總和除以2。

77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103

(86 + 87) / 2 = 86.5

示例:使用NumPy模塊:

import numpy

speed = [99,86,87,88,86,103,87,94,78,77,85,86]

x = numpy.median(speed)

print(x)

眾數(shù)

眾數(shù)是出現(xiàn)最頻繁的值:

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

SciPy模塊有一個用于此目的的方法。了解有關(guān)SciPy模塊的信息,請查看我們的SciPy教程。

示例:使用SciPy的mode()方法找到出現(xiàn)最頻繁的數(shù)字:

from scipy import stats

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

x = stats.mode(speed)

print(x)

最后

為了方便其他設(shè)備和平臺的小伙伴觀看往期文章:公眾號搜索Let us Coding,或者掃描下方二維碼,關(guān)注公眾號,即可獲取最新文章。

看完如果覺得有幫助,歡迎點贊、收藏關(guān)注

Python 機器學(xué)習(xí)入門:數(shù)據(jù)集、數(shù)據(jù)類型和統(tǒng)計學(xué)文章來源地址http://www.zghlxwxcb.cn/news/detail-745946.html

到了這里,關(guān)于Python 機器學(xué)習(xí)入門:數(shù)據(jù)集、數(shù)據(jù)類型和統(tǒng)計學(xué)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 《SPSS統(tǒng)計學(xué)基礎(chǔ)與實證研究應(yīng)用精解》視頻講解:SPSS依托統(tǒng)計學(xué)處理數(shù)據(jù)的應(yīng)用場景

    《SPSS統(tǒng)計學(xué)基礎(chǔ)與實證研究應(yīng)用精解》視頻講解:SPSS依托統(tǒng)計學(xué)處理數(shù)據(jù)的應(yīng)用場景

    《SPSS統(tǒng)計學(xué)基礎(chǔ)與實證研究應(yīng)用精解》1.4 視頻講解 視頻為 《SPSS統(tǒng)計學(xué)基礎(chǔ)與實證研究應(yīng)用精解》張?zhí)?楊維忠著 清華大學(xué)出版社 一書的隨書贈送視頻講解1.4節(jié)內(nèi)容 。本書已正式出版上市,當(dāng)當(dāng)、京東、淘寶等平臺熱銷中,搜索書名即可。本書旨在手把手教會使用SPSS撰寫實

    2024年01月23日
    瀏覽(21)
  • 補充點【數(shù)據(jù)分析統(tǒng)計學(xué)知識點】

    補充點【數(shù)據(jù)分析統(tǒng)計學(xué)知識點】

    0.數(shù)據(jù)分析師拿到數(shù)據(jù) 第一利器:描述性統(tǒng)計信息 第二利器:對比分析法 第三利器:指標體系-要素拆解,維度拆解 第四利器:相關(guān)分析 第五利器:趨勢預(yù)測 1.均值 2.中位數(shù) 3.眾數(shù) 4.數(shù)據(jù)離散程度 5.數(shù)據(jù)的頻數(shù)分析 [外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機制,建議將圖片保存

    2024年02月05日
    瀏覽(22)
  • 統(tǒng)計學(xué)基礎(chǔ)1:描述性統(tǒng)計(數(shù)據(jù)的離散度、極差、方差、標準差)

    1、頻數(shù):一組定量數(shù)據(jù)中,每一個數(shù)值發(fā)生的次數(shù)即為頻數(shù)。 2、頻率:將每一個數(shù)值發(fā)生的次數(shù)除以樣本總數(shù)量,即頻率

    2023年04月10日
    瀏覽(29)
  • 【AI底層邏輯】——篇章1&2:統(tǒng)計學(xué)與概率論&數(shù)據(jù)“陷阱”

    目錄 引入 一、“思維方式”是解題關(guān)鍵!! 1、統(tǒng)計思維的誕生 2、概率的力量

    2024年02月11日
    瀏覽(28)
  • 《SPSS統(tǒng)計學(xué)基礎(chǔ)與實證研究應(yīng)用精解》視頻講解:SPSS數(shù)據(jù)排序

    《SPSS統(tǒng)計學(xué)基礎(chǔ)與實證研究應(yīng)用精解》視頻講解:SPSS數(shù)據(jù)排序

    《SPSS統(tǒng)計學(xué)基礎(chǔ)與實證研究應(yīng)用精解》4.6 視頻講解 視頻為 《SPSS統(tǒng)計學(xué)基礎(chǔ)與實證研究應(yīng)用精解》張?zhí)?楊維忠著 清華大學(xué)出版社 一書的隨書贈送視頻講解4.6節(jié)內(nèi)容 。本書已正式出版上市,當(dāng)當(dāng)、京東、淘寶等平臺熱銷中,搜索書名即可。本書旨在手把手教會使用SPSS撰寫實

    2024年01月23日
    瀏覽(20)
  • 統(tǒng)計學(xué) - 數(shù)理統(tǒng)計與應(yīng)用統(tǒng)計的區(qū)別

    目錄 1. 概率與統(tǒng)計 2. 數(shù)理統(tǒng)計與應(yīng)用統(tǒng)計 概率論是研究隨機現(xiàn)象數(shù)量規(guī)律的數(shù)學(xué)分支。隨機現(xiàn)象是相對于決定性現(xiàn)象而言的,在一定條件下必然發(fā)生某一結(jié)果的現(xiàn)象稱為決定性現(xiàn)象。例如在標準大氣壓,純水加熱到100℃時水必然會沸騰等。隨機現(xiàn)象則是指在基本條件不變的

    2024年02月13日
    瀏覽(24)
  • 統(tǒng)計學(xué)-基于R (第四版) 賈俊平編著 第二章: 數(shù)據(jù)可視化 2.1, 2.2 習(xí)題答案 【自用】

    數(shù)據(jù)和包準備 1. Sex 和 Survived 并列條形圖 和 堆疊條形圖,并添加頻數(shù)標簽 代碼里沒有調(diào)整 Male Femal 圖例的大小,只做了 grey80 的框 BarText() 的參數(shù) pos 可以決定 bartext 所處的 位置。 pos one of “topout”, “topin”, “mid”, “bottomin”, “bottomout”, defining if the labels should be placed

    2024年02月05日
    瀏覽(24)
  • 【應(yīng)用統(tǒng)計學(xué)】方差分析

    【應(yīng)用統(tǒng)計學(xué)】方差分析

    【例7-1】 三臺設(shè)備平均灌裝時間分別是15.82秒、16.67秒和14.97秒。試用樣本數(shù)據(jù)檢驗這3臺機器灌裝過程的時間是否存在顯著不同,以便對設(shè)備的購買做出決策。( α=0.05 ) ?如果檢驗結(jié)果 接受原假設(shè) ,則樣本數(shù)據(jù)表明三臺設(shè)備的平均灌裝時間沒有顯著差異,選擇任何一家提供商

    2023年04月16日
    瀏覽(27)
  • 統(tǒng)計學(xué)期末復(fù)習(xí)整理

    統(tǒng)計學(xué):描述統(tǒng)計學(xué)和推斷統(tǒng)計學(xué)。計量尺度:定類尺度、定序尺度、定距尺度、定比尺度。 描述統(tǒng)計中的測度: 1.數(shù)據(jù)分布的集中趨勢 2.數(shù)據(jù)分布的離散程度 3.數(shù)據(jù)分布的形狀。 離散系數(shù) 也稱為標準差系數(shù),通常是用一組數(shù)據(jù)的標準差與其平均數(shù)之比計算 C . V . = s x  ̄

    2024年02月07日
    瀏覽(30)
  • 統(tǒng)計學(xué) 一元線性回歸

    統(tǒng)計學(xué) 一元線性回歸

    回歸(Regression) :假定因變量與自變量之間有某種關(guān)系,并把這種關(guān)系用適當(dāng)?shù)臄?shù)學(xué)模型表達出來,利用該模型根據(jù)給定的自變量來預(yù)測因變量 線性回歸 :因變量和自變量之間是線性關(guān)系 非線性回歸 :因變量和自變量之間是非線性關(guān)系 變量間的關(guān)系 :往往分為 函數(shù)關(guān)系

    2024年02月06日
    瀏覽(27)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包