国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

猿創(chuàng)征文|【Python數(shù)據(jù)科學(xué)快速入門系列 | 05】常用科學(xué)計(jì)算函數(shù)

這篇具有很好參考價(jià)值的文章主要介紹了猿創(chuàng)征文|【Python數(shù)據(jù)科學(xué)快速入門系列 | 05】常用科學(xué)計(jì)算函數(shù)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

這是機(jī)器未來的第44篇文章

原文首發(fā)地址:https://blog.csdn.net/RobotFutures/article/details/126615267

猿創(chuàng)征文|【Python數(shù)據(jù)科學(xué)快速入門系列 | 05】常用科學(xué)計(jì)算函數(shù)

1. 概述

本文以鳶尾花的數(shù)據(jù)預(yù)處理為例,描述了科學(xué)計(jì)算在機(jī)器學(xué)習(xí)使用的示例。

2. 加載數(shù)據(jù)集

以鳶尾花數(shù)據(jù)集為例。
鳶尾花數(shù)據(jù)集有4個(gè)特征,1個(gè)標(biāo)簽,特征為sepal_length,sepal_width,petal_length,petal_width,分別為花萼長度、花萼寬度,花瓣長度、花瓣寬度,標(biāo)簽為鳶尾花的分類,0,1,2分別代表山鳶尾(Setosa)、變色鳶尾(Versicolor)、維吉尼亞鳶尾(Virginical)

import numpy as np

data = []
with open(file='iris.txt',mode='r') as f:
    f.readline()
    while True:
        line = f.readline()
        if line:
            data.append(line.strip().split(','))
        else:
            break

data = np.array(data,dtype=float)

# 使用切片提取前4列數(shù)據(jù)作為特征數(shù)據(jù)
X_data = data[:, :4]  # 或者 X_data = data[:, :-1]

# 使用切片提取最后1列數(shù)據(jù)作為標(biāo)簽數(shù)據(jù)
y_data = data[:, -1]

data.shape, X_data.shape, y_data.shape
((150, 5), (150, 4), (150,))

3. 查看數(shù)據(jù)特征

3.1 查看首5行數(shù)據(jù)

X_data[0:5], y_data[0:5]
(array([[5.1, 3.5, 1.4, 0.2],
        [4.9, 3. , 1.4, 0.2],
        [4.7, 3.2, 1.3, 0.2],
        [4.6, 3.1, 1.5, 0.2],
        [5. , 3.6, 1.4, 0.2]]),
 array([0., 0., 0., 0., 0.]))

3.2 查看數(shù)據(jù)集每個(gè)特征的最大值

# axis = 0指定X軸,取每列的最大值
np.max(X_data, axis=0)
array([7.9, 4.4, 6.9, 2.5])

上面的取值就是每個(gè)特征的最大值,數(shù)據(jù)集的花萼長度最大值為7.9,花萼寬度最大值為4.4,花瓣長度最大值為6.9,花瓣寬度最大值為2.5

如果去掉軸axis參數(shù),就是取數(shù)據(jù)集所有數(shù)據(jù)中的最大值,會(huì)綜合所有列一起的最大值。

np.max(X_data)
7.9

3.3 查看每個(gè)特征的最小值

np.min(X_data, axis=0)
array([4.3, 2. , 1. , 0.1])

上面的取值就是每個(gè)特征的最小值,數(shù)據(jù)集的花萼長度最小值為4.3,花萼寬度最小值為2,花瓣長度最小值為1,花瓣寬度最小值為0.1

3.4 查看特征均值

np.mean(X_data, axis=0)
array([5.84333333, 3.05733333, 3.758     , 1.19933333])

3.5 查看特征百分位數(shù)

百分位數(shù)是統(tǒng)計(jì)中使用的度量,表示小于這個(gè)值的觀察值樣本數(shù)量占總體的百分比。

# 25%
np.percentile(X_data, 0.25, axis=0)
array([4.33725, 2.0745 , 1.03725, 0.1    ])
# 50%
np.percentile(X_data, 0.50, axis=0)
array([4.3745, 2.149 , 1.0745, 0.1   ])
# 75%
np.percentile(X_data, 0.75, axis=0)
array([4.4    , 2.2    , 1.11175, 0.1    ])

3.6 查看特征數(shù)據(jù)分布波動(dòng)

np.std(X_data, axis=0)
array([0.82530129, 0.43441097, 1.75940407, 0.75969263])

從標(biāo)準(zhǔn)差可以看到特征花萼寬度標(biāo)準(zhǔn)差為0.43441097數(shù)據(jù)波動(dòng)最小,花瓣長度標(biāo)準(zhǔn)差數(shù)據(jù)為1.75940407,數(shù)據(jù)波動(dòng)最大。

3.8 查看特征樣本數(shù)量

X_data.shape
(150, 4)

可以看到樣本數(shù)量為150,每個(gè)樣本4個(gè)特征

3.9 查看標(biāo)簽數(shù)據(jù)分布

通過np.unique分別獲得唯一ID和對(duì)應(yīng)的樣本數(shù)量,然后通過zip、dict轉(zhuǎn)換為字典。

unique, count = np.unique(y_data, return_counts=True)
label_count = dict(zip(unique, count))
label_count
{0.0: 50, 1.0: 50, 2.0: 50}

可以看到標(biāo)簽是均衡的,每個(gè)分類的樣本數(shù)均是50.

4. 其它常用的科學(xué)函數(shù)

函數(shù) 說明 示例
np.sum 求累加 np.sum((y_pred - y_data)**2)
np.exp 以自然常數(shù)e為底的指數(shù)函數(shù) np.exp**2
np.var 求方差 np.var(X_data, axis=0)
np.round 四舍五入 np.round(np.var(X_data, axis=0), decimals=2)
np.square 求平方 np.square(X_data)
np.abs 求絕對(duì)值 np.abs([1, -1, -7.9, 6])
np.argmax 求最大值的位置索引 np.argmax(X_data, axis=0)
np.argmin 求最小值的位置索引 np.argmin(X_data, axis=0)

5. 總結(jié)

以上就是numpy科學(xué)函數(shù)的簡單介紹,更多api在將來的使用中再描述。

寫在末尾:

  • 博客簡介:專注AIoT領(lǐng)域,追逐未來時(shí)代的脈搏,記錄路途中的技術(shù)成長!
  • 專欄簡介:從0到1掌握數(shù)據(jù)科學(xué)常用庫Numpy、Matploblib、Pandas。
  • 面向人群:AI初級(jí)學(xué)習(xí)者
  • 專欄計(jì)劃:接下來會(huì)逐步發(fā)布跨入人工智能的系列博文,敬請(qǐng)期待
    • Python零基礎(chǔ)快速入門系列
    • Python數(shù)據(jù)科學(xué)系列
    • 人工智能開發(fā)環(huán)境搭建系列
    • 機(jī)器學(xué)習(xí)系列
    • 物體檢測(cè)快速入門系列
    • 自動(dòng)駕駛物體檢測(cè)系列

猿創(chuàng)征文|【Python數(shù)據(jù)科學(xué)快速入門系列 | 05】常用科學(xué)計(jì)算函數(shù)文章來源地址http://www.zghlxwxcb.cn/news/detail-407077.html

到了這里,關(guān)于猿創(chuàng)征文|【Python數(shù)據(jù)科學(xué)快速入門系列 | 05】常用科學(xué)計(jì)算函數(shù)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 猿創(chuàng)征文|“云“創(chuàng)新展望:數(shù)據(jù)之浩瀚

    猿創(chuàng)征文|“云“創(chuàng)新展望:數(shù)據(jù)之浩瀚

    ??wei_shuo的個(gè)人主頁 ??wei_shuo的學(xué)習(xí)社區(qū) ??Hello World ! AWS亞馬遜云科技提供全球覆蓋廣泛、服務(wù)深入的云平臺(tái),全球數(shù)據(jù)中心提供超過 200 項(xiàng)功能齊全的服務(wù) 連續(xù) 11 年被 Gartner 評(píng)為\\\"全球云計(jì)算領(lǐng)導(dǎo)者\(yùn)\\" ;2021 年全新 Gartner 魔力象限中被評(píng)為\\\"云基礎(chǔ)設(shè)施與平臺(tái)服務(wù)(Iaas Pa

    2023年04月24日
    瀏覽(23)
  • 猿創(chuàng)征文|Hadoop大數(shù)據(jù)技術(shù)綜合實(shí)驗(yàn)

    猿創(chuàng)征文|Hadoop大數(shù)據(jù)技術(shù)綜合實(shí)驗(yàn)

    當(dāng)前互聯(lián)網(wǎng)應(yīng)用中,萬維網(wǎng)(World Wide Web)應(yīng)用占據(jù)了絕大部分的份額。萬維網(wǎng)應(yīng)用對(duì)外提供服務(wù)需要架設(shè)Web服務(wù)器軟件。典型的Web服務(wù)器軟件有Apache、Nginx等。Web服務(wù)器軟件在運(yùn)行過程中會(huì)寫入各種日志到磁盤文件中。例如,Apache Web服務(wù)器軟件運(yùn)行過程中,會(huì)產(chǎn)生access.log文

    2024年02月03日
    瀏覽(31)
  • 猿創(chuàng)征文|大數(shù)據(jù)開發(fā)必備的數(shù)據(jù)采集工具匯總

    猿創(chuàng)征文|大數(shù)據(jù)開發(fā)必備的數(shù)據(jù)采集工具匯總

    隨著大數(shù)據(jù)近幾年的發(fā)展,已經(jīng)在國內(nèi)外的開發(fā)市場(chǎng)積累出一大批大數(shù)據(jù)開發(fā)的技術(shù)型人才,不論是批處理還是流處理各大公司都研究出一套專門解決自身公司業(yè)務(wù)的大數(shù)據(jù)解決方案。它們是市面上大數(shù)據(jù)組件的融合碰撞產(chǎn)生的適合自身的。 在數(shù)據(jù)處理的最前端一定是數(shù)據(jù)的

    2024年02月01日
    瀏覽(21)
  • 猿創(chuàng)征文|Python-sklearn機(jī)器學(xué)習(xí)之旅:我的第一個(gè)機(jī)器學(xué)習(xí)實(shí)戰(zhàn)項(xiàng)目

    目錄 前言 一、從目的出發(fā) 1.導(dǎo)入數(shù)據(jù) 二、項(xiàng)目開啟 1.導(dǎo)入數(shù)據(jù)

    2024年01月24日
    瀏覽(100)
  • 猿創(chuàng)征文|vue vant-ui數(shù)據(jù)列表上拉加載更多,下拉刷新功能

    ?????? ? 作者: 船長在船上 ?????? ? 主頁: 來訪地址船長在船上的博客 ?????? ? 簡介: CSDN前端領(lǐng)域優(yōu)質(zhì)創(chuàng)作者,資深前端開發(fā)工程師,專注前端開發(fā),在CSDN總結(jié)工作中遇到的問題或者問題解決方法以及對(duì)新技術(shù)的分享,歡迎咨詢交流,共同學(xué)習(xí)。 ??????

    2023年04月12日
    瀏覽(24)
  • 猿創(chuàng)征文|工具百寶箱-數(shù)據(jù)庫連接工具-接口調(diào)試與測(cè)試工具-抓包工具

    猿創(chuàng)征文|工具百寶箱-數(shù)據(jù)庫連接工具-接口調(diào)試與測(cè)試工具-抓包工具

    工具沒有絕對(duì)意義上的好壞之分,只有需求適合與否,這些需求可能包括:功能、價(jià)格、安全、服務(wù)、技術(shù)等諸多方面。 技術(shù)在更新迭代,開發(fā)者工具也在更新迭代。一個(gè)高效趁手的工具在工作上錦上添花。給大家分享一下我平時(shí)用的一部分工具。 官方活動(dòng)入口:「猿創(chuàng)征

    2023年04月27日
    瀏覽(17)
  • 猿創(chuàng)征文 | Shell編程【上篇】

    猿創(chuàng)征文 | Shell編程【上篇】

    目錄 1,Shell編程 1.1:簡介 1.1.1:shell解釋器 1.2:快速入門 1.2.1:編寫腳本 1.2.2:執(zhí)行shell腳本 1.3:shell變量 1.3.1:簡介 1.3.2:使用變量 1.3.3:刪除變量 1.3.4:只讀變量 ?1.4:字符串 1.4.1:單引號(hào) 1.4.2:雙引號(hào)? 1.4.3:獲取字符串長度? ?1.4.4:提取子字符串 ?1.5:傳遞參數(shù) 1

    2024年02月02日
    瀏覽(24)
  • 猿創(chuàng)征文 |【Linux】常用命令

    猿創(chuàng)征文 |【Linux】常用命令

    ?? 博客主頁: ??@不會(huì)壓彎的小飛俠 ? 歡迎關(guān)注: ?? 點(diǎn)贊 ?? 收藏 ? 留言 ? ? 系列專欄: ??Linux專欄 ? 歡迎加入社區(qū): ??不會(huì)壓彎的小飛俠 ? 人生格言:知足上進(jìn),不負(fù)野心。 ?? 歡迎大佬指正,一起學(xué)習(xí)!一起加油! command [-options] [parameter] command:命令名 [-o

    2024年01月16日
    瀏覽(56)
  • 猿創(chuàng)征文|【HTML】標(biāo)簽學(xué)習(xí)之路

    猿創(chuàng)征文|【HTML】標(biāo)簽學(xué)習(xí)之路

    ?? 目錄 一、HTML語法規(guī)范 1.基本語法概述 2.標(biāo)簽關(guān)系 二、HTML基本結(jié)構(gòu)標(biāo)簽 1.第一個(gè)HTML頁面 2.HTML基本結(jié)構(gòu)標(biāo)簽總結(jié) 1.基本語法概述 html是由尖括號(hào)包圍的,列如: html 。 html標(biāo)簽通常是成對(duì)出現(xiàn)的,列如:html和/html,我們稱為 雙標(biāo)簽 。標(biāo)簽對(duì)里的第一個(gè)標(biāo)簽是開始標(biāo)

    2024年01月16日
    瀏覽(25)
  • 猿創(chuàng)征文|ZooKeeper(偽)集群搭建

    猿創(chuàng)征文|ZooKeeper(偽)集群搭建

    前言:zookeeper作為一款分布式協(xié)調(diào)中間件,其重要性不言而喻,因此需要保證其高可用性。所以一般都會(huì)搭建zookeeper集群,今天葉秋帶領(lǐng)大家在一臺(tái)服務(wù)器上搭建偽集群。 目錄 1、 搭建要求 2、 準(zhǔn)備工作 3、 配置集群 ?4 啟動(dòng)集群 ?5 模擬集群異常 1、 搭建要求 真實(shí)的集群是

    2024年02月01日
    瀏覽(30)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包