數(shù)據(jù)集
csv文件內(nèi)容
一共80個(gè)數(shù)據(jù)(只截取前10個(gè)數(shù)據(jù))
在excel中顯示的內(nèi)容
在pycharm中顯示的內(nèi)容
txt文件內(nèi)容
一共80個(gè)數(shù)據(jù)
在記事本中顯示的內(nèi)容
在pycharm中顯示的內(nèi)容
利用pandas方式讀取
一、csv文件
1、讀取所有內(nèi)容
import pandas as pd
data_pd = pd.read_csv("Sheet1.csv")
# 讀取表頭元素
head_label = list(Sheet1.columns.values)
# head_label打印結(jié)果為
#['序號(hào)', '學(xué)號(hào)', '身高(CM)', '體重(KG)', '鞋碼', '發(fā)長(zhǎng)(CM)', '性別(0/1)']
print(data_pd)
data_pd打印結(jié)果
2、數(shù)據(jù)轉(zhuǎn)為numpy
import numpy as np
import pandas as pd
Sheet1 = pd.read_csv("Sheet1.csv")
# 將Sheet1變?yōu)榫仃囆问酱鎯?chǔ)在Sheet2中
Sheet2 = np.array(Sheet1) # 會(huì)自動(dòng)將首行漢字去除,如果沒(méi)有可以切片,切除首行數(shù)據(jù)
# 只提取我們所需要的特征值 ['身高(CM)', '體重(KG)', '鞋碼', '發(fā)長(zhǎng)(CM)', '性別(0/1)']
# 提取Sheet2的所有行與從第二列向后的所有列數(shù)據(jù),并轉(zhuǎn)為numpy數(shù)組
data_np = np.array(Sheet2[:, 2:])
print(data_np) # 維度 (80, 5)
data_np打印結(jié)果
二、txt文件
1、讀取所有內(nèi)容
import pandas as pd
data_pd = pd.read_table('Sheet_text.txt', sep=',') # 讀入txt文件,分隔符為,
print(data_pd)
data_pd打印結(jié)果
2、數(shù)據(jù)轉(zhuǎn)為numpy
import csv
import numpy as np
data_list = []
with open("Sheet1 - 副本.csv", "r") as CSVF:
reader = csv.reader(CSVF)
for line in reader:
data_list.append(line)
data_np = np.array(data_list)
print(data_np) # 維度 (81*7)
data_np打印結(jié)果
利用csv包方式讀取
一、csv文件
1、讀取所有內(nèi)容
由于原來(lái)的Sheet1數(shù)據(jù)首行有中文所以讀取時(shí)不方便讀取
建議使用pandas讀取,或直接刪除首行中文,或?qū)⒅形母臑橛⑽?br> 這里我將中文改為英文
更改后csv文件:
import csv
data_list = []
with open("Sheet_ENG.csv", "r") as CSVF:
reader = csv.reader(CSVF)
for line in reader:
data_list.append(line)
print(data_list) # 將數(shù)據(jù)存儲(chǔ)在列表中
data打印部分結(jié)果
2、數(shù)據(jù)轉(zhuǎn)為numpy
import csv
import numpy as np
data_list = []
with open("Sheet1 - 副本.csv", "r") as CSVF:
for line in csv.reader(CSVF):
data_list.append(line)
data_np = np.array(data_list)
print(data_np) # 維度 (81*7)
data_np打印結(jié)果
二、txt文件
1、讀取所有內(nèi)容
data_list = []
with open('Sheet_text.txt', encoding='utf-8') as file_obj:
# encoding='utf-8'文件編碼格式為utf-8,否則文字無(wú)法輸出
for line in file_obj:
data_list.append(line.rstrip().split(',')) # rstrip()去掉換行符
print(data_list)
2、數(shù)據(jù)轉(zhuǎn)為numpy
import numpy as np
data_list = []
with open('Sheet_text.txt', encoding='utf-8') as file_obj:
for line in file_obj:
data_list.append(line.rstrip().split(','))
data_np = np.array(data_list)
print(data_np) #維度為 (81, 7)
data_np打印結(jié)果文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-410425.html
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-410425.html
到了這里,關(guān)于Python兩種讀取txt與csv文件方式(利用numpy處理數(shù)據(jù))的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!