国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

openpyxl被干掉?全新python高性能excel解析庫(kù)

這篇具有很好參考價(jià)值的文章主要介紹了openpyxl被干掉?全新python高性能excel解析庫(kù)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

同事有一段 python 腳本,里面用 pandas 讀取一個(gè)幾十萬(wàn)行的 excel 文件,但是速度實(shí)在太慢了。問(wèn)我有沒(méi)有什么好辦法提升運(yùn)行速度。如果在幾個(gè)月以前,就實(shí)在沒(méi)有什么好辦法了。畢竟在 python 生態(tài)中,讀寫 excel 最后的倔強(qiáng)就是 openpyxl 了。你就別指望它能提速了。

現(xiàn)在可不一樣了。馬上升級(jí)你的 pandas 版本,因?yàn)樵?pandas 2.2 版本,開(kāi)始引入一個(gè)全新的 excel 解析引擎庫(kù),它不僅僅性能吊打 openpyxl ,并且同時(shí)支持一眾 excel 格式( xls , xlsx , xlsm , xlsb , xla , xlam )

這就是 calamine 庫(kù),如果你到 github 上查看,會(huì)看到其實(shí)它是一個(gè) rust 的庫(kù):openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

看看 calamine 官方的性能對(duì)比:openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

calamine 是 openpyxl 的 10 倍。

好消息是,python 也有對(duì)應(yīng)的接口庫(kù):openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

更好的消息是,pandas 在 2.2 版本開(kāi)始,悄悄支持了 calamine 。為什么說(shuō)"悄悄"?因?yàn)橹悄芴崾径紱](méi)有提示出來(lái):openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

并且 to excel 還不能使用它。不過(guò),pandas 在即將到來(lái)的 3.0 版本,正式支持 calamine。

今天,我們先親自下場(chǎng)嘗試一下。


加載一份 800 多萬(wàn)行的 feather 文件:openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

自然不可能全部塞到 excel 里面,就取前 50 萬(wàn)行吧:openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

由于 to excel 仍然使用 openpyxl ,速度可想而知,用了差不多2分鐘。

現(xiàn)在看看使用 calamine 引擎,加載到 dataframe 要多久:openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

9.4 秒,還是比 feather 文件的 2.5 秒慢多了。不過(guò)有相關(guān)經(jīng)驗(yàn)的小伙伴應(yīng)該知道,加載一個(gè)50 萬(wàn)行的 excel,只要差不多10秒,已經(jīng)是謝天謝地了。

看看 openpyxl 的速度,你能感受到什么是絕望:openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

白白多出1分鐘

點(diǎn)擊下方安全鏈接前往獲取

CSDN大禮包:《Python入門&進(jìn)階學(xué)習(xí)資源包》免費(fèi)分享

??Python實(shí)戰(zhàn)案例??

光學(xué)理論是沒(méi)用的,要學(xué)會(huì)跟著一起敲,要?jiǎng)邮謱?shí)操,才能將自己的所學(xué)運(yùn)用到實(shí)際當(dāng)中去,這時(shí)候可以搞點(diǎn)實(shí)戰(zhàn)案例來(lái)學(xué)習(xí)。

openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

??Python書籍和視頻合集??

觀看零基礎(chǔ)學(xué)習(xí)視頻,看視頻學(xué)習(xí)是最快捷也是最有效果的方式,跟著視頻中老師的思路,從基礎(chǔ)到深入,還是很容易入門的。

openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

??Python副業(yè)創(chuàng)收路線??

openpyxl被干掉?全新python高性能excel解析庫(kù),python,excel,開(kāi)發(fā)語(yǔ)言

這些資料都是非常不錯(cuò)的,朋友們?nèi)绻行枰禤ython學(xué)習(xí)路線&學(xué)習(xí)資料》,點(diǎn)擊下方安全鏈接前往獲取

CSDN大禮包:《Python入門&進(jìn)階學(xué)習(xí)資源包》免費(fèi)分享

本文轉(zhuǎn)自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-836254.html

到了這里,關(guān)于openpyxl被干掉?全新python高性能excel解析庫(kù)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 高性能計(jì)算的矩陣乘法優(yōu)化 - Python + OpenMP實(shí)現(xiàn)

    高性能計(jì)算的矩陣乘法優(yōu)化 - Python + OpenMP實(shí)現(xiàn)

    關(guān)于上一節(jié)讀者某些疑問(wèn) :為什么你用進(jìn)程并行不是線程并行? 回答 :由于Python解釋器有GIL(全局解釋器鎖),在單進(jìn)程的解釋器上有線程安全鎖,也就是說(shuō)每次只能一個(gè)線程訪問(wèn)解釋器,因此Python在語(yǔ)法上的多線程(multithreads)實(shí)現(xiàn)是不會(huì)提高并行性能的。 這一點(diǎn)和C

    2024年02月15日
    瀏覽(31)
  • 高性能計(jì)算的矩陣乘法優(yōu)化 - Python +MPI的實(shí)現(xiàn)

    本次實(shí)驗(yàn)的目的是使用MPI的并行性來(lái)進(jìn)行矩陣乘法優(yōu)化,本人使用 Python 實(shí)現(xiàn) 實(shí)驗(yàn)硬件: CPU :AMD Ryzen 7 5800H(3.20 GHz) 內(nèi)存 :32GB (3200MHz) 要求 :使用一個(gè)矩陣,一個(gè)向量相乘,分別用單進(jìn)程和多進(jìn)程的mpi接口實(shí)現(xiàn)。 全局的規(guī)模參數(shù)是 Scale 數(shù)據(jù)示例 : 當(dāng) Scale=5 時(shí),數(shù)據(jù)示例如

    2023年04月22日
    瀏覽(31)
  • 【大蝦送書第三期】《Python高并發(fā)與高性能編程: 原理與實(shí)踐》

    【大蝦送書第三期】《Python高并發(fā)與高性能編程: 原理與實(shí)踐》

    目錄 ?寫在前面 ?主要內(nèi)容 ?本書特色 ?關(guān)于作者 ???????博客主頁(yè):大蝦好吃嗎的博客 ? ? ???專欄地址:免費(fèi)送書活動(dòng)專欄地址 Python成為時(shí)下技術(shù)革新的弄潮兒,全民Python的發(fā)展趨勢(shì)讓人們不再滿足于簡(jiǎn)單地運(yùn)行Python程序,逐步探索其更為廣泛的日常應(yīng)用和高性能

    2024年02月16日
    瀏覽(34)
  • 《Python高并發(fā)與高性能編程:原理與實(shí)踐》——小解送書第六期

    《Python高并發(fā)與高性能編程:原理與實(shí)踐》——小解送書第六期

    目錄 書籍介紹 ?抽獎(jiǎng) Python成為時(shí)下技術(shù)革新的弄潮兒,全民Python的發(fā)展趨勢(shì)讓人們不再滿足于簡(jiǎn)單地運(yùn)行Python程序,逐步探索其更為廣泛的日常應(yīng)用和高性能設(shè)計(jì)。以ChatGPT為代表的大模型產(chǎn)品對(duì)初級(jí)程序開(kāi)發(fā)人員提出了挑戰(zhàn),要想在開(kāi)發(fā)領(lǐng)域站穩(wěn)腳跟、有發(fā)展,必須掌握更

    2024年02月14日
    瀏覽(20)
  • 【潔潔送書第一期】Python高并發(fā)與高性能編程: 原理與實(shí)踐

    【潔潔送書第一期】Python高并發(fā)與高性能編程: 原理與實(shí)踐

    Python成為時(shí)下技術(shù)革新的弄潮兒,全民Python的發(fā)展趨勢(shì)讓人們不再滿足于簡(jiǎn)單地運(yùn)行Python程序,逐步探索其更為廣泛的日常應(yīng)用和高性能設(shè)計(jì)。 以ChatGPT為代表的大模型產(chǎn)品對(duì)初級(jí)程序開(kāi)發(fā)人員提出了挑戰(zhàn),要想在開(kāi)發(fā)領(lǐng)域站穩(wěn)腳跟、有發(fā)展,必須掌握更高級(jí)的技巧和能力。

    2024年02月16日
    瀏覽(27)
  • FastAPI + NGINX + Gunicorn:一步一步教你部署一個(gè)高性能的Python網(wǎng)頁(yè)應(yīng)用

    FastAPI + NGINX + Gunicorn:一步一步教你部署一個(gè)高性能的Python網(wǎng)頁(yè)應(yīng)用

    部署一個(gè) FastAPI 應(yīng)用到你的服務(wù)器是一項(xiàng)復(fù)雜的任務(wù)。如果你對(duì) NGINX 、 Gunicorn 和 Uvicorn 這些技術(shù)不熟悉,可能會(huì)浪費(fèi)大量的時(shí)間。如果你是剛接觸 Python 語(yǔ)言不久或者希望利用 Python 構(gòu)建自己的Web應(yīng)用程序,本文的內(nèi)容可能會(huì)讓你第一次部署時(shí)更節(jié)省時(shí)間。 FastAPI 是用于開(kāi)發(fā)

    2024年02月05日
    瀏覽(22)
  • Rust 開(kāi)發(fā)的高性能 Python 包管理工具,可替換 pip、pip-tools 和 virtualenv

    Rust 開(kāi)發(fā)的高性能 Python 包管理工具,可替換 pip、pip-tools 和 virtualenv

    最近,我在 Python 潮流周刊 中分享了一個(gè)超級(jí)火爆的項(xiàng)目,這還不到一個(gè)月,它在 Github 上已經(jīng)拿下了 8K star 的亮眼成績(jī),可見(jiàn)其受歡迎程度極高!國(guó)內(nèi)還未見(jiàn)有更多消息,我趁著周末把一篇官方博客翻譯出來(lái)了,分享給大家。 作者:@charliermarsh 譯者:豌豆花下貓@Python貓 英

    2024年03月09日
    瀏覽(32)
  • 《高性能MySQL》——?jiǎng)?chuàng)建高性能的索引(筆記)

    《高性能MySQL》——?jiǎng)?chuàng)建高性能的索引(筆記)

    索引(在MySQL中也叫做“鍵(key)”) 是存儲(chǔ)引擎用于快速找到記錄的一種數(shù)據(jù)結(jié)構(gòu)。 索引對(duì)于良好的性能非常關(guān)鍵。尤其是當(dāng)表中的數(shù)據(jù)量越來(lái)越大時(shí),索引對(duì)性能的影響愈發(fā)重要。 在數(shù)據(jù)量較小且負(fù)載較低時(shí),不恰當(dāng)?shù)乃饕龑?duì)性能的影響可能還不明顯,但當(dāng)數(shù)據(jù)量逐漸增大時(shí)

    2024年02月07日
    瀏覽(95)
  • 【Linux高性能服務(wù)器編程】——高性能服務(wù)器框架

    【Linux高性能服務(wù)器編程】——高性能服務(wù)器框架

    ? hello !大家好呀! 歡迎大家來(lái)到我的Linux高性能服務(wù)器編程系列之高性能服務(wù)器框架介紹,在這篇文章中, 你將會(huì)學(xué)習(xí)到高效的創(chuàng)建自己的高性能服務(wù)器,并且我會(huì)給出源碼進(jìn)行剖析,以及手繪UML圖來(lái)幫助大家來(lái)理解,希望能讓大家更能了解網(wǎng)絡(luò)編程技術(shù)?。?! 希望這篇

    2024年04月25日
    瀏覽(97)
  • 讀高性能MySQL(第4版)筆記09_創(chuàng)建高性能索引(下)

    讀高性能MySQL(第4版)筆記09_創(chuàng)建高性能索引(下)

    1.4.4.1.?InnoDB的二級(jí)索引在葉子節(jié)點(diǎn)中保存了記錄的主鍵值,所以如果二級(jí)索引能夠覆蓋查詢,則可以避免對(duì)主鍵索引的二次查詢 7.1.5.1.?常見(jiàn)的類似錯(cuò)誤通常是由于嘗試使用rsync備份InnoDB導(dǎo)致的 7.3.3.1.?否則,對(duì)于范圍查詢、索引覆蓋掃描等操作來(lái)說(shuō),速度可能會(huì)降低很多 7

    2024年02月08日
    瀏覽(97)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包