第十章 Python第三方庫概覽
10.1 Python第三方庫的獲取和安裝
Python第三方庫依照安裝方式靈活性和難易程度有三個(gè)方法:pip工具安裝、自定義安裝和文件安裝。
10.1.1 pip工具安裝
最常用且最高效的Python第三方庫安裝方式是采用pip工具安裝。pip是Python官方提供并維護(hù)的在線第三方庫安裝工具。
使用pip安裝第三方庫需要聯(lián)網(wǎng)。語法格式如下:
pip install <擬安裝庫名>
pip是Python第三方庫最主要的安裝方式,可以安裝超過90%以上的第三方庫。然而還有一些第三方庫無法暫時(shí)用pip安裝,此時(shí)需要其他的安裝方法。
pip工具與操作系統(tǒng)也有關(guān)系,在Mac OS X和Linux等操作系統(tǒng)中,pip工具幾乎可以安裝任何Python第三方庫,在Windows操作系統(tǒng)中,有一些第三方庫任然需要用其他方式嘗試安裝。
10.1.2 自定義安裝
自定義安裝指按照第三方庫提供的步驟和方式按照。第三方庫都有主頁用于維護(hù)庫的代碼和文檔。以科學(xué)計(jì)算用的numpy為例,
開發(fā)者維護(hù)的官方主頁是:https://numpy.org/
10.1.3 文件安裝
由于Python某些第三方庫僅提供源代碼,通過pip下載文件后無法在Windows系統(tǒng)編譯安裝,會(huì)導(dǎo)致第三方庫安裝失敗。在Windows平臺(tái)下所遇到無法安裝第三方庫的問題大多屬于這類。
為了解決這類第三方庫安裝問題,美國(guó)加州大學(xué)爾灣分校提供了一個(gè)頁面,幫助Python用戶獲得Windows可直接安裝的第三方庫文件,鏈接地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/
10.1.4 pip工具使用
列出常用的子命令,語法格式如下:
pip -h
卸載已安裝的第三方庫,語法格式如下:
pip uninstall <擬卸載庫名>
列出已經(jīng)安裝的第三方庫,語法格式如下:
pip list
查看已經(jīng)安裝庫的詳細(xì)信息,語法格式如下:
pip show <擬查詢庫名>
下載第三方庫的安裝包,語法格式如下:
pip download <擬下載庫名>
聯(lián)網(wǎng)搜索庫名或摘要中關(guān)鍵字,語法格式如下:
pip search <擬查詢關(guān)鍵字>
10.2 PyInstaller庫概述
PyInstaller是一個(gè)十分有用的Python第三方庫,它能夠在Windows、Linux、Mac OS X等操作系統(tǒng)下將Python源文件打包,變成可直接運(yùn)行的可執(zhí)行文件。
通過對(duì)源文件打包,Python程序可以在沒有安裝Python的環(huán)境中運(yùn)行,也可以作為一個(gè)獨(dú)立文件方便傳遞和管理。
PyInstaller需要在命令行下用pip工具安裝,安裝命令如下:
pip install PyInstaller
10.3 PyInstaller庫與程序打包
使用PyInstaller庫對(duì)Python源文件打包十分簡(jiǎn)單,語法格式如下:
PyInstaller <Python源程序文件名>
執(zhí)行完畢后,源文件所在目錄將生成dist和build兩個(gè)文件夾。其中build目錄是PyInstaller存儲(chǔ)臨時(shí)文件的目錄,可以安全刪除。最終的打包程序在dist內(nèi)部與源文件同名的目錄中。目錄中其他文件是可執(zhí)行文件的動(dòng)態(tài)鏈接庫
可以通過-F參數(shù)對(duì)Python源文件生成一個(gè)獨(dú)立的可執(zhí)行文件,語法格式如下:
PyInstaller -F <Python源程序文件名>
執(zhí)行后在dist目錄中出現(xiàn)了文件,沒有任何依賴庫,執(zhí)行它即可顯示相應(yīng)效果。
PyInstaller常用參數(shù):
參數(shù) | 功能 |
---|---|
-h,–help | 查看幫助 |
–clean | 清理打包過程中的臨時(shí)文件 |
-D,–onedir | 默認(rèn)值,生成dist目錄 |
-F,–onefile | 在dist文件夾中只生成獨(dú)立的打包文件 |
-i<圖標(biāo)文件名.ico> | 指定打包程序使用的圖標(biāo)(icon)文件 |
10.4 jieba庫概述
由于中文文本中的單詞不是通過空格或者標(biāo)點(diǎn)符號(hào)分割,中文及類似語言存在一個(gè)重要的“分詞”問題。
jieba(“結(jié)巴”)是Python匯總給一個(gè)重要的第三方中文分詞函數(shù)庫,能夠?qū)⒁欢沃形奈谋痉指畛芍形脑~語的序列。
jieba庫需要通過pip指令安裝,安裝命令如下:
pip install jieba
jieba庫的分詞原理是利用一個(gè)中文詞庫,將待分詞的內(nèi)容與分詞詞庫進(jìn)行比對(duì),通過圖結(jié)構(gòu)和動(dòng)態(tài)規(guī)劃方法找到最大概率的詞組。除了分詞,jieba還提供增加自定義中文單詞的功能。
jieba庫支持三種分詞模式:文章來源:http://www.zghlxwxcb.cn/news/detail-471233.html
- 精確模式,將句子最精確的切開,適合文本分析。
- 全模式:把句子中所有可以成詞的詞語都掃描出來,速度非???,但是不能解決歧義。
- 搜索引擎模式:在精確模式基礎(chǔ)上,對(duì)長(zhǎng)詞再次切分,提高召回率,適合用于搜索引擎分詞。
10.5 jieba庫與中文分詞
jieba庫常用的分詞函數(shù)如下:文章來源地址http://www.zghlxwxcb.cn/news/detail-471233.html
函數(shù) | 描述 |
---|---|
jieba.lcut(s) | 精確模式,返回一個(gè)列表 |
jieba.lcut(s,cut_all=Ture) | 全模式,返回一個(gè)列表類型 |
jieba.lcut_for_search(s) | 搜索引擎模式,返回一個(gè)列表類型 |
jieba.add_wor |
到了這里,關(guān)于第十章 Python第三方庫概覽的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!