- spacy 簡介
spacy 是 Python 自然語言處理軟件包,可以對自然語言文本做詞性分析、命名實(shí)體識別、依賴關(guān)系刻畫,以及詞嵌入向量的計(jì)算和可視化等。
1.安裝 spacy
使用 “pip install spacy" 報(bào)錯(cuò), 或者安裝完 spacy,無法正常調(diào)用,可以通過以下鏈接將 whl 文件下載到本地,然后 cd 到文件路徑下,通過 pip 安裝。
pip install spacy
下載鏈接:
Archived: Python Extension Packages for Windows - Christoph Gohlke (uci.edu)
選擇對應(yīng)的版本:
2. 語言庫安裝
2.1 zh_core_web_sm
2.1:英文 = python -m spacy download en_core_web_sm
2.2:中文 = python -m spacy download zh_core_web_sm
可以手動(dòng)下載包再安裝
下載地址 = https://github.com/explosion/spacy-models/releases/download/zh_core_web_sm-3.7.0/zh_core_web_sm-3.7.0-py3-none-any.whl
下載好之后執(zhí)行命令:pip install zh_core_web_sm-3.7.0-py3-none-any.whl
通過下方鏈接下載 whl 文件到本地:
zh_core_web_sm · Releases · explosion/spacy-models (github.com)
選擇對應(yīng)的版本:
下載好對應(yīng)版本的 zh_core_web_sm.whl 文件,cd 文件保存目錄,然后通過 pip 安裝。
pip install spacy
python -m spacy download zh_core_web_sm
安裝成功提示:
2.2 安裝 en_core_web_sm
通過下方鏈接下載 whl 文件到本地:
en_core_web_sm · Releases · explosion/spacy-models (github.com)
選擇對應(yīng)的版本:
下載好對應(yīng)版本的 zh_core_web_sm.whl 文件,cd 文件保存目錄,然后通過 pip 安裝。
3.效果測試
3.1 英文測試
# 導(dǎo)入英文類
from spacy.lang.en import English
# 實(shí)例化一個(gè)nlp類對象,包含管道pipeline
nlp = English()
# print(nlp)
doc = nlp("December is excited!")
# 迭代tokens
for token in doc:
print(token.text)
token = doc[1]
print(token.text)
輸出結(jié)果:文章來源:http://www.zghlxwxcb.cn/news/detail-792920.html
December
is
excited
!
is
3.2 中文測試
# 處理文本
nlp = spacy.load('zh_core_web_sm')
doc = nlp("英偉達(dá)準(zhǔn)備用20億美金買下這家法國的創(chuàng)業(yè)公司。")
# 遍歷識別出的實(shí)體
for ent in doc.ents:
# 打印實(shí)體文本及其標(biāo)注
print(ent.text, ent.label_)
輸出結(jié)果:文章來源地址http://www.zghlxwxcb.cn/news/detail-792920.html
英偉達(dá) ORG
20億美金 MONEY
法國 NORP
到了這里,關(guān)于自然語言處理(NLP)-spacy簡介以及安裝指南(語言庫zh_core_web_sm)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!