NLP基本概念:
- 自然語言處理( Natural Language Processing, NLP)是以語言為對象,利用計算機(jī)技術(shù)來分析、理解和處理自然語言的一門學(xué)科,即把計算機(jī)作為語言研究的強(qiáng)大工具,在計算機(jī)的支持下對語言信息進(jìn)行定量化的研究,并提供可供人與計算機(jī)之間能共同使用的語言描寫。包括自然語言理解( NaturalLanguage Understanding, NLU)和自然語言生成( Natural LanguageGeneration, NLG)兩部分。它是典型邊緣交叉學(xué)科,涉及到語言科學(xué)、計算機(jī)科學(xué)、數(shù)學(xué)、認(rèn)知學(xué)、邏輯學(xué)等,關(guān)注計算機(jī)和人類(自然)語言之間的相互作用的領(lǐng)域。人們把用計算機(jī)處理自然語言的過程在不同時期或側(cè)重點不同時又稱為自然語言理解( Natural Language Understanding, NLU)、人類語言技術(shù)( Human Language Technology, HLT)、計算語言學(xué)Hl(Computational Linguistics)、計量語言學(xué)( QuantitativeLinguistics)、數(shù)理語言學(xué)( Mathematical Linguistics)
- 自然語言處理(NLP,Natural Language Processing)是研究人與計算機(jī)交互的語言問題的一門學(xué)科。按照技術(shù)實現(xiàn)難度的不同,這類系統(tǒng)可以分成簡單匹配式、模糊匹配式和段落理解式三種類型。
- 處理自然語言的關(guān)鍵是要讓計算機(jī)“理解”自然語言,所以自然語言處理又叫做自然語言理解(NLU,NaturalLanguage Understanding),也稱為計算語言學(xué)(Computational Linguistics)。一方面它是語言信息處理的一個分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心課題之一。
NLP基本類型示例
- 按照技術(shù)實現(xiàn)難度的不同,這類系統(tǒng)可以分成簡單匹配式、模糊匹配式和段落理解式三種類型。簡單匹配式輔導(dǎo)答疑系統(tǒng)主要通過簡單的關(guān)鍵字匹配技術(shù)來實現(xiàn)對學(xué)生提出問題與答案庫中相關(guān)應(yīng)答條目的匹配,從而做到自動回答問題或進(jìn)行相關(guān)輔導(dǎo)。模糊匹配式輔導(dǎo)答疑系統(tǒng)則在此基礎(chǔ)上増加了同義詞和反義詞的匹配。這樣,即使學(xué)生所提問題中按原來的關(guān)鍵字在答案庫中找不到直接匹配的答案,但是假若與該關(guān)鍵字同義或反義的詞能夠匹配則仍可在答案庫中找到相關(guān)的應(yīng)答條目。段落理解式輔導(dǎo)答疑系統(tǒng)是最理想的、也是真正智能化的輔導(dǎo)答疑系統(tǒng)(簡單匹配式和模糊匹配式,嚴(yán)格說只能稱之為“自動輔導(dǎo)答疑系統(tǒng)”而非“智能輔導(dǎo)答疑系統(tǒng)”)。但是由于這種系統(tǒng)涉及自然語言的段落理解,對于漢語來說,這種理解涉及自動分詞、詞性分析、句法分析和語義分析等NLP領(lǐng)域的多種復(fù)雜技術(shù),所以實現(xiàn)難度很大。迄今為止,在國內(nèi)的網(wǎng)絡(luò)教學(xué)中還沒有一個實用化的、能真正實現(xiàn)漢語段落理解的智能輔導(dǎo)答疑系統(tǒng)。但是在我國有些大學(xué)的人工智能實驗室或中文信息處理實驗室中,已有少數(shù)研究人員正在研發(fā)這類系統(tǒng)的實驗原型。相信在不久的將來,就會有這一類的實用性智能系統(tǒng)問世。這是優(yōu)質(zhì)網(wǎng)絡(luò)課程的重要研究方向之一。
NLP主要應(yīng)用方向文章來源:http://www.zghlxwxcb.cn/news/detail-530651.html
- 自然語言處理主要應(yīng)用于機(jī)器翻譯、輿情監(jiān)測、自動摘要、觀點提取、文本分類、問題回答、文本語義對比、語音識別、中文OCR等方面。
NLP發(fā)展史文章來源地址http://www.zghlxwxcb.cn/news/detail-530651.html
- 早期自然語言處理
- 第一階段(60~80年代):基于規(guī)則來建立詞匯、句法語義分析、問答、聊天和機(jī)器翻譯系統(tǒng)。好處是規(guī)則可以利用人類的內(nèi)省知識,不依賴數(shù)據(jù),可以快速起步;問題是覆蓋面不足,像個玩具系統(tǒng),規(guī)則管理和可擴(kuò)展一直沒有解決。
- 統(tǒng)計自然語言處理
- 第二階段(90年代開始):基于統(tǒng)計的機(jī)器學(xué)習(xí)(ML)開始流行,很多NLP開始用基于統(tǒng)計的方法來做。主要思路是利用帶標(biāo)注的數(shù)據(jù),基于人工定義的特征建立機(jī)器學(xué)習(xí)系統(tǒng),并利用數(shù)據(jù)經(jīng)過學(xué)習(xí)確定機(jī)器學(xué)習(xí)系統(tǒng)的參數(shù)。運(yùn)行時利用這些學(xué)習(xí)得到的參數(shù),對輸入數(shù)據(jù)進(jìn)行解碼,得到輸出。機(jī)器翻譯、搜索引擎都是利用統(tǒng)計方法獲得了成功。
- 神經(jīng)網(wǎng)絡(luò)自然語言處理
- 第三階段(2008年之后):深度學(xué)習(xí)開始在語音和圖像發(fā)揮威力。隨之,NLP研究者開始把目光轉(zhuǎn)向深度學(xué)習(xí)。先是把深度學(xué)習(xí)用于特征計算或者建立一個新的特征,然后在原有的統(tǒng)計學(xué)習(xí)框架下體驗效果。比如,搜索引擎加入了深度學(xué)習(xí)的檢索詞和文檔的相似度計算,以提升搜索的相關(guān)度。自2014年以來,人們嘗試直接通過深度學(xué)習(xí)建模,進(jìn)行端對端的訓(xùn)練。目前已在機(jī)器翻譯、問答、閱讀理解等領(lǐng)域取得了進(jìn)展,出現(xiàn)了深度學(xué)習(xí)的熱潮。
到了這里,關(guān)于NLP(自然語言處理)是什么?的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!