国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

文本標注技術(shù)方案(NLP標注工具)

這篇具有很好參考價值的文章主要介紹了文本標注技術(shù)方案(NLP標注工具)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

Doccano

doccano 是一個面向人類的開源文本注釋工具。它為文本分類、序列標記和序列到序列任務提供注釋功能。您可以創(chuàng)建用于情感分析、命名實體識別、文本摘要等的標記數(shù)據(jù)。只需創(chuàng)建一個項目,上傳數(shù)據(jù),然后開始注釋。您可以在數(shù)小時內(nèi)構(gòu)建數(shù)據(jù)集。

支持命名實體識別,情感分類,機器翻譯任務,界面比較友好。

  • 當前公司私有化部署的地址:(當前掛掉了,后端處理中)
  • git:https://github.com/doccano/doccano

技術(shù)方案

前端:vue2 + nuxt

后端:python

技術(shù)難點

  1. 標注工具編輯器部分組件

文本標注技術(shù)方案(NLP標注工具),自然語言處理,人工智能

功能:

  • 支持標注 Label
  • 支持關(guān)系 Relation

開源組件:

  • vue 組件:
    • https://www.npmjs.com/package/v-annotator
    • https://github.com/doccano/v-annotator/blob/master/package.json
    • demo:https://github.com/doccano/doccano/blob/93cfd52924378bd2c8e109fff2b072199ff2e8bc/frontend/pages/demo/named-entity-recognition/index.vue
<v-annotator
      :dark="$vuetify.theme.dark"
      :rtl="rtl"
      :text="text" //文本內(nèi)容
      :entities="entities" // 注解內(nèi)容
      :entity-labels="entityLabels" // 注解標簽
      :relations="relations"http:// 關(guān)系內(nèi)容
      :relation-labels="relationLabels" // 關(guān)系標簽
      :allow-overlapping="allowOverlapping"
      :grapheme-mode="graphemeMode"
      :selected-entities="selectedEntities"
      @add:entity="handleAddEvent" // 添加注解內(nèi)容
      @click:entity="onEntityClicked"  // 點擊注解
      @click:relation="onRelationClicked" // 點擊關(guān)系
        @addRelation="addRelation" // 添加 關(guān)系
      @contextmenu:entity="deleteEntity" // 右鍵菜單點擊
      @contextmenu:relation="deleteRelation" // 右鍵菜單點擊
    />

 <entity-editor
                :dark="$vuetify.theme.dark"
                :rtl="rtl"
                :text="currentDoc.text"
                :entities="currentDoc.annotations"
                :entity-labels="entityLabels"
                :relations="relations"
                :relation-labels="relationLabels"
                :allow-overlapping="allowOverlapping"
                @addEntity="addEntity"
                @click:entity="updateEntity"
                @contextmenu:entity="deleteEntity"
                @contextmenu:relation="deleteRelation"
              />
  • react 組件

https://github.com/microsoft/react-text-annotator

當前看 v-annotator 是 doccanno 封裝的一個組件,react 這個組件要分析一下是不是支持當前的特性

文本標注技術(shù)方案(NLP標注工具),自然語言處理,人工智能

代碼如下:

import {AnnotationData, Labeler} from 'react-text-annotator'

const HomePage: React.FC = () => {
  const annotations: AnnotationData[] = [
    {
        id: 'id1',
        color: 'red',
        endToken: 5,
        startToken: 0,
        name: 'label111111',
        kind: 'label',
        onClick:(e) => {
          console.log(e);
        },
        level: 1,// 設置層級
        onRenderTooltip: (e) =><>label111111</>
    },{
      id: 'id1',
      color: 'green',
      endToken: 5,
      startToken: 1,
      name: 'label222222',
      kind: 'label',
      onRenderTooltip: (e) =><>label222222</>
  },
    {
        id: 'id2',
        color: 'blue',
        endToken: 25,
        startToken: 10,
        name: 'relation',
        kind: 'relation',
        
    }
];

const labelerText = 'This is sample text to test the labeler functionality.';


return <>
  <Labeler text={labelerText} annotations={annotations} labelerConfigs={{ isAnnotationResizingEnabled: true,isRtl: false, tokenizationType: 'character' }} 
    labelerOverflow={'scroll'}
    labelerHeight={"100px"}
  />
</>;
};

export default HomePage;

下面的了解即可

YEDDA:(2016)(python)

優(yōu)點是安裝方便,程序很小,標注方便,如果要實現(xiàn)給同一個實體加多個標簽,也可以實現(xiàn)。最大標簽數(shù)8,界面也還過的去。

YEDDA(以前的 SUTDAnnotator)是為在文本(幾乎所有語言,包括英語、中文)、符號甚至表情符號上注釋塊/實體/事件而開發(fā)的。它支持快捷注釋,對于手動注釋文本非常有效。用戶只需選擇文本范圍并按快捷鍵,該范圍就會自動注釋。它還支持命令注釋模型,可以批量注釋多個實體,并支持將注釋文本導出為序列文本。此外,更新版本還增加了智能推薦和管理員分析。它兼容所有主流操作系統(tǒng),包括Windows、Linux和MacOS。

https://github.com/jiesutd/YEDDA

python

Prodigy(2017):

Prodigy 是一種現(xiàn)代注釋工具, 用于為機器學習模型創(chuàng)建訓練和評估數(shù)據(jù)。您還可以使用 Prodigy 來幫助您檢查和清理數(shù)據(jù)、進行錯誤分析以及開發(fā)基于規(guī)則的系統(tǒng)以與統(tǒng)計模型結(jié)合使用。

https://prodi.gy/docs/

Python library

Chinese-Annotator:(2017)

基于prodigy的中文標注工具

https://github.com/deepwel/Chinese-Annotator

demo:https://demo.prodi.gy/?=null&view_id=textcat

技術(shù)方案:

  • vue2 element
  • Python

Brat:(2010)

支持實體、關(guān)系、事件抽取的標注??梢詷俗⑶楦?。

優(yōu)點在標注實體的同時可以進行關(guān)系標注,還可以實現(xiàn)二級標注。

brat rapid annotation tool

GitHub - nlplab/brat: brat rapid annotation tool (brat) - for all your textual annotation needs

技術(shù)方案

  • jq
  • Python

IEPY

主要用來信息抽取和關(guān)系抽取任務

https://github.com/machinalis/iepy

DeepDive

主要用來關(guān)系抽取任務,17就停止更新了

http://deepdive.stanford.edu/#documentation

個人小結(jié)

大致可以選用Brat,Doccano,YEDDA,Prodigy試一下,選用Brat是因為有現(xiàn)成的中文情感標注,還有Brat有關(guān)系標注,選用Doccano是它的頁面很友好,而且可添加的標簽數(shù)也比較多,選用YEDDA是它完全用Python桌面開發(fā)且支持中文,選用Prodigy是因為支持標注的功能最全。

文本標注技術(shù)方案(NLP標注工具),自然語言處理,人工智能

中文分詞工具(分詞工具有的也可以做命名實體識別和詞性標注,可以去看看)

中科院計算所NLPIR http://ictclas.nlpir.org/nlpir/

ansj分詞器 https://github.com/NLPchina/ansj_seg

哈工大的LTP https://github.com/HIT-SCIR/ltp

清華大學THULAC https://github.com/thunlp/THULAC

斯坦福分詞器 https://nlp.stanford.edu/software/segmenter.shtml

Hanlp分詞器 https://github.com/hankcs/HanLP

結(jié)巴分詞 https://github.com/yanyiwu/cppjieba

KCWS分詞器(字嵌入+Bi-LSTM+CRF) https://github.com/koth/kcws

ZPar https://github.com/frcchang/zpar/releases

IKAnalyzer https://github.com/wks/ik-analy文章來源地址http://www.zghlxwxcb.cn/news/detail-685877.html

到了這里,關(guān)于文本標注技術(shù)方案(NLP標注工具)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務器費用

相關(guān)文章

  • 自然語言處理 Paddle NLP - 檢索式文本問答-理論

    自然語言處理 Paddle NLP - 檢索式文本問答-理論

    基礎 自然語言處理(NLP) 自然語言處理PaddleNLP-詞向量應用展示 自然語言處理(NLP)-前預訓練時代的自監(jiān)督學習 自然語言處理PaddleNLP-預訓練語言模型及應用 自然語言處理PaddleNLP-文本語義相似度計算(ERNIE-Gram) 自然語言處理PaddleNLP-詞法分析技術(shù)及其應用 自然語言處理Pa

    2024年02月11日
    瀏覽(26)
  • 自然語言處理3——玩轉(zhuǎn)文本分類 - Python NLP高級應用

    自然語言處理3——玩轉(zhuǎn)文本分類 - Python NLP高級應用

    隨著信息時代的不斷發(fā)展,海量的文本數(shù)據(jù)成為我們獲取知識和信息的重要來源。如何高效地從這些文本中提取有用的信息,成為數(shù)據(jù)分析和數(shù)據(jù)挖掘領(lǐng)域的熱門問題之一。本文將介紹文本分類在自然語言處理(NLP)中的高級應用,通過Python實現(xiàn),讓你輕松玩轉(zhuǎn)文本分類。

    2024年02月03日
    瀏覽(43)
  • 自然語言處理(NLP)技術(shù)

    ????????自然語言處理技術(shù)是一種人工智能技術(shù),它的目標是使計算機能夠理解、分析、處理和生成自然語言(人類使用的語言)。NLP技術(shù)包括文本分類、情感分析、機器翻譯、語音識別、語音合成、信息檢索、信息抽取、問答系統(tǒng)等。NLP技術(shù)的應用非常廣泛,例如智能客

    2024年02月14日
    瀏覽(33)
  • 暢談自然語言處理——初識NLP技術(shù)

    暢談自然語言處理——初識NLP技術(shù)

    最近,一個名為ChatGPT的模型將計算機領(lǐng)域震撼,它以對話的方式進行交互,對話形式使 ChatGPT 能夠回答后續(xù)問題、承認錯誤、挑戰(zhàn)不正確的前提并拒絕不適當?shù)恼埱?。使人們感受到了人工智能越來越接近人類智能?作為目前人工智能領(lǐng)域最前沿的研究成果之一, ChatGPT的實現(xiàn)

    2024年02月01日
    瀏覽(25)
  • 自然語言處理(NLP)技術(shù)的例子

    以下是幾個自然語言處理(NLP)技術(shù)的例子: 機器翻譯:機器翻譯是將一種自然語言的文本轉(zhuǎn)換成另一種語言的文本的過程。這種技術(shù)應用于在線翻譯器、多語言聊天機器人、多語言搜索引擎等地方。 文本分類:文本分類將文本分成不同的類別,它可以被應用到垃圾郵件過

    2024年02月10日
    瀏覽(31)
  • 舉例說明自然語言處理(NLP)技術(shù)

    自然語言處理(NLP)技術(shù)是一種人工智能領(lǐng)域的技術(shù),用于處理自然語言文本或語音信號。下面是一些自然語言處理技術(shù)的例子: 機器翻譯:機器翻譯是一種自然語言處理的技術(shù),它可以將一種語言的文本翻譯成另一種語言的文本,如將英語翻譯成中文。 命名實體識別:命

    2024年02月10日
    瀏覽(34)
  • 【NLP】靈魂提問:自然語言處理(NLP)技術(shù)是什么?

    自然語言處理(NLP)技術(shù)是一種讓計算機能夠理解和處理人類語言的技術(shù)。它可以應用于多個領(lǐng)域,包括自動翻譯、語音識別、情感分析、問答系統(tǒng)等。 當涉及到自然語言處理(NLP)技術(shù)時,有許多不同的應用例子,包括但不限于以下幾個方面: 機器翻譯:NLP技術(shù)可以用于

    2024年01月20日
    瀏覽(29)
  • 自然語言處理NLP:文本預處理Text Pre-Processing

    自然語言處理NLP:文本預處理Text Pre-Processing

    大家好,自然語言處理(NLP)是計算機科學領(lǐng)域與人工智能領(lǐng)域中的一個重要方向,其研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法。本文將介紹文本預處理的本質(zhì)、原理、應用等內(nèi)容,助力自然語言處理和模型的生成使用。 文本預處理是將原始文本數(shù)

    2024年04月26日
    瀏覽(91)
  • 7個頂級開源數(shù)據(jù)集來訓練自然語言處理(NLP)和文本模型

    7個頂級開源數(shù)據(jù)集來訓練自然語言處理(NLP)和文本模型

    推薦:使用 NSDT場景編輯器快速助你搭建可二次編輯的3D應用場景 NLP現(xiàn)在是一個令人興奮的領(lǐng)域,特別是在像AutoNLP這樣的用例中,但很難掌握。開始使用NLP的主要問題是缺乏適當?shù)闹笇Ш驮擃I(lǐng)域的過度廣度。很容易迷失在各種論文和代碼中,試圖吸收所有內(nèi)容。 要意識到的是

    2024年02月13日
    瀏覽(25)
  • 自然語言處理 Paddle NLP - 文本語義相似度計算(ERNIE-Gram)

    自然語言處理 Paddle NLP - 文本語義相似度計算(ERNIE-Gram)

    基礎 自然語言處理(NLP) 自然語言處理PaddleNLP-詞向量應用展示 自然語言處理(NLP)-前預訓練時代的自監(jiān)督學習 自然語言處理PaddleNLP-預訓練語言模型及應用 自然語言處理PaddleNLP-文本語義相似度計算(ERNIE-Gram) 自然語言處理PaddleNLP-詞法分析技術(shù)及其應用 自然語言處理Pa

    2024年02月08日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包