大家好,我是技術(shù)宅小伙,今天要跟大家分享一下我之前寫的 GPT 長(zhǎng)文本處理程序。當(dāng)時(shí)我寫完后就把它放到 Hog 上了,因?yàn)樽铋_始是為了自己用,所以后來就忘掉了。最近有同學(xué)把它翻出來用,然后經(jīng)常來問我,說不知道這個(gè)東西怎么用。其實(shí)在我看來這個(gè)挺簡(jiǎn)單的,但是如果你沒有一些關(guān)于 GPT 或者說 OPPO AI 的基礎(chǔ)知識(shí)的話,那你來用它可能就會(huì)有一些問題。所以今天我專門錄一個(gè)文章來講一下。
首先我們要來說為什么你需要這么一個(gè)長(zhǎng)文本處理程序。通常情況下我們有一個(gè)對(duì)話窗口,然后你跟 GPT 來進(jìn)行聊天就好了,但是這個(gè)聊天他的長(zhǎng)度是有限的。有很多同學(xué)最近在網(wǎng)上鉆研,說怎么在 GPT 的官方聊天界面里邊去輸入盡可能多的內(nèi)容,但事實(shí)上呢,如果官方也是后邊也是模型,前面是一個(gè)意外的話,他其實(shí)真正受到限制的是他后邊的這個(gè)模型的 Max tokens,就是他可以接收的最大 token 數(shù)量。有可能說官方用的這個(gè)模型 token 數(shù)更多,但是也不會(huì)特別的多?,F(xiàn)在我們已知的說你用 GPT4,然后有一個(gè) 32K 的 token,且這個(gè) token 是非常高的,但是有非常的貴。
BAT 就是長(zhǎng)文本處理程序,它是什么樣一個(gè)邏輯呢?就是說雖然你 GPT 一次只能處理一定量的數(shù)據(jù),但沒有關(guān)系我們可以把一個(gè)非常長(zhǎng)的文本給分成段落,然后每一個(gè)段落放進(jìn)去然后來處理。處理完了以后把這些結(jié)果全部拼起來,再變成一個(gè)文本,這樣就完成了對(duì)常文本的一個(gè)處理。當(dāng)然這個(gè)具體的處理指什么,我們這里給了一個(gè)例子是說,你可以把這個(gè)英文給它翻成中文,這是一個(gè)翻譯,一段一段翻,翻完了最后把所有翻好的拼接起來。當(dāng)然你說我是不是也可以做其他的,當(dāng)然可以,你可以通過寫這個(gè)提示詞,然后來指示它干什么。有同學(xué)說我不會(huì)寫提示詞,雖然說提示詞他是一個(gè)專有名詞,但是在 GPT 這個(gè)里邊,他其實(shí)就是用自然語(yǔ)言來描述你想干什么。比方說我們現(xiàn)在來舉一個(gè)例子,我之前寫過一本電子書叫做經(jīng)濟(jì)副業(yè)假設(shè),假設(shè)我們現(xiàn)在要把這本書然后翻譯成繁體中文,要怎么做呢?就如果你沒有這個(gè) BAT 這個(gè)東西,那你可能就要一段一段的來粘貼,然后來復(fù)制。那如果有了它呢,我就最簡(jiǎn)單的方式就是首先我們把它整理成一個(gè)文本,一個(gè)長(zhǎng)文本。但這個(gè)地方就是,然后我們把它存成 txt,然后把它處理成每個(gè)段落的長(zhǎng)度,然后我們就可以來開始處理了。
點(diǎn)一下提交,然后你可以看到他在這個(gè)地方就已經(jīng)開始在處理了,是 15 段里邊的第二段。因?yàn)檫@個(gè)返回不是像這個(gè)聊天一樣是一個(gè)字一個(gè)字返回的,所以他整體返回會(huì)比較慢。如果你想知道一些細(xì)節(jié)的話,你可以按一下 F12,然后你可以通過 network 來看見他是不是在正常工作。這個(gè)翻譯完的內(nèi)容會(huì)緩存到你這個(gè)瀏覽器里邊,所以如果你翻譯失敗了,你在其中的一個(gè)地方,然后他的這個(gè)行為中斷了,那你也不用著急,你可以到時(shí)候重新再照著這個(gè)一模一樣的來進(jìn)行。
除了對(duì)文本進(jìn)行翻譯,這個(gè)長(zhǎng)文本處理程序還可以用于其他用途。比如在進(jìn)行自然語(yǔ)言生成時(shí),我們可以將一篇長(zhǎng)文本的內(nèi)容輸入到 GPT 中,讓它生成一些新的文章段落,這樣可以得到更加豐富的內(nèi)容。此外,在進(jìn)行文本分類時(shí),也可以將一篇長(zhǎng)文本輸入到 GPT 中,然后根據(jù)生成的文本內(nèi)容來判斷它的類別??傊?,這個(gè)長(zhǎng)文本處理程序可以幫助我們更好地使用 GPT,提高我們的文本處理效率。
如果你想要使用這個(gè)長(zhǎng)文本處理程序,可以先將需要處理的文本整理成一個(gè) txt 文件,然后將其上傳到程序中。程序會(huì)自動(dòng)將文本分段,并進(jìn)行相應(yīng)的處理。如果你對(duì)程序的使用還有其他疑問,可以隨時(shí)聯(lián)系我,我會(huì)盡力為你解答。 大家好,我是技術(shù)宅小伙,今天要跟大家分享一下我之前寫的 GPT 長(zhǎng)文本處理程序。當(dāng)時(shí)我寫完后就把它放到 Hog 上了,因?yàn)樽铋_始是為了自己用,所以后來就忘掉了。最近有同學(xué)把它翻出來用,然后經(jīng)常來問我,說不知道這個(gè)東西怎么用。其實(shí)在我看來這個(gè)挺簡(jiǎn)單的,但是如果你沒有一些關(guān)于 GPT 或者說 OPPO AI 的基礎(chǔ)知識(shí)的話,那你來用它可能就會(huì)有一些問題。所以今天我專門錄一個(gè)文章來講一下。
首先我們要來說為什么你需要這么一個(gè)長(zhǎng)文本處理程序。通常情況下我們有一個(gè)對(duì)話窗口,然后你跟 GPT 來進(jìn)行聊天就好了,但是這個(gè)聊天他的長(zhǎng)度是有限的。有很多同學(xué)最近在網(wǎng)上鉆研,說怎么在 GPT 的官方聊天界面里邊去輸入盡可能多的內(nèi)容,但事實(shí)上呢,如果官方也是后邊也是模型,前面是一個(gè)意外的話,他其實(shí)真正受到限制的是他后邊的這個(gè)模型的 Max tokens,就是他可以接收的最大 token 數(shù)量。有可能說官方用的這個(gè)模型 token 數(shù)更多,但是也不會(huì)特別的多?,F(xiàn)在我們已知的說你用 GPT4,然后有一個(gè) 32K 的 token,且這個(gè) token 是非常高的,但是有非常的貴。
BAT 就是長(zhǎng)文本處理程序,它是什么樣一個(gè)邏輯呢?就是說雖然你 GPT 一次只能處理一定量的數(shù)據(jù),但沒有關(guān)系我們可以把一個(gè)非常長(zhǎng)的文本給分成段落,然后每一個(gè)段落放進(jìn)去然后來處理。處理完了以后把這些結(jié)果全部拼起來,再變成一個(gè)文本,這樣就完成了對(duì)常文本的一個(gè)處理。當(dāng)然這個(gè)具體的處理指什么,我們這里給了一個(gè)例子是說,你可以把這個(gè)英文給它翻成中文,這是一個(gè)翻譯,一段一段翻,翻完了最后把所有翻好的拼接起來。當(dāng)然你說我是不是也可以做其他的,當(dāng)然可以,你可以通過寫這個(gè)提示詞,然后來指示它干什么。有同學(xué)說我不會(huì)寫提示詞,雖然說提示詞他是一個(gè)專有名詞,但是在 GPT 這個(gè)里邊,他其實(shí)就是用自然語(yǔ)言來描述你想干什么。比方說我們現(xiàn)在來舉一個(gè)例子,我之前寫過一本電子書叫做經(jīng)濟(jì)副業(yè)假設(shè),假設(shè)我們現(xiàn)在要把這本書然后翻譯成繁體中文,要怎么做呢?就如果你沒有這個(gè) BAT 這個(gè)東西,那你可能就要一段一段的來粘貼,然后來復(fù)制。那如果有了它呢,我就最簡(jiǎn)單的方式就是首先我們把它整理成一個(gè)文本,一個(gè)長(zhǎng)文本。但這個(gè)地方就是,然后我們把它存成 txt,然后把它處理成每個(gè)段落的長(zhǎng)度,然后我們就可以來開始處理了。
點(diǎn)擊提交按鈕,你可以看到程序已經(jīng)在處理長(zhǎng)度為15段的第二段了。返回結(jié)果不像聊天一樣一字一字地返回,所以整體返回會(huì)比較慢。如果你想了解更多細(xì)節(jié),可以按F12鍵,通過network查看它是否正常工作。翻譯完的內(nèi)容會(huì)緩存到你的瀏覽器中,所以如果你在處理過程中遇到問題,處理被中斷了,你也不用著急,你可以重新按照相同的步驟進(jìn)行處理。
除了對(duì)文本進(jìn)行翻譯,這個(gè)長(zhǎng)文本處理程序還可以用于其他用途。比如在進(jìn)行自然語(yǔ)言生成時(shí),我們可以將一篇長(zhǎng)文本的內(nèi)容輸入到GPT中,讓它生成一些新的文章段落,這樣可以得到更加豐富的內(nèi)容。此外,在進(jìn)行文本分類時(shí),也可以將一篇長(zhǎng)文本輸入到GPT中,然后根據(jù)生成的文本內(nèi)容來判斷它的類別。總之,這個(gè)長(zhǎng)文本處理程序可以幫助我們更好地使用GPT,提高我們的文本處理效率。文章來源:http://www.zghlxwxcb.cn/news/detail-421617.html
如果你想要使用這個(gè)長(zhǎng)文本處理程序,可以先將需要處理的文本整理成一個(gè)txt文件,然后將其上傳到程序中。程序會(huì)自動(dòng)將文本分段,并進(jìn)行相應(yīng)的處理。如果你對(duì)程序的使用還有其他疑問,可以隨時(shí)聯(lián)系我,我會(huì)盡力為你解答。文章來源地址http://www.zghlxwxcb.cn/news/detail-421617.html
到了這里,關(guān)于利用ChatGPT如何進(jìn)行批量長(zhǎng)文本處理工具GPTBAT的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!