国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

聊聊心理醫(yī)療領(lǐng)域大模型的落地思考

這篇具有很好參考價值的文章主要介紹了聊聊心理醫(yī)療領(lǐng)域大模型的落地思考。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

轉(zhuǎn)載請注明出處:https://www.cnblogs.com/zhiyong-ITNote

近來,工作偏向于心理醫(yī)療領(lǐng)域方面的大模型,僅從領(lǐng)域大模型的落地,聊聊個人的一些思考。

硬件

準備好花錢買GPU。

領(lǐng)域大模型

業(yè)務(wù)場景的思考

首先需要審視斟酌業(yè)務(wù)領(lǐng)域的特殊性與可行性,我們要做的是心理領(lǐng)域,而心理領(lǐng)域傾向于醫(yī)患對話,即詢問鏈的場景;不僅僅是一問一回答的角度,而作為智能體(AI模型/醫(yī)生)還需要 對患者的回答進行 引導(dǎo)/打分,且作為問詢對話場景,對話上下文的長度必然不會少,這也是需要考慮的問題。其次,治療時的患者,會處于不同的治療階段,就需要做不同的治療,治療的側(cè)重點就會不一樣。
總之,在實際開展的前期,對業(yè)務(wù)領(lǐng)域的場景與方向需要與產(chǎn)品不斷的打磨研究,分析出產(chǎn)品的方向場景及特殊性。

開源模型

摸著石頭過河——目前醫(yī)療、金融等領(lǐng)域已經(jīng)有很多的開源模型,作為技術(shù)儲備與預(yù)研,極其需要對已有的開源模型做一些調(diào)研。如下是我個人覺得不錯且對于我們的場景可以借鑒的醫(yī)療模型:

  1. 扁鵲 BianQue
  2. 靈心 SoulChat
  3. CareGPT
  4. MedicalGPT

對于開源模型的研究,不僅僅是跑demo,沒有什么用處,畢竟又不能直接拿過來落地——現(xiàn)在很多的模型都只是丟個訓(xùn)練完的模型文件上來,最關(guān)鍵的訓(xùn)練數(shù)據(jù)、業(yè)務(wù)流程、訓(xùn)練流程、調(diào)試代碼并沒有放上來;這類開源庫參考意義不大。
如下幾點是我比較看重的:

  1. 訓(xùn)練數(shù)據(jù)及格式
  2. 微調(diào)框架(官方、開源)
  3. 業(yè)務(wù)流程
  4. 訓(xùn)練流程及代碼
  5. 訓(xùn)練方式
  6. 是否支持微調(diào)

業(yè)務(wù)流程

對比上述的模型,靈心模型的場景及應(yīng)用和我們的業(yè)務(wù)極度貼近,但官方只是給了模型文件部署,并沒有提供相關(guān)的訓(xùn)練數(shù)據(jù)也不支持微調(diào)。所幸,其業(yè)務(wù)流程還是很詳細,給我們的業(yè)務(wù)落地也提供了參考。

訓(xùn)練流程及代碼

而CareGPT與MedicalGPT兩個模型給我提供了詳細的訓(xùn)練流程參考:

  • 第一階段:PT(Continue PreTraining)增量預(yù)訓(xùn)練,在海量領(lǐng)域文檔數(shù)據(jù)上二次預(yù)訓(xùn)練AI模型,以適應(yīng)領(lǐng)域數(shù)據(jù)分布。
  • 第二階段:SFT(Supervised Fine-tuning)有監(jiān)督微調(diào),構(gòu)造指令微調(diào)數(shù)據(jù)集,在預(yù)訓(xùn)練模型基礎(chǔ)上做指令精調(diào),以對齊指令意圖,并注入領(lǐng)域知識。
  • 第三階段
    • RLHF(Reinforcement Learning from Human Feedback)基于人類反饋對語言模型進行強化學(xué)習(xí),分為兩步:
      • RM(Reward Model)獎勵模型建模,構(gòu)造人類偏好排序數(shù)據(jù)集,訓(xùn)練獎勵模型,用來建模人類偏好,主要是"HHH"原則,具體是"helpful, honest, harmless"。
      • RL(Reinforcement Learning)強化學(xué)習(xí),用獎勵模型來訓(xùn)練SFT模型,生成模型使用獎勵或懲罰來更新其策略,以便生成更高質(zhì)量、更符合人類偏好的文本。
    • DPO(Direct Preference Optimization) 直接偏好優(yōu)化方法,DPO通過直接優(yōu)化語言模型來實現(xiàn)對其行為的精確控制,而無需使用復(fù)雜的強化學(xué)習(xí),也可以有效學(xué)習(xí)到人類偏好,DPO相較于RLHF更容易實現(xiàn)且易于訓(xùn)練,效果更好。

針對如上階段,開源模型有對應(yīng)階段的腳本已實現(xiàn),最好是可以一鍵執(zhí)行。

訓(xùn)練數(shù)據(jù)及格式

數(shù)據(jù)的質(zhì)量與格式,在這些開源模型都是有的;而且對我們的業(yè)務(wù)來說,多輪對話是很常見的,因此怎么樣讓數(shù)據(jù)更緊湊更小,但不損壞數(shù)據(jù)質(zhì)量,是我們需要審視的。
扁鵲與靈心 領(lǐng)域模型的數(shù)據(jù)格式是我蠻滿意的,而且極度滿足我們的業(yè)務(wù)場景:

input: "病人:六歲寶寶拉大便都是一個禮拜或者10天才一次正常嗎,要去醫(yī)院檢查什么項目\n醫(yī)生:您好\n病人:六歲寶寶拉大便都是一個禮拜或者10天才一次正常嗎,要去醫(yī)院檢查什么項目\n醫(yī)生:寶寶之前大便什么樣呢?多久一次呢\n病人:一般都是一個禮拜,最近這幾個月都是10多天\n醫(yī)生:大便干嗎?\n病人:每次10多天拉的很多\n醫(yī)生:"
target: "成形還是不成形呢?孩子吃飯怎么樣呢?"

同時,在不同的治療階段,治療的側(cè)重點也是不一樣的,指令instruction的引導(dǎo)與數(shù)據(jù)的場景化顯得尤為重要。

訓(xùn)練方式

訓(xùn)練方式?jīng)Q定著,采取怎樣的訓(xùn)練形式——微調(diào)訓(xùn)練/多階段訓(xùn)練。基于官方微調(diào)文檔的訓(xùn)練還是開源微調(diào)框架的訓(xùn)練,都是不一樣的。
目前來說,越來越多的領(lǐng)域模型是基于開源微調(diào)框架來做的微調(diào)訓(xùn)練,微調(diào)框架比如LLaMA-Factory;相比較官方文檔來說,開源微調(diào)框架的流程更清晰,微調(diào)策略更多樣、訓(xùn)練階段更完善、且支持的數(shù)據(jù)格式也多種。

MVP

MVP是最小可行性產(chǎn)品英文的首字母縮寫,是企業(yè)用最小的成本開發(fā)出可用且能表達出核心理念的產(chǎn)品版本,使其功能極簡但能夠幫助企業(yè)快速驗證對產(chǎn)品的構(gòu)思。
準備好AI模型與服務(wù)器后,按上述的流程實現(xiàn)一個MVP,以供產(chǎn)品人員試用、客戶演示、進而實現(xiàn)項目最小閉環(huán);最終就是走向產(chǎn)品迭代,不斷演進。

轉(zhuǎn)載請注明出處:https://www.cnblogs.com/zhiyong-ITNote

首發(fā)于個人公眾號

聊聊心理醫(yī)療領(lǐng)域大模型的落地思考文章來源地址http://www.zghlxwxcb.cn/news/detail-841940.html

到了這里,關(guān)于聊聊心理醫(yī)療領(lǐng)域大模型的落地思考的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 大模型在金融醫(yī)療、生命系統(tǒng)和物理仿真領(lǐng)域的創(chuàng)新應(yīng)用探索

    大模型在金融醫(yī)療、生命系統(tǒng)和物理仿真領(lǐng)域的創(chuàng)新應(yīng)用探索

    點擊藍字 關(guān)注我們 AI TIME歡迎每一位AI愛好者的加入! 在當今迅速發(fā)展的科技領(lǐng)域,大模型技術(shù)正日益成為金融醫(yī)療、生命系統(tǒng)和物理仿真等領(lǐng)域中的重要工具。2023年6月16日,AI TIME舉辦的青年科學(xué)家大模型專場活動邀請了國防科技大學(xué)理學(xué)院數(shù)學(xué)系統(tǒng)計與運籌學(xué)講師王琦、

    2024年02月13日
    瀏覽(32)
  • 第九章:AI大模型的實踐案例9.2 醫(yī)療領(lǐng)域9.2.1 病例分析與輔助診斷

    隨著人工智能技術(shù)的不斷發(fā)展,AI大模型在醫(yī)療領(lǐng)域的應(yīng)用也日益普及。醫(yī)療領(lǐng)域的AI大模型主要應(yīng)用于病例分析與輔助診斷,這些模型可以幫助醫(yī)生更快速、準確地診斷疾病,從而提高診斷準確率,降低醫(yī)療成本。 在這篇文章中,我們將深入探討AI大模型在醫(yī)療領(lǐng)域的應(yīng)用,

    2024年02月21日
    瀏覽(16)
  • 聊聊ChatGLM-6B醫(yī)療數(shù)據(jù)微調(diào)

    聊聊ChatGLM-6B醫(yī)療數(shù)據(jù)微調(diào)

    轉(zhuǎn)載請注明出處: https://www.cnblogs.com/zhiyong-ITNote/ 參考了多個醫(yī)療大模型,如扁鵲、靈心等,重新思考了下微調(diào)的方案以及數(shù)據(jù)集的格式;基于ChatGLM/其它LLM整合多種微調(diào)方法的非官方實現(xiàn)的框架,審視其數(shù)據(jù)集格式,以及調(diào)試效果,進行微調(diào)。 最終基于liucongg/ChatGLM-Finetuning開

    2024年03月16日
    瀏覽(21)
  • 【思考】聊聊低代碼的實踐之路

    【思考】聊聊低代碼的實踐之路

    這個概念由來已久,但是在國內(nèi)興起,是最近幾年; 低代碼即Low-Code; 指提供可視化開發(fā)環(huán)境,可以用來創(chuàng)建和管理軟件應(yīng)用; 簡單的說 就是可以通過各種組件的拖拽,實現(xiàn)頁面的創(chuàng)建,交互流程和邏輯,以及數(shù)據(jù)層面的管理,更加高效的實現(xiàn)需求; 早先在數(shù)據(jù)公司時;見

    2024年02月01日
    瀏覽(21)
  • 【深度思考】聊聊CGLIB動態(tài)代理原理

    CGLIB的全稱是:Code Generation Library。 CGLIB是一個強大的、高性能、高質(zhì)量的代碼生成類庫,它可以在運行期擴展Java類與實現(xiàn)Java接口, 底層使用的是字節(jié)碼處理框架ASM。 Github地址:https://github.com/cglib/cglib。 CGLIB的Maven坐標如下所示: 首先,新增一個類: 然后,自定義一個方法

    2023年04月21日
    瀏覽(19)
  • 【深度思考】聊聊JDK動態(tài)代理原理

    首先,定義一個接口: 然后,新增一個類并實現(xiàn)上面的接口: 假設(shè)現(xiàn)在有這么一個需求:在不改動以上類代碼的前提下,對該方法增加一些前置操作或者后置操作。 接下來就來講解下,如何使用 JDK動態(tài)代理 來實現(xiàn)這個需求。 首先,自定義一個調(diào)用處理器,實現(xiàn) java.lang.r

    2023年04月17日
    瀏覽(19)
  • 布局AIGC,快商通對話式AI落地消費醫(yī)療智能營銷

    布局AIGC,快商通對話式AI落地消費醫(yī)療智能營銷

    ChatGPT是OpenAI于2022年11月底推出的一款人工智能對話聊天機器人。該產(chǎn)品一上線便迅速走紅,推出僅僅2個月,月活躍用戶就成功過億,成為歷史上增長最快的消費者應(yīng)用程序。隨著ChatGPT的爆火,其所屬的AIGC賽道也引發(fā)熱烈關(guān)注。 ChatGPT代表著人工智能在認知智能方面向前邁了

    2024年02月12日
    瀏覽(21)
  • 一文解讀 AIGC 驅(qū)動高績效商業(yè)的落地與思考

    一文解讀 AIGC 驅(qū)動高績效商業(yè)的落地與思考

    本文根據(jù)神策數(shù)據(jù)智能業(yè)務(wù)負責(zé)人郭榮鋒《AIGC 驅(qū)動高績效商業(yè)的實踐》的主題演講整理所得,主要圍繞神策對 AIGC (即 AI-Generated Content,人工智能生成內(nèi)容)業(yè)務(wù)應(yīng)用的理解、AIGC 的落地實踐及心得體會等方面展開。 以下為本文的要點: 懂業(yè)務(wù)并且能夠與 AI 進行對話的人,

    2024年02月13日
    瀏覽(18)
  • 關(guān)于單測技術(shù)選型,聊聊我的思考

    對于單測來說,目前常用的單測框架有: JUnit Mockito Spock PowerMock JMockit TestableMock 其中 JUnit 不支持 Mock,因此基本不會只用 JUnit,而是結(jié)合其他有 Mock 功能的框架一起使用。從知名度及使用率來說,Mockito 和 Spock 使用較多,而 PowerMock、JMockit、TestableMock 使用較少。下面我們將主

    2023年04月11日
    瀏覽(20)
  • 人工智能在醫(yī)療領(lǐng)域的應(yīng)用

    人工智能是研究開發(fā)用于模擬和延伸人的智能的理論,方法,技術(shù)和應(yīng)用系統(tǒng)的一項新技術(shù)科學(xué),它的結(jié)構(gòu)類似金字塔結(jié)構(gòu):上層是算法,中間是芯片,第三層是各種軟硬件平臺,最下面是應(yīng)用。人工智能領(lǐng)域的研究是從1956年正式開始的,這一年在達特茅斯大學(xué)校園的會議上

    2024年02月09日
    瀏覽(35)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包