国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

清華發(fā)布首個(gè)最全大模型安全評(píng)測(cè)系統(tǒng),ChatGPT登榜首!

這篇具有很好參考價(jià)值的文章主要介紹了清華發(fā)布首個(gè)最全大模型安全評(píng)測(cè)系統(tǒng),ChatGPT登榜首!。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

清華發(fā)布首個(gè)最全大模型安全評(píng)測(cè)系統(tǒng),ChatGPT登榜首!夕小瑤科技說(shuō) 原創(chuàng)
作者 | 天于刀刀 Python
當(dāng)前大型語(yǔ)言模型的火爆程度我們不用再進(jìn)行贅述了,伴隨著百度文心一言打響國(guó)內(nèi)商業(yè)大模型第一槍,華為盤(pán)古,阿里通義千問(wèn),智譜ChatGLM,科大訊飛星火等國(guó)內(nèi)公司紛紛開(kāi)始布局。

另一方面由于眾所周知的政策原因,和如火如荼層出不窮的各個(gè)大模型相比,現(xiàn)在國(guó)內(nèi)AIGC內(nèi)容生成的商業(yè)落地產(chǎn)品則是寥寥無(wú)幾。根據(jù)2023年4月11日國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布的生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿):

第四條 提供生成式人工智能產(chǎn)品或服務(wù)應(yīng)當(dāng)遵守法律法規(guī)的要求,尊重社會(huì)公德、公序良俗...?

第五條 利用生成式人工智能產(chǎn)品提供聊天和文本、圖像、聲音生成等服務(wù)的組織和個(gè)人(以下稱“提供者”),包括通過(guò)提供可編程接口等方式支持他人自行生成文本、圖像、聲音等,承擔(dān)該產(chǎn)品生成內(nèi)容生產(chǎn)者的責(zé)任;涉及個(gè)人信息的,承擔(dān)個(gè)人信息處理者的法定責(zé)任,履行個(gè)人信息保護(hù)義務(wù)。

第六條 利用生成式人工智能產(chǎn)品向公眾提供服務(wù)前,應(yīng)當(dāng)按照《具有輿論屬性或社會(huì)動(dòng)員能力的互聯(lián)網(wǎng)信息服務(wù)安全評(píng)估規(guī)定》向國(guó)家網(wǎng)信部門(mén)申報(bào)安全評(píng)估,并按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》履行算法備案和變更、注銷(xiāo)備案手續(xù)。

換句話說(shuō),哪怕是人工智能也得遵守基本法,需要正能量!

這也就意味著,現(xiàn)在行業(yè)中急需一個(gè)專門(mén)用于檢測(cè)漢語(yǔ)大型語(yǔ)言模型道德觀法律觀的評(píng)估方法!

而來(lái)自清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系的CoAI小組為我們帶來(lái)了一套系統(tǒng)的安全評(píng)測(cè)框架!他們的工作已經(jīng)整理成論文的形式[1],并且相關(guān)的公開(kāi)基準(zhǔn)數(shù)據(jù)集也已經(jīng)發(fā)布在 HuggingFace 平臺(tái)[2]。想要進(jìn)一步對(duì)模型進(jìn)行多樣化安全評(píng)測(cè)的團(tuán)隊(duì)和個(gè)人也可以聯(lián)系CoAI團(tuán)隊(duì)[3][4],在隱藏測(cè)評(píng)數(shù)據(jù)上進(jìn)行測(cè)試。

該團(tuán)隊(duì)的一個(gè)主要貢獻(xiàn)是設(shè)計(jì)和總結(jié)了一個(gè)較為完備的安全分類(lèi)體系:

8種典型安全場(chǎng)景和6種指令攻擊的安全場(chǎng)景。

清華發(fā)布首個(gè)最全大模型安全評(píng)測(cè)系統(tǒng),ChatGPT登榜首!清華發(fā)布首個(gè)最全大模型安全評(píng)測(cè)系統(tǒng),ChatGPT登榜首!

下圖展示了截至目前在公開(kāi)測(cè)試集上安全性能前10名的模型 leaderboard。

清華發(fā)布首個(gè)最全大模型安全評(píng)測(cè)系統(tǒng),ChatGPT登榜首!

我們可以看到一些商用的大模型,如文心一言和通義千問(wèn)并沒(méi)有參加測(cè)試,因此并沒(méi)有上榜。這可能是因?yàn)樽髡邎F(tuán)隊(duì)時(shí)間有限導(dǎo)致的。

不過(guò)由于大模型生成內(nèi)容的隨機(jī)性,作者團(tuán)隊(duì)設(shè)計(jì)的測(cè)試流程不可避免地會(huì)涉及到一些人工測(cè)評(píng)的工作。這也是當(dāng)前評(píng)估基準(zhǔn)測(cè)試流程的一個(gè)痛點(diǎn):效率和成本相互沖突。?作者也在論文中提到他們之后會(huì)進(jìn)一步增加更多有挑戰(zhàn)性的攻擊性提示,并且會(huì)進(jìn)一步優(yōu)化評(píng)估流程。

不過(guò)對(duì)于那些急需上線 AIGC 服務(wù)的公司來(lái)說(shuō),這個(gè)基準(zhǔn)測(cè)試集不失為一個(gè)快速檢驗(yàn)產(chǎn)品能力和局限性的優(yōu)秀資源。想要利用大模型賺錢(qián)的同學(xué)們可千萬(wàn)不要錯(cuò)過(guò)這個(gè)好項(xiàng)目哦。

沖鴨~文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-456078.html

清華發(fā)布首個(gè)最全大模型安全評(píng)測(cè)系統(tǒng),ChatGPT登榜首!清華發(fā)布首個(gè)最全大模型安全評(píng)測(cè)系統(tǒng),ChatGPT登榜首!
清華發(fā)布首個(gè)最全大模型安全評(píng)測(cè)系統(tǒng),ChatGPT登榜首!
[1]Safety Assessment of Chinese Large Language Models, https://arxiv.org/pdf/2304.10436.pdf
[2]Datasets: thu-coai/Safety-Prompts, https://huggingface.co/datasets/thu-coai/Safety-Prompts
[3]Github: thu-coai/Safety-Prompts, https://github.com/thu-coai/Safety-Prompts
[4]中文大模型安全評(píng)測(cè)平臺(tái), http://coai.cs.tsinghua.edu.cn/leaderboard/

到了這里,關(guān)于清華發(fā)布首個(gè)最全大模型安全評(píng)測(cè)系統(tǒng),ChatGPT登榜首!的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 百川智能發(fā)布首個(gè)530億參數(shù)閉源大模型,今年追上GPT-3.5

    百川智能發(fā)布首個(gè)530億參數(shù)閉源大模型,今年追上GPT-3.5

    4月官宣創(chuàng)業(yè),6月15日發(fā)布第一款7B開(kāi)源模型,7月11日發(fā)布第二款13B、130億參數(shù)開(kāi)源模型。 平均保持2個(gè)月一個(gè)版本發(fā)布速度,8月8日,百川智能發(fā)布了創(chuàng)業(yè)以來(lái)的首個(gè)530億參數(shù)閉源大模型——Baichuan-53B(以下簡(jiǎn)稱“53B”)。 光錐智能獲悉,53B支持中英雙語(yǔ),在知識(shí)性上表現(xiàn)優(yōu)

    2024年02月13日
    瀏覽(16)
  • Mistral AI發(fā)布首個(gè)開(kāi)源MoE模型,魔搭社區(qū)推理微調(diào)最佳實(shí)踐來(lái)啦!

    Mistral AI發(fā)布首個(gè)開(kāi)源MoE模型,魔搭社區(qū)推理微調(diào)最佳實(shí)踐來(lái)啦!

    原文:Mistral AI發(fā)布首個(gè)開(kāi)源MoE模型,魔搭社區(qū)推理微調(diào)最佳實(shí)踐來(lái)啦! - 知乎 繼Mistral 7B 后,Mistral AI 近日又放出一記大招——發(fā)布了引爆開(kāi)源社區(qū)的首個(gè) MoE 開(kāi)源模型 Mixtral 8x7B,在 Apache 2.0 許可證下可商用。 Mixtral-8x7B 是 一款混合專家模型( Mixtrue of Experts ),由8個(gè)擁有70億

    2024年01月16日
    瀏覽(29)
  • MistralAI發(fā)布全球首個(gè)MoE大模型-Mixtral 8x7B,創(chuàng)新超越GPT-4

    MistralAI發(fā)布全球首個(gè)MoE大模型-Mixtral 8x7B,創(chuàng)新超越GPT-4

    引言 MistralAI,一家法國(guó)的初創(chuàng)企業(yè),近期在AI界引發(fā)了轟動(dòng),剛剛發(fā)布了 全球首個(gè)基于MoE(Mixture of Experts,混合專家) 技術(shù)的大型語(yǔ)言模型——Mistral-8x7B-MoE。這一里程碑事件標(biāo)志著AI技術(shù)的一個(gè)重要突破,尤其是在模型結(jié)構(gòu)和效率上的創(chuàng)新,讓它在業(yè)界贏得了“超越GPT-4”的

    2024年02月04日
    瀏覽(27)
  • CSA GCR大會(huì)正式發(fā)布全球首個(gè)云滲透測(cè)試認(rèn)證專家課程,騰訊安全獲評(píng)“特別貢獻(xiàn)單位”

    CSA GCR大會(huì)正式發(fā)布全球首個(gè)云滲透測(cè)試認(rèn)證專家課程,騰訊安全獲評(píng)“特別貢獻(xiàn)單位”

    4月13日,第六屆云安全聯(lián)盟大中華區(qū)大會(huì)(CSA GCR Congress)在上海舉辦,大會(huì)由聯(lián)合國(guó)數(shù)字安全聯(lián)盟、上海市經(jīng)濟(jì)和信息化委員會(huì)、上海市委網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室、上海市普陀區(qū)人民政府指導(dǎo),云安全聯(lián)盟大中華區(qū)主辦。 會(huì)上,CSA GCR正式發(fā)布了全球首個(gè)云滲透測(cè)試

    2024年02月15日
    瀏覽(19)
  • OpenCloudOS 9.0 發(fā)布:首個(gè)全自研服務(wù)器操作系統(tǒng)

    OpenCloudOS 9.0 發(fā)布:首個(gè)全自研服務(wù)器操作系統(tǒng)

    系統(tǒng)開(kāi)源社區(qū) OpenCloudOS 正式發(fā)布 首個(gè)全自研社區(qū) 9.0 版本 (以下簡(jiǎn)稱 OC 9.0)。據(jù)了解,該版本由騰訊等十余家企業(yè)共同開(kāi)發(fā)并長(zhǎng)期維護(hù),其內(nèi)核及用戶態(tài)軟件均為自主選型、獨(dú)立演進(jìn),在操作系統(tǒng)發(fā)行版的全鏈路均實(shí)現(xiàn)自主可控。 ?操作系統(tǒng)等基礎(chǔ)軟件是信息技術(shù)的根基,

    2024年02月09日
    瀏覽(23)
  • 【AI大模型】訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,現(xiàn)場(chǎng)發(fā)布四大行業(yè)應(yīng)用成果

    【AI大模型】訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,現(xiàn)場(chǎng)發(fā)布四大行業(yè)應(yīng)用成果

    ?創(chuàng)作者:全棧弄潮兒 ?? 個(gè)人主頁(yè): 全棧弄潮兒的個(gè)人主頁(yè) ??? 個(gè)人社區(qū),歡迎你的加入:全棧弄潮兒的個(gè)人社區(qū) ?? 專欄地址:AI大模型 【分享幾個(gè)國(guó)內(nèi)免費(fèi)可用的ChatGPT鏡像】 【10幾個(gè)類(lèi)ChatGPT國(guó)內(nèi)AI大模型】 【用《文心一言》1分鐘寫(xiě)一篇博客簡(jiǎn)直yyds】 【用訊飛星火

    2024年02月04日
    瀏覽(65)
  • ACL2023 | WebCPM:清華發(fā)布中文LFQA 數(shù)據(jù)集,探索搜索引擎和PLM大模型結(jié)合新范式

    ACL2023 | WebCPM:清華發(fā)布中文LFQA 數(shù)據(jù)集,探索搜索引擎和PLM大模型結(jié)合新范式

    一、概述 title:WEBCPM: Interactive Web Search for Chinese Long-form Question Answering 論文地址:https://arxiv.org/abs/2305.06849 代碼:https://github.com/thunlp/WebCPM 1.1 Motivation 開(kāi)發(fā)一個(gè)類(lèi)似于WebGPT一樣的中文版本的數(shù)據(jù)集,用于檢索相關(guān)事實(shí),并基于這些事實(shí)生成最終回答,并發(fā)布一個(gè)baseline模型。

    2024年02月12日
    瀏覽(17)
  • AI時(shí)代的生成式3D大模型全面評(píng)測(cè) - “ChatGPT時(shí)刻”的前夜

    AI時(shí)代的生成式3D大模型全面評(píng)測(cè) - “ChatGPT時(shí)刻”的前夜

    在我過(guò)去的所有文章中,我一直把AI分成四個(gè)模態(tài)去進(jìn)行分類(lèi): AI文本(大語(yǔ)言模型)、AI繪圖、AI聲音、AI視頻 而在我最近的交流和訪談中,有一個(gè)游離于這四模態(tài)之外的存在,被反復(fù)提起。 AI 3D。 12月20號(hào),這個(gè)星期三的晚上,我在接受一個(gè)朋友的采訪很開(kāi)心的聊了一個(gè)小

    2024年02月03日
    瀏覽(23)
  • 【ChatGLM】本地版ChatGPT ?6G顯存即可輕松使用 !ChatGLM-6B 清華開(kāi)源模型本地部署教程

    【ChatGLM】本地版ChatGPT ?6G顯存即可輕松使用 !ChatGLM-6B 清華開(kāi)源模型本地部署教程

    目錄 感謝B站秋葉aaaki大佬 前言 部署資源 部署流程? 實(shí)機(jī)演示 ChatGML微調(diào)(人格煉成)(個(gè)人感覺(jué)蠻有趣的地方) ?分享有趣の微調(diào)人格 ?實(shí)機(jī)演示(潘金蓮人格) 秋葉aaaki的個(gè)人空間_嗶哩嗶哩_bilibili https://space.bilibili.com/12566101 由于ChatGLM-6B的規(guī)模較小,目前已知其具有相當(dāng)

    2024年02月06日
    瀏覽(34)
  • 首個(gè)ChatGPT機(jī)器人- Figure 01;李開(kāi)復(fù)旗下零一萬(wàn)物推出Yi系列AI大模型API

    首個(gè)ChatGPT機(jī)器人- Figure 01;李開(kāi)復(fù)旗下零一萬(wàn)物推出Yi系列AI大模型API

    ?? AI新聞 ?? 首個(gè)ChatGPT機(jī)器人- Figure 01 摘要 :Figure 01是一個(gè)由初創(chuàng)公司Figure聯(lián)合OpenAI開(kāi)發(fā)的人形機(jī)器人。它展示了與人類(lèi)和環(huán)境互動(dòng)的能力,可以說(shuō)話、看東西,并且可以執(zhí)行各種任務(wù),如遞食物、撿垃圾、收拾碗筷等。Figure 01還具備推理能力,可以自主識(shí)別、計(jì)劃和執(zhí)行

    2024年04月23日
    瀏覽(20)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包