歡迎關注【youcans的學習筆記】原創(chuàng)作品,火熱更新中
5月11日 Google I/O 開發(fā)者大會發(fā)布大語言模型 PaLM2(Pathways Language Model 2),稱在部分任務上超越 GPT-4。
- 谷歌辦公全家桶 Workspace 將集成 Duet AI;
- 谷歌聊天機器人 Bard 全面升級并向所有人開放;
- 谷歌云將上線多個基礎大模型,提供生成式 AI 服務。
說明:本文主要內容參考 Google CEO Sundar Pichai 在 Google I/O 2023 的演講及 Google 相關資料。
1. PaLM2 大型語言模型
1.1 谷歌發(fā)布 PaLM2
2017年谷歌提出 transformer 架構,為近年來人工智能突破性發(fā)展奠定了基礎。
2022年 4月,谷歌發(fā)布第一代 PaLM 大型語言模型(Pathways Language Model),在 7800億 token 的高質量文本上訓練 5400 億參數(shù)的稠密自回歸 Transformer,在數(shù)百個自然語言、代碼和數(shù)學推理任務上實現(xiàn)了state-of-the-art 的結果。
2023年5月11日,谷歌最新發(fā)布了新的大型語言模型模型 PaLM2,推出了超過 25 種由 PaLM 2 提供支持的產品和功能。
PaLM2 建立在谷歌的基礎研究和最新的基礎設施之上,提供了不同規(guī)模的四個版本以便勝任不同任務和部署:“壁虎” (Gecko),“水獺”(Otter)、“野?!保˙ison)和“獨角獸”(Unicorn)。輕量級的 Gecko 模型可以在移動設備上運行,速度非常快,可以在設備上運行出色的交互式應用程序,支持離線使用。這使在手機也能運行交互式應用程序,每秒可以處理20個token。
英偉達 Jim Fan 對此表示贊同, **“下一波大型語言模型(LLM)將是移動原生的。一個離線的、永遠在線的 LLM 不僅可以降低服務成本,而且還為用戶體驗開辟了全新的途徑。**例如,一個元應用程序可以從你的移動工作流程中學習,并為你實現(xiàn)自動化?!?/p>
Sundar Pichai 在演講中說:
-
PaLM2 是我們以負責任的方式將 AI 帶給數(shù)十億人的十年旅程中的最新一步。 它建立在兩個世界級研究團隊 Brain Team 和 DeepMind 取得的進展之上。
-
回顧過去十年定義性的 AI 突破,這些團隊為其中的許多突破做出了貢獻:AlphaGo、Transformer、序列到序列模型等等。 所有這些都為我們今天所處的拐點奠定了基礎。
-
我們最近將這兩個團隊合并為一個部門,即 Google DeepMind。 他們利用 Google 的計算資源,專注于安全、負責任地構建功能更強大的系統(tǒng)。
-
這包括我們仍在訓練中的下一代基礎模型 Gemini。 Gemini 旨在實現(xiàn)多模式、高效的工具和 API 集成,并旨在實現(xiàn)未來的創(chuàng)新,例如記憶和規(guī)劃。Gemini 將具有像 GPT-4 一樣的萬億參數(shù),目前仍在訓練中,但已經展示出了以往模型中從未見過的多模態(tài)能力。
1.2 PaLM2 的功能與性能
Google DeepMind 副總裁 Zoubin Ghahramani 說:回顧過去十年人工智能領域的最大突破時,谷歌一直走在其中的最前沿。
- 我們在基礎模型方面的開創(chuàng)性工作已成為該行業(yè)和數(shù)十億人每天使用的人工智能產品的基石。
- 我們如何構建和訓練模型的最新進展教會了我們如何解鎖多模態(tài)、在循環(huán)中獲得人類反饋的重要性,以及如何比以往更有效地構建模型。
- 我們將繼續(xù)推進 AI 的最先進水平,同時構建可以為人們的日常生活帶來真正好處的模型。
PaLM 2 是一種最先進的語言模型,具有改進的多語言、推理和編碼能力。
(1)語言能力:
PaLM2 在多語言文本方面接受了更多的訓練,涵蓋 100 多種語言。 這顯著提高了它在多種語言中理解、生成和翻譯細微差別文本(包括成語、詩歌和謎語)的能力。PaLM2 通過了高級語言能力考試,日語水平達到了A 級,法語水平達到了C1級,語言能力已經“足以教授這門語言”。
(2)推理能力:
PaLM2 的廣泛數(shù)據集包括科學論文和包含數(shù)學表達式的網頁。 因此,它展示了邏輯、常識推理和數(shù)學方面的改進能力。根據 MATH、GSM8K 和 MGSM 基準測試的評估,具有思維鏈提示的 PaLM2 的部分結果超越了 GPT-4。
(3)編程能力:PaLM2 現(xiàn)在支持 20種編程語言,不僅擅長 Python 和 JavaScript 等流行的編程語言,但也可以生成 Prolog、Fortran 和 Verilog 等語言的專用代碼。還可以幫助開發(fā)人員在世界各地進行協(xié)作
(4)專業(yè)領域模型:
-
谷歌健康團隊打造的 Med-PaLM2。它能回答各種醫(yī)學問題,在美國醫(yī)療執(zhí)照考試中達到專家水平。今后將引入多模態(tài),檢查 X 光片給出診斷。今年該模型將對部分谷歌云用戶開放。
-
面向網絡安全維護的Sec-PaLM2。它使用人工智能來幫助分析和解釋潛在惡意腳本的行為,快速檢測哪些腳本會對個人和組織構成實際威脅。
2. 基于 PaLM2 的谷歌 AI 產品
谷歌的聊天機器人 Bard 以及 25個 AI 產品和功能,都以 PaLM2 作為底層技術支持。
2.1 智能助手 Duet AI
Google Workspace 中的Duet AI 是一個內嵌在各種辦公軟件中的 AI 助手,類似于微軟的 365 Copilot。
谷歌展示了 Duet AI 在Gmail、Google Docs、Google Sheets 中的能力。它可以根據提示補充郵件內容、生成PPT、根據提示生成圖片素材、一鍵生成表格等。Duet AI 助手也能提供編程幫助,包括實時推薦、糾錯代碼塊,并且以對話方式解答編程問題。
Google Workspace 中的 Duet AI 還提供了一些工具,可以根據 Slides 和 Meet 中的文本描述生成圖像,在 Sheets 中創(chuàng)建自定義計劃等等。
Duet AI 通過自動數(shù)據分類和創(chuàng)建自定義計劃,幫助您比以往更快地分析和處理表格中的數(shù)據。
Duet AI 直接從幻燈片中的文本生成圖像。
閱讀有關Workspace 最新更新的更多信息。
2.2 Gmail:幫我寫郵件
從 Gmail 開始,生成式 AI 正在幫助改進我們的產品。2017年,我們推出智能回復,一鍵選擇簡短回復。 接下來是 Smart Compose,它會在您鍵入時提供寫作建議。 Smart Compose 帶來了由 AI 提供支持的更高級的寫作功能。 在過去的一年里,它們就在 Workspace 中被使用了超過 1800 億次。 現(xiàn)在,有了更強大的生成模型,我們將在 Gmail 中邁出下一步:“幫我寫(Help me write)”
假設您收到一封電子郵件,告知您的航班已取消。 航空公司已經發(fā)了代金券,但你真正想要的是全額退款。 你可以回復,并使用“幫我寫”。
只需輸入您想要的提示——一封要求全額退款的電子郵件——點擊創(chuàng)建,就會出現(xiàn)完整的草稿。 它可以方便地從上一封電子郵件中提取航班詳細信息。 它看起來與您要發(fā)送的內容非常接近,但也許您想進一步完善它。 在這種情況下,更詳盡的電子郵件可能會增加獲得退款的機會。 “幫我寫”將作為我們 Workspace updates 的一部分開始推出。 就像使用 Smart Compose 一樣,您會發(fā)現(xiàn)它會隨著時間的推移變得更好。
2.3 Google Maps:全新沉浸式視圖
自街景早期以來,人工智能已經將數(shù)十億張全景圖像拼接在一起,因此人們可以通過他們的設備探索世界。 在去年的 I/O 上,我們推出了沉浸式視圖,它使用 AI 創(chuàng)建一個地方的高保真表示,因此您可以在訪問之前體驗它。
現(xiàn)在,我們正在擴展相同的技術來做地圖最擅長的事情:幫助你到達你想去的地方。 谷歌地圖每天提供 200 億公里的方向——這是很多次旅行。 現(xiàn)在想象一下,如果你能提前看到你的整個旅程。 無論您是步行、騎自行車還是駕車,都可以使用沉浸式視圖查看路線。
假設您在紐約市并且想騎自行車。 地圖為您提供了幾個靠近您所在位置的選項。 海濱的那個看起來風景優(yōu)美,但你想先感受一下,所以你點擊沉浸式視圖查看路線。 這是一種全新的方式來看待您的旅程。 您可以放大以獲得令人難以置信的騎行鳥瞰圖。
還有更多可用信息。 您可以查看空氣質量、交通和天氣,看看它們會如何變化。
Immersive View 航線將于夏季開始推出,并于年底前在 15 個城市推出,包括倫敦、紐約、東京和舊金山。
2.4 Google Photos:魔法編輯體驗
另一個由 AI 改進的產品是 Google Photos。 我們在 2015 年的 I/O 大會上推出了它,它是我們首批 AI 原生產品之一。 機器學習的突破使搜索照片中的人物、日落或瀑布等事物成為可能。
當然,我們希望您做的不僅僅是搜索照片——我們還希望幫助您改進照片。 事實上,每個月都有 17 億張圖片在 Google 相冊中進行編輯。 人工智能的進步為我們提供了更強大的方法來做到這一點。 例如,首先在 Pixel 上推出的 Magic Eraser 使用 AI 驅動的計算攝影來消除不必要的干擾。 今年晚些時候,通過結合語義理解和生成 AI,您可以通過一種名為 Magic Editor 的新體驗做更多事情。
這是一個例子:這是一張很棒的照片,但作為父母,您可能希望您的孩子處于一切的中心。 看起來氣球在這個中被切斷了,所以你可以繼續(xù)重新定位生日男孩。 Magic Editor 會自動重新創(chuàng)建原始鏡頭中未捕捉到的部分長凳和氣球。 作為畫龍點睛之筆,可以一拳沖天。 這也會改變照片其余部分的光線,使編輯感覺一致。 這真的很神奇。 我們很高興在今年晚些時候在 Google 相冊中推出 Magic Editor。
2.5 讓人工智能對每個人更有幫助
從 Gmail、Google Maps 到 Photos,這些只是 AI 如何在關鍵時刻為您提供幫助的幾個例子。 我們還有很多工作可以做,以在您了解和喜愛的產品中充分發(fā)揮 AI 的潛力。
今天,我們有 15 種產品,每一種都為超過 5 億人和企業(yè)提供服務。 其中六款產品分別為超過 20 億用戶提供服務。 這為我們提供了很多機會來履行我們的使命——組織世界信息并使人人都可以訪問和使用這些信息。
這是一個永恒的使命,隨著時間的推移,感覺更有意義。 展望未來,讓 AI 對每個人都有幫助是我們推進使命的最深刻方式。 我們通過四種重要方式來做到這一點:
首先,通過提高你的知識和學習,加深你對世界的理解。
其次,通過提高創(chuàng)造力和生產力,您可以表達自己并完成工作。
第三,通過使開發(fā)人員和企業(yè)能夠構建自己的變革性產品和服務。
最后,通過負責任地構建和部署人工智能,讓每個人都能平等受益
3. Bard 全面開放
3.1 對話式 AI 引擎 Bard
谷歌推出了由 PaLM2 驅動的全新對話式 AI 引擎 Bard,簡單地說就是谷歌版的 New Bing Chat。
谷歌說的更具有正能量:
-
隨著模型變得更好、更有能力,最令人興奮的機會之一就是讓人們可以直接參與其中。
-
我們早就看到了通過對話式 AI 使信息和計算更容易訪問的潛力。兩年前,我們推出了LaMDA(對話應用程序語言模型)
-
我們一直在快速發(fā)展對話式 AI,Bard 是我們在 3 月份推出的對話式 AI 實驗。
-
Bard 完全在 PaLM 2 上運行。它現(xiàn)在支持廣泛的編程功能,并且在推理和數(shù)學提示方面變得更加智能。
-
Bard 即將支持各種第三方擴展,例如自動根據輸入的文本生成圖像,根據輸入的圖像識別內容和回答問題。
谷歌助手副總裁 Sissie Hsiao 說:今天我們將推出 Bard 的新更新,包括圖像功能、編碼功能和應用程序集成。 此外,我們正在擴大全球訪問范圍,引入更多語言并結束候補名單,在180個國家或地區(qū)提供服務。
注:處于符合當?shù)胤梢蟮脑?,目前暫不向“部分國家和地區(qū)”開放。
進一步獲取有關Bard 的更新信息,請閱讀: Bard 最新更新。
進一步了解 Bard 的原理,請閱讀:LaMDA: our breakthrough conversation technology。
Bard 是什么?
我們早就看到了通過對話式人工智能使信息和計算更容易訪問的潛力。兩年前,我們推出了LaMDA(對話應用程序語言模型),這是一個能夠進行流暢、多回合對話的對話式人工模型,并提供關于LaMDA的反饋。
Bard 是一個基于同樣技術的實驗,可以讓你與生成人工智能合作。作為一個富有創(chuàng)造力和樂于助人的合作者,Bard 可以增強你的想象力,提高你的生產力,并幫助你將你的想法付諸實踐,無論你是想幫助規(guī)劃完美的生日派對和起草邀請函,或者簡單地理解真正復雜的話題。
如果你對更多的技術細節(jié)感興趣,Bard 是一個基于 Transformer 的模型。該語言模型通過“閱讀”數(shù)萬億個單詞來學習,這有助于它掌握構成人類語言的模式,因此它善于預測什么可能是合理的反應。
Bard 是否給出準確和安全的回應?
Bard 是實驗性的,有些回答可能不準確,所以仔細檢查 Bard 回答中的信息。
在 Bard 公開發(fā)布之前,數(shù)千名測試人員參與提供反饋,以幫助 Bard 提高其質量、安全性和準確性。
用生成人工智能加速人們的想法確實令人興奮,但現(xiàn)在還為時過早,Bard 是一個實驗。雖然 Bard 有內置的安全控制和明確的反饋機制,符合我們的人工智能原則,但要注意,它可能會顯示不準確的信息或冒犯性的陳述。
3.2 Bard 的注冊方法
Bard 是一個讓你與生成人工智能合作的實驗。
Bard 作為一個富有創(chuàng)造力和樂于助人的合作者,可以增強你的想象力,提高你的生產力。
登錄 Bard
要使用 Bard,您需要使用谷歌帳戶登錄。
你需要什么
您自己管理的個人谷歌帳戶,或管理員已啟用 Bard 訪問權限的谷歌工作區(qū)帳戶。
年滿18歲。
支持的瀏覽器:Chrome、Safari、Firefox、Opera或Edgium。
重要提示:目前,Bard 僅提供日語、韓語和英語版本。
登錄 Bard
- 訪問 bard.google.com。
- 在右上角,選擇“登錄(Sign in)”。
- 登錄您的個人谷歌帳戶。
退出 Bard
- 訪問 bard.google.com。
- 在右上角,選擇您的個人資料圖片或首字母。
- 選擇“注銷(Sign out)”。
3.3 Bard 使用體驗
Bard 的用戶界面如下,非常簡單。
使用體驗:
1. 圖文搜索
【User】What are some must-see sights in New Orleans?
【Bard】
雖然 Bard 支持圖文搜索,但該功能對普通用戶“即將推出” 。
2. 圖像搜索
【User】write a funny caption about these two?
【Bard】
雖然 Bard 支持圖像搜索,但該功能對普通用戶“即將推出” 。
3. 中文支持
【User】請用中文輸出以上內容
【Bard】
目前提供日語、韓語和英語版本。
4. 新的搜索生成體驗
隨著 AI 繼續(xù)快速改進,我們專注于為用戶提供有用的功能。
(1)多模態(tài)搜索體驗,Lens 與多模態(tài)結合,允許使用圖像和文本進行搜索。
計算機視覺的進步引入了視覺搜索的新方法。Lens 與多模態(tài)相結合導致了多重搜索,它允許您使用圖像和文本進行搜索?,F(xiàn)在,即使您不知道用什么詞來描述您要查找的內容,您也可以使用 Google Lens 搜索您看到的任何內容。Lens 每個月用于視覺搜索的次數(shù)超過 120 億次。
(2)生成式搜索體驗,將生成式AI直接引入谷歌搜索。
Google 對信息的深刻理解與生成 AI 的獨特功能相結合,可以再次改變搜索的工作方式,解開搜索可以回答的全新問題,并創(chuàng)造越來越有用的體驗,將您與豐富的網絡聯(lián)系起來。
將生成式 AI 應用于搜索仍處于早期階段。 世界各地的人們在重要時刻都依賴 Google 搜索,我們知道做好這一點并繼續(xù)贏得他們的信任是多么重要。 那永遠是我們的北極星。
(3)搜索提供代碼提示,提供代碼片段和更快更智能地編寫代碼。
(4)搜索結果添加到表格,可以將搜索結果直接插入到電子表格中,可以直接從谷歌搜索輕松添加鏈接。
我們以負責任的態(tài)度對待創(chuàng)新,從一開始就力爭達到信息質量的最高標準。 這就是為什么我們首先在實驗室中為您帶來新的搜索生成體驗。新的搜索體驗可以幫助您快速找到并理解信息。在搜索時,您可以通過AI驅動的概述、探索更多內容的指示以及以自然跟進的方式來了解主題的要點。
我們將為您提供一種新的方式來預覽 Workspace 和其他產品的一些體驗。如果想試用這些新工具,需要注冊 Workspace Labs 加入候補名單。現(xiàn)在,任何人都可以申請加入候補名單。注:處于符合當?shù)胤梢蟮脑?,目前暫不向“部分國家和地區(qū)”開放。
5. 推動 Android 的進步
谷歌展示了下一代移動操作系統(tǒng) Android14 的新能力。
(1)使用 Android 推動進步
我們通過 Android 等計算平臺,釋放人們的創(chuàng)造力和潛力,惠及盡可能多的人。
我們分享了 AI 的進步如何讓您的手機更加個性化,包括 Magic Compose、Cinematic Wallpapers 和 Generative AI Wallpapers。
Magic Compose將于今年夏天在谷歌的默認短信應用 Message中推出測試版,它是一種基于AI生成模型的工具,讓你在回短信的時候根據聊天內容獲得大量提示。它會學習你的說話方式,你也可以讓自己的回復內容看起來有不同的語氣,或者用莎士比亞的風格來寫。
Generative Wallpapers 使用生成式 AI 來幫你制作獨一無二的手機壁紙,和 AI 畫圖一樣使用語言提示完成。
(2)新的 Pixel 平板電腦和折疊手機
我們還推出了 Pixel 7a、Pixel Fold 和 Pixel 平板電腦,以構建由 Google 設計的完整的人工智能設備生態(tài)系統(tǒng)。 Pixel 7a 從今天開始可供購買,Pixel Fold 和 Pixel Tablet 現(xiàn)已開放預訂。
谷歌發(fā)布了 AI 筆記本Project Tailwind,目標受眾定位為學生。它就像一個真正的筆記本一樣,可以在里面記筆記,而這些內容就是AI學習的對象。用戶可以從谷歌云端硬盤中挑選文件,創(chuàng)建一個兼具個性化和私人屬性的AI模型。在示例演示中,Tailwind收集了一大堆學習筆記,然后生成了包括主題詞在內的很多內容,比如用戶可以為特定主題創(chuàng)建術語表。
(3)專為 Android 開發(fā)的 AI 編碼機器人 Studio Bot
Studio Bot 不僅可以生成代碼、修復BUG,還能回答關于 Android 應用開發(fā)的相關問題,同時支持 Kotlin 和 Java 編程語言,并將直接嵌入到 Android Studio 開發(fā)工具的工具欄中。
6. 推動 AI 創(chuàng)新平臺和工具
AI 不僅是一個強大的推動者,也是一個巨大的平臺轉變。 每個企業(yè)和組織都在思考如何推動轉型。 這就是為什么我們專注于讓其他人能夠輕松且可擴展地利用 AI 進行創(chuàng)新。
這意味著提供最先進的計算基礎設施——包括最先進的 TPU 和 GPU——并擴大對谷歌最新基礎模型的訪問,這些模型已經在我們自己的產品中經過嚴格測試。 我們還致力于提供世界一流的工具,以便客戶可以訓練、微調和運行他們自己的模型——具有企業(yè)級的安全、保障和隱私。
谷歌為云端機器學習平臺 Vertex AI 推出了三款大模型:
- Codey:text-to-code,幫助程序員寫代碼
- Imagen:text-to-image,生成高質量圖像
- Chirp:speech-to-text,方便溝通
在 Vertex AI 上還能使用文本和圖像的嵌入式API。它支持將文本和圖像數(shù)據轉換為多維數(shù)值向量、映射語義關系,從而允許開發(fā)者創(chuàng)建出更加創(chuàng)新的應用。
谷歌云發(fā)布了一款新的 A3 超級計算機虛擬機。
-
A3 GPU VM 專為當今的機器學習工作負載提供最高性能的訓練而設計。
-
A3 GPU VM 配備 Nvidia H100 GPU,可以獲得具有高吞吐量和低延遲的巨大計算能力。
7. 共創(chuàng)未來,迎接新時代
我一直在反思我們都參與其中的重大技術變革。 AI 的轉變與它們來時一樣大,這就是為什么我們讓 AI 對每個人都有幫助如此重要。 我們懷著興奮的心情大膽地接近它。 我們正在以一種負責任的方式來做這件事,這種方式強調了我們對把它做好的堅定承諾。
沒有一家公司可以單獨做到這一點。 我們的開發(fā)者社區(qū)將是釋放未來巨大機遇的關鍵。 我們期待著共同努力,共同建設。
最后,“這個新時代,是承前啟后、繼往開來的時代…
參考資料:
Google CEO Sundar Pichai 在 Google I/O 2023 的演講,[https://blog.google/technology/ai/google-io-2023-keynote-sundar-pichai/#ai-products]
及 Google 相關資料。文章來源:http://www.zghlxwxcb.cn/news/detail-454189.html
版權聲明:
歡迎關注【youcans的 AIGC 學習筆記】,轉發(fā)請注明原文鏈接:【PaLM2】PaLM2 大語言模型與 Bard 使用體驗
Copyright 2023 youcans, XUPT
Crated:2023-05-12文章來源地址http://www.zghlxwxcb.cn/news/detail-454189.html
到了這里,關于【PaLM2】PaLM2 大語言模型與 Bard 使用體驗的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!