在上周發(fā)布 Gemini 后,本周谷歌又有了新動(dòng)作。
12 月 13 日,谷歌在其云平臺(tái)上推出了一系列 AI 模型以供用戶(hù)體驗(yàn)并實(shí)際應(yīng)用:向開(kāi)發(fā)者和企業(yè)開(kāi)放 Gemini Pro、面向開(kāi)發(fā)者和安全運(yùn)營(yíng)的 Duet AI、圖像生成 Imagen 2 以及用于醫(yī)療保健場(chǎng)景的 MedLM。
01
Gemini Pro 開(kāi)發(fā)者 API 上線(xiàn),目前免費(fèi)試用
谷歌 Gemini 發(fā)布一周之后,面向開(kāi)發(fā)者的 API 也終于上線(xiàn)了。
目前,不管是 Gemini Pro,還是 Gemini Pro Vision,都可以免費(fèi)體驗(yàn)。雖然每分鐘最多支持 60 次請(qǐng)求,但基本上可以滿(mǎn)足大多數(shù)應(yīng)用程序開(kāi)發(fā)的需求。
而到了明年初上線(xiàn)時(shí),谷歌將正式開(kāi)啟收費(fèi)。API 定價(jià),也將和 GPT-3.5 看齊,都是 0.001 刀每千 token 輸入,0.002 刀每千 token 輸出。
Gemini Pro
GPT-3.5
具體來(lái)說(shuō):
-
目前支持 32K 的上下文窗口,之后還會(huì)進(jìn)一步擴(kuò)大。
-
其他基本的功能也都支持:函數(shù)調(diào)用、嵌入、語(yǔ)義檢索、自定義知識(shí)。
-
支持全球 180 多個(gè)國(guó)家和地區(qū)的 38 種語(yǔ)言。
-
支持文本的 API 輸出,不過(guò)輸出暫時(shí)還只支持文字。
-
提供了 Python、Android (Kotlin)、Node.js、Swift 和 JavaScript 的 SDK 支持。
-
在當(dāng)前版本中,Gemini Pro 接受文本作為輸入,并可生成文本輸出。谷歌此次還發(fā)布了專(zhuān)用的 Gemini Pro Vision 多模態(tài)端點(diǎn),可接受文本和圖像作為輸入,并據(jù)此輸出文本響應(yīng)。
微調(diào)方面,用戶(hù)可以通過(guò) Google AI Studio 直接接入 Gemini Pro API,而且用戶(hù)還可以通過(guò) Vertex AI 來(lái)全面地自定義 Gemini。
其中,用戶(hù)可以使用自己的數(shù)據(jù),在無(wú)代碼環(huán)境構(gòu)建自己的 Gemini 對(duì)話(huà)機(jī)器人,支持 RAG,搜索,嵌入,對(duì)話(huà)劇本等功能。而且谷歌保證,所有用戶(hù)的數(shù)據(jù)和 IP 谷歌都不會(huì)用來(lái)訓(xùn)練模型。
借助 Vertex AI,同樣可以訪(fǎng)問(wèn) Gemini 模型,并能夠:
-
使用自有企業(yè)數(shù)據(jù)微調(diào)及蒸餾 Gemini,立足底層對(duì)模型進(jìn)行增強(qiáng),使其包含最新信息和擴(kuò)展以獲取實(shí)際功能。
-
在低代碼 / 無(wú)代碼環(huán)境中構(gòu)建 Gemini 支持的搜索和對(duì)話(huà) agent,包括支持檢索增強(qiáng)生成(RAG)、混合搜索、嵌入、對(duì)話(huà) playbook 等。
-
安心進(jìn)行應(yīng)用部署。谷歌不會(huì)利用 Google Cloud 上的客戶(hù)輸入或輸出數(shù)據(jù)訓(xùn)練 Gemini 模型,相關(guān)數(shù)據(jù)與 IP 將始終歸客戶(hù)所有。
目前,開(kāi)發(fā)者可以通過(guò) Google AI Studio 免費(fèi)訪(fǎng)問(wèn) Gemini Pro 與 Gemini Pro Vision,每分鐘最多支持 60 條請(qǐng)求,可以滿(mǎn)足大部分應(yīng)用開(kāi)發(fā)需要。Vertex AI 計(jì)劃于明年發(fā)布正式版本,在此之前開(kāi)發(fā)者同樣能以每分鐘 60 條請(qǐng)求的方式訪(fǎng)問(wèn) Gemini 基礎(chǔ)模型。
02
文生圖模型 Imagen 2 發(fā)布,圖像更逼真
距離上個(gè)版本 Imagen 的發(fā)布已經(jīng)過(guò)去了一年半。Imagen 2 包含了更強(qiáng)的提示一致性,更逼真的圖像生成,支持了圖像編輯功能,包括圖像修復(fù)和圖像擴(kuò)展。
自然語(yǔ)言理解能力
為提高生成圖像的質(zhì)量和準(zhǔn)確性,Imagen 2 增加了圖像描述的詳細(xì)信息。這使得 Imagen 2 能更好地理解不同風(fēng)格的標(biāo)題,從而更準(zhǔn)確地響應(yīng)用戶(hù)的指令。通過(guò)這種細(xì)化的圖像-描述配對(duì),Imagen 2 提高了對(duì)圖文關(guān)系以及上下文細(xì)節(jié)的理解和感知。
除了 DALL·E 3 之外,我們又有了一個(gè)僅憑自然語(yǔ)言就能生圖的模型。
對(duì)于依賴(lài)視覺(jué)內(nèi)容的行業(yè)來(lái)說(shuō),這徹底改變了游戲規(guī)則,大大減少了傳統(tǒng)內(nèi)容制作所需的時(shí)間,內(nèi)容創(chuàng)作者可以以前所未有的速度,制作高質(zhì)量的視覺(jué)效果。
同時(shí),Imagen 2 還具有無(wú)可比擬的圖像質(zhì)量和多功能性。Imagen 2 用到了谷歌最先進(jìn)的文本到圖像擴(kuò)散技術(shù),生圖質(zhì)量極高、效果逼真,而且和用戶(hù)的提示具有高度的一致性。
原因在于,它是使用訓(xùn)練數(shù)據(jù)的自然分布來(lái)生成更逼真的圖像,而非采用預(yù)先編程的樣式。
A jellyfish on a dark blue background
水母在深藍(lán)色的背景下悠然漂浮
可以看到,Imagen 2 的圖像生成能力非常驚人。
創(chuàng)新的圖像編輯,更強(qiáng)的「修復(fù)」和「擴(kuò)圖」
Imagen 2 帶來(lái)了創(chuàng)新的圖像編輯功能,包括「inpainting(圖像修復(fù))」和「outpainting(圖像擴(kuò)展)」。
用戶(hù)可通過(guò) inpainting 功能在原始圖像中添加新內(nèi)容,或利用 outpainting 功能結(jié)合參考圖像和遮罩,將圖像擴(kuò)展到原有邊界之外。
這項(xiàng)技術(shù)是一個(gè)計(jì)劃發(fā)布,計(jì)劃在未來(lái)一年內(nèi)融入谷歌云的 Vertex AI 中。
除了英語(yǔ),Imagen 2 還支持其他 6 種語(yǔ)言(中文、印地語(yǔ)、日語(yǔ)、韓語(yǔ)、葡萄牙語(yǔ)、西班牙語(yǔ)),并計(jì)劃在 2024 年初增加更多語(yǔ)言。這項(xiàng)功能還包括提示與輸出之間的翻譯能力,比如,可以用西班牙語(yǔ)提示,但指定輸出為葡萄牙語(yǔ)。
為了幫助降低文本到圖像生成技術(shù)的潛在風(fēng)險(xiǎn)和挑戰(zhàn),谷歌從設(shè)計(jì)和開(kāi)發(fā)到產(chǎn)品部署都設(shè)置了強(qiáng)大的護(hù)欄。
Imagen 2 集成了 SynthID——用于加水印和識(shí)別 AI 生成內(nèi)容的尖端工具包。這樣,Google Cloud 平臺(tái)的客戶(hù)可以直接在圖像中添加數(shù)字水印,同時(shí)不會(huì)降低圖像質(zhì)量。即使在對(duì)圖像進(jìn)行過(guò)濾、裁剪或使用有損壓縮方案保存后,SynthID 仍然可以檢測(cè)出。
需要注意的是:Imagen 2 目前還未提供用戶(hù) UI,僅供開(kāi)發(fā)人員和云客戶(hù)使用,需要通過(guò)谷歌云 Vertex AI 中的 Imagen API 使用。
03
Duet AI:代碼生成平臺(tái)
谷歌正式宣布全面推出 Duet AI for Developers,用于代碼補(bǔ)全和生成的人工智能輔助工具套件。
更令人興奮的是,未來(lái)幾周將得到 Gemini 模型的加持。
要知道,當(dāng)今開(kāi)發(fā)者中最受歡迎的代碼平臺(tái)工具,非微軟的 GitHub 的 Copilot 莫屬。
與之不同的是,谷歌采用了 25 家公司的平臺(tái)的數(shù)據(jù)集,來(lái)幫助開(kāi)發(fā)人員構(gòu)建應(yīng)用程序,并排除代碼故障。比如,Confluent、HashiCorp 和 MongoDB 將提供數(shù)據(jù)來(lái)訓(xùn)練 Duet AI for Developers,以幫助開(kāi)發(fā)人員為其平臺(tái)編寫(xiě)代碼。
雖然這些合作伙伴的數(shù)據(jù)在代碼補(bǔ)全和生成體驗(yàn)中大多有用,但 Datadog、JetBrains 和 LangChain 將提供文檔和知識(shí)源。這些文檔和知識(shí)源可能在 Duet AI for Developers 聊天體驗(yàn)中最有用。
例如,利用這些數(shù)據(jù),該服務(wù)將能夠?yàn)殚_(kāi)發(fā)和運(yùn)營(yíng)團(tuán)隊(duì)提供有關(guān)如何創(chuàng)建測(cè)試自動(dòng)化、解決生產(chǎn)中的問(wèn)題和修復(fù)漏洞的信息。
谷歌云的一位宣傳者 Richard Seroter 表示,人工智能如何幫助擺脫我們不喜歡做的事情?我們?nèi)绾巫尵幋a變得更好?這就是我們一直在追逐的很多東西。我們?nèi)绾螛?gòu)建一種人工智能助手,既能滿(mǎn)足開(kāi)發(fā)人員使用的工具,又能在其中加入一點(diǎn)谷歌的元素?
那么,如何在這些工具中加入谷歌的元素?
比如,在開(kāi)發(fā)人員已經(jīng)使用的所有流行集成開(kāi)發(fā)環(huán)境之上,確保模型經(jīng)過(guò)最新云原生實(shí)踐的訓(xùn)練,并將其集成到谷歌云控制臺(tái)中。Seroter 強(qiáng)調(diào),谷歌著眼于整個(gè) Duet AI 產(chǎn)品系列,其中 Duet AI in Security Operations 現(xiàn)在也作為企業(yè)級(jí)產(chǎn)品正式發(fā)布。
谷歌的 AI 編碼工具研發(fā)過(guò)程與其他所有科技公司的產(chǎn)品基本相同。
例如,Seroter 指出,開(kāi)發(fā)人員已經(jīng)熟悉的 IDE 中的代碼自動(dòng)補(bǔ)全功能有助于開(kāi)發(fā)人員保持工作流不變。與其他大廠(chǎng)一樣,谷歌自身不認(rèn)為這些工具會(huì)取代編碼技能,但有助于提高開(kāi)發(fā)人員的工作效率。
目前,一家「人工智能驅(qū)動(dòng)的技術(shù)服務(wù)公司」Turing,在采用 Duet AI for Developers 后,生產(chǎn)力提高了 33%。
Duet AI for Developers 目前支持 20+種語(yǔ)言,包括 C、C++、Java、JavaScript 和 Python。除了常用的編碼功能之外,它還包括對(duì) AI 日志匯總和錯(cuò)誤解釋的支持,例如還支持與 Cloud Logging、以及 Smart Actions 的集成,谷歌將其描述為執(zhí)行單元測(cè)試生成等任務(wù)的一鍵式快捷方式。
明年 1 月底之前,Duet AI for Developers 將免費(fèi)開(kāi)放。之后,谷歌也會(huì)采取收費(fèi)制,每月 19 美元,按年度為單位。
04
其他產(chǎn)品
此外,谷歌還推出了 MedLM,這是一個(gè)面向醫(yī)療保健用例的大語(yǔ)言模型。其中的兩套模型均基于谷歌自家的 Med-PaLM 2 系列。其中較大、更強(qiáng)的模型專(zhuān)為較復(fù)雜的任務(wù)而設(shè)計(jì),例如篩選學(xué)術(shù)論文及技術(shù)文檔以提供潛在的新藥研發(fā)線(xiàn)索;另一套模型則負(fù)責(zé)處理比較簡(jiǎn)單的雜務(wù),例如總結(jié)醫(yī)患對(duì)話(huà)和回應(yīng)常見(jiàn)的醫(yī)療咨詢(xún)問(wèn)題。
MedLM 模型的早期采用者包括 HCA Healthcare 診所、藥物設(shè)計(jì)企業(yè) BenchSci,以及埃森哲與德勤等。
谷歌表示,未來(lái)幾周,MedLM 模型將正式入駐谷歌的開(kāi)放 Model Garden,后續(xù)還將有更多基于 Gemini 的模型被納入 MedLM 家族以提供更多功能。
參考鏈接:
https://blog.google/technology/ai/google-gemini-pro-imagen-duet-ai-update/
https://blog.google/technology/ai/gemini-api-developers-cloud/
https://www.theregister.com/2023/12/13/google_gemini_duet_ai/
https://deepmind.google/technologies/imagen-2/
https://cloud.google.com/blog/products/ai-machine-learning/imagen-2-on-vertex-ai-is-now-generally-available文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-778207.html
文章轉(zhuǎn)自公眾號(hào)「AI 前線(xiàn)」、「新智元」文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-778207.html
到了這里,關(guān)于Imagen 2 發(fā)布、Gemini Pro 免費(fèi)體驗(yàn)、代碼平臺(tái) Duet AI 上線(xiàn),谷歌大爆發(fā)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!