国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

27|從Midjourney開始,探索AI產品的用戶體驗

這篇具有很好參考價值的文章主要介紹了27|從Midjourney開始,探索AI產品的用戶體驗。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

學到這里,這個課程終于到了尾聲。過去的二十多講里,我們圍繞著文本、語音、視頻、圖像體驗了大量的 AI 應用場景。不過在這些場景里,我們還只是通過撰寫代碼體驗了 AI 的能力。那么,如果我們今天想通過學習到的這些知識,開發(fā)一個真正的 AI 應用,需要注意些什么呢?我們是只需要簡單地給我們的 Python 代碼封裝一個對話框一樣的用戶界面就可以了嗎?

如果你有這樣的疑惑,那請一定要堅持學完這最后一講。我們一起來看看 Midjourney 這個 AI 畫畫的應用是怎么做的。它在整個應用的體驗里考慮了哪些設計原則?畢竟,Midjourney 在過去一年里可謂是創(chuàng)造了一個 AI 產品的奇跡。它沒有獨立的 App,完全依賴 Discord 這個語音社區(qū)聊天工具和用戶交互。團隊只有十幾個人,但是出圖的質量始終領先于有整個開源社區(qū)支持的 Stable Diffusion。沒有外部融資,卻完全靠用戶訂閱獲取了 1 億美元的年收入。

無論從哪個角度來看,Midjourney 都是一個值得研究的 AI 產品。在它所有的產品設計里,我認為有三個要點是今天所有的 AI 應用都應該借鑒的,那就是以用戶社區(qū)作為入門教程、給用戶即時反饋以及搭建數(shù)據(jù)飛輪以迭代模型。下面我們一個一個來看。

善用用戶社區(qū),降低上手門檻

Midjourney 這樣的 AI 內容生成類型的產品,常常會遇到一個挑戰(zhàn),就是用戶其實不知道該怎么玩這個產品。這個“不知道怎么玩兒”,不是說不知道怎么生成一張圖片,而是說不知道什么樣的提示語值得一試,可以畫出什么樣的場景。

因為大部分人和你我一樣,不太懂得繪畫,也缺少一些想象力。這樣,很容易隨便畫了兩三張圖片之后,就放棄使用 Midjourney 這樣的產品了。所以,Midjourney 就做了一個很巧妙的設計。就是你一旦注冊成功,進入 Midjourney 的 Discord 頻道之后,并不是讓你對著 Midjourney 的機器人自己發(fā)揮想象去畫畫,而是會直接進入某一個新用戶的聊天室里,無論是自己通過提示語去畫畫,還是其他在聊天室里的用戶去畫畫,都會在聊天室里不停地刷新。

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI
默認你會進入一個新用戶的聊天室里

因為用戶的背景以及想要畫的內容各不相同,所以你在這個聊天室里,可以看到各種不同風格的畫作。而如果你想要自己嘗試相同的風格,這些畫作的提示語也在那里。你只需要簡單地復制粘貼提示語,然后修改幾個單詞,就可以嘗試復刻其他人相同風格的畫作了。

而且,這樣的聊天室并不僅僅局限于新用戶。Midjourney 同樣也為老用戶設置了 general 頻道,你在里面一樣可以看到老玩家們繪制的優(yōu)秀畫作。?

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI

此外,整個 Midjourney 的 Discord 里,還有 show-case、daily-theme 等一系列從用戶生成的圖片里面挑選出來的優(yōu)秀案例。

通過“共享”用戶創(chuàng)建的內容這樣的方式,Midjourney 很容易地讓整個社區(qū)成為了教會新用戶使用產品的通道。而不需要自己費勁費力地去寫教程,或者提供大量的新手引導功能。

事實上,ChatGPT 就缺少這樣的功能。這也給很多外部開發(fā)者提供了機會,于是就有了 ShareGPT、FlowGPT 這樣分享 ChatGPT 對話內容以及特定、有趣的提示語網(wǎng)站了。

AI 應用面臨的技術限制

在通過這樣的引導學會了使用 Midjourney 各種好用的提示語之后,相信用戶都會愿意多試試不同的提示語,畫出漂亮的圖畫來。而作為一個 AI 內容生成的應用,Midjourney 在產品設計里的第一個挑戰(zhàn),就是響應時間問題。

我們之前用 Stable Diffusion 畫畫的時候,即使已經(jīng)用 UniPCMultistepScheduler 來加快生成速度了,也還是要花上個 10 秒鐘,而且那還是我們獨占一塊顯卡的時候。如果你要像 Midjourney 一樣,直接面向消費者提供服務,你還會面臨一個問題,就是所有的用戶請求需要排隊。并且,最好能夠按照一個批次(Batch)進行處理。

這是由我們通過 GPU 來生成內容的原理決定的,GPU 不像 CPU 那樣可以通過多線程或者時分復用的方式來處理請求,而只適合順序地處理請求。而為了讓顯卡的利用率最大化,最好的辦法是一個批次能夠同時處理多張圖片。

通過及時反饋,提升用戶體驗

所以我的預測是,你發(fā)給 Midjourney 的請求在它服務器端的集群里一樣會先去排隊。等到其他人的請求和你的請求一起湊滿了一個批次,才會去生成圖片。這也會使得從我們向 Midjourney 發(fā)送提示語,到拿到最終的圖片需要更長的時間。而這也會進一步消耗用戶的耐心,讓用戶可能連第一次嘗試都等不到完成的時候就走了。

Midjourney 解決問題的辦法,則是盡可能讓用戶能在等待過程中看到這個任務是有進展的。

首先,在你的提示語提交之后,Discord 里面的 Bot 會告訴你,目前的任務是處于 Waiting to start 的階段的。

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI

而一旦整個圖片生成的任務啟動,Midjourney 就會不斷更新圖片生成的中間過程,整個圖像會逐漸從模糊變清晰。你不需要等到整個圖片生成完成之后,才能看到最后的完整圖片。而是每隔一兩秒鐘就能看到一點點進展,這樣整個圖片的生成過程感覺一晃就過去了。而如果你想用 StableDiffusion 來做一個圖片生成的應用的話,我們在第 24 講也演示了如何將生成過程里的中間結果輸出出來。你完全可以仿照著實現(xiàn)和 Midjourney 相同的效果。

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI

此外,針對每次你輸入的提示語,Midjourney 并不是為你直接生成一張高清晰度的大圖,而是生成了 4 張不同的圖片。這其實也是為了彌補 Diffusion 類型算法的一個缺陷,就是生成的圖像可控性比較差,一次性就能拿到我們滿意的圖片的概率比較低。比如,我們這里輸入的“Michael Jordan playing soccer”是想要生成邁克爾喬丹踢足球的照片。但是里面右下角的第四張圖里,顯然還是一個打籃球的姿勢,只是把手上拿著的籃球換成了足球而已。而一次性提供四張圖片,讓用戶可以從四張里面挑一張,顯然成功率就高多了。

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI

而且生成小尺寸的圖片,GPU 需要的計算時間也比較少。等到我們確定大致圖片沒有問題了,再通過 Diffusion 的生成算法,把圖片放大變成高清大圖,需要的總時間也短得多。在上面的 4 張圖里,顯然第 2 張更像是一張靠譜的踢足球的圖片。我們選擇它之后,只要 1~2 秒鐘,就能拿到自己想要的高清大圖。

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI

事實上,盡可能地讓用戶在內容生成的過程中就獲取到反饋,是現(xiàn)在很多 AI 應用一個比較常見的產品設計策略。比如用來做文本生成的 ChatGPT,在你輸入問題之后,并不是等到整個答案生成完畢之后一股腦兒地返回給你。而是在生成的過程中就一個詞一個詞地輸出,讓你能夠看到整個答題過程。在第 18 講的時候,也教過如何使用 OpenAI API 的 Stream 模式來達到這樣的效果。所以你可以自己嘗試一下。

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI
ChatGPT一樣在數(shù)據(jù)的生成過程中將文本發(fā)送出來

搭建數(shù)據(jù)飛輪,快速迭代模型

如果你用過 Midjourney 的話,應該知道它出的圖質量很好,很多人都覺得要比開源的 Stable Diffusion 好上不少。在我看來,這背后有一個很重要的因素,就是它擁有更多高質量的標注數(shù)據(jù)。你可能要問了,Midjourney 只有不到 20 個人的團隊,哪里來的資源去標注數(shù)據(jù)呢?答案就在 Midjourney 的產品設計流程里。

最直接的一個數(shù)據(jù)標注,就是在每次生成的高清大圖下面,都有一個 Favourite 的按鈕。用戶可以點擊這個按鈕表示喜歡并且收藏這個圖片。而每次當用戶按下這個按鈕的時候,Midjourney 的團隊其實就獲得了一個由用戶標注好的優(yōu)質圖片數(shù)據(jù),也就是用戶輸入的提示詞和對應圖片的配對組合。

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI
Favorite 按鈕能夠幫助你標記圖片,同時也是在幫Midjourney標注數(shù)據(jù)

但是只要做過一些產品,你也會發(fā)現(xiàn)真的會主動點擊 Favorite 的用戶還是太少了。不過,Midjourney 其實還有更多“隱形”的操作,也幫助他們標注了圖片質量的好壞。

我們上面剛剛介紹過 Midjourney 對于任何一個提示語,都會生成四張圖片。除了直接從四張圖片里面選一張放大之外,還可以有另外兩個選擇。

第一個是可能對四張圖片都不滿意,那么可以直接點擊圖片下面的“刷新”按鈕,重新生成四張圖片。?

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI
如果對四張圖片都不滿意,你可以一鍵重新生成4張圖片

或者,對其中一張圖片的整體觀感還是不錯的,但是還不夠滿意。同樣可以點擊四格圖下方的 V1-V4 按鈕中的一個,以四格圖里面的一張為基礎,再生成 4 張相似的圖片。而對于已經(jīng)放大了的高清大圖,用戶同樣可以點擊 Make Variation 的按鈕,來重新生成 4 張圖片,再讓用戶選擇。?

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI

這兩個動作里,用戶盡管沒有標記說哪一張圖片是好的。但是其實已經(jīng)告訴了我們,哪些圖片他并不喜歡,以及 4 張圖片里哪一張更接近他心目中理想的圖片。而 Midjourney 就可以根據(jù)用戶前后的一系列操作日志,來篩選出那些用戶最終選擇的圖片。如果用戶做了大量刷新重新生成或者生成變體的操作,并且最后選定了一張圖片放大,那么這張圖片大概率是一張用戶滿意的高清大圖,我們不需要依賴用戶點擊 Favorite 按鈕這一動作。

其實,這樣“隱式”的反饋,在搜索、推薦等應用場景下早就被廣泛應用了。在搜索的應用場景下,如果用戶輸入了搜索詞之后,沒有點擊任何鏈接又重新輸入了新的搜索詞,那么自然表示用戶對搜索結果不滿意。在短視頻的推薦里面,盡管用戶沒有點贊或者收藏,但是用戶看完了整個視頻,大概率表示用戶對視頻是感興趣的。

對于 AIGC 應用,這樣“隱式”反饋信息的使用也是非常重要的。能夠盡早讓產品上線,并且收集到的真實用戶反饋往往能帶來意想不到的產品優(yōu)勢。因為用戶反饋越多,數(shù)據(jù)的質量也就越高。高質量的數(shù)據(jù),則能讓我們訓練出更好的模型。而更好的模型,就意味著產品能夠生成更高質量的內容,吸引更多的用戶。這樣,好的產品 -> 更多的用戶數(shù)據(jù) -> 更好的模型質量 -> 更好的產品就進入了一個正向循環(huán)。一旦我們搭建起了這樣的數(shù)據(jù)飛輪,就能在競爭中和對手拉開距離。

27|從Midjourney開始,探索AI產品的用戶體驗,AI大模型,midjourney,AI

就比如 Midjourney,盡管沒有開源社區(qū)里自帶干糧的開發(fā)者們添磚加瓦,但是大量的用戶反饋數(shù)據(jù)給了他們一個高質量的數(shù)據(jù)集。而開源的 Stable Diffusion,相對來說就缺少這樣的數(shù)據(jù)反饋。因為大部分人部署模型之后,生成的圖片都是自己使用,并沒有把什么樣的圖片質量高、什么樣的圖片沒法用反饋給 Stability AI 這個公司。

小結

好了,這一講我們針對 Midjourney 這個現(xiàn)象級的 AI 應用,總結了 AI 產品設計的一些核心原則。

很多用戶面對 AI 內容生成類的應用,其實是不知道應該如何入手的。因為生成內容的挑戰(zhàn)不在于如何操作,而是如何發(fā)揮想象。而通過 Discord 的新手房間,任何一個新用戶都可以看到其他人的提示語和對應的圖片效果。很快就能學會更多的提示語。

而通過 AI 來生成內容需要的時間往往比較長,所以我們需要在內容生成的過程中,就要給到用戶反饋。即使只是一個模糊的輪廓圖,也能撫慰用戶焦躁的情緒。此外,因為文生圖本身的可控性比較差,Midjourney 采取了一次性生成 4 張小圖的方式,讓用戶有更多挑選的余地。只有當用戶確定真的滿意其中的某一張圖,再通過一次生成過程將其變成高清大圖。

最后,通過生成 4 張小圖供用戶進行選擇的這個過程,Midjourney 本質上是讓用戶為自己標注大量的數(shù)據(jù)。每一次用戶選擇進行“變形”的圖片,都是一個正面反饋的標注。而每一張用戶選擇放大的圖片,也都是一個更強力的“正面”信號。在不經(jīng)意間,Midjourney 就有了海量的用戶在背后為他們標注數(shù)據(jù)。

當然,Midjourney 以及其他優(yōu)秀的 AI 產品的亮點并不只有這三個。但是一般來說,用戶社區(qū)、及時反饋以及建立數(shù)據(jù)飛輪是 AIGC 類應用必不可少的組成部分。如果你接下來決定開發(fā)一個這樣的應用,一定不能在產品中漏掉這三個元素。文章來源地址http://www.zghlxwxcb.cn/news/detail-830036.html

到了這里,關于27|從Midjourney開始,探索AI產品的用戶體驗的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 產品設計與用戶體驗 優(yōu)漫動游

    ??用戶體驗是指產品在運行過程中與用戶產生的聯(lián)系以及用戶在使用過程中的主觀感受;產品在設計并生產的過程中,哪些會影響用戶的體驗,以及如何圍繞以用戶為中心進行產品設計,在《用戶體驗要素》一書中提出了用戶體驗五要素的理念: ? 產品設計與用戶體驗 ?

    2024年02月07日
    瀏覽(24)
  • 產品經(jīng)理如何平衡用戶體驗與商業(yè)價值?

    產品經(jīng)理如何平衡用戶體驗與商業(yè)價值?

    ????????近期負責前端產品設計工作的小李忍不住抱怨:公司總是要求客戶第一,實現(xiàn)客戶良好體驗,但在實際操作過程中,面向用戶????????體驗提升的需求,研發(fā)資源計劃幾乎很難排上,資源都放在公司根據(jù)業(yè)務價值排序的需求上了。 ????????其實小李反映的問

    2024年02月14日
    瀏覽(26)
  • 認識設計組件幫助測試,以提高產品用戶體驗

    認識設計組件幫助測試,以提高產品用戶體驗

    一、控制元素 1、活動指示器——應與背景想?yún)f(xié)調,用于持續(xù)時間不明的進程,單一元素不顯示,大于1個顯示 2、加載控件——同一個專區(qū)頁面,加載樣式統(tǒng)一 ? 3、頁碼控制器——原點最好控制在5點內,左右滑動,點擊原點可切換 ? 4、刷新控件——下拉刷新,反饋內容不變

    2024年02月11日
    瀏覽(13)
  • 產品經(jīng)理如何向最終用戶提供創(chuàng)新的數(shù)據(jù)體驗

    產品經(jīng)理如何向最終用戶提供創(chuàng)新的數(shù)據(jù)體驗

    本文由葡萄城技術團隊于博客園原創(chuàng)并首發(fā)。轉載請注明出處:葡萄城官網(wǎng),葡萄城為開發(fā)者提供專業(yè)的開發(fā)工具、解決方案和服務,賦能開發(fā)者。 隨著互聯(lián)網(wǎng)和大數(shù)據(jù)技術的發(fā)展,越來越多的企業(yè)開始重視數(shù)據(jù)的價值。伴隨著企業(yè)數(shù)字化轉型的大趨勢,數(shù)據(jù)分析需求將進一

    2024年02月07日
    瀏覽(28)
  • AI制圖工具丨Midjourney產品功能介紹

    AI制圖工具丨Midjourney產品功能介紹

    Midjourney是一款AI制圖工具,只要,就能透過AI算法生成相對應的圖片,只需要不到一分鐘。 可以選擇不同畫家的藝術風格,例如安迪華荷、達芬奇、達利和畢加索等,還能識別特定鏡頭或攝影術語。 有別于谷歌的 Imagen和OpenAI的DALL.E,Midjourney是第一個快速生成AI制圖并

    2024年02月16日
    瀏覽(24)
  • 探索網(wǎng)頁原型設計:構建出色的用戶體驗

    探索網(wǎng)頁原型設計:構建出色的用戶體驗

    在當今數(shù)字化時代,用戶對網(wǎng)頁體驗的要求日益提高。在網(wǎng)頁設計過程中,扮演著至關重要的角色。通過網(wǎng)頁原型設計,產品經(jīng)理能夠更好地展示和傳達網(wǎng)頁的整體布局、導航結構、元素位置和交互效果,從而使團隊成員更清晰地了解設計意圖,提供及時的反饋,并做出必要

    2024年02月15日
    瀏覽(22)
  • 從程序員到產品經(jīng)理 第三章:用戶研究和體驗設計

    目錄 用戶研究的方法和技巧 用戶行為分析和用戶畫像 產品設計的原則和流程

    2024年02月02日
    瀏覽(32)
  • 【騰訊云 TDSQL-C Serverless 產品體驗】聚焦業(yè)務價值之在Serverless上的探索和實踐

    【騰訊云 TDSQL-C Serverless 產品體驗】聚焦業(yè)務價值之在Serverless上的探索和實踐

    【騰訊云 TDSQL-C Serverless 產品體驗】聚焦業(yè)務價值之在Serverless上的探索和實踐 簡介:隨著公司商城的業(yè)務規(guī)模量的逐漸增長,對系統(tǒng)服務的彈性訴求越來越強烈,通過借助騰訊云TDSQL-C Serverless最佳落地實踐如何對企業(yè)有效的降低成本,提高效率。 公司在今年上半年開發(fā)了一

    2024年02月08日
    瀏覽(15)
  • 創(chuàng)建交互式用戶體驗:探索JavaScript中的Prompt功能

    在前端開發(fā)中,JavaScript的 prompt() 函數(shù)是一個強大而有用的工具,它可以創(chuàng)建交互式的用戶體驗。無論是接收用戶輸入、進行簡單的驗證還是實現(xiàn)高級的交互功能, prompt() 函數(shù)都能勝任。本篇博客將深入探討 prompt() 函數(shù)的用法、最佳實踐和一些示例代碼,為您展示如何利用它

    2024年02月15日
    瀏覽(21)
  • 【智慧之窗】AI驅動產品探索

    【智慧之窗】AI驅動產品探索

    ChatGPT 是由 OpenAI 開發(fā)的自然語言處理(NLP)模型,基于 GPT(Generative Pre-trained Transformer)架構。GPT 系列的模型旨在理解和生成自然語言文本。ChatGPT 專注于支持對話性任務,即與用戶進行對話。 GPT 模型采用了 Transformer 架構,這是一種基于自注意力機制的深度學習模型。該架

    2024年02月04日
    瀏覽(22)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包