今天小編分享的科學經驗:大模型挑選指南來了!涵蓋六種情況下的選擇方案,為你匹配最佳模型,歡迎閱讀。
最近 Claude 2 亮相、谷歌 Bard 支持中文、Open AI 推出 Code Interpreter(代碼解釋器)……
大模型發布一波接着一波,但五花八門,沒有一個可解決所有問題。
所以不同任務到底該用哪一個?
别着急,這不來自賓夕法尼亞大學沃頓商學院的 Ethan Mollick 教授整理了一份挑選指南。
選擇困難症 " 患者 " 這下有救了!
這份指南不僅涵蓋了截至今年夏季的最新情況,而且在不同的任務中,還附上了不同大模型的表現對比。
手把手教你在六個使用場景下挑選大模型,還有最佳免費選項、付費選項。
網友看到後表示:
先替我同事收藏了。
一起來康康這份挑選指南裡都有啥。
一、撰寫文字
最佳免費選項:Bing 、Claude 2
付費選項:ChatGPT 4.0、ChatGPT+ 插件
AI 寫作這一塊,Ethan Mollick 教授認為,GPT-4 目前仍是最靠譜的工具。
家人們還可以選擇用免費的 Bing(創意模式 creative mode),Claude 也是一個不錯的選擇。
具體來說,用大模型可以幫你做這些事:打草稿、優化寫作内容、協助完成任務、解鎖自己(AI 可以給你提供一種克服困難的方式)。
此外,這些工具還被整合到了一些辦公應用程式中,比如 Microsoft Office+GPT、Google Docs+Bard。
上面這些大模型在文字寫作方面的表現都不錯,但也都有可能產生 " 幻覺 ",胡言亂語。特别是要求未聯網的大模型提供互聯網的參考、引用信息。
Bing 相較而言產生的 " 幻覺 " 更少,因為 GPT-4 表現效果通常更好,而且 Bing 連接網絡可以真正獲取相關事實信息。
Ethan Mollick 教授在此前的使用中還發現一個問題:
AI 并不能解釋自己,它只是讓你以為它在解釋。
如果你要求它解釋為什麼寫了某個東西,它會給你一個看似合理但完全是捏造的答案。當你詢問它的思考過程時,它并不是在真正審問自己的行為,只是生成一些聽起來像是在這樣做的文本。
二、制作影像
最透明的選項:Adobe Firefly
開源選項:Stable Diffusion
最佳免費選項:Bing、Bing Image Creator(使用 DALL-E),Playground(可以使用多個模型)
最高質量的影像:Midjourney
目前主要的影像生成工具包括:
Stable Diffusion:已開源,特别适合與其它來源的影像結合使用(使用指南見文末)。
DALL-E:來自 OpenAI,已整合到 Bing(需用創意模式)和 Bing Image Creator(Bing 影像生成器)中。DALL-E 很可靠,但比 Midjourney 差一些。
Midjourney:今年年中最好的系統,學習曲線(learning-curve)是所有系統中最低的。只需輸入 "thing-you-want-to-see — v 5.2"(末尾的— v 5.2 很重要,使用最新的模型),就能得到非常不錯的結果。Midjourney 需要使用 Discord(使用指南見文末)。
Adobe Firefly:集成在 Adobe 產品中的,但在生成圖片質量方面不如 DALL-E 和 Midjourney。Adobe 稱他們在訓大模型時,只使用有使用權的影像。
大模型各自的表現是這樣嬸兒的(每張圖都是同樣提示下不同模型生成的第一張圖):
△Prompt: "Fashion photoshoot of sneakers inspired by Van Gogh"
需要注意的是,受訓練數據影響,這些模型難免存在一些偏見。
此外,目前圖片生成中不能真正創作文本,只能生成一堆看起來像文本的東西。但 Midjourney 對手部的描繪很好。
三、構思創意
最佳免費選項:Bing
付費選項:ChatGPT 4.0(但由于 Bing 聯網,表現可能更好)
要有好的創意,通常需要有大量的想法,而 AI 正是擅長產生大量的想法。
在創意模式下,可以用 Bing 查找你喜歡的非常規創意生成技巧,例如布萊恩 · 伊諾的傾斜策略(oblique strategies)或馬歇爾 · 麥克盧漢的四元結構(tetrads),然後進行應用,或者要求模型提供一些奇怪的想法。
四、制作視頻
最佳動畫工具:D-iD(用于在視頻中為面部添加動畫效果)、Runway v2(用于通過文本創建視頻)
最佳聲音克隆:ElevenLabs
現在,AI 生成視頻方面可以來個一條龍服務:
從生成的角色,到劇本創建,再到配音,都可以交給 AI 來完成。
用 AI 工具生成的視頻有時看起來還蠻逼真。Ethan Mollick 教授就拿自己的照片做過一段 " 假視頻 ":
但需要特别注意的是,這些工具都需要合乎道德地使用。
五、處理檔案和數據
數據(以及使用代碼的任何奇怪想法):Code Interpreter
文檔:Claude 2(大型文檔或同時處理多個文檔),Bing(側邊欄适用于較小的文檔和網頁)
Ethan Mollick 教授還設定了一個用 Code Interpreter 來處理數據可視化的方法(鏈接見文末):
處理 PDF 文檔這方面,還是要 Claude 2 出馬。
Ethan Mollick 教授表示曾将整本書粘貼到 Claude 中,還給過它許多復雜的學術文章,并要求它總結結果,Claude 的表現都不錯。
不僅如此,還可以通過繼續提問進一步探讨資料,比如說這種方法的證據是什麼?作者的結論是什麼……
但有時候模型還是會產生 " 幻覺 ",這一點還是要注意。
六、獲取信息并學習知識
最佳免費選擇:Bing
付費選項:對于兒童來說,可用 Khanmigo(AI 輔導)
Ethan Mollick 教授認為最好不要把這些大模型當作搜索引擎來用,出現 " 幻覺 " 的風險很高。
而他建議使用 Bing,也是因為 Bing 聯網," 幻覺 " 會相對來說少一點。但如果謹慎使用,AI 通常可以提供比搜索更有用的答案,特别是在搜索引擎給的結果不是很好的情況下。
此外,用這些 AI 工具來幫助我們學習是個不錯的選擇。Ethan Mollick 教授還給出了一個他認為比較好的 " 自動導師 " 提示:
傳送門:
[ 1 ] https://www.jonstokes.com/p/stable-diffusion-20-and-21-an-overview(Stable Diffusion 使用指南)
[ 2 ] https://www.pcworld.com/article/540080/how-to-use-discord-a-beginners-guide.html(Discord 使用指南)
[ 3 ] https://huggingface.co/spaces/society-ethics/DiffusionBiasExplorer(觀察圖片生成偏見)*
[ 4 ] https://www.oneusefulthing.org/p/a-quick-and-sobering-guide-to-cloning(Ethan Mollick 用照片生成視頻)
[ 5 ] https://chat.openai.com/share/afe54a2d-0ad0-4166-b1aa-9a5394deff66(用 Code Interpreter 做數據可視化)
[ 6 ] https://chat.openai.com/share/ec1018ec-1d86-4160-b587-354253c7d5cb(AI 導師提示)*
參考鏈接:
[ 1 ] https://www.oneusefulthing.org/p/how-to-use-ai-to-do-stuff-an-opinionated
[ 2 ] https://twitter.com/emollick/status/1680586569617481728?s=20