今天小編分享的科技經驗:AI落地現狀:大事幹不了,小事沒必要,歡迎閱讀。
大模型未必最優,小模型也有機會
前幾天刷 B 站的時候,碰到了一個很抽象很難評的事情——一個科普 up 主的視頻裡,夾帶了一個 AI 產品的廣告。
接廣子本身不是問題,問題是廣子和 up 主的屬性實在犯衝——這個 AI 產品,主打的是幫你分析辦公室工位的風水。
科普 up 主接風水商單,這可能就是所謂的 " 科學的盡頭是玄學 " 吧。
實際上,在當下這個 AI 橫行的時代,被廣泛證明行之有效能賺錢的 AI 落地方式,恰恰就是看上去很野路子的 AI 陪伴和 AI 玄學——虛拟男友 / 女友,AI 看風水、AI 算命等等。
有直接用 AI 滿足穿越古代願望的
有直接設定好了人設和劇情選項直接角色扮演的
有和 AI 女友鬥智鬥勇的
最樂子的還得是看風水和算命的,比如我問他夢到武裝直升機是什麼預兆,他說:直升機象征着向上和自由,武裝直升機更強調力量和戰鬥能力,所以預示着我在現實生活中獲得更多的勇氣和自信,能夠勇敢面對挑戰。
為什麼 AI 在這些領網域的落地特别有效果?
因為這些領網域主打的就是一個 " 模棱兩可 " ——算命這事兒,和星座一樣,從來都是正反看來都對,不信你可以看看别的星座的介紹,你會發現似乎放在自己身上也都說得通。
這是人類歷史最悠久的 " 文字遊戲 ",而現在的 AI,基本也都是 " 大語言模型 "。
都是玩文字遊戲的高手。
今天,我們就來聊聊當下 AI 的落地姿勢。
01 AI 落地的矛盾
比較有趣的是,當前人們對于 AI 落地的看法,往往呈現出兩種完全不同的趨勢。
在老板們的眼裡,AI 似乎是一種讓公司原地飛升的靈丹妙藥—— AI 來了,成本就降低了,AI 來了,效率就有了。似乎好像靠着 AI,就能精簡公司團隊,從而實現降本增效。
而在具體做事的一線員工看來,AI 卻并不像宣傳中那樣強大,有時候與其說是 " 人工智能 ",不如說是 " 人工智障 " —— 壓根兒不具備獨立完成整體任務的能力,能在某些環節裡幫上忙就已經燒高香了。
這種矛盾的來源是人們對于當前 AI 的一種判斷——我們似乎高估了當下 AI 的能力,總認為大模型帶來的技術飛躍足夠強大,可以靠着某種 " 殺手應用 " 來解決普及和落地的問題。
很難說這種觀念是對是錯,因為長期來看,确實有很大可能會這樣發展下去。但短期來看,這種 " 殺手應用 " 并不現實。
當前的 AI 并不足以滿足這樣的期待。
以央視新聞曾經報道過的一個案例來說,上海的一家遊戲公司從 2022 年開始就在使用人工智能技術輔助遊戲開發,在遊戲角色的設計環節,使用人工智能之後,開發周期大大縮減。例如某款休閒類遊戲中,可能設計 1000 多個圖示,如果是人工繪制,每一個圖示的成本 400 元左右,1000 多個圖示将會耗時一個多月,成本高達 60 萬元。但在 AI 輔助後,基本上一個人兩個星期就能完成,只需要兩三萬元的成本。
從這案例可以看出,AI 要做的并不是直接取代人類,或者直接幫助人類完成所有工作。 更多,只是去幫助加速某些環節(比如設計環節),從而相比以前減少成本。
還是我們之前文章裡表達過的觀點:當下的 AI,都是大語言模型,本質上都是在 " 猜字謎 " —— AI 确實能理解我說的每一個字,也确實能夠給出看上去還挺靠譜的回答,但這一切的背後,不是 AI 真的理解了這個世界的規律,而是 AI 覺得這樣的回答更容易被人類接受罷了。
尤其是當你要求 AI 完成一個相對完整的任務,這種馬腳就會立刻顯露出來——當下的 AI 根本不知道事物的規律,只是在根據訓練的數據, 做出一些似乎看上去還挺靠譜的回答而已。
以 Openai 的 Sora 模型生成的視頻來說,在早期的一段宣傳視頻中,AI 被要求生成一段建築工地的移軸畫面,整體看上去似乎還不錯,但如果仔細看,你會發現,視頻裡的叉車根本不理會地面上堆放的建築材料,直接開了上去,而且碰到人之後原地來了個漂移。
這就是一個典型的 AI 生成作品的問題:它只給你提供一個看似靠譜的東西,因為它并不能從原理上知道該怎麼做。
因此,如果要評價當下 AI 帶給我們的實際體驗,大概率會是這樣的一種感覺:如果我們需要走 100 公裡的路, 當前的 AI 并不能讓我們在轉瞬間走完這 100 公裡,但卻可以讓其中的 10 公裡的路段變得更好走。
02 產業 AI 和大眾 AI
從另一個角度來看的話,則是成本和收益的問題。
本輪的 AI 浪潮,核心其實是 LLM,即語言大模型——參數量數十億乃至上百億,需要專門的 GPU 集群,訓練成本極高——真正能跑出來的產品,無一例外,都是用真金白銀堆砌起來的。
但 AI 顯然是要普及的,封閉、資本密集的大模型并不符合這樣的大趨勢。于是乎,開源的小模型成為了新的熱點——大模型的體量,使得它在手機、物聯網設備等小型終端上部署起來頗為麻煩,但小模型則不同。尤其是那些要求快速反應的領網域,比如語音和影像的識别處理,小模型的處理效率也會更快——某種程度上說,小模型相當于是大模型的精華版。
以 openai 的 GPT-4o mini 來說,成本下降的情況下,質量反而更高,這就是數據集和訓練方式改變後帶來的突破。
當前 AI 的這種特性,也影響了產業 AI 和大眾 AI 的發展方向——因為當下的 AI 大模型,哪怕開發成本高昂、功能強大,其實也不足以做到 0-100 都給我高質量包圓,所以 AI 要麼就是專精于某一個環節,幫助產業裡的某個環節提速,即產業 AI;要麼就是直接娛樂化,也不追求什麼質量,差不多能用就行,即通常的大眾 AI。
大眾 AI 的例子很多,國外的有 chatgpt,midjourney 等,國内有文心一言、豆包等,
這些 AI 產品的相似性是:基本都是黑盒模式,你根本不知道它到底是怎麼操作的,在具體使用的時候,往往是需要多次生成,然後在諸多結果裡選擇最優的那個。
以 Chat-gpt 這樣的大語言模型來說,它的工作原理就是去 " 猜字謎 " ——首先是數據收集與準備工作。所需的數據來源廣泛,包括小說、新聞報道,甚至涵蓋視頻和音頻等多種形式。
除此之外,還需構建一個龐大且多樣化的語料庫,以便模型進行深入學習。為提高學習效率,應對這些原始數據進行嚴格的标準化處理,确保模型能夠更為高效地攝取和處理信息。
随後,在構建大語言模型的過程中,基于 Transformer 架構成為首選。盡管 Transformer 架構在技術層面頗為復雜,但從本質上講,它能夠模拟人類語言的語法規則,進而實現自然且流暢的内容生成,相當于是讓 AI 掌握的基本的人類語法知識——所以雖然 AI 給出的東西未必好用,但肯定不會胡言亂語——在這方面,Transformer 架構可以被視作 AI 的語言中樞及表達工具。
而之後的訓練,則需要 MLM 技術的幹預——在訓練環節,随機遮擋住輸入文本裡的一些詞匯,不需要人工介入,模型就會自動利用剩下的信息去分析判斷,在這個過程裡,大模型會學習到詞匯之間的關系,知道如何去理解一句話和一段話的上下文關系,從而提高它對于自然語言的駕馭能力。
像是圖片生成類的 AI 其實也都是類似的原理,只不過把遮蓋起來的東西從文字變成了影像。
而專業的 AI 則相反,更加精準,不需要多次生成結果選最優。在這個領網域,國外有 Adobe firefly 和 comic maker ai,國内有釘釘 AI。
以 adobe firefly 來說,它相當于是讓傳統的 Photoshop 軟體有了 AI 功能,用戶不再需要像以前那樣手動在十幾個菜單裡選擇不同的選項進行操作,而是可以圈起來要修改的部分,直接用自然語言命令 AI 完成特定的操作。而釘釘的 AI 則有各種智能助手功能——例如 "AI 工單助理 ",可以自動抓取釘釘群裡的消息,分析其中表達的訴求,根據預先學習的企業知識,自動生成工單并派單給有關責任人。
不論是 firefly,還是釘釘的工單助理,說到底,其實是先得有 photoshop 和釘釘這樣的工具類軟體,而後才能在此基礎上進行 AI 更新,從而開發出相關的 AI 產品—— 這類專業 AI 產品僅能在本體軟體的範圍内活動,但卻能更精準、更高效,不需要像大眾 AI 產品那樣多次生成選最好。
03 結尾:實用主義的 AI
綜上所述,我們可以清晰地看到,當下的 AI 正處在一個充滿矛盾與機遇的發展階段。它既能在某些特定領網域大放異彩,為我們帶來前所未有的便捷與效率,又時常會在更廣泛的任務面前顯得捉襟見肘,暴露出其能力的局限性。
沒辦法,技術的發展從來不是一蹴而就的,從來都是螺旋上升的——現在是 2024 年,5 年前的 2019 年,我們之中絕大多數人不會意識到 AI 會發展成現在這個樣子。
當下的 AI 大模型等產品,雖然還有這樣或者那樣的問題,但技術的發展是相當迅速的,AI 大模型的進化是比摩爾定律的速度更吓人的—— 尤其是在當下,在強化學習技術越來越成熟的情況下,AI 将不再只是猜字謎,而是真正開始學習、認識這個世界,具備獨立思考的能力。
本文來自微信公眾号 " 星海情報局 ",作者:星海老局。