今天小編分享的科技經驗:我們需要更多不做大模型的 AI 應用主義者,歡迎閱讀。
All in AI ,到 2024 年這個節點幾乎已經成了科技互聯網公司的主旋律。
仿佛全世界都陷入了 AI Fomo(AI 錯失恐懼症),科技公司展開了追趕 OpenAI 的大模型軍備競賽,普通個體擔心被 AI 取代,于是 199 元的 AI 課收獲了大批擁趸。
而在國内掀起的「百模大戰」中,金山辦公算是一個異類。這家國内辦公軟體市場份額最高、現金流也十分充足的公司,并沒有投入到大模型的競争中,卻在國内最先推出了基于大語言模型的智能辦公助手 WPS AI。
在昨天的金山辦公生產力大會,CEO 章慶元再次強調金山辦公是一個大模型的應用者,目前也接入了國内幾乎所有主流大模型。
以這種方式 All in AI 的金山辦公,在過去 36 年間從 PC 時代走到移動互聯網時代後,正在經歷的第三個重要的節點,而前兩個節點都影響了中國辦公軟體的市場的走向。
八十年代,求伯君把自己關在在深圳蔡屋圍酒店 501 号房 14 個月,用一台 386 電腦敲出了 12 萬行匯編代碼,1988 年 WPS 1.0 誕生。
2002 年,金山 6 号員工雷軍帶領 100 多位工程師花三年重寫了 WPS 500 多萬行代碼,推出了完全兼容微軟 Office 的 WPS 2005。
▲ 雷軍(左)和求伯君
現在大模型的到來開始改變軟體應用的使用方式和開發方式,章慶元認為未來甚至 UI(User Interface,用戶互動)這個詞都會消失。金山也從去年開始暫停了所有跟 AI 無關的業務,全面轉型。
愛範兒曾在年初的 ifanRank 中預測,我們正邁向工具性、普适化和工業化的「大應用時代」,2024 年将看到更多滿足消費者或商業需求的 AI 原生應用。
大模型賽道逐漸趨于飽和,接下我們顯然需要更多專注 AI 產品落地的公司,将大模型能力轉化為行業生產力和創造力。
AI 生產力的迷思
回顧過去一年的爆款 AI 工具,無論是微軟的 Copilot ,還是春節開始刷屏的 Sora ,伴随出現的高頻詞匯往往有兩個——颠覆和取代。
盡管這些 AI 工具奔着提升生產力而來,但比起它們可能帶來的效率提升,能取代多少工作颠覆哪些行業卻總是被讨論最多的話題,甚至還有不少機構樂此不疲計算出精确的百分比。
工具本質是什麼?幫助我們更輕松地完成想要做的事。那提升生產力無非就是兩種方式,要麼提升單個步驟的效率,要麼縮減任務過程中所需的步驟,或者兩者同時實現。
大模型驅動的一眾 AI 工具,則是大大縮短了從提出需求到實現想法所需的流程。
你只要一句話,讓 AI 幾秒列出大綱,然後生成 20 多頁 PPT。
一些需要過去拍攝和後期制作的視頻,如今化作一段 prompt 指令。
哪怕是用手機随手一拍的照片,用手指圈一圈就能去掉将路人或雜物。
章慶元在去年接受采訪時曾預測,大概再過一年,人們就可以用「100 塊錢一個月請一個全能 Office 助手」的方式,實現對辦公軟體全新的掌控,任何復雜的表單、表格和計算等工具欄都會從辦公軟體上消失,用「訂閱」的方式根本改變辦公軟體的商業模式。
這背後其實是 AI 加速了算力平民化的進程。
WPS AI 的產品經理付子豪不久前在一次分享中提出一個觀察:大模型的出現不能類比移動互聯網出現的狀态,它更像是 PC 誕生的時代,雲誕生的時代。
随着人類社會出現的需求和場景越來越復雜,大腦的算力已經不夠用,我們開始通過計算機擴展算力。但要充分釋放計算機算力的門檻并不低,你可能需要懂得編程語言,就算是常用 Excel 表格、PS,要用好也不容易。
AIGC 解決的就是算力門檻的問題,只要用自然語言就能讓計算機理解你的思考邏輯 ,并生成結果,極大地縮短從想法到結果的鏈條。
如果理解了這個邏輯,對 Sam Altman 最近專訪關于 AI 将取代多少工作的回答或許更有共鳴。Altman 思考的方式不是 AI 将完成多少百分比的工作,而是 AI 在一段時間内将完成多少百分比的任務。
我認為這是一個比 AI 可以做多少工作更有趣、更有影響力、更重要的問題,因為它是一種工具,可以在越來越復雜的水平上工作,在越來越長的時間範圍内完成越來越多的任務,并讓人們以一種更靈活的方式進行操作。所以也許人們的工作效率會更高。
這個思考不僅對于用戶,對于 AI 工具的開發者同樣有價值。因為用戶需要的其實不是參數越來越大的模型,而是能讓他們更容易将想法落實的工具,就像當年喬布斯一個經典的回答:
必須從用戶體驗入手,然後再回過頭去開發技術,而不是從技術入手,然後再試着想辦法,看這個技術能用到哪?
Copilot 的互動
在《大模型元年,人類文明的作業系統正在大更新》一文中,我們提到下一代革命性的人機互動模式可能會是自然用戶界面(Natural user interface, NUI )。
NUI 最核心的原則是簡單性高于一切。復雜性是自然用戶界面的敵人。每個互動都應該是不言自明的,不需要說明手冊。
而 Copilot ,則是 NUI 互動邏輯下 AI 工具理想的形态。Copilot 這個詞源自飛行術語,指的是協助主駕駛員操作飛機的副駕駛,當主駕駛員需要休息或處理其他任務時,副駕駛員就會接管控制權,二者共同負責飛機的安全飛行。
我認為這也是人和 AI 互動最恰當的形容。微軟對于 Copilot 的定義是:一種使用自然語言處理技術或大語言模型,幫助人們完成復雜或認知任務的應用程式或組件。
WPS AI 同樣将人機互動作為三大戰略方向之一,也把基于自然語言多輪問答式的自然互動稱為 Copilot,能夠深入植入到文檔和協作的各種場景。
比如昨天推出的 WPS AI 企業版可以提供「文理兼修」的數字員工服務,例如閱讀助手、畫圖助手、考勤助手、銷售分析、合同分析等等,觸達各類細微的辦公場景。
其中的 Copilot Pro 則可幫助運營人員使用自然語言驅動 BI 產品分析數據,同時可調用 WPS 365 API 和企業自有 API,解決辦公自動化需求。
GitHub 一項數據顯示,在使用 GitHub Copilot 的開發人員中,88% 的人表示他們的生產力更高,74% 的人表示他們可以專注于更令人滿意的工作中,77% 的人表示它有助于他們減少搜尋資訊或範例的時間。
章慶元有個形容也十分貼切,自然語言互動大幅降低用戶互動成本,意味着 Photoshop 可以直接進入「美圖秀秀」這類工具的市場。
用戶能以操作美圖秀秀的互動難度,實現 Photoshop 中復雜的功能。這樣情況正在越來越多類型的 AI 產品中出現。如果留意去年 WPS AI 的更新,也會發現用戶界面在不斷簡化,自然語言的輸入開始替代原來一些按鈕的功能。
可以看到,目前辦公文檔處理套件,已經向「 office+ 協作 +AI 」組成的一站式 AI 辦公轉變。一個產品能高效完成越來越多的任務,但集成的功能模塊卻越來越少,也将是 AI 工具的趨勢。
科技的革新本質上是人機互動的進化,當 Copilot 發展到一定程度,甚至可能整個互動界面本身就是一個超級應用,不僅連功能按鈕被取消,甚至很多應用本身都不一定再需要單獨存在。
我們需要更多不做大模型的 AI 公司
很多人把大模型或 AIGC 視為第四次工業革命,實際上如果一個技術要被冠以革命性的帽子,實際指的不是技術的突破本身,而是能影響整個商業社會、改變大多數人的生活方式。
無論是蒸汽、電力還是互聯網,毫無疑問都符合這些特點,那大模型呢?至少現階段肯定是達不到這個程度。我們需要的是通過 AI 應用產品将大模型能力發揮出來,從而來影響人們的工作和生活。
▲ 吳恩達
計算機科學家吳恩達也認為, AI 作為新一代通用技術,更多的機會,在于大規模應用落地。
這也是為什麼我一開始就說,我們需要更多不做模型的 AI 公司。大模型作為底層技術固然不可或缺,但專注于滿足消費者的各種需求以及各類商業交易的 AI 公司絕對需要更多,才能讓 AI 在社會層面真正爆發。
就像多點觸控技術,早在初代 iPhone 發布 20 多年前就有了成熟應用,但只有蘋果讓這項技術成為後來幾乎所有智能手機的互動方案。
而在這波 AI 浪潮中,也有着不生產大模型,但堅定要做大模型應用者的探索者,金山辦公就是其中的佼佼者。
金山辦公的策略十分務實,關注落地的場景,幾乎與國内主流的 AI 大模型公司都達成了深度合作,包括 MiniMax、智譜 AI、商湯、文心一言、通義大模型等,自己則聚焦落地的場景。
金山扮演的角色就像分診台,負責判斷用戶所有的問題和要解決的場景然後調用對應最适合的模型來執行任務。而一些小眾場景則由金山辦公的自研小模型補充滿足需求。
比如商湯在數據分析上比較出色,WPS AI 就調用它處需要理科思維的場景。而像文字、PPT 等場景則通過智譜 AI 等模型來完成。
這樣化整為零的大模型應用方式,好處是能充分發揮各模型的長處,實現優勢互補,不會受到某個模型能力的限制。實際上就算是 GPT-4,也有一些場景存在短板。
昨天的 WPS 發布會上,開場章慶元提到一個點我印象比較深。他說今天看到的所有功能,都是馬上能體驗,一定是落到客戶真實的應用場景裡的。
AI 除了在聊天框之外,在長文本處理不斷内卷之外,還有什麼更有想象力的應用方式?這是值得更多人去探索的,盡管目前大模型應用處于起步階段,但像金山這樣的 AI 應用主義者應該要多一些。