今天小編分享的互聯網經驗:MiniMax:「AGI」之路,我們不走「捷徑」,歡迎閱讀。
加入大模型賽道,魏偉說,他和不少人一樣,是 " 跑步進場 "。
在互聯網領網域,魏偉并非初來乍到——相反,魏偉是一名技術出身的 " 老兵 "。
2006 年在百度,魏偉就是百度在雲領網域嘗試的第一批貢獻者,和餘凱、賈磊、徐偉等大牛同袍同澤。2011 年,他也是最早一批開始使用 GPU 驅動深度學習的先鋒,支持算力平台。從百度出來,魏偉在 2016 年加入了正在高速發展期的騰訊雲任職副總裁,在技術和業務層面都有涉獵。
中間,魏偉又經歷了一段創業,而也是在這時,ChatGPT 橫空出世,讓 AGI ——這個一度被視為 " 口号式 " 的人工智能願景——展現出了新的可能性。
面對這個可能颠覆科技界的機會,魏偉怎能不心動?在介紹之下,魏偉遇到了 MiniMax。魏偉發現這個年輕的團隊對人工智能未來發展趨勢的理解十分深刻,并且也堅定地相信着 AGI。
于是," 跑步進場 " 的魏偉加入了 MiniMax,擔任副總裁和開放平台負責人,幫助 MiniMax 在 B 端發展開放平台,拓展業務。現在,MiniMax 已經成為大模型獨角獸公司。
近日,雷峰網來到了 MiniMax 北京辦公室,和魏偉進行了一次深談。也是在這次談話後,有關 MiniMax 的很多疑惑,也都在不同程度上獲得了解答。
一、MiniMax 是誰?
在外界,MiniMax 這個名字并不 " 響亮 " ——甚至不少 AI 領網域的從業者,都從來沒聽過這個名字。
如同 " 錦衣夜行 ",MiniMax 鮮少對外發聲,鮮少參與測評,也鮮少主動發布自己的產品。事實上,和雷峰網的對談,是 MiniMax 的高管首次面對媒體,直抒胸臆。
既有頭部資本的支持,又有米哈遊、騰訊、小紅書等大廠的青睐。單從這一點來看,雖然沒有主動制造 " 神秘感 ",MiniMax 正伫立在聚光燈下,作為中國 AI 的新生代力量被密切關注着。
MiniMax 是誰?在魏偉的描述中,雷峰網看到了很多個 " 面相 "。
1、AGI 的信仰者
從幾位早期成員,到今天 MiniMax 近 200 人的整體團隊,平均年齡在 95 後左右,還有不少 00 後。
(在 AI 2.0 的 " 英雄時代 " 中,湧現了一大批年輕有為的 85 後、90 後創業者,雷峰網後續将持續關注和報道他們的故事和成果,歡迎添加作者微信:william_dong,交流認知,互通有無。)
魏偉來到 MiniMax,主要工作之一就是組建開放平台團隊。不少入職的員工,都經過魏偉的親自面試。
單是招人這一關,MiniMax 的标準,就足以管中窺豹,看到他們企業文化的一個側面——每個加入 MiniMax 的候選人,都需要對技術和產品有足夠的信念感。
這種對于 AGI 的信仰,體現在很多方面。比如,MiniMax 并不特别青睐更了解傳統 NLP 或 CV 技術的 " 老人 ",也并不強求新人具有多厚重的經驗和背景。
" 其實在大模型上,我們講泛化能力;我們用一樣的方式看人——應用到人身上,我們招人更講究‘通才性’。" 魏偉說道,"(我們招人)已經不再局限于必須得是計算機出身。我們也發現,很多數學、物理,甚至文學、心理學出身的人,都會有實際輸出。"
在過去,不少頭部 AI 公司招人,很多的關注都被放在:拿過多少競賽獎項、發過多少頂會的 Paper ……而這些 " 名頭 ",MiniMax 卻并不強求,反而對很多進取、活躍、沒有包袱的年輕人廣開大門。
" 大模型賽道還存在着太多非共識,既然我們也沒完全弄懂,幹脆和新朋友一起學習和成長。" 魏偉對雷峰網表示道。
2、低調的 " 野心家 "
MiniMax 的低調,已經幾乎成了一種 " 習慣 "。
而當問到為什麼他們更享受這種 " 神秘 " 的感覺的時候,魏偉對雷峰網說,他們并非刻意在保持一種 " 神秘 ",而是真的覺得,自己的技術還并沒達到能夠讓内部覺得 " 拿得出手 " 的程度:
" 我們的技術還沒能讓我們滿意,所以就不會貿然公布什麼——在我們還沒能達到自己期待的時候,過多‘抛頭露面’,反而消耗的是市場和社會,對大模型事業的期望值。"
有一個投資人對雷峰網說過:在賽道過熱時,能體現出一家公司定力的,不是他們在這個時刻做了什麼,反而是他們選擇不做什麼。
這種定力,反而是體現在公司對于 AGI 的 " 野心 "。
" 如果大家都在現階段水平下 " 卷 ",其實沒有任何意義,目前距離實現真正的 AGI 仍然有很長的路要走。我們的目标是在算法上持續保持領先,在業務上始終為用戶創造實際的價值。"
這種 " 野心 ",在 MiniMax 的身上體現相當明顯。但也正是這種 " 野心 ",讓 MiniMax 顯得相當謙遜。
然而事實上,MiniMax 在技術上的實力從成立至今一直保持領先水平,也是目前國内少有的擁有文本、語音、視覺三模态融合的通用大模型引擎能力,并打通產品全鏈路的創業公司。
對于全鏈路自研,MiniMax 的目标相當執着,目前模型每周都會做迭代更新,這對整個系統有着非常高的算法要求和工程标準。
" 不少人質疑我們的算法是不是‘套殼’——對于我們來說,這甚至稱得上一種褒獎。" 魏偉對雷峰網說道。
二、MiniMax 在做什麼?
在算法能夠初步達到面向市場的程度之後,MiniMax 一直致力于 "User-in-the-Loop" 的產品研發模式,并且還取得了不錯的成績,而由此取得的用戶反饋數據,也為算法的進一步提升打下了堅實基礎。
但 MiniMax 還不滿足于此,在算法日漸成熟之後,他們把眼光轉向了 B 端市場。魏偉所負責的面向企業及用戶的開放平台,就是 MiniMax 意在利用大模型改變市場的矛頭先鋒。
做 To B 和做 To C 的邏輯完全不同,大模型更是如此—— To B 的產品要能實打實地帶來生產力和使用體驗的提升。
魏偉表示:" 一個 C 端用戶通過低廉,或免費的方式,獲取大模型對他們問題的解答,或許有不少人願意買單。但 B 端用戶是否願意為大模型付費,支撐公司的營收,中間其實還有一道鴻溝——很多 B 端客戶不會輕易掏這個錢。"
而跨越這道鴻溝,MiniMax 選擇的方法無他,只有通過加深對場景的理解能力,來發展出更具優勢的技術。MiniMax 開放平台目前已接入數百家企業客戶,打通辦公協作、智能硬體、教育、醫療、客服等十餘個行業場景。
" 首先還是基于我們過去一年的研發能力積累,整套研發鏈路跑通後,我們會基于我們的算法能力來幫助客戶在實際場景中對齊輸出效果。"
以辦公場景為例,MiniMax 為金山辦公旗下的智能辦公助手 WPS AI 提供多種大模型能力。
結合辦公場景的業務需求,大模型可以幫助用戶完成文本生成、要點總結、任務分發、表格和演示生成等任務,以讓辦公更流暢、高效、智能。
如果你參加今年的 WAIC,在 WPS AI 的展區,MiniMax 将聯合金山辦公,完成一場技術分享會,推介他們最新的技術研發成果。
為了能讓算法對于文檔場景的理解能更加深刻,做文章、故事的續寫,乃至到代碼的生成,MiniMax 不僅有團隊全時派駐在客戶的公司,來幫助廠商獲得更好的 " 使用姿勢 ";同時還更是分出人力,一家家地跑了不少業務相關小公司,有不少甚至只是五六個人的工作室,Case by case 地收集案例和使用需求,以此來實現算法層面的更新。
在落地的過程中魏偉帶領的開放平台團隊就是如此,跨越了一個又一個挑戰。今天在辦公文檔領網域,MiniMax 的算法已經可以幫助客戶處理超過 16k 的長文、支持和優化摘要和縮寫格式的輸出、更準确直接地理解用戶的需求,甚至生成代碼,讓處理文檔的算法,從一個 " 文科生 " 往 " 理科生 " 的方向上轉變。
而當被問起時,對于過去經歷的難題,魏偉似乎并不完全在意。
" 都是已經被解決了的問題," 他說," 我們更關注的是下一個我們将要邁過的‘坎’。"
以技術突圍,MiniMax 已經在多個領網域有了不少落地的案例:
在企業服務場景中,MiniMax 與騰訊輕聯做了許多關于打造個人工作生活 " 小助手 " 嘗試,在其已有工具上做模型轉化後能力輸出,拉通大模型和 SaaS 產品的融合使用。
與掌閱科技合作的對話式 AI 應用 " 閱愛聊 ",能讓文學作品中的角色來到現實,與用戶展開一場 " 跨次元 " 對談;
而與金山合作的 WPS AI,則已接入了 WPS 矩陣中文檔、演示、表格中大量場景,在智能辦公領網域提供了不少新的可能,與上面提到的 " 閱愛聊 " 一同,入選了 " 北京市通用人工智能大模型行業應用典型場景案例 ";
而與小米,MiniMax 也展開了深入的合作—— MiniMax 開放平台為小愛同學(小米的智能語音助手)在智能硬體、商城助手等場景賦能,具體包括閒聊、角色扮演、知識問答、信息提取等相關能力。
三、MiniMax 要去哪?
MiniMax 最重要的企業文化是 " 不走捷徑 "。
在 To B 生意上已經生根發芽,但這對于一家有 " 野心 " 的大模型公司來說,要保持技術領先并持續打通產品和業務鏈路,走向通用人工智能的終極目标,這只能算是一個階段性成果。
因為核心團隊都親歷過 AI 1.0 時代,MiniMax 決定不走捷徑,把 " 與用戶共建智能 "(Intelligence with Everyone),作為公司立身發展的第一性。魏偉堅定表示,"始終基于用戶需求,這樣算法才能不斷突破臨界點,我們也才能為越來越多的客戶帶來實打實的價值。"
這勢必是一場持久旅程。當下,大模型算法的天花板還沒能看到,MiniMax 起步雖然不晚,但在數據和場景的積累上,還依然需要很多沉澱。
而 MiniMax 也絕不單純只是 " 眼望星空 " 的空想家,在 " 腳踏實地 " 的層面,他們也勇敢地面對接踵而來的挑戰。
一位圈内人士對雷峰網表示,大模型從一項 " 技術 " 變成能實際變成生產力的 " 產品 ",中間有很多復雜的工程問題需要解決。而能否解決這些工程問題,則是眾多 AI 公司能否 " 落到地面 " 的關鍵細節。
而大模型 To B 做 MaaS,也就是 " 模型即服務 ",部署就是這樣一個相當微妙的工程問題:
一方面,要做雲端部署,不少客戶,尤其是身處醫療、金融行業等對保密性、安全性要求更高的企業,對于雲端部署的不确定性相當介意;
另一方面,企業承擔私有化部署的成本非常高。而當下很多小模型由于算法能力不足,盡管企業針對私有數據進行 fine-tune,仍然很難達到業務上線标準,反而會讓企業花更多成本踩 " 坑 "。
魏偉和團隊認為,只有當模型能力足夠通用之後,企業買私有化部署的模型才能產生足夠大的價值,這樣才能實打實的解決企業問題。
不少廠商給出的解決方案,是做一套更小的模型,降低私有化部署的壓力,通過一定程度犧牲模型能力,來換取更加低成本的產品落地。但這裡必須要解決更新速度的問題,不然會很難跟上技術發展。
魏偉認為,不管哪種解決方案,只有能真正讓企業在業務上獲得提升,才是真正有價值的。
MiniMax 在模型性能上不想妥協,那麼部署問題就必須被解決。
而這個問題,難不倒雲業務出身、SaaS 經驗豐富的魏偉和他帶領的開放平台團隊。MiniMax 給出的方案,是 " 雲上專區 " 部署。
針對客戶基于安全性的需求,MiniMax 和多家雲廠商達成了合作,模型提供方把模型在雲端放置在一個相對封閉的專區中,只具備日常更新和 Debug 的權限;雲廠商只作為審計第三方,通過堡壘機和安全審計來防止非法的下載。
這種單向的鏈路,讓無論模型提供方還是雲廠商,都無法直接下載用戶的數據,安全性就得到了很大程度上的保障。
同時在這個模式下,模型直給應用,用戶通過 API,可以直接調用專屬的集群,模型提供方實時的模型更新,用戶也能第一時間接收到成果。
這種 " 雲上專區 " 在美國有不少嘗試者,而這種模式也正逐漸為 MiniMax 國内的各個大客戶所接受。
結語:不走捷徑的 MiniMax
不少了解 MiniMax 内情的人,會用 " 外佛内卷 " 來形容這家公司。
對外,MiniMax 足夠 " 佛 "。他們知道過多的關注會給團隊的心态帶來不确定的影響,于是 " 謹言慎行 ",能夠不受外界影響,專研開發的狀态,嚴謹而 " 孤獨 "。
對内,MiniMax 卻很 " 卷 "。他們的更新迭代始終保持在一個很高的節奏上,因為距離真正實現 AGI,對所有人來說都還很遙遠,必須要保持足夠快的進步速度。
因此,評價這家年輕的創業公司,盡管團隊和公司的年齡都不大,卻總能讓人感受到一種不似新創公司的 " 老成 "。團隊有激情、有拼勁,公司文化也更直接,對事不對人。一位獵頭向雷峰網表示,現在上海能從字節逆向挖人的,除了剛在拼多多對面開辦公室對着挖拼多多和字節增長崗的 Shein,就是 MiniMax 了。
MiniMax 之所以 " 有所為,有所不為 ",是因為他們把 " 與用戶共建智能 ",看得比什麼都重。
在内部,MiniMax 常常用 " 造一艘火箭 " 來形容自己的狀态——在火箭成功上天之前,一切都應該踏踏實實為技術發展服務。
有了解 MiniMax 的人分析,以 MiniMax 的算法演進,目前在中文能力上在不少復雜場景已經可以平替 GPT3.5,而 GPT-4 似乎也不再只是一個 " 可望不可及 " 的目标。(當前 MiniMax 開放平台已上線其最新版本的文本模型 "MiniMax-ABAB 5.5",歡迎申請體驗:https://api.minimax.chat/)。
去往 AGI 的路途雖然仍然遙遠,在今天可能只寫完了一個 " 序言 "。而明天,對于 MiniMax 來說,仍如同黑夜中的海洋,充滿着未知的風浪。
好在,遠處仍然有一座燈塔,還閃爍着依稀溫暖的光芒——只要心中仍有對 AGI 的信仰,MiniMax 就不至于迷路。
(雷峰網後續将持續關注 MiniMax 以及其他優秀的大模型創業公司,歡迎添加作者微信:william_dong,一同見證這個足稱 " 偉大 " 的 AI " 英雄時代 "。)