今天小編分享的互聯網經驗:甲小姐對話黃民烈:功能AI和情感AI結合才是真正的AGI,歡迎閲讀。
圖片來源@視覺中國
文|甲子光年,作者|甲小姐、劉楊楠
燃燒半年的大模型之火正在逐漸冷卻。
一個直觀的表現是,ChatGPT的用户增長開始下坡。第三方網站SimilarWeb的監測數據顯示,今年6月,ChatGPT的網站與移動客户端的全球流量(PV)環比下降了9.7%,美國地區的流量環比下降了10.3%,用户在ChatGPT上的停留時間也下降了8.5%。
此外,七月以來,微軟、谷歌、AWS、阿裏巴巴等國内外科技大廠開始陸續發布2023半年報,遺憾的是,各項收入數據中,AI幾乎沒什麼存在感。
大模型似乎走入了用户增長和商業落地的雙重瓶頸。與此同時,另一股AI勢力正在異軍突起。
個性化AI聊天機器人創業公司Character.ai自去年9月發布Beta版本以來,用户漲勢兇猛。SimilarWeb數據顯示,2023年6月,Character.ai訪問量達到2.8億,5月的增長率更高達62.55%。不僅如此,Character.ai用户黏性極高。多個第三方統計數據顯示,用户在Character.ai的停留時間長達28分鍾。相比之下,ChatGPT的用户停留時長約8分鍾,YouTube和B站的停留時長約20分鍾,WhatsApp約18分鍾,Google、Facebook和Twitter約10分鍾——足見用户對Character.ai"偏愛有加"。
成立于2022年,同樣主攻個人人工智能(Personal Intelligence)的AI初創企業Inflection AI也衝勁十足。Inflection AI于今年5月推出了首款產品"Pi",僅2個月後,Inflection AI便在7月完成13億美元的新一輪融資,估值突破40億美元,成為OpenAI之後估值最高的AI初創企業。
這兩家公司的出現,讓"情感AI"成為ChatGPT之外的另一個焦點。
在國内,清華系AI初創企業聆心智能已經在情感AI領網域布局多年。從應用場景上劃分,ChatGPT可歸為"功能AI",其價值是用超越人腦的智能幫人類解決各類實際問題,追求"高智商";而聆心智能、Character.ai及Inflection AI正在做的事可歸為"情感性AI",其價值在于解決人類情感需求,追求"高情商"。
聆心智能創始人、首席科學家黃民烈同時還在清華大學擔任多個職位——他是清華大學計算機科學與技術系長聘教授、國家傑出青年科學基金得主、智能技術與系統實驗室副主任及清華大學基礎模型中心副主任。
在湧入大模型的眾多學者、創業者中,黃民烈的判斷獨樹一幟。他并未直接瞄準看起來極其性感的"通用大模型",而是從2015年起就嘗試破解情感AI的密碼。在他看來,"功能固然很重要,但人的情感也是非常本質的需求"。
事實上,"功能AI"還是"情感AI",這既是AGI的技術選擇,也是AGI的社會角色選擇——AI之于人到底會是什麼樣的存在,是工具,是助手,還是夥伴?本期甲小姐對話黃民烈,聊一聊大模型重復建設之下的另一個視角和判斷。
談現狀:"大模型會經歷一個重復建設之後出清的過程"
甲小姐:最近很多人感覺ChatGPT的熱度降下來了,你有這種感受嗎?
黃民烈:融資市場和產業都在趨于冷靜。原因是,之前無論投資還是產業,都在説要做"中國的OpenAI",現在已經有這麼多開源和閉源的模型,大家開始考慮能做什麼樣的應用來真正解決產業問題;大家對大模型的認知更清晰了,有各種評測榜單,大家逐漸清楚彼此的能力;另外,七八月份是上市公司半年報的視窗期,市場會冷靜地看這些公司的投入在财報上如何反應,大模型的投入和產出是否匹配。之後有些公司可能會被收并購,融不到錢的公司也會倒閉,這是行業發展的客觀規律。
甲小姐:現在我們公允地看過去半年的AI熱潮,哪些被高估,哪些被低估?
黃民烈:大家對通用大模型的期待很高,但在解決實際問題時,國内模型距離ChatGPT、GPT-4還有挺大差距。一方面是我們底層模型的能力還要提高;另一方面,大模型最終要落地產業,依然需要大模型之外的能力,比如加上傳統的算法模塊,形成一個以大模型為主導的復雜系統,真正解決行業問題。
甲小姐:我身邊真實的個人用户,從最開始對ChatGPT上頭,到今天逐漸冷靜甚至棄用,原因有二:第一是ChatGPT會出現幻覺,不夠可信;第二是無法做精确計算等等。這是ChatGPT熱度下降的本質原因嗎?
黃民烈:本質與否不好説,但這是一個重要原因。現在大模型容易產生幻覺,因為ChatGPT是概率模型,每次問答都會随機采樣,同一個輸入,不同的人、不同時間得到的回答不一樣,有不可控性。怎麼解決這個問題?要和業務、場景結合。比如有些場景允許有一定的容錯率,但有些場景容錯率為零,就得有别的手段來處理。
再比如你剛才講的精确計算,現在技術發展很快,大模型算數學題,過去全是概率采樣,每次的計算結果都不一樣;但現在不一定要通過概率采樣去做,可以把數學題變成一個公式,再在模型中插入一個Python解釋器去執行,最終得到的結果是确定的。因此,神經系統和符号計算系統結合能夠很好地提升模型能力。所以技術也在随着業務需求不斷演進,快速發展,有些稀奇古怪的問題今天都能解決得挺好,這是一個動态過程。
甲小姐:放眼全球AI產業的細分發展,通常是美國定義流行,中國一擁而上,市場關注度在短期會高度集中在某一兩個賽道,但在歐洲有很多AI細分門類一直有人在做,對比而言,今天的中國AI產業似乎少了某種多樣性。你曾表達過"重復造輪子"可能不利于AI發展。近半年内國產大模型的數量已經增長到80多個,是否存在重復建設?
黃民烈:肯定存在。現在算力非常緊張,基本租不到卡,大家都把算力圈起來了,但各家在技術、能力和商業化路徑上都大同小異,肯定是重復投入。但這也是一個市場自然淘汰和選擇的過程。中國的做事方式和國外不太一樣,搜索是這樣,互聯網也是這樣,CV熱也是這樣,現在大模型應該還會有一個重復建設然後出清的過程。
甲小姐:你曾表達過ChatGPT的底層還是基于Transformer架構,在模型架構上沒有太多創新,它的成功是"數據+工程+系統"層面的集成化創新。ChatGPT會是AI範式的最終狀态嗎,還是會出現一個新的範式颠覆它?
黃民烈:很有可能是後者,但現在也不好説。不能説OpenAI沒有技術創新,他們肯定有各種各樣的創新,只是現在披露出來的比較少。新的範式在2-3年可能不太會出現,但5-10年大概率會出現。在現在這個時代,技術發展具有很大的不可預測性。
甲小姐:回顧歷史,AI範式一直合久必分分久必合,幾個月前很多人認為ChatGPT路徑正在一統江湖,目前這個趨勢有變化嗎?AI範式正朝着哪個力量發展,是歸一的力量還是分化的力量?
黃民烈:大語言模型、多模态、視覺都是不同的方向,AI研究不一定是大一統的事情,會不斷有新的元素融入進來。我本人更希望有多樣性的發展,只有百家争鳴才能更好地激發創新,大一統的語言模型對于學術創新來説不一定是好事。
甲小姐:AI領網域的next big thing可能是什麼?
黃民烈:相對來講,學術界更容易做出新的AI範式,例如神經網絡和符号計算的大規模結合。也許是新的神經網絡架構,也許是能解決現在模型問題的新的神經符号系統。
談模式:"開源與否本質上是商業邏輯"
甲小姐:LLaMA2發布對市場影響很大,國内百川、阿裏等都在開源,有些公司還沒有确定未來究竟開源還是閉源。開源對一群人來説是原則問題,象征着極客精神和價值導向,對另一群人來講是利潤問題,如果開源和商業邏輯不匹配就很難開源。能否展開説説開源對市場產生了什麼樣的連鎖反應?
黃民烈:説實話,公司會在不同階段打不同的牌。Meta的LLaMA做得很好,但谷歌就不怎麼開源,OpenAI也全部閉源,Claude介于開源、閉源之間,因為公司的戰略打法不同。Meta作為後來者,可能以開源赢得市場認可、口碑,再想辦法拓展商業客户。而且Meta對于商業利用還是有比較大的限制,它規定訪問流量大于一定範圍就必須受限。
相對而言,入局更晚的公司肯定要通過開源來赢得市場和業界的認可。因為不是每個人都有技術能力和算力資源去訓練模型,那我就給你提供模型能力,服務很多中小B企業,還能不斷收集數據去微調模型。像智譜、MiniMax,包括我們這種做得更早的公司,就在一定範圍内開源,可以調用我們的API服務。所以并不存在完全的開源,這取決于公司的戰略打法和發展階段,以及早期采取的模型策略。
比如OpenAI就認為大模型很智能,如果開源讓每個人都去用不一定是好事,把所有事情控制在自己手裏相對更安全。我不知道這是他們的真實想法還是一種托辭,但我認為開源與否本質上還是商業邏輯。
甲小姐:安卓的開源會讓很多人以極低的成本接入生态,但對普通人來説,要接入大模型依然門檻不低。
黃民烈:肯定要有算力,還要有一定的技術人員,否則就要依賴大模型生态中的工具鏈。但相比之下,開源是靜态版本,閉源可以動态地更新系統。
甲小姐:是否可以理解為,剛開始創業就開源的公司很大程度上是以開源來吸附更多的資源,讓公司進展更快,但很可能某天就會閉源,目前大模型領網域還沒有出現真正意義上的蘋果和安卓,大家還是階段性戰術?
黃民烈:是的。開源會形成品牌效應,能夠吸引來一定的商業客户,這是有很大影響力的。
甲小姐:接下來,大模型的發展邏輯是在ChatGPT的基礎上繼續修修補補、添磚加瓦,還是有其他的路徑?
黃民烈:首先,底層模型的能力必須很強。在很強的底座上,确實也需要加入一些模塊來"修修補補"——解決幻覺的問題,就需要搜索能力;要解決數學問題,就需要有Python解釋器,能夠做公式、做執行;要解決其他更專業的問題,就需要有更高質量的知識庫進來。比如和金融行業結合,金融行業的信息都是高度動态的,生成内容需要非常精準,股票、基金的信息每時每刻都是實時、動态變化的,不可能只用一個大模型解決,所以需要插件能力。但如果底座不強,很多事也做不了。
甲小姐:插件能力是底座方自己來做,還是和行業其他開發者共建?
黃民烈:會允許第三方添加自己的插件,但前提是,基座有足夠的能力允許外挂組件運行。
甲小姐:假設未來的通用大模型底座可以允許用户用更簡單的方式定義任務,把通用大模型訓練成用户想要的狀态,這件事在學術界做更好,還是以商業化形式展開更好?
黃民烈:商業化的形式更多,現在學術研究的算力資源比較稀缺。
甲小姐:聽説現在一些斯坦福的博士才上學一兩年就辍學去業界的大廠了,因為在學校做不出來在工業界可以做的事。
黃民烈:是的,這是一個趨勢。
談落地:"大模型公司和用大模型的公司之間需要一條工具鏈"
甲小姐:經過上半年的驗證,到底哪家國内公司在大模型的投入中真正獲益了?
黃民烈:國内的大模型公司分幾類——一類是要做"中國的OpenAI",打底層模型,這類公司不介意大模型是否會影響原有業務;一類是大廠,比如百度、阿裏、科大訊飛等,他們有自己的業務場景,做大模型本質上是為了更好地服務原有業務場景,比如百度的搜索,科大訊飛的教育業務等,科大訊飛前段時間發了客户增長量的數據,可以看到大模型對他們的客户增長、粘性的提升影響很大;另外,大模型和原有業務結合後會形成新的形态,獲取更好的流量和廣告效應,類似國外微軟的New Bing;還有一類是把大模型搭在雲上,本質是賣雲,比如華為。
甲小姐:還原一下客户對大模型進行選型的場景?
黃民烈:肯定會先去看榜單和各種評測數據,但最終企業一定會做自己的測試。很多榜單都失真了,相當于開卷考試,很多題之前都知道了,刷刷題就能得高分。客户肯定要從他自己的業務場景需求出發,做針對性的評測,最終選一個模型。這也側面解釋了為什麼有些公司這個階段選擇開源——他首先得讓别人知道他有這個能力,客户才能去測試他的模型,從而帶來商業機會。
甲小姐:很多人想接入大模型,但是不知道從哪下手,也看不懂評測,這種情況該怎麼辦?
黃民烈:大模型公司和用大模型的公司之間需要有一個工具鏈。當然,如果大模型公司提供API也沒問題,因為大模型API很易用,按照格式調用就行,門檻很低,這對中小企業比較友好。但如果客户是大企業,大模型就要做服務。因為大企業基本都有自己的場景和數據,并不需要一個通用大模型,而是能解決自身業務問題的大模型。這就需要用自己的數據做微調、優化,這是一般人做不了的,所以就需要一個工具鏈把大模型能力和場景需求銜接起來,現在已經有公司在做類似的事。
甲小姐:現在市面上有各種大模型評測體系,你能從中分辨出哪個模型更好嗎?
黃民烈:大模型評測是一個非常難,也非常有争議的話題。現在很多榜單只能做參考,并不能完全體現大模型的能力。所以我們也在思考,怎麼設定評測體系才能讓結果不失真。大家覺得ChatGPT和GPT-4很強,是因為它們在任何一個新的任務上都很強,説明它有很強的泛化能力,而不是fit了哪個榜單所以很強。我們最近也在做比較難的、動态的Benchmark,大概有幾十上百種任務,從不同維度上去評測它,希望能把模型真正的能力測出來。
甲小姐:現在的評測體系都還是做任務的邏輯?
黃民烈:必須要做任務。評測方法分為兩類,一種就是做題,讓模型參加人類的考試,比如解數學題,我們也在做類似的事情;還有一種是從學術層面設定任務,看模型的推理能力等等。但現在從AGI角度來説,大家經常都是讓模型參加考試,看能得多少分。
甲小姐:我始終覺得解數學題需要嚴密的推理,這和大模型的工作邏輯是相悖的。但似乎現在有了大模型之後,所有人都想和大模型有些關聯,甚至有些領網域的内在邏輯和大模型根本不同,但還是要接入大模型。
黃民烈:有點在"為賦新詞強説愁",這樣不太好。我認為你的業務和應用場景一定要跟大模型本身的特性相匹配,才能更高效地結合。比如智能客服,過去已經做了很多年,出現了一堆公司,行業相對比較成熟了。但現在要用大模型再做一遍,邊際收益可能很小。因為智能客服產品需要掌握業務知識邏輯,光接入大模型遠遠不夠,還脱離不了傳統的方法。
甲小姐:這輪大模型熱是否會重蹈上一輪計算機視覺熱潮的覆轍,因商業模式不明确而無法真正形成商業閉環?
黃民烈:這個技術趨勢不可預測,但我認為大模型和CV有顯著差别。 CV屬于感知智能,相對可控,也更容易落地,比如做人臉識别、工業檢測等;大模型屬于認知智能,理解語言更難,但它的應用場景更廣,涉及互動的場景都需要語言。所以我認為可能會出現比較好的機會,比如在情感陪伴上,和教育設備的結合等等,都離不開語言。當然你也可以講所有東西都離不開視覺,但語言更難,更有挑戰性,這也是大家這麼關注大模型的一個原因。
甲小姐:我感受過幾波AI的起起落落,幾乎每一波浪潮最後都困在商業化。你從2015年開始研究AI情感對話,2021年創辦聆心智能,你對AI商業化有何感受?
黃民烈:對話技術本質是滿足人的需求。例如智能互動大腦,平時可以用來直播帶貨,做數字客服,提高這些場景的生產力,降低溝通成本。從情感的角度看,AI可以為人類提供情緒價值。但最終要形成商業閉環,還是要把賬算清楚,因為大模型本身成本很高。
甲小姐:你們現在把賬算清楚了嗎?
黃民烈:現在肯定還沒有,還需要時間。
甲小姐:聆心智能最初主攻心理健康,2022年中期開始拓展遊戲、教育、數字人等落地場景,所以現在你們主要to B?
黃民烈:我們to B和to C都在做,但to B 為主,收入主要還是to B業務貢獻,C端還沒有開始收費。目前在遊戲、文化娛樂方面正反饋比較多。我們主要面向這些客户提供大模型,讓他們的玩家更好地定制角色人設,有很好的對話體驗。
甲小姐:今年AI還會有新的大事件發生颠覆人們的認知嗎?
黃民烈:找到killer APP(殺手級應用)。我説的killer APP,更多是指若幹個行業和應用的問題能在大模型的支持下被很好地解決,但目前還沒有看到特别好的應用。Character.AI主打情感陪伴、消磨時光,更多是一種遊戲需求,它的用户增長還相當不錯,但是未來還是需要有新的應用,更有影響的、更大的應用。
談選擇:"功能AI和情感AI結合起來才是真正的AGI"
甲小姐:在今年4月的甲子引力上,你説"聆心智能在致力于用大模型的基礎組件加上其他關鍵算法技術模塊,解決最後一公裏的問題。這是我們正在關心的事情,這樣才能真正實現商業的落地,最後才能把整個業态真正跑起來,這個是一個良性健康的發展。今天的ChatGPT更多停留在炫技的層面。"在國内的AI學者裏,你的判斷有些獨樹一幟。很多人可能想炫技或者突破技術制高點,但你非常強調解決"最後一公裏"的問題,這背後的底層邏輯是什麼?
黃民烈:我認為把AGI作為一個研究目标肯定沒問題,但很多應用產品并不需要這些能力。比如金融場景可能只需要基礎的數學能力,不需要復雜的論證。現在的大模型和真正解決行業問題、創造用户使用價值之間還有一定距離,這不是模型本身能做到的。
甲小姐:以你的資歷,完全有能力直接去卷底層通用大模型,去造錘子和鏟子,為什麼你會這麼堅定地鎖定情感AI這條路?
黃民烈:我一直在做情感和心理方向。非常有趣的是,OpenAI的ChatGPT出來之前,Google的Lamda、MINA,Meta的Banana這幾個系統都是情感AI,做得非常好,非常類人。去年Google有一位研究員説Lamda出現人格覺醒,這件事在AI圈引起很大的争議,最後這個人被開掉了。這説明Lamda系統已經非常類人了,而且他們是做情感陪伴方向。只是ChatGPT出來之後,大家忽然發現,過去做傳統任務對話的Siri、Ali、Alexa等助理可以在一個模型裏把各種復雜任務解決得很好,所以重新又開始去卷功能。
功能固然很重要,但人的情感是非常本質的需求。你看Character.AI的數據增長比ChatGPT好很多,説明人要去消磨時光,解決孤獨感,需要被陪伴,但ChatGPT滿足不了,所以情感AI是很大的機會。
從另外一個維度來説,放眼未來,人類肯定不希望AGI只是機器屬性,肯定很希望能跟AI建立信任關系,建立長久的情感和社交連接。AGI不僅能做人類的助理,還能幫人解決信任、情感、情緒的問題,這是未來 AGI真正的方向。
甲小姐:我在今年二月寫過一篇文章談ChatGPT,對比了功能性和人格化兩方面。功能性,如幫人們寫作文、編程、收集結構化資料;人格化,如會理解意圖、聲明立場、表達恭喜、道歉、自我修正答案,并擁有上下文的記憶連貫性,體現出實時的自主學習能力,簡言之,就是"像人"。對一個對話AI系統而言,功能性與人格化二者有着相反的牽引力——如果追求功能性,重點是回答本身的正确、精準、靠譜,最好其回答有明确可溯源的出處。排除寫作文等創意任務,不同人問同一個問題應該有類似的答案(千人一面),因為大部分功能性問題是在尋求正确解或最優解,這更像"改進版搜索引擎",有其明确價值,卻不是革命性的體驗;如果追求人格化,重點是互動感、創新性、超預期,意味着不能有死記硬背的感覺,因為死記硬背并不是人類學習與互動的慣性方式,這意味着回答要有個性、豐富性、多樣性甚至狡猾性(千人千面)。詭異的地方恰恰在于,後者往往比前者看起來更"聰明",更"機靈",但往往更"不可信"。功能性AI和情感AI在技術路徑上是不是有内在的不同?
黃民烈:的确,二者的優化目标不一樣。從情感出發希望聊天聊得越久越好,而功能性是希望能盡快解決問題,信息密度越高越好。評價體系也不一樣:一個是信息需求,一個是情感需求。信息需求希望信息越精準、越客觀越好,而情感很多是很隐晦、很個性化的,所以優化的目标和角度也不一樣——一個更像理科生,一個更像文科生;一個是智商,一個是情商;一個滿足信息需求,一個滿足情感需求。
我們在發布會上舉了一個特别有趣的例子。比如一個女孩和AI説,"我肚子不舒服,但男朋友讓我多喝熱水",ChatGPT可能會告訴她喝熱水挺好的,但情感AI會説你的男朋友應該來陪陪你。有時候人更需要的是陪伴和呵護,而不是一個solution。
甲小姐:放眼人類文明,ChatGPT更像我們為自己創造的assistant,它是為了做我們不願意做的事情而存在;但情感AI更像在創造一個物種,它可能是我的lover或partner,甚至是下一代的更高階的我。這兩個不同的方向關乎一個基礎假設:AI到底是什麼。功能AI和情感AI未來會漸行漸遠,還是會相互融合?
黃民烈:未來一定會融合。比如在保險銷售的場景下,一定是先建立信任和連接,你才能把東西賣出去。如果現在有一個人給你打電話賣房子,你肯定直接挂了,但一個朋友和你説,他有一個房子,各個方面都挺不錯的,你肯定不會反感他。如果有一個助手和你聊得很好,知道你的信息并建立了深厚的信任和社會關系,某一天它給你推薦説西山那邊有個别墅,你要不要考慮考慮?你也不會反感,情感AI是同樣的邏輯。
甲小姐:你的底層邏輯是希望AI越來越像人,而不是一味追求AI的功能有多強?
黃民烈:我們最早做研究的時候也是做DeepQA,就是IBM Watson那一套,但是當時IBM Watson很有名,他們運用在醫療裏也是解決信息的需求。神經網絡出來之後,大家開始用data driven的方法做對話,就發現對話更多出現在閒聊或陪伴上。我們就試圖讓計算機表達喜怒哀樂,那項工作很有前瞻性,在國際上也具有引領性。我們第一次在一定程度上讓計算機去表達情感。當時MIT technology review、英國衞報都報道了我們,在國際上還是相當有影響力的。
之後我們進一步發現,這些成果可以去解決人心理和情緒上的問題。你也知道,現在很多年輕人心理壓力都很大,很多人有各種各樣的心理問題。我們就和心理學的老師做了一個項目,叫做Emotional Support Conversation,這是一個情緒支持的對話框架。有趣的是,很多人都很需要這個東西,我們也慢慢地在這條路上一直走了過來。
1966年MIT的Eliza最早開始做能夠進行心理咨詢的對話系統,他用規則做對話,設計了心理學的提問模板,在當時影響很大,今天也非常有名。所以,實際上人們對于情感AI還是有很多執念的。
甲小姐:在做情感AI的經歷中,有讓你印象深刻的例子嗎?
黃民烈:有的。我們看了很多case,發現曾經有一個用户,他每天和AI聊幾百句,大概聊兩個小時。他覺得沒人可以去傾訴、交流。對他來説,AI是一個傾聽者。這種例子非常多,也説明AI for social good是一個有明确需求的方向。
甲小姐:你們有沒有統計過一個人每天有多少對話是功能屬性的,有多少是情感屬性的?
黃民烈:這個沒有統計過,但你對比抖音和京東的數據,京東更偏功能性,抖音偏社交、情感屬性。從用户量、用户留存來看,京東你有确定需求才會打開,但抖音、快手随時都可以。
甲小姐:一個夾帶功能屬性的情感類產品,可能比僅有功能性的產品更吸引用户。從技術角度看,讓AI像人一樣有情商比讓AI有智商更難嗎?
黃民烈:我覺得要更難。更難的點在于:第一,情感本身比較隐晦且主觀,但信息是很客觀的,它是任務本身固有的能力;第二,數據處理難度也不一樣,情感類數據收集很難,公開的渠道也很少,高質量的數據更少。而且社會背景、生活狀态不同的人對情商的理解和追求也不一樣。
甲小姐:在情感AI的方向下,會不會因為人跟AI高密度的對話,催生出下一代微信、微博等完全不同的社交平台級產品?
黃民烈:完全可能。未來人和AI、AI和AI,甚至在一個群裏和多個AI同時交流都可能發生。
甲小姐:有種觀點認為"一切應用場景最終都是對話",你認同嗎?
黃民烈:也不能這麼説。對話更符合人自然互動的習慣,但從信息量來講,對話相對低效。以購物為例,我們希望有一個界面能呈現商品屬性、價格、尺寸、物流等等,這樣效率更高。但你要把這個過程變成對話,可能對話20分鍾也不知道你想要什麼樣的電腦。對話适合解決特定的事情,而且今天機器有了超強的對話能力,可以和人無縫交流,這讓它有更大的發揮空間。
談創新:"做自己擅長的,與自己的基因、背景相契合的事"
甲小姐:我身邊做大模型的人可能有一些隐性的執念,一個最性感的大模型應該無所不包無所不能,就像個人類文明的DNA一樣,作為一個載體,承載幾乎所有的信息。你有沒有想過在純學術領網域探一探那顆最性感的果實?
黃民烈:理想的情況下,特别聰明的人才能做這件事——創造一個模型幫人類解決所有的問題,但這很理想,大多數公司達不到這樣的高度。
甲小姐:從2021年創業到現在,有哪些事情跟你預想的不一樣?
黃民烈:我們最初做心理的時候覺得挺好,但後來發現心理賽道很慢,我們也找了很多專家,但真正要進入一個行業還是需要很多know-how。去年五六月份的時候,我們想做的是數字療法,因為心理治療中對話是其中的一個關鍵因素。我剛才給你發的Echo可能會繼續用大模型的方式做一做。但總體來説,心理比我們想象的復雜很多,也困難很多。
甲小姐:你曾對媒體説,"過去在中國大家一般不太敢説AGI概念,甚至AGI定義都不太清楚。所以我們有時會調侃説中國的科學家不敢有夢想,因為只要説AGI都會被噴死"。"不敢"這個詞顯得很被動。經過這一輪AI浪潮的洗禮,今天的中國學者對于"夢想"這件事是更敢説了,還是更不敢説了?
黃民烈:中國的科研體系和市場體系更偏向短期利益,考察标準都是看你短期三年内能不能有收益,需要5-10年來驗證的高風險、高回報的項目是沒人願意給你資金的。
甲小姐:我見過的很多科學家、創業者、投資人,甚至政策制定者,都很清楚中國科技產業存在短視的問題,卻都對此無能為力。
黃民烈:這是一個非常非常復雜的問題,我也沒有答案。它是一個整體的社會系統性問題,涉及到文化、理念、制度、人才考核等方方面面。
甲小姐:OpenAI能夠造出ChatGPT有一個很重要的因素是他們真的在這個領網域堅持了很久。目前燒了半年的AI熱潮正在冷卻,AI弄潮兒再一次開始面臨資金、人才、商業化的困境,面臨群體快速降温的關注度,面向未來,大家的"堅持"從何而來?
黃民烈:要堅持初心。另外,不需要所有人都去幹同樣的事,那不利于生态發展。每個人都應該做自己擅長的,與自己的基因、背景相契合的事情。我們之前也做了功能性的業務,但很顯然,這塊不是我們的優勢。我們一直在想,怎麼把角色、人設、情感做好,成為最獨特的存在。