今天小編分享的教育經驗:Hugging Face王鐵震:有人的地方就會有江湖,有開發者的地方就會有社區,歡迎閲讀。
"開放性平台創造了比封閉式平台高1000倍的價值。只要我們能夠通過開源社區把這個餅做大,即使捕獲這個價值的1%,也可能比獨占未開放產品100%份額的價值更大。"
"我們的轉型取得了巨大的成功,但在當時其實是一項相當大膽的決策。過去并沒有太多開源社區成功轉型為商業公司的案例。這個過程也并非一帆風順。比如,去年年終的時候GPT-3出來了,這個模型特别火,但OpenAI也在那個時候就決定不開源了,這對開源社區來説實際上是一個非常大的打擊。"
"什麼是潮流?什麼是酷的?這實際上是被時代定義的。如果有一天通過ChatGPT寫程式、搞一些AI應用變成了一個很酷的事情,那我覺得AI行業的發展就沒問題了。這是我比較浪漫主義的想法。"Hugging Face工程師王鐵震説。
Hugging Face,AI開源社區的當紅炸子雞,被稱為AI界的GitHub。成立于2016 年,近一年來估值翻了一翻,飙升至45億美元,谷歌、亞馬遜、英偉達、英特爾、Salesforce等科技巨頭紛紛參與投資。
Hugging Face的Transformers庫是最快超100k的GitHub項目;迄今為止社區成員總共分享了超過 423k 個模型公開模型和超過84k 個公開數據集;有超過5萬家組織使用Hugging Face;它不僅開發了Transformers庫(目前最受歡迎的大語言模型庫),也提供了各種構建、部署和訓練機器學習模型的工具和資源……
今天,Hugging Face工程師王鐵震老師做客混沌,帶來課程《開源世界觀:如何用技術浪漫主義實現AI普惠》。為你揭開Hugging Face的神秘面紗,帶你了解開源世界觀與落地實踐。
以下為課程筆記:(篇幅所限,文章内容僅為部分課程内容,請前往混沌APP看完整課程)
授課老師|王鐵震 Hugging Face工程師
編輯|混沌商業研究團隊
支持|混沌前沿課
Hugging Face是誰?
大家可能經常在媒體上看到,最近又有一個有趣的東西在Hugging Face上發布了,但又不太了解我們。
實際上Hugging Face是一個AI開源社區,可以把它理解為AI屆的GitHub。Hugging Face現在的估值達到了45億美元,上面有超過100萬個AI模型和數據集、展示。迄今為止,使用過Hugging Face的組織超過5萬家,迄今為止社區成員總共分享了超過 423k 個模型公開模型和超過84k 個公開數據集。除此之外,Hugging Face還提供大模型領網域生态底層的一些開源資料庫,比如Transformers,這也是GitHub上最快達成star數量10萬裏程碑的開源項目之一。
自2016年起Hugging Face就開始啓動了,最早它是一款面向青少年有趣好玩的聊天機器人應用軟體。我們當時做的還不錯,成功進行了B輪融資。随着Transformer結構的出現,我們也積極擁抱新技術。在2018年,我們參加了NeurIPS dialog competition這個競賽,拿了第一名。随後我們做了一件很不一樣的事,那就是将這個Transformers模型開源了。它大受歡迎,越來越多的模型被大家集成在了這個庫裏。紅線是這個Transform庫的增長曲線,大家可以看到它增長得非常快。
然後我們就遇到一個問題,到底是繼續做原先的聊天機器人,還是要做開源?盡管聊天機器人做得不錯,但我們的幾個創始人心裏有個更大的圖景,就是促進人類高效合作。所以我們決定進行轉型,放棄聊天機器人,轉而致力于建立AI開源社區。
開源社區在我們看來,是非常有價值的。
首先開放性平台創造了比封閉式平台高1000倍的價值。只要我們能夠通過開源社區把這個餅做大,即使捕獲這個價值的1%,也可能比獨占未開放產品100%份額的價值更大。
做一個開源社區,其實也給我們很多信息上的優勢。如果你悶頭做自己的產品,可能就忘記了外面的世界發生了什麼。作為創業者,其實最重要的是要積極地去聽取開源社會的開源信息,跟大家做更多的交流。不是説現在就去想一個十年之後的計劃,可能我們一年之前都沒有想到ChatGPT和生成式AI會有這麼火。做開源社區,收集到更多聲音,一起去推動行業的前進,其實是更有價值的。
另外,開源的透明也會帶來好處。很多程式員并不希望自己的作品被用于AI訓練,開源數據集可以讓創作者清楚地了解數據的使用情況。通過查看網站,他們可以知悉是否有人在使用其代碼進行訓練,并提出聲明要求移除代碼,開源賦予了其在互聯網上被遺忘的權利。
如今看來這個轉型的決定取得了巨大的成功,但在當時其實是一項相當大膽的決策,因為過去并沒有太多開源社區成功轉型為商業公司的案例。這個過程也并非一帆風順。
比如,去年年終的時候GPT-3出來了,這個模型特别火,但OpenAI也在那個時候就決定不開源了,這對開源社區來説實際上是一個非常大的打擊。所以我們也與幾位合作夥伴共同推動了BigScience項目,我們發布了BLOOM這個最早在100B以上、支持多語言的開源模型。在商業授權方面,BLOOM幾乎沒有任何限制。它不僅授人以魚,更是授人以漁。我們走過的所有彎路、積累的所有經驗都公開到開源社區之中,為後來者提供了一個示範。
篇幅所限,本文内容僅為課程十分之一
點擊海報,看完整課程!
開源社區的商業模式與組織機制
1)Hugging Face創造了哪些有意思的活動與產品
Hugging Face是一個從社區中成長出來的公司,社區既是我們最重要的積澱,也是我們最大的壁壘。那我們社區的底色是什麼呢?實際上不是賺錢,是Have fun,大家都是因為興趣加入進來的。
你可能沒有Machine Learning的學位,也沒讀過這個領網域的書籍或論文,但技術發展至今,實際上并沒有把這一領網域的門檻拉高,反而将門檻降低了。我有個朋友對我所從事的事業一無所知,覺得大模型玄而又玄,但我給他分享了一個開源庫之後,他只需點點滑鼠就可以創建出他想要的圖文。一個月之後,他已經成為那個領網域的專家了,雖然他不會寫代碼,但是他會畫圖,也知道自己想要的圖是什麼樣子的。我有給他付工資嗎?沒有。他在上面有獲得什麼實際的利益嗎?也沒有,但這個東西好玩,它滿足了他從小以來一直都有的畫家夢想。
我還向一個媒體朋友科普了開源社區,他在了解并使用之後告訴我,他現在感覺一天二十四小時根本不夠用,每天都有太多事情在開源社區發生。開源實際上将大家從不明真相的吃瓜群眾變成了事件的參與者,因為所有的代碼和讨論都是公開的,任何人都可以溯源了解事情的始末,與KOL進行互動,甚至以這種方式自己逐漸成為KOL。
我相信很少有公司員工下班之後還願意查看内部溝通軟體,但我們公司的員工每天刷公司的Slack刷得停不下來,就把它當成Instagram或者小紅書來刷,甚至覺得時間不夠用。為什麼呢?因為做開源,能夠把他的興趣和工作結合在一起。如果你讓我去做别的事情,我可能個人興趣也是天天去看AI界發生了什麼,現在還有人付錢讓我去看AI界發生了什麼,我覺得非常開心。
所以這就是Have Fun。無論是對社區的使用者,還是于社區本身而言,Have Fun都是一件極其重要的事情,樂趣和工作同時存在。
正是由于大家在工作中能獲得樂趣,每個人都投入了很多精力,公司的生态系統也生長得非常迅速。我們去年是以Transformer為基礎的幾個庫,到今年已經形成了一個完善的生态系統。基于Transformer結構的大模型庫,Diffusers是圖文生成領網域的基礎庫,解決模型安全問題的庫Safetensors等等,都已經成為整個社區非常重要的基礎庫。
除了自己玩得開心,我們也舉辦了很多活動希望吸引更多人參與其中。比如在谷歌的支持下,我們獲得了免費的TPUV3資源,讓大家發揮自己的創意進行模型訓練。我們還在國内開辦了一個Diffusion model class分享擴散模型的内容,還把課程内容翻譯成了中文出版成書。
2)Hugging Face的組織架構
我們的組織中絕大多數成員是工程師,超過90%。與國内的一些社區不同,我們沒有專職運營人員,每個工程師都參與運營。因為我們的根基就是社區,大家都是從社區中成長起來的,也非常懂社區運作之道,知道大家是怎麼從小白成為社區的貢獻者,再成為社區的創造者。我記得剛進公司的時候,有一個開發者寫了三行代碼,本來只是随手做了一些事情,結果收到了許多祝賀,讓他感到非常開心,那一瞬間甚至以為自己得了諾獎。這種開源心态讓大家覺得,來開源社區不僅是一件有趣的事,而且能夠找到家的感覺。
3)開源社區的合作與決策機制
我們公司采用分布式的工作和決策模式,是非常有意思的。在工作方式上,所有員工都是遠程辦公,不需要去辦公室,因此我們會通過郵件和Slack進行異步溝通。并且很多溝通并不是在公司系統内部完成的,而是在公開的渠道,比如GitHub上進行。
另外一點也非常重要,我們的決策也是分布式的。我剛進公司的時候,因為之前在大公司待了很多年,覺得要先師出有名,先讓老板批準,于是我寫了六頁的一個計劃書,説我要做一個什麼東西。老板看了之後説,你寫得非常好,下次不要寫了。只要跟我説你做了什麼,有很多事情你可以自己決定,你不需要等我。
這也是為什麼我們幾個人就可以做非常多的活動,第一我們不開會,第二個我們每個人都可以做決定。很多事情老板都鼓勵大家自行決定,無需進行大型的會議讨論或是等待來自總部的批準。在這裏工作,你會有很強的參與感,而不會覺得自己只是大公司一枚不起眼的螺絲釘。另外,我們公司内部沒有明确的部門間的界限,每個人都可以提出自己的想法,大家一起商量并通過合作加以實現。
我們是一個不到二百多人的小公司,等我們有一萬人的時候,我相信也不會是這樣的治理方式,當然這是另外一個問題,要不要成長到有有一萬人的公司?也可能我們覺得小而美挺好的。
我們現在的公司内部其實并沒有像OKR這樣的内部治理模式,目前還處于一個比較有趣的階段,員工的薪水可能相對較低,但由于公司自由度較高,鼓勵大家不斷進行探索,所以員工更願意留在這裏發揮主觀能動性。在招聘方面,我們公司其實比較嚴格,入職者大多是在開源社區有一定影響力的人。我們并不是以傳統的算法作為篩選人才的标準,而是對候選人在行業的号召力和過去的數字足迹進行考察,這樣就确保了新進人員的價值觀與公司一致,并且在很大程度上能夠在公司内產生積極影響。
國内公司傳統的發展模式是大公司壟斷所有人才,内部事務對外不透明。相比之下,開源社區的模式更适合小公司,公司内部的事務高度透明,大家可以通過參與開源項目與CEO直接對話。企業間的合作也變得更加簡單直接,無需籤署各種繁瑣的協定,在開源社區提出合作想法即可。很多公司可能也想要追求類似我們公司的發展模式,但我們也是在天時地利人和的條件之下才實現了這一點。我猜測,這種更透明、更易于互相連接的企業模式可能是未來發展的一個明确方向,而這也是得益于開源領網域的不斷發展。
4)Hugging Face作為開源社區,如何在商業上盈利?
第一,咨詢服務,提供咨詢服務是開源項目最常見的盈利模式。企業在使用我們的開源庫時,遇到問題會自然而然地想要咨詢我們。我們在Slack上與用户交流,解答問題,提供較為簡單的咨詢服務。
第二,硬體服務,我們通過HPP(Hardware Partner Program)提供硬體服務。芯片公司希望将他們的芯片銷售出去,但由于雲服務商主要支持NVIDIA GPU,其他廠商的產品在軟體上很難适配。我們與硬體廠商合作,将下層的NVIDIA GPU接口替換為其他廠商的接口,就用户的使用而言并沒有任何差别,只需要支持Transformer就可以,從而使得硬體廠商更易銷售他們的產品。
第三,SaaS服務,比如AutoTrain,就是一個無代碼的模型訓練服務。用户只需上傳模型并提供訓練需求,剩下的工作AutoTrain會自行完成。訓練完成後,用户通過Inference endpoints将模型部署在Hugging Face上之後就可以直接調用它進行工作。
5)如何做一個開源社區
第一,如果要做一個開源的項目,最好第一天就要想着走向世界。開源這件事很多都是在GitHub、Hugging Face這樣的全球化社區完成的,要從一開始就設想這個開源項目是要服務全人類的,比如使用英文進行項目配置,這樣能更好地與全球的開發者進行互動。
第二,快速驗證可行性。很多開源項目都是在公司從上到下的推動下進行的,一開始就獲得了巨大的流量,但是流量并不是開源項目成功的唯一要素,做開源最重要的是不停地進行嘗試,找到特定生态位上的獨特價值,快速地失敗,快速地總結。
第三,積極吸取社區中的各種反饋。無論是正向意見還是負面評價,都應當積極對待。在社區中創建一種家的氛圍,才能夠讓社區成員在不斷的參與互動中共同成長。
第四,專注于特定的任務。很多國内的公司都在追求一個無所不能、包容萬象的東西,而開源世界所期待的是一個個具有特定價值的小項目,并通過堆砌多個項目實現更大的目标。
第五,關注開發者的體驗。與關注用户體驗相同,開源社區的特殊性決定了其還要關注開發者在其中的體驗和感受,以确保社區的活力和項目的質量。
篇幅所限,本文内容僅為課程十分之一
點擊海報,看完整課程!
1)大模型創業未來還有沒有機會?
第一,最重要的是信念。大家説的成本、使用場景難易度等問題,我覺得都會得到解決,就像一年前的我們絕對想不到今天的世界是這個樣子。現在大家可能覺得開源還差點勁,可能明年開源模型就真的有GPT3.5、4的水平。只有擁有堅定的信念,你才會有勇氣全力以赴。如果只關注眼前的不足,你可能難以下決心去行動。但等你明白這一點時,機會可能已經錯過了。
第二,選擇比努力更重要。在新技術的發展方向中,也許你選擇做了一個非常輕量級的應用,但是卻遠不如大平台它們已有的體量,就很容易被它們的推進力吃掉。2015年、2016年的時候,安卓剛剛推出來,手機這個賽道非常火。我有一個同學做了一個打開手電筒的應用,還做了一個一鍵關閉WIFI的應用,最高一個月可能賺了四五萬美元,但是後來這些東西全部變成了系統自帶的功能,瞬間他就變得很沮喪,覺得如果當時做了一點别的東西,現在可能已經有了更好地積累。
那選擇什麼呢?要麼是降本,要麼是增效。我覺得在國内場景下增效可能比降本更重要,因為上一波AI其實做得非常成功,降本的空間微乎其微,所以這條路走不通的話,不如想象增效,有哪些事情是以前做不了的,或是有哪些事情可以做得比以前更好的。比如説之前提到的代碼生成模型,有數據顯示這個模型可以将工程師的工作效率提高20%到30%。我們的目标不僅是要想提高員工和企業的效率,更重要的是确保每個使用這項技術的人也能感到開心。
第三,走向高度的定制化。在未來,我認為代碼生成能力将會促使世界變為需求驅動。我需要什麼樣的軟體,就告訴ChatGPT,讓它幫忙生成一個軟體,或者説讓ChatGPT生成一個簡單的腳本,可以滿足大家具體的需求,解決各自的問題。我覺得這種特定場景下所形成的定制化信息将會越來越多。
第四,智能的分發。工業革命解決了商品的分發問題,而信息革命帶來的是信息的分發。信息分發與智能分發是有一定差别的,我們看到一本書,并不是就完全理解了書的意思。以心理咨詢行業為例,那麼多的教科書、那麼多的課程,我們可能需要花費三五年的時間把他們全都學會,再形成智能去幫人解決心理問題,但是一旦訓練了一個大模型,這個模型就可以進行心理問答,能夠直接幫人回答心理上的一些咨詢問題,這就可以快速地讓更多的人體會到過去高階專家才能帶來的服務,并且這個價格會降得很低很低。
2)AI Agent機會
小時候用計算機,經常聽到比爾蓋茨的一個説法,他説,我希望在未來每個人的桌子上都有一台Windows。這個夢想其實已經實現了,他最近又有一個判斷,他説,AI Agent會改變你使用電腦的方式。我深受啓發,我覺得AI會帶來一種巨大的變革。
在《流浪地球》中有個片段,就是説月球基地上其實有很多的工程器械,唯獨缺少一個電腦主機對它們進行控制。後來他們從地球上帶來了一台新的計算機550C,計算機接入網絡之後首先去發現周圍有哪些工具,有哪些器械,然後和這些器械建立了一個聯結,并且學會了使用這些器械的方法,再去對它們進行統一調度。這其實比較像我所向往的AI的最終模式,AI Agent作為大模型的延伸,作為大模型的手和腳,大概要經歷使用工具、選擇工具、發現工具、創造工具四個階段。
非常早期的時候,我們做了一個Transformer Agent,它從用户那裏拿到一個指令之後,會從我們給它提供的一些給定的工具中進行選擇,再生成一段代碼來調用這個工具,最後完成任務。再來看看現在的產品,以Perplity.AI為例,我同時問了它兩個問題,一是Hugging Face是做什麼的,二是它什麼時候發布了Diffusers這個庫。它就會使用工具拆解我的問題,然後從數據庫裏找到16條資料,最後從資料中提煉出一個最終回答。盡管我發現它給出了錯誤的回答,但是我可以給它一個反饋,這就是所謂的人在回路。
3)範式變革:AI vs 互聯網,商業模式的重構機會
未來互聯網盈利的範式到底是什麼?在過去,像谷歌這樣的搜索引擎其實是在賣廣告,你搜索一個關鍵字,它就會給你推薦一些相關的產品。淘寶、抖音也是類似的模式。但這真的就是未來最合适的模式嗎?
現在為什麼會有很多人願意使用New Bing,或者Perplexity進行搜索,因為用它搜索更高效,如果想找一個什麼東西,不需要提供很精确的關鍵字,它們就會給我一段需要閲讀很多文章才能總結出來的答案。如果有一天它們走向廣告模式,我問它一個東西,它就給我回答一個廣告,那我就不會用它了,我還不如用搜索引擎。這種廣告模式實際上跟生產力是反着來的。現在大家對大模型這麼感興趣,其實也是因為我們相信它可以帶來更高的生產力。我認為在未來我更願意為高生產力付費,比如有一個知道我所有偏好的Agent,可以在我想要買東西的時候,在不同的平台上找到我想要的東西,然後幫我計算好折扣模式,并且對比出不同平台上的價格。
4)多模态的機會
無論是Perplexity還是大模型,它們都是一個文字進文字出的單模态模型,而ChatGPT-4V最近已經可以做到看見、聽見、説出。ChatGPT-4V的官方Demo講述的就是在修車場景中,如果沒有多模态模型,很難向ChatGPT描述清楚車到底有什麼問題。有了多模态的理解,把圖片傳給它,它就可以告訴我們車哪裏有問題,應該用什麼工具去修。這對打開其在生活中的使用場景有很大的幫助。
我覺得這個領網域會衍生出非常多的機會,當然做一個多模态模型的成本是遠遠高于做一個普通大模型的,我們也希望能夠有更多人參與到開源社區之中,一起推動這個領網域的發展。
多模态生成也是一個非常有意思的話題。基于Diffusers這個數據庫,通過Stable Diffusion的這個模型可以生成出非常好的宇航員的照片,包括面罩的反光等都已經能夠做到很好的效果。最近也看到很多視頻生成、音頻生成,我相信多模态生成技術有非常多的應用機會。
有人的地方就會有江湖,有開發者的地方就會有社區。圍繞着剛才所説的Stable Diffusion這種文生圖的多模态生成模型,其實也慢慢就形成了一個非常有名的社區,叫CIVITAI,很多人在這上面交流自己做的文生圖的模型。和小紅書一樣,它也是一個社交平台,只不過大家交流的不是照片或者感悟,而是進行模型的交流,智能的交流。甚至説智能分發普及之後,也許大家在社交媒體上點擊一下對方,看到的并不是對方生成的内容,而會有一個活生生的人在那裏等着與你進行互動。
5)從線下到線上再回歸現實
我一開始看到AI文生圖的圖片時,覺得非常驚豔,但是看多了CIVITAI上這些漂亮的圖片之後,就發現它們都缺少一種真實感、沉重感。這些圖片并不是我想要的,我現在反而更喜歡看我五歲的寶寶畫的畫,因為是他用自己的理解和自己的感受在作畫。
現在大家都在講,把這個搞成VR,那個搞成VR,好像加上VR就會變得有趣且酷,從而獲得很多流量。也許在未來大家就開始説,把VR摘了吧,現實世界更有樂趣一些。
在我小時候,有人做了一個實驗,把一堆人關在房子裏,一整天都不能出門,必須使用互聯網完成生活的一切操作。ChatGPT剛出來的時候我也做過類似的事情,就是強迫自己過一個ChatGPT Day,在那一天我必須通過ChatGPT完成所有的事情,包括寫的郵件、回復的消息。那天我其實過得很痛苦,我想有一天我會懷念今天這樣完全不用生成式AI就能過得很好的日子。
6)AI與大模型可能帶來的風險
第一,偏見。比如做文生圖的時候,想生成一個科學家的圖片,那麼模型就會從數據庫中找到與科學家相關的東西進行生成。你去看包括Stable Diffusion的模型數據,大多數與科學家相關的圖片都是以白人男性科學家為主體,因此它生成的圖片也大多是白人男性的形象。
我們會發現,由于數據的局限性,大模型在很多時候都會有一些偏見。因此,通過開源的方式,可以讓每個人都可以檢查數據集的内容以及與自己的關系,從而對數據集進行反饋,并進一步調整生成式AI模型的輸出。
第二,幻覺。比如説問ChatGPT某個人是誰,它的回答其實會出現很多錯誤。為什麼會出現這樣的問題?如果把大模型比作人,就容易理解了。我們疲憊或者迷糊的時候,也比較容易説錯話,大模型也是一樣,甚至沒有我們人類聰明,偶爾説錯也是可以理解的。有的時候我們是希望大模型有一些幻覺的,否則它只會陳述事實,就永遠無法想象一個架空的宇宙,永遠不能進行小説創作。
因此,當大家用大模型做一些產品的時候,可以考慮如何利用幻覺或避免幻覺。比如在教育領網域,幻覺問題實際上是非常嚴重的。訓練模型可能學了很多東西,但它是一個閉卷考試,所以做題過程中可能會出錯。而RAG是一個開卷考試,大模型會搜索出各種相關的參考資料,找到對應的确鑿的證據後再進行回答。因此,有時候幻覺可以通過RAG去避免。
由于大模型創作存在IP風險,因此很多企業不太敢使用生成式AI去做一些事情,擔心生成的東西與數據庫中沒有獲得創作者許可的東西長得太像了,從而會有法律風險。Microsoft Copilot和Adobe在軟體的使用協定中加了一段説明,説如果用户使用它們的軟體生成了某種東西,并且具有法律風險的話,它們來扛這個責任。這樣的做法就能避免大家在很多場景中使用生成式AI模型的顧慮。
我之前在西電讀的應用物理,後來去法國的一個學校進行交換學習。在法國讀書的經歷對我影響蠻大的。這個法國學校實際上是一個通才培養的學校,學制三年,前兩年半什麼都要學,到了最後半年才開始選專業。
這段經歷給了我一種勇氣,我覺得轉行做另一件事不是那麼可怕了,好像什麼東西我都懂一點。我也敢于邁出第一步,去嘗試、去學習。五六年前我還在做通訊相關的東西,但是我覺得AI這個東西我也可以學,所以就勇敢地去嘗試,試圖轉行。
畢業後,我進了谷歌雲工作,做的是TensorFlow這個深度學習框架。谷歌把TensorFlow開源出來了,所以我們和開源社區有非常多良好的互動。開源社區是一個神奇的地方,因為參與開源的很多人其實是不賺錢的,大家只是為了開心,為了好玩,在開源社區信息交流非常快,大家也能接觸到很多志同道合的人,所以我特别喜歡開源。後來我轉入到一個非開源的部門,我感覺自己好像和整個技術界脱軌了,我還想要回到開源,于是就加入Hugging Face。
智能分發以後,很多需要十年苦讀才能學習到的技能很輕易地被ChatGPT所賦能了。比如原本寫程式可能得寫個三千小時才能寫得非常好,現在ChatGPT一下子就把我的能力提高了,只要看得懂程式,就可以在自己需要的時候寫出相應的程式。同樣地,只要我有審美就可以畫畫,只要知道什麼是好作品就可以寫小説。如果機器給我生成了一個不好的作品,我就可以調換一下參數,重新生成一個。
我們馬上就會看到ChatGPT對我們工作場合的影響。有時候我們會發現我們的工作重心因為技術的轉變而有所變化,能否積極地擁抱這個變化,我認為是非常重要的。
最早大家對程式員的刻板印象就是木讷,不解風情,每天穿格子衫。後來阿裏巴巴上市了,杭州房價炒高了,程式員賺得比較多,大家就開始羨慕程式員。大家羨慕的真的是程式員在做的事情嗎?其實不是,人們大多只是羨慕程式員獲得了世俗上的成功,但對寫程式這件事的看法并沒有本質變化,還是會覺得這是一件呆板的事,也會覺得程式員到35歲就要轉行了,應該提早布局。
選專業的時候,我本來想選數學,但是家裏所有的親戚長輩都跟我説,學數學有什麼用,出來就是當個老師。我其實非常喜歡數學,但是還是會受到國内這種世俗觀念的影響。到法國之後,我發現法國人好喜歡數學。在法國讀大學前會有一個預科班,這些選擇數學為專業的人都會很自豪地説這件事。法國也出了很多著名的數學家,笛卡爾、費馬、帕斯卡,拉格朗日、泊松、拉普拉斯、柯西,全都是法國人。
這些法國人這麼自豪地説自己是學數學的,于是我就很好奇,他們學數學到底是為了什麼?我發現他們很多人學數學是覺得好玩,喜歡頭腦風暴這個過程。中國人的思考方式偏向于實用主義,在國内可能很多人覺得學數學不是那麼酷,但在巴黎有一百多條街道,還有很多廣場和車站是用數學家的名字命名的。
什麼是潮流?什麼是酷的?這實際上是被時代定義的。如果有一天通過ChatGPT寫程式、搞一些AI應用變成了一個很酷的事情,那我覺得AI行業的發展就沒問題了。這是我比較浪漫主義的想法,我感覺有了生成式AI的能力之後,每個人都可以變成程式員,通過寫程式讓自己的生活工作更高效。前段時間參加中國開源年會的時候,我已經感覺到這樣的苗頭了,很多初中生、小學生已經能用生成式AI做很酷的事情了。
《流浪地球》對我啓發很大。我覺得無論AI怎麼發展,人始終扮演着非常重要的角色,就像之前提到的Perplexity的例子,AI給了我們一些信息,我們也會再把自己的想法反饋給它。
在《流浪地球中》,550W從一個冰冷的自感知/自适應/自組織/可重塑編譯計算核心進化為了一個更高級别的人工智能生命一MOSS。MOSS説"人類的命運取決于人類的選擇"。在一個人與機器共存的社會裏,我們每個人都是變量。堅持開源也許是對人類未來更有意義更有幫助的方式。
如何從技術和產品角度了解大模型原理?
篇幅所限,本文内容僅為課程十分之一
點擊海報,看完整課程!
>