Hugging Face王鐵震：有人的地方就會有江湖，有開發者的地方就會有社區

今天小編分享的教育經驗：Hugging Face王鐵震：有人的地方就會有江湖，有開發者的地方就會有社區，歡迎閲讀。

"開放性平台創造了比封閉式平台高1000倍的價值。只要我們能夠通過開源社區把這個餅做大，即使捕獲這個價值的1%，也可能比獨占未開放產品100%份額的價值更大。"

"我們的轉型取得了巨大的成功，但在當時其實是一項相當大膽的決策。過去并沒有太多開源社區成功轉型為商業公司的案例。這個過程也并非一帆風順。比如，去年年終的時候GPT-3出來了，這個模型特别火，但OpenAI也在那個時候就決定不開源了，這對開源社區來説實際上是一個非常大的打擊。"

"什麼是潮流？什麼是酷的？這實際上是被時代定義的。如果有一天通過ChatGPT寫程式、搞一些AI應用變成了一個很酷的事情，那我覺得AI行業的發展就沒問題了。這是我比較浪漫主義的想法。"Hugging Face工程師王鐵震説。

Hugging Face，AI開源社區的當紅炸子雞，被稱為AI界的GitHub。成立于2016 年，近一年來估值翻了一翻，飙升至45億美元，谷歌、亞馬遜、英偉達、英特爾、Salesforce等科技巨頭紛紛參與投資。

Hugging Face的Transformers庫是最快超100k的GitHub項目；迄今為止社區成員總共分享了超過 423k 個模型公開模型和超過84k 個公開數據集；有超過5萬家組織使用Hugging Face；它不僅開發了Transformers庫（目前最受歡迎的大語言模型庫），也提供了各種構建、部署和訓練機器學習模型的工具和資源……

今天，Hugging Face工程師王鐵震老師做客混沌，帶來課程《開源世界觀：如何用技術浪漫主義實現AI普惠》。為你揭開Hugging Face的神秘面紗，帶你了解開源世界觀與落地實踐。

以下為課程筆記：（篇幅所限，文章内容僅為部分課程内容，請前往混沌APP看完整課程）

授課老師｜王鐵震 Hugging Face工程師

編輯｜混沌商業研究團隊

支持｜混沌前沿課

Hugging Face是誰？

大家可能經常在媒體上看到，最近又有一個有趣的東西在Hugging Face上發布了，但又不太了解我們。

實際上Hugging Face是一個AI開源社區，可以把它理解為AI屆的GitHub。Hugging Face現在的估值達到了45億美元，上面有超過100萬個AI模型和數據集、展示。迄今為止，使用過Hugging Face的組織超過5萬家，迄今為止社區成員總共分享了超過 423k 個模型公開模型和超過84k 個公開數據集。除此之外，Hugging Face還提供大模型領網域生态底層的一些開源資料庫，比如Transformers，這也是GitHub上最快達成star數量10萬裏程碑的開源項目之一。

自2016年起Hugging Face就開始啓動了，最早它是一款面向青少年有趣好玩的聊天機器人應用軟體。我們當時做的還不錯，成功進行了B輪融資。随着Transformer結構的出現，我們也積極擁抱新技術。在2018年，我們參加了NeurIPS dialog competition這個競賽，拿了第一名。随後我們做了一件很不一樣的事，那就是将這個Transformers模型開源了。它大受歡迎，越來越多的模型被大家集成在了這個庫裏。紅線是這個Transform庫的增長曲線，大家可以看到它增長得非常快。

然後我們就遇到一個問題，到底是繼續做原先的聊天機器人，還是要做開源？盡管聊天機器人做得不錯，但我們的幾個創始人心裏有個更大的圖景，就是促進人類高效合作。所以我們決定進行轉型，放棄聊天機器人，轉而致力于建立AI開源社區。

開源社區在我們看來，是非常有價值的。

首先開放性平台創造了比封閉式平台高1000倍的價值。只要我們能夠通過開源社區把這個餅做大，即使捕獲這個價值的1%，也可能比獨占未開放產品100%份額的價值更大。

做一個開源社區，其實也給我們很多信息上的優勢。如果你悶頭做自己的產品，可能就忘記了外面的世界發生了什麼。作為創業者，其實最重要的是要積極地去聽取開源社會的開源信息，跟大家做更多的交流。不是説現在就去想一個十年之後的計劃，可能我們一年之前都沒有想到ChatGPT和生成式AI會有這麼火。做開源社區，收集到更多聲音，一起去推動行業的前進，其實是更有價值的。

另外，開源的透明也會帶來好處。很多程式員并不希望自己的作品被用于AI訓練，開源數據集可以讓創作者清楚地了解數據的使用情況。通過查看網站，他們可以知悉是否有人在使用其代碼進行訓練，并提出聲明要求移除代碼，開源賦予了其在互聯網上被遺忘的權利。

如今看來這個轉型的決定取得了巨大的成功，但在當時其實是一項相當大膽的決策，因為過去并沒有太多開源社區成功轉型為商業公司的案例。這個過程也并非一帆風順。

比如，去年年終的時候GPT-3出來了，這個模型特别火，但OpenAI也在那個時候就決定不開源了，這對開源社區來説實際上是一個非常大的打擊。所以我們也與幾位合作夥伴共同推動了BigScience項目，我們發布了BLOOM這個最早在100B以上、支持多語言的開源模型。在商業授權方面，BLOOM幾乎沒有任何限制。它不僅授人以魚，更是授人以漁。我們走過的所有彎路、積累的所有經驗都公開到開源社區之中，為後來者提供了一個示範。

篇幅所限，本文内容僅為課程十分之一

點擊海報，看完整課程！

開源社區的商業模式與組織機制

1）Hugging Face創造了哪些有意思的活動與產品

Hugging Face是一個從社區中成長出來的公司，社區既是我們最重要的積澱，也是我們最大的壁壘。那我們社區的底色是什麼呢？實際上不是賺錢，是Have fun，大家都是因為興趣加入進來的。

你可能沒有Machine Learning的學位，也沒讀過這個領網域的書籍或論文，但技術發展至今，實際上并沒有把這一領網域的門檻拉高，反而将門檻降低了。我有個朋友對我所從事的事業一無所知，覺得大模型玄而又玄，但我給他分享了一個開源庫之後，他只需點點滑鼠就可以創建出他想要的圖文。一個月之後，他已經成為那個領網域的專家了，雖然他不會寫代碼，但是他會畫圖，也知道自己想要的圖是什麼樣子的。我有給他付工資嗎？沒有。他在上面有獲得什麼實際的利益嗎？也沒有，但這個東西好玩，它滿足了他從小以來一直都有的畫家夢想。

我還向一個媒體朋友科普了開源社區，他在了解并使用之後告訴我，他現在感覺一天二十四小時根本不夠用，每天都有太多事情在開源社區發生。開源實際上将大家從不明真相的吃瓜群眾變成了事件的參與者，因為所有的代碼和讨論都是公開的，任何人都可以溯源了解事情的始末，與KOL進行互動，甚至以這種方式自己逐漸成為KOL。

我相信很少有公司員工下班之後還願意查看内部溝通軟體，但我們公司的員工每天刷公司的Slack刷得停不下來，就把它當成Instagram或者小紅書來刷，甚至覺得時間不夠用。為什麼呢？因為做開源，能夠把他的興趣和工作結合在一起。如果你讓我去做别的事情，我可能個人興趣也是天天去看AI界發生了什麼，現在還有人付錢讓我去看AI界發生了什麼，我覺得非常開心。

所以這就是Have Fun。無論是對社區的使用者，還是于社區本身而言，Have Fun都是一件極其重要的事情，樂趣和工作同時存在。

正是由于大家在工作中能獲得樂趣，每個人都投入了很多精力，公司的生态系統也生長得非常迅速。我們去年是以Transformer為基礎的幾個庫，到今年已經形成了一個完善的生态系統。基于Transformer結構的大模型庫，Diffusers是圖文生成領網域的基礎庫，解決模型安全問題的庫Safetensors等等，都已經成為整個社區非常重要的基礎庫。

除了自己玩得開心，我們也舉辦了很多活動希望吸引更多人參與其中。比如在谷歌的支持下，我們獲得了免費的TPUV3資源，讓大家發揮自己的創意進行模型訓練。我們還在國内開辦了一個Diffusion model class分享擴散模型的内容，還把課程内容翻譯成了中文出版成書。

2）Hugging Face的組織架構

我們的組織中絕大多數成員是工程師，超過90%。與國内的一些社區不同，我們沒有專職運營人員，每個工程師都參與運營。因為我們的根基就是社區，大家都是從社區中成長起來的，也非常懂社區運作之道，知道大家是怎麼從小白成為社區的貢獻者，再成為社區的創造者。我記得剛進公司的時候，有一個開發者寫了三行代碼，本來只是随手做了一些事情，結果收到了許多祝賀，讓他感到非常開心，那一瞬間甚至以為自己得了諾獎。這種開源心态讓大家覺得，來開源社區不僅是一件有趣的事，而且能夠找到家的感覺。

3）開源社區的合作與決策機制

我們公司采用分布式的工作和決策模式，是非常有意思的。在工作方式上，所有員工都是遠程辦公，不需要去辦公室，因此我們會通過郵件和Slack進行異步溝通。并且很多溝通并不是在公司系統内部完成的，而是在公開的渠道，比如GitHub上進行。

另外一點也非常重要，我們的決策也是分布式的。我剛進公司的時候，因為之前在大公司待了很多年，覺得要先師出有名，先讓老板批準，于是我寫了六頁的一個計劃書，説我要做一個什麼東西。老板看了之後説，你寫得非常好，下次不要寫了。只要跟我説你做了什麼，有很多事情你可以自己決定，你不需要等我。

這也是為什麼我們幾個人就可以做非常多的活動，第一我們不開會，第二個我們每個人都可以做決定。很多事情老板都鼓勵大家自行決定，無需進行大型的會議讨論或是等待來自總部的批準。在這裏工作，你會有很強的參與感，而不會覺得自己只是大公司一枚不起眼的螺絲釘。另外，我們公司内部沒有明确的部門間的界限，每個人都可以提出自己的想法，大家一起商量并通過合作加以實現。

我們是一個不到二百多人的小公司，等我們有一萬人的時候，我相信也不會是這樣的治理方式，當然這是另外一個問題，要不要成長到有有一萬人的公司？也可能我們覺得小而美挺好的。

我們現在的公司内部其實并沒有像OKR這樣的内部治理模式，目前還處于一個比較有趣的階段，員工的薪水可能相對較低，但由于公司自由度較高，鼓勵大家不斷進行探索，所以員工更願意留在這裏發揮主觀能動性。在招聘方面，我們公司其實比較嚴格，入職者大多是在開源社區有一定影響力的人。我們并不是以傳統的算法作為篩選人才的标準，而是對候選人在行業的号召力和過去的數字足迹進行考察，這樣就确保了新進人員的價值觀與公司一致，并且在很大程度上能夠在公司内產生積極影響。

國内公司傳統的發展模式是大公司壟斷所有人才，内部事務對外不透明。相比之下，開源社區的模式更适合小公司，公司内部的事務高度透明，大家可以通過參與開源項目與CEO直接對話。企業間的合作也變得更加簡單直接，無需籤署各種繁瑣的協定，在開源社區提出合作想法即可。很多公司可能也想要追求類似我們公司的發展模式，但我們也是在天時地利人和的條件之下才實現了這一點。我猜測，這種更透明、更易于互相連接的企業模式可能是未來發展的一個明确方向，而這也是得益于開源領網域的不斷發展。

4）Hugging Face作為開源社區，如何在商業上盈利？

第一，咨詢服務，提供咨詢服務是開源項目最常見的盈利模式。企業在使用我們的開源庫時，遇到問題會自然而然地想要咨詢我們。我們在Slack上與用户交流，解答問題，提供較為簡單的咨詢服務。

第二，硬體服務，我們通過HPP（Hardware Partner Program）提供硬體服務。芯片公司希望将他們的芯片銷售出去，但由于雲服務商主要支持NVIDIA GPU，其他廠商的產品在軟體上很難适配。我們與硬體廠商合作，将下層的NVIDIA GPU接口替換為其他廠商的接口，就用户的使用而言并沒有任何差别，只需要支持Transformer就可以，從而使得硬體廠商更易銷售他們的產品。

第三，SaaS服務，比如AutoTrain，就是一個無代碼的模型訓練服務。用户只需上傳模型并提供訓練需求，剩下的工作AutoTrain會自行完成。訓練完成後，用户通過Inference endpoints将模型部署在Hugging Face上之後就可以直接調用它進行工作。

5）如何做一個開源社區

第一，如果要做一個開源的項目，最好第一天就要想着走向世界。開源這件事很多都是在GitHub、Hugging Face這樣的全球化社區完成的，要從一開始就設想這個開源項目是要服務全人類的，比如使用英文進行項目配置，這樣能更好地與全球的開發者進行互動。

第二，快速驗證可行性。很多開源項目都是在公司從上到下的推動下進行的，一開始就獲得了巨大的流量，但是流量并不是開源項目成功的唯一要素，做開源最重要的是不停地進行嘗試，找到特定生态位上的獨特價值，快速地失敗，快速地總結。

第三，積極吸取社區中的各種反饋。無論是正向意見還是負面評價，都應當積極對待。在社區中創建一種家的氛圍，才能夠讓社區成員在不斷的參與互動中共同成長。

第四，專注于特定的任務。很多國内的公司都在追求一個無所不能、包容萬象的東西，而開源世界所期待的是一個個具有特定價值的小項目，并通過堆砌多個項目實現更大的目标。

第五，關注開發者的體驗。與關注用户體驗相同，開源社區的特殊性決定了其還要關注開發者在其中的體驗和感受，以确保社區的活力和項目的質量。

篇幅所限，本文内容僅為課程十分之一

點擊海報，看完整課程！

1）大模型創業未來還有沒有機會？

第一，最重要的是信念。大家説的成本、使用場景難易度等問題，我覺得都會得到解決，就像一年前的我們絕對想不到今天的世界是這個樣子。現在大家可能覺得開源還差點勁，可能明年開源模型就真的有GPT3.5、4的水平。只有擁有堅定的信念，你才會有勇氣全力以赴。如果只關注眼前的不足，你可能難以下決心去行動。但等你明白這一點時，機會可能已經錯過了。

第二，選擇比努力更重要。在新技術的發展方向中，也許你選擇做了一個非常輕量級的應用，但是卻遠不如大平台它們已有的體量，就很容易被它們的推進力吃掉。2015年、2016年的時候，安卓剛剛推出來，手機這個賽道非常火。我有一個同學做了一個打開手電筒的應用，還做了一個一鍵關閉WIFI的應用，最高一個月可能賺了四五萬美元，但是後來這些東西全部變成了系統自帶的功能，瞬間他就變得很沮喪，覺得如果當時做了一點别的東西，現在可能已經有了更好地積累。

那選擇什麼呢？要麼是降本，要麼是增效。我覺得在國内場景下增效可能比降本更重要，因為上一波AI其實做得非常成功，降本的空間微乎其微，所以這條路走不通的話，不如想象增效，有哪些事情是以前做不了的，或是有哪些事情可以做得比以前更好的。比如説之前提到的代碼生成模型，有數據顯示這個模型可以将工程師的工作效率提高20%到30%。我們的目标不僅是要想提高員工和企業的效率，更重要的是确保每個使用這項技術的人也能感到開心。

第三，走向高度的定制化。在未來，我認為代碼生成能力将會促使世界變為需求驅動。我需要什麼樣的軟體，就告訴ChatGPT，讓它幫忙生成一個軟體，或者説讓ChatGPT生成一個簡單的腳本，可以滿足大家具體的需求，解決各自的問題。我覺得這種特定場景下所形成的定制化信息将會越來越多。

第四，智能的分發。工業革命解決了商品的分發問題，而信息革命帶來的是信息的分發。信息分發與智能分發是有一定差别的，我們看到一本書，并不是就完全理解了書的意思。以心理咨詢行業為例，那麼多的教科書、那麼多的課程，我們可能需要花費三五年的時間把他們全都學會，再形成智能去幫人解決心理問題，但是一旦訓練了一個大模型，這個模型就可以進行心理問答，能夠直接幫人回答心理上的一些咨詢問題，這就可以快速地讓更多的人體會到過去高階專家才能帶來的服務，并且這個價格會降得很低很低。

2）AI Agent機會

小時候用計算機，經常聽到比爾蓋茨的一個説法，他説，我希望在未來每個人的桌子上都有一台Windows。這個夢想其實已經實現了，他最近又有一個判斷，他説，AI Agent會改變你使用電腦的方式。我深受啓發，我覺得AI會帶來一種巨大的變革。

在《流浪地球》中有個片段，就是説月球基地上其實有很多的工程器械，唯獨缺少一個電腦主機對它們進行控制。後來他們從地球上帶來了一台新的計算機550C，計算機接入網絡之後首先去發現周圍有哪些工具，有哪些器械，然後和這些器械建立了一個聯結，并且學會了使用這些器械的方法，再去對它們進行統一調度。這其實比較像我所向往的AI的最終模式，AI Agent作為大模型的延伸，作為大模型的手和腳，大概要經歷使用工具、選擇工具、發現工具、創造工具四個階段。

非常早期的時候，我們做了一個Transformer Agent，它從用户那裏拿到一個指令之後，會從我們給它提供的一些給定的工具中進行選擇，再生成一段代碼來調用這個工具，最後完成任務。再來看看現在的產品，以Perplity.AI為例，我同時問了它兩個問題，一是Hugging Face是做什麼的，二是它什麼時候發布了Diffusers這個庫。它就會使用工具拆解我的問題，然後從數據庫裏找到16條資料，最後從資料中提煉出一個最終回答。盡管我發現它給出了錯誤的回答，但是我可以給它一個反饋，這就是所謂的人在回路。

3）範式變革：AI vs 互聯網，商業模式的重構機會

未來互聯網盈利的範式到底是什麼？在過去，像谷歌這樣的搜索引擎其實是在賣廣告，你搜索一個關鍵字，它就會給你推薦一些相關的產品。淘寶、抖音也是類似的模式。但這真的就是未來最合适的模式嗎？

現在為什麼會有很多人願意使用New Bing，或者Perplexity進行搜索，因為用它搜索更高效，如果想找一個什麼東西，不需要提供很精确的關鍵字，它們就會給我一段需要閲讀很多文章才能總結出來的答案。如果有一天它們走向廣告模式，我問它一個東西，它就給我回答一個廣告，那我就不會用它了，我還不如用搜索引擎。這種廣告模式實際上跟生產力是反着來的。現在大家對大模型這麼感興趣，其實也是因為我們相信它可以帶來更高的生產力。我認為在未來我更願意為高生產力付費，比如有一個知道我所有偏好的Agent，可以在我想要買東西的時候，在不同的平台上找到我想要的東西，然後幫我計算好折扣模式，并且對比出不同平台上的價格。

4）多模态的機會

無論是Perplexity還是大模型，它們都是一個文字進文字出的單模态模型，而ChatGPT-4V最近已經可以做到看見、聽見、説出。ChatGPT-4V的官方Demo講述的就是在修車場景中，如果沒有多模态模型，很難向ChatGPT描述清楚車到底有什麼問題。有了多模态的理解，把圖片傳給它，它就可以告訴我們車哪裏有問題，應該用什麼工具去修。這對打開其在生活中的使用場景有很大的幫助。

我覺得這個領網域會衍生出非常多的機會，當然做一個多模态模型的成本是遠遠高于做一個普通大模型的，我們也希望能夠有更多人參與到開源社區之中，一起推動這個領網域的發展。

多模态生成也是一個非常有意思的話題。基于Diffusers這個數據庫，通過Stable Diffusion的這個模型可以生成出非常好的宇航員的照片，包括面罩的反光等都已經能夠做到很好的效果。最近也看到很多視頻生成、音頻生成，我相信多模态生成技術有非常多的應用機會。

有人的地方就會有江湖，有開發者的地方就會有社區。圍繞着剛才所説的Stable Diffusion這種文生圖的多模态生成模型，其實也慢慢就形成了一個非常有名的社區，叫CIVITAI，很多人在這上面交流自己做的文生圖的模型。和小紅書一樣，它也是一個社交平台，只不過大家交流的不是照片或者感悟，而是進行模型的交流，智能的交流。甚至説智能分發普及之後，也許大家在社交媒體上點擊一下對方，看到的并不是對方生成的内容，而會有一個活生生的人在那裏等着與你進行互動。

5）從線下到線上再回歸現實

我一開始看到AI文生圖的圖片時，覺得非常驚豔，但是看多了CIVITAI上這些漂亮的圖片之後，就發現它們都缺少一種真實感、沉重感。這些圖片并不是我想要的，我現在反而更喜歡看我五歲的寶寶畫的畫，因為是他用自己的理解和自己的感受在作畫。

現在大家都在講，把這個搞成VR，那個搞成VR，好像加上VR就會變得有趣且酷，從而獲得很多流量。也許在未來大家就開始説，把VR摘了吧，現實世界更有樂趣一些。

在我小時候，有人做了一個實驗，把一堆人關在房子裏，一整天都不能出門，必須使用互聯網完成生活的一切操作。ChatGPT剛出來的時候我也做過類似的事情，就是強迫自己過一個ChatGPT Day，在那一天我必須通過ChatGPT完成所有的事情，包括寫的郵件、回復的消息。那天我其實過得很痛苦，我想有一天我會懷念今天這樣完全不用生成式AI就能過得很好的日子。

6）AI與大模型可能帶來的風險

第一，偏見。比如做文生圖的時候，想生成一個科學家的圖片，那麼模型就會從數據庫中找到與科學家相關的東西進行生成。你去看包括Stable Diffusion的模型數據，大多數與科學家相關的圖片都是以白人男性科學家為主體，因此它生成的圖片也大多是白人男性的形象。

我們會發現，由于數據的局限性，大模型在很多時候都會有一些偏見。因此，通過開源的方式，可以讓每個人都可以檢查數據集的内容以及與自己的關系，從而對數據集進行反饋，并進一步調整生成式AI模型的輸出。

第二，幻覺。比如説問ChatGPT某個人是誰，它的回答其實會出現很多錯誤。為什麼會出現這樣的問題？如果把大模型比作人，就容易理解了。我們疲憊或者迷糊的時候，也比較容易説錯話，大模型也是一樣，甚至沒有我們人類聰明，偶爾説錯也是可以理解的。有的時候我們是希望大模型有一些幻覺的，否則它只會陳述事實，就永遠無法想象一個架空的宇宙，永遠不能進行小説創作。

因此，當大家用大模型做一些產品的時候，可以考慮如何利用幻覺或避免幻覺。比如在教育領網域，幻覺問題實際上是非常嚴重的。訓練模型可能學了很多東西，但它是一個閉卷考試，所以做題過程中可能會出錯。而RAG是一個開卷考試，大模型會搜索出各種相關的參考資料，找到對應的确鑿的證據後再進行回答。因此，有時候幻覺可以通過RAG去避免。

由于大模型創作存在IP風險，因此很多企業不太敢使用生成式AI去做一些事情，擔心生成的東西與數據庫中沒有獲得創作者許可的東西長得太像了，從而會有法律風險。Microsoft Copilot和Adobe在軟體的使用協定中加了一段説明，説如果用户使用它們的軟體生成了某種東西，并且具有法律風險的話，它們來扛這個責任。這樣的做法就能避免大家在很多場景中使用生成式AI模型的顧慮。

我之前在西電讀的應用物理，後來去法國的一個學校進行交換學習。在法國讀書的經歷對我影響蠻大的。這個法國學校實際上是一個通才培養的學校，學制三年，前兩年半什麼都要學，到了最後半年才開始選專業。

這段經歷給了我一種勇氣，我覺得轉行做另一件事不是那麼可怕了，好像什麼東西我都懂一點。我也敢于邁出第一步，去嘗試、去學習。五六年前我還在做通訊相關的東西，但是我覺得AI這個東西我也可以學，所以就勇敢地去嘗試，試圖轉行。

畢業後，我進了谷歌雲工作，做的是TensorFlow這個深度學習框架。谷歌把TensorFlow開源出來了，所以我們和開源社區有非常多良好的互動。開源社區是一個神奇的地方，因為參與開源的很多人其實是不賺錢的，大家只是為了開心，為了好玩，在開源社區信息交流非常快，大家也能接觸到很多志同道合的人，所以我特别喜歡開源。後來我轉入到一個非開源的部門，我感覺自己好像和整個技術界脱軌了，我還想要回到開源，于是就加入Hugging Face。

智能分發以後，很多需要十年苦讀才能學習到的技能很輕易地被ChatGPT所賦能了。比如原本寫程式可能得寫個三千小時才能寫得非常好，現在ChatGPT一下子就把我的能力提高了，只要看得懂程式，就可以在自己需要的時候寫出相應的程式。同樣地，只要我有審美就可以畫畫，只要知道什麼是好作品就可以寫小説。如果機器給我生成了一個不好的作品，我就可以調換一下參數，重新生成一個。

我們馬上就會看到ChatGPT對我們工作場合的影響。有時候我們會發現我們的工作重心因為技術的轉變而有所變化，能否積極地擁抱這個變化，我認為是非常重要的。

最早大家對程式員的刻板印象就是木讷，不解風情，每天穿格子衫。後來阿裏巴巴上市了，杭州房價炒高了，程式員賺得比較多，大家就開始羨慕程式員。大家羨慕的真的是程式員在做的事情嗎？其實不是，人們大多只是羨慕程式員獲得了世俗上的成功，但對寫程式這件事的看法并沒有本質變化，還是會覺得這是一件呆板的事，也會覺得程式員到35歲就要轉行了，應該提早布局。

選專業的時候，我本來想選數學，但是家裏所有的親戚長輩都跟我説，學數學有什麼用，出來就是當個老師。我其實非常喜歡數學，但是還是會受到國内這種世俗觀念的影響。到法國之後，我發現法國人好喜歡數學。在法國讀大學前會有一個預科班，這些選擇數學為專業的人都會很自豪地説這件事。法國也出了很多著名的數學家，笛卡爾、費馬、帕斯卡，拉格朗日、泊松、拉普拉斯、柯西，全都是法國人。

這些法國人這麼自豪地説自己是學數學的，于是我就很好奇，他們學數學到底是為了什麼？我發現他們很多人學數學是覺得好玩，喜歡頭腦風暴這個過程。中國人的思考方式偏向于實用主義，在國内可能很多人覺得學數學不是那麼酷，但在巴黎有一百多條街道，還有很多廣場和車站是用數學家的名字命名的。

什麼是潮流？什麼是酷的？這實際上是被時代定義的。如果有一天通過ChatGPT寫程式、搞一些AI應用變成了一個很酷的事情，那我覺得AI行業的發展就沒問題了。這是我比較浪漫主義的想法，我感覺有了生成式AI的能力之後，每個人都可以變成程式員，通過寫程式讓自己的生活工作更高效。前段時間參加中國開源年會的時候，我已經感覺到這樣的苗頭了，很多初中生、小學生已經能用生成式AI做很酷的事情了。

《流浪地球》對我啓發很大。我覺得無論AI怎麼發展，人始終扮演着非常重要的角色，就像之前提到的Perplexity的例子，AI給了我們一些信息，我們也會再把自己的想法反饋給它。

在《流浪地球中》，550W從一個冰冷的自感知/自适應/自組織/可重塑編譯計算核心進化為了一個更高級别的人工智能生命一MOSS。MOSS説"人類的命運取決于人類的選擇"。在一個人與機器共存的社會裏，我們每個人都是變量。堅持開源也許是對人類未來更有意義更有幫助的方式。

如何從技術和產品角度了解大模型原理？

篇幅所限，本文内容僅為課程十分之一

點擊海報，看完整課程！