今天小編分享的互聯網經驗:市值不足上市時的2%,矽谷明星基因檢測公司23 and me瀕臨破產,歡迎閱讀。
文 | 矽谷101
曾經估值60億美元的基因檢測巨頭23andMe正在加速墜落。這家2006年成立、由谷歌創始人謝爾蓋·布林前妻Anne Wojcicki創辦的公司,曾是矽谷最耀眼的明星之一。11月12日,23andMe宣布裁員40%、關閉藥物研發部門,這已是自2023年以來的第五輪裁員,員工規模從800人驟降至300人。财報顯示,公司第三季度收入同比下滑12%,淨虧損5900萬美元。
第一代公司如23andMe采用互聯網思維,通過明星效應和低價策略吸引用戶,用基因大數據講故事來獲取融資。但這種模式存在根本性缺陷:既無法像互聯網產品那樣實現網絡效應,又缺乏真正的醫療價值。以23andMe為例,其產品可能只能檢測某種疾病數百個已知突變基因點中的幾個,這種"廣而不精"的方法難以滿足臨床需求。
本期《矽谷101》節目我們邀請到了N1 Life聯合創始人兼CEO臧曉羽(Janice Zang)博士。Janice認為,基因檢測行業正經歷一輪新舊交替的路徑轉換。她深度分析了23 and me的衰落與垂直基因檢測公司的崛起,他們或專攻腸道微生物檢測,或聚焦特定癌症基因檢測。這種專業化、精細化的趨勢,意味着整個行業正在告别"廣撒網"、大而全的檢測模式。
以下是部分訪談精選:
01 從唾液測基因到數據洩露:23andMe的商業模式為何失敗
泓君:23andMe的其中一個聯合創始人是谷歌創始人Sergey Brin(謝爾蓋·布林)的前妻,能分析下這家明星公司如何隕落的嗎?
Janice:這是一家很有代表性的矽谷公司,總部在Mountain View(山景城)。創始人Anne Wojcicki不僅是Sergey的前妻,她姐姐還是YouTube前CEO,雖然現在已經過世,但整個家族在科技圈都很有影響力。
公司創立時正值2000-2010年人類全基因組測序計劃取得重大進展,大家看到Human Genome Project(人類基因組計劃)在醫療、健康等各方面理解人體的巨大潛力。Anne本人畢業于耶魯大學生物專業,基于專業背景和行業前景創立了公司。
當時矽谷投資氛圍活躍,公司一成立就獲得包括Sergey Brin在内的大量投資,共完成26輪融資,總額達十幾億美金。但現在急轉直下,華爾街時報估計賬上資金只能維持到2025年。這家公司做了一件突破性的事情:将原本昂貴、門檻高、離普通人生活很遠的技術帶入日常生活,把一次測序的價格降到99美金。它是第一個降價并直接面向消費者的公司。此前的基因檢測公司如LabCorp、Natera等都是面向企業的模式,與醫院合作。
泓君:為什麼能把價格降下來?面向消費者的檢測和面向企業的檢測有什麼區别?
Janice:這與技術進步有關。基因測序儀的技術,比如說Illumina這家公司就是行業标杆。從Illumina最重要的二代測序技術(Next Generation Sequencing,NGS)出現後,測序速度和通量都提高了。不需要一個樣本測很多天,可以收集很多樣本一起測,整體成本就降下來了。23andMe早期就是收集大量消費者樣本,集中到中央實驗室處理。
就像醫院驗血一樣有開機費,要收集所有人的樣本一起做實驗,這樣設備運行費用和耗材使用就能平均到每個樣本上。設備本身是硬體,但每次做基因測序都需要多個步驟:先提取DNA,需要提取試劑;然後要擴增,因為含量很低,這過程也需要試劑;最後才是測序。整個過程中使用了很多試劑和耗材,這些都是消耗品,是每個樣本的固定成本。
測序過程中PCR(聚合酶鏈式反應)擴增就要用很多試劑。耗材包括兩類:一類是試劑,如dNTP的混合物(四種核苷酸),要求高純度、低溫保存,還需要引物和酶,這些都要從試劑生產商采購,保存條件苛刻。另一類是實驗耗材,如Eppendorf管、移液槍槍頭等,要求無菌且一次性使用。一個半小時的實驗可能用掉幾百個槍頭。
在自動化之前,這些都是人工操作,人工費用很高。23andMe通過自動化設備降低了人工成本。此外每次基因測序都會產生海量數據。從創立到現在他們有1000萬人的樣本,這些數據的處理和存儲費用也很高,需要大團隊和完整的基礎設施。
泓君:那它為什麼急轉直下了呢?
Janice:這個問題很多人都問過。CEO Anne的說法是因為行業不景氣,大家對檢測的需求降低。但很多人反駁說,雖然行業不景氣,其他公司都能盈利。如果看那些頭部基因檢測公司,包括前面提到的Illumina,還有國内的華大基因,以及Roche(羅氏)的檢測公司等,大家業績都比較好。
從技術角度講,這些基因檢測公司并不是發明設備的公司,大家用的測序儀差不多,區别在于樣本來源、數據收集和分析手段、數據庫等這些方面。最重要的是商業模式,23andMe從一開始就走面向消費者的路線,這可能是問題的根本原因。
醫療場景和消費場景很不一樣。在美國醫院做基因檢測是醫生開處方,由保險支付,費用比較高但患者感受不到。消費產品必須用戶自己支付,所以必須降價。23andMe早期在設備和自動化流程上确實做了很多創新突破,才能做到99美金的價格,但從财報看至今沒有盈利。
泓君:大家為什麼會有檢測自己基因的需求和動力?在醫院我能理解,比如新生兒要檢測基因缺陷,或者有醫療需求的病人需要尋找靶點。但消費者直接去做基因檢測的動力是什麼?我知道他們最開始在一些名人派對上讓大家去吐唾沫,通過明星效應帶動,但普通人檢測的需求是什麼?
Janice:更多是滿足好奇心或獵奇心理。23andMe其實很像互聯網公司,利用創始人家庭和投資人的光環,通過名人宣傳產品,普通人就會效仿。但它并不是第一個,美國和德國早期有兩家公司,比如Ancestry,他們主要做族譜,讓人探查祖先來源。因為美國是民族大熔爐,大家會好奇自己的種族構成,他們就利用這種好奇心理,用更科學的手段滿足需求。大家看到只要100美金就覺得可以接受。
泓君:你有做過基因檢測嗎?
Janice:我沒做過23andMe這類消費級檢測,可能因為我對自己的家族史很清楚。但在醫院做過一些醫療需求的檢測,比如女性生育相關的檢查,檢測DNA或染色體缺陷,還有癌症早篩等。這是個很重要的區别:基因檢測是作為消費產品還是醫療產品。作為消費產品不是剛需,但醫療需求的檢測是必要的。
泓君:消費者做一次基因檢測就滿足終身需求了,因為DNA是不變的,對吧?
Janice:大家認為這是個很大的問題。23andMe創始人最早講故事時說美國有幾億人口,每人做一次也是天文數字。他們還想把數據和疾病風險因素關聯起來。但實際產品并沒有完成這件事。比如某種疾病可能有幾百個已知突變基因點,但在23andMe的產品裡可能只能測其中的幾個而已。因為不是純醫療產品,沒有能力把所有基因都檢測一遍。
泓君:所以更像是一個玩具,不是特别專業的事情。我看現在很多基因檢測公司,比如SelfDecode聲稱他們的基因檢測比23andMe的數據範圍深100倍。
Janice:對,現在新一代公司更專注垂直領網域,比如專門測腸道微生物的基因檢測,或專門測某個癌症相關的大腸癌基因檢測。他們把這個做得很垂直,而且能利用很多數據庫。但23andMe提倡測所有基因,顯得有點業餘。
泓君:23andMe給我的印象是在跟資本市場講故事:我們不是靠賣基因檢測賺錢,而是靠DNA數據庫創造價值。像互聯網搜索模式,提供低價甚至免費服務,通過數據賺錢。但具體也沒玩出來,反而因為這個模式出了問題。2023年洩露了690萬客戶敏感信息,陷入官司還要支付3000萬美元和解金。這徹底摧毀了消費者對公司的信任。
Janice:确實,他們每輪融資都在講數據的故事。我們這裡的投資人也常說這家公司最值錢的是數據。但問題是這些數據怎麼變現?理論上數據是不能随便商用的,雖然23andMe聲稱80%的用戶同意數據用于研究或其他用途。
除了個人信息,還包括生物數據。在80、90年代可能感覺不到它的重要性,但現在非常重要。23andMe被黑客攻擊後,大家開始思考黑客為什麼要竊取這種數據。
第一,可以賣給保險公司,通過這些信息看到每個人的患病風險。如果投保人後來真的患病,保險公司可能拒絕理賠,因為這是自帶的疾病而不是突發情況。重疾險一般只保不在預期裡的情況。保險公司會讓你填既往病史和家族遺傳風險,比如高血壓、高血脂、心髒病等,你可能當時不知道,但你的家族裡有這個信息。
第二,還有生物識别(biometric)相關的風險。現在很多都是生物識别,比如指紋識别、虹膜識别。有些電影裡顯示未來可能有基因相關的識别,這個更準确,因為指紋可以用膠帶復制,但基因信息現在認為是無法復制的。如果有人能復制基因信息,就可能盜取很多東西。
第三,還有一些商業價值,很多醫藥公司用這些基因數據和臨床數據來幫助研發。如果數據來源合法,這是好事,可以加速藥物研發進程。
最後,但這些數據管理很嚴格,比如中國人在國内測的數據就不允許到國外去。23andMe現在手裡有幾千萬人的唾液樣本,這些生物樣本如果被竊取也很危險。就像國内之前有人把醫院的血樣偷偷賣給國外公司,最終因危害國家安全被重判。
泓君:你覺得除了23andMe,像Ancestry、MyHeritage這些老牌基因檢測公司是否也面臨同樣的挑戰?
Janice:行業帶來的挑戰和用戶增長挑戰是普遍存在的,但Ancestry現在比23andMe更健康。因為Ancestry本身是關注追溯祖先和家族歷史的,早期就積累了對這方面感興趣的用戶。現在它的數據庫比23andMe還大,可能是兩倍。2015年收入就突破10億美元,其中8億是會員訂閱收入。會員訂閱能帶來重復付費,這是23andMe一直無法跨越的門檻。
02 從泛基因檢測到癌症篩查:新一代公司轉向專精細分
泓君:在我們讨論新舊基因檢測公司之前,我想先分享一下為什麼會想到這個選題。年初我讀了一本在生物醫學圈非常有名的書《超越百歲》,書中提到了三代醫療的概念,即醫學 1.0、2.0、3.0。
醫學 1.0 以希波克拉底為代表,主要依靠直接觀察得出結論。比如早期發現醫生做完屍檢後去接生,產婦死亡率會非常高。當時只能觀察到這種現象,但不明白原因,甚至可能走向迷信的方向。直到發現了細菌,才知道檢測完屍體要洗手才能接生。這個過程标志着醫學從 1.0 向 2.0 的過渡,而青黴素的發明則是醫學 2.0 真正的變革者。
在醫學 2.0 時代,人類取得了很多進步,比如通過疫苗幾乎消滅了小兒麻痹症,肺結核也可以治療了。但整體來說,醫學 2.0 在癌症等長期疾病的治療上表現還不夠理想,更多是在幫助人延緩死亡。
最近作者提出了醫學 3.0 的理論,強調維持壽命和生活質量。我們可以通過運動、營養飲食來改變生活習慣達到這個目标。書中講到四大"騎士"類疾病:心髒病、癌症、糖尿病和神經退行性疾病(如阿茲海默症),這些是人類死亡的主要原因。
讓我關注的是,書中所有預測和數據都不是憑空而來,而是基于具體的健康指标。比如講到心髒病時,提出了 ApoB ,發現它比我們常規體檢查的壞膽固醇與心血管疾病的相關性更高,更有預測價值。但目前醫院常規體檢并不包含這些指标。
因為矽谷在健康養生、抗衰領網域一直走在前沿,所以我查到了一些公司,比如 InsideTracker 這樣的新基因檢測公司是可以檢測 ApoB 的。在查資料過程中發現,基于大家對細分市場、抗衰、長壽的需求,整個矽谷的基因檢測領網域正在全面爆發,出現了很多新公司。
Janice:是的,從 1.0 到 2.0 确實是一種進步。早期大家都是經驗科學,因為那時獲取數據的手段可能就是用雙眼觀察,然後做一些感官上的記錄。到了後來有了更多手段,比如剛才提到的心血管疾病相關指标,在幾十年前(decade)現代醫學發展後,我們可以通過抽血檢查血液裡的蛋白質、脂質等生物分子,通過它們的含量與疾病建立聯系。
現在我們提到的 ApoB 是一個代表,我們把它的表達量與疾病關聯起來。這說明我們一直在用新產生的數據類型與人體實際表現出的疾病做關聯,在不斷學習這個規律中,我們可以總結出什麼樣的基因可能導向什麼樣的疾病。從這個角度看,真正在發展的是檢測技術和科學觀察的手段。
泓君:23andMe 是 2006 年建立的,已經快 18 年了,整個行業已經變化了好幾輪。你能講講新一代的這些公司有什麼特征嗎?
Janice:現在更新的公司我覺得有兩個特點:
一個是有的基因測序公司開發了自己的測序技術,有更好更高效的測試方法,這是第一個特點。比如灣區另一家公司 10X Genomics,非常知名,一開始融資就過億美金。它成立于 2012 年,比 23andMe 晚,但有革命性的 DNA 測序技術,可以加快整個基因組的測序,而且收入增長特别快。
10X Genomics 有兩種重要技術:一個是測試 DNA 短序列的 linked reads,另一個是對單細胞 RNA 進行測序的技術。這些技術聽起來更高端復雜,并不是直接與某種疾病挂鉤,而是可以做各種測序。應用場景非常廣,可以和很多科研實驗室、企業合作。它每測一次直接收費,是 service-based 的模式,加上試劑耗材和設備的銷售,商業模式與直接面向消費者的互聯網產品很不一樣,市場規模也更大。
泓君:聽起來它是在做這些前端基因檢測公司的上遊供應商。你剛剛講到這裡,我突然想到一個問題:我們知道整個互聯網的本質是壟斷,它建立起的網絡效應會讓用戶越多,最終吞噬整個市場。你覺得在基因檢測市場,未來會是眾多垂直領網域百花齊放的格局,還是會更加集中化?
Janice:這個問題要從基因檢測行業裡每一類公司的角色說起。
最底層做基因檢測首先要有測序儀,這些測序儀大部分公司現在用的都是 Illumina 的設備,确實形成了很集中的效果。這種壟斷是多年積累的結果,最早期是技術專利的壟斷。
Illumina 主要有兩個非常重要的專利:一個是通過收購 Solexa 這家公司獲得的陣列式測序技術,這幫助他們能夠更高通量、更高精度地做測序;另一個是 Roche 454 的測序平台,也是高通量技術。所以如果直接看現在基因檢測行業的頭部公司,最頂端的就是 Illumina,下一個是 Thermo Fisher,都是做測序儀的大公司。雖然他們也提供直接測序的服務和平台,但核心是設備。這種格局短期内很難改變,要在硬體方面做突破、革新一個行業需要很多年。
再往下走,就是使用這些測序儀的公司,比如有具體產品或服務的公司,這些公司現在的趨勢是越來越垂直細分,這是第二個特點。而且這種細分化并不意味着市場規模或商業潛力變小,反而因為專業性讓大家更相信這些數據,產生更多參考價值。
現在我們知道 23andMe 的數據在美國醫生那裡是不受認可的,因為參考價值很有限,能測到的新東西也很少。但後來像 LabCorp、Quest 這些更專業的公司,還有專門測腸道微生物的、皮膚微生物的、阿茲海默基因風險的等等,因為有了專注度和精确度,醫生會覺得更有參考價值,大家也會更認真、理性地看待這些數據。
所以從這個角度看,現在基因檢測公司的數量在增加,但每一家都很專精。這個行業未來不太可能出現一家公司壟斷全人體基因組檢測的情況,而是可能在結直腸癌檢測、阿茲海默病風險檢測等細分領網域各有頭部公司。
泓君:我看現在很多新一代的基因檢測公司在打破 23andMe 的模式,不是只收一次性的檢測費用(比如 199 美元),而是增加了一個月 129 美元這樣的訂閱制服務,提供個性化的營養、運動、睡眠指南,還有醫生一對一咨詢,把一次性費用變成長期訂閱。這算智商稅嗎?
Janice:我覺得不能算智商稅,反而是一個特别好的創新點。因為剛才提到 23andMe 的產品做不大的原因在于,大家會說"我知道這些結果,然後呢?"這些新公司就給出了答案。比如說通過基因檢測發現你的基因與代謝速率有關,或者與心血管疾病高發相關,然後你的一些生活症狀是不是與基因有關?這時他們用基因數據說服你去改變飲食或運動習慣,給你一個解決方案。這時候你買的不只是解決方案,同時也買了一個科學的理解。
比如我有個家人,本身患病風險就很高,但一直不注意,特别是一些慢性病的風險。以前他完全不注意生活方式,喜歡喝酒、抽煙。但看了基因相關的報告後,他就會想"我的基因注定我容易得這個病,但我又想多活幾年,那我得好好注意了"。所以這種服務還是很有幫助的。
泓君:對,我剛才提到 ApoB 對心血管疾病的影響。我還發現一個叫 APOE 的基因,它是參與膽固醇運輸和加工的蛋白,有三種亞型:e2、e3、e4。其中 e3 是最常見的,但如果擁有一個或兩個 e4 亞型的拷貝,就可能讓一個人患阿茲海默病的風險增加 2 到 12 倍。
當我們看到這些相關性,是不是說基于這些已經研究出來的基因會如何影響疾病的關聯性,垂直方向的基因檢測公司就可以慢慢建立起來了?它可以幫我們預測這些疾病。一方面是整個基因測序技術在發展,另一方面是在每種疾病裡面,哪些靶點會影響哪種疾病,當這些細分的科學領網域都在發展時,基于這些細分領網域的基因檢測公司就會越來越有價值。
Janice:對,它們的數據越來越多之後,建立的關聯性或者能下的診斷結論就更有依據。有個非常著名的例子就是安吉麗娜·朱莉,她做了基因檢測後發現攜帶 BRCA 基因。雖然我們剛才提到有些基因的關聯性還沒那麼強,但有些基因,尤其是在腫瘤方面的致癌基因,現在已經得到非常好的确認了。安吉麗娜·朱莉通過檢測發現自己有非常高的乳腺癌風險,最後選擇做了雙乳切除,這是一個轟動性的新聞。她這個決定就是基于基因檢測的結果。
泓君:目前已知的基因檢測項目中,除了我們提到的心髒病和阿茲海默症,還有哪些比較常見的檢測靶點?
Janice:現在有一些靶點是醫療界已經認可的,醫院裡會做的這些檢測項目更值得信賴。比如說剛才提到的與癌症相關的BRCA基因,還有一種叫HER2的基因,它主要跟乳腺癌和卵巢癌等多種腫瘤相關。基于這些發現,誕生了很多所謂的"blockbuster"(重磅)藥物。
這是一個很成功的案例:科學家發現很多腫瘤病人過量表達了這種基因,并在他們的腫瘤上發現了相關蛋白的表達。這帶來了兩個方向的進展:一是診斷方面,我們可以在臨床實驗或日常治療中識别病人是否過量表達這種基因;二是治療方面,很多醫藥公司專門針對這個HER2靶點開發藥物,這些靶向藥物的有效率特别高。
除此之外,基因檢測在罕見病領網域也有重要應用,因為很多罕見病都是基因病或遺傳病,特别是單基因遺傳病,比如地中海貧血症等。這些疾病很早就開始使用基因療法治療,現在也有了一些基因編輯類的藥物。但你會發現,治療這些疾病的公司都在關注相似的幾個靶點,因為能夠建立起非常完整邏輯鏈條的靶點還是比較少的。每一個靶點都需要大量研究來支持。
03 uBiome的新型騙局:為何基因檢測騙局頻出
泓君:矽谷有一個非常知名的公司Theranos,就是《壞血》這本書的主角,它一度估值高達90億美元,很多政客和名人都投資了這家公司。但最後發現它宣稱的"一滴血能監測所有生物樣本"在科學上是站不住腳的,這個騙局維持了很久。現在創始人Elizabeth Holmes已經入獄了。還有一個類似的例子是uBiome,也是一個基因檢測公司,估值達到39億美元,但他們試圖榨取醫療保險,蒙蔽法務顧問,誤導投資者。能講講這個公司的前因後果嗎?
Janice:Theranos這個案例确實很知名,已經有書和影視劇。實際上不能說一滴血完全測不了所有疾病,只是在2003年她創立公司時,這個技術還遠遠不夠成熟。
至于uBiome這家公司,又是一家矽谷公司,最初創立時它的技術其實是可行的,但遺憾的是他們沒有把技術真正用到實處。它不是測所有基因,而是收集病人的腸道微生物,通過這些檢測來預測疾病或幫助診斷。這個過程比血液檢測在樣本收集上更容易。
這家公司引起轟動有幾個原因:首先融到了很多錢,幾乎所有矽谷知名投資人都參與其中,甚至包括一些中國背景的投資人。其次,它與23andMe等其他檢測公司不同的是,它成功突破了支付問題。它不是直接面向消費者(ToC),而是與醫院和保險公司合作(ToD和ToI,即to doctor和to insurance company)。每個檢測套件保險公司要支付594美金,比23andMe還要貴得多。
泓君:所以他的數據其實對醫生沒有幫助,但還是偽造了一些看似有幫助的數據來獲取保險?
Janice:對,醫生每次給病人開具他們的gut biome檢測處方(產品叫smart gut),保險公司就會支付594美金。這是直接的騙保行為。更嚴重的是,如果他們的虛假信息誤導醫生做出錯誤診斷,而這個診斷對應的治療也被保險覆蓋,那保險公司就會有更大的損失。
泓君:這個事情是怎麼被發現的?又可以成為一本書的素材了。
Janice:這個事情不是突然被發現的。從FBI對uBiome的調查卷宗可以看到,他們采訪了很多醫生。醫生們逐漸發現uBiome提供的數據缺乏嚴肅的醫療價值,數據非常簡陋,後期甚至只提供像問卷調查一樣的簡單答案。而且他們的產品已經銷售多年,保險公司也支付了很多年,卻始終沒有獲得FDA的認可,這讓醫生的懷疑越來越多。
從用戶角度來說,有一位用戶本來只訂購了一套,因為就他一個人用,但公司卻給他寄了6套收集樣本的工具。公司還忽悠說要收集多次樣本,可以追蹤不同時間點。這個用戶覺得奇怪就去追查,最後發現uBiome會把一個人的樣本當成6個人來使用。就是這些細節讓很多人發現了問題。但即便在人們開始質疑後,這家公司仍然繼續運營了很長時間,保險公司繼續支付,兩個創始人繼續忽悠。
泓君:為什麼醫療領網域的騙局會一直層出不窮呢?
Janice:我想到兩個原因:首先是專業壁壘。像Theranos的Elizabeth Holmes和uBiome的兩個創始人,當他們以專業背景去融資時,對于非專業領網域的投資人或政界名人來說,更容易相信他們講的故事,因為他們是專業人士,能把專業技術講得很好,讓人覺得既能理解又有很好的商業前景。
另一點是醫療行業的特點。這是一個高度監管的行業。做藥物研發比較難造假,因為FDA一直在監管。但在診斷、檢測這些領網域,造假的可能性更高,而且還有保險支付的可能。我們知道美國的醫療費用非常高,雖然有保險支付,但這裡面的誘惑非常大。如果真的能把這個局做起來,收入規模會非常可觀。
泓君:整體來說,現在基因檢測方向的政府監管還不太完善,導致市場魚龍混雜,我們很難鑑别。
Janice:對,确實有這個問題。所以你會看到能夠進入醫院的檢測公司非常少,現在醫院裡做的基本都是LabCorp或Quest這些長期合作的公司,這些都是FDA重點關注的對象。出問題的公司更多是在市場上,就是醫院以外的這些公司。現在有很多基因檢測公司,難免這裡有一個造假的,那裡有一個忽悠的。
泓君:那是不是建議大家如果拿到基因檢測報告發現有問題,不要馬上懷疑自己,先去醫院做一份?
Janice:對,但是醫院并不會鼓勵普通人随便做檢測,一定要有醫療原因,比如備孕的人,或者已經懷孕的,或者兒童需要做這些檢測。如果沒有原因的話也做不了。
泓君:所以就造成了這樣的一個市場的信息差。
Janice:是的,而且大家發現這種事又發生了。他的投資方跟Theranos的投資方也很相似,包括A16Z等非常知名的投資人,而且這家公司還是Y Combinator投資的。你看這些在投資方面很專業的投資人,但在生命科學這個領網域,門檻還是非常高。
04 CRISPR對生命科學的影響,不亞于生成式AI
泓君:你覺得生物學在這個世紀裡面最大的幾個突破是什麼?
Janice:現在是2024年,這個世紀已經過了1/5。從我的角度來看,對生物醫藥行業、生命科學領網域影響最大的可能是基因編輯技術。基因編輯技術的影響力确實非常大,它幾乎改變了所有生物實驗室的工作流程和思路。比如說以前大家想要做一個新的細胞系或者新的動物模型,這個周期是非常長、非常昂貴的,但自從有了CRISPR,你就可以自己設計想要的模型。
除了這個以外,CRISPR現在也被用于疾病研究。它不僅可以用于科研,還已經應用到生物醫藥的藥物研發中。這些藥物不僅僅是化學藥物,還包括生物藥,比如基因療法、細胞療法。細胞療法是用細胞作為藥物,要讓這些細胞具有治療效果,我們需要對它進行工程化,給它編輯一些功能,這時候也用到了基因編輯技術。所以在每個細分領網域,甚至每個環節都會用到這些技術,可以說是無處不在。
泓君:我覺得整個基因編輯對現在科學的影響可能都不亞于這一輪的人工智能。
Janice:對,我覺得很多人都有自己的理解。剛才說基因編輯是一個非常大的突破,是基于我個人的觀察和工作經驗。人工智能等技術跟CRISPR相比現在有個差距:我們現在看到的更多是理論上的進步,我們認為它能做一些事情,但要真正做到還有很大距離,它現在還沒有滲透到生命科學、生物醫藥的每個環節和領網域。但基因編輯技術其實已經做到了。
泓君:要不要解釋一下基因編輯技術?
Janice:我們剛才聊的基因編輯技術特指CRISPR技術,它獲得了諾獎,其中有一位非常知名代表人物就是華人科學家張峰。
簡單來講,基因編輯并不是一個新概念。在CRISPR技術出現之前就有其他的編輯技術,但過程非常冗長,編輯時可能會出現錯誤。這些老技術在CRISPR出現後基本都消失了。現在不管是人工智能還是其他技術,都有各種各樣的算法,但基因編輯基本都集中到了這個工具上。
這個工具的原理是這樣的:它用的時候有兩個組份,其中一個是"剪刀",用來剪開基因,是一個叫CAS protein的蛋白質。另一個組分叫Guide RNA,相當于給剪刀加上一雙眼睛,這個眼睛可以識别出要剪的位置。如果我想剪的位置很明确,就把這個信息設計到Guide RNA這雙"眼睛"裡,然後這雙眼睛就會帶着剪刀去到基因上的特定位置進行剪切。
剪完之後,我們希望補充一個新的片段進去,這就是基因編輯:把不想要的部分剪掉,再把想要的部分粘上去。這個粘合的過程是DNA本身修復時就會發生的,所以不一定需要額外的工具。
泓君:我覺得很重要的一點是這個技術變得非常簡單了。我聽說這個技術在發明以後,在波士頓的酒吧裡面,因為那邊是高校聚集區,連酒保都可能會自己去做一些基因編輯。
Janice:對,有這個可能。這個技術真的把門檻降低了很多,而且操作流程就像我剛才講的這麼簡單,只需要加入兩個東西。但是前期當然需要很多設計工作,因為RNA和蛋白質,就是這個"剪刀"和"眼睛",這兩個都是分子,需要非常精确的設計。我們的基因是由ATCG這些鹼基組成的,是非常精确的,如果設計有一點偏差,它就會找錯位置。所以前期的設計更重要。
泓君:那現在基因編輯還有基因治療的痛點和難點在哪裡呢?
Janice:目前行業裡比較公認的一個難點是遞送問題(delivery)。為什麼呢?就是我剛才提到的Guide RNA和剪刀這個部分,它們都是生物大分子,和我們以前使用的化學藥品分子有很大的差别。
如果我們想要定向地編輯或治療某一個致病基因或具體靶點,就需要把這兩個物質運送到疾病發生的地方,比如某種細胞裡面或腫瘤裡面。如果僅僅通過血液注射這兩個物質,它們會在血液裡被降解掉,因為它們是不穩定的生物分子,我們人體中有很多酶都可以把它們降解掉。
因此現在有一個專門的細分領網域,也是我們公司正在研究的方向,叫做drug delivery(藥物遞送)。我們需要研究一些工具,在運輸過程中保護這些基因編輯器或基因藥物,讓它們能夠安全、高效地到達目标位置,并且能夠進入細胞。這個行業現在備受關注,而且基本上是一種平台型技術。像我們開發的這種平台型技術,可以用于不同的RNA,包括我剛才提到的"眼睛"或"剪刀"都可以是RNA分子的形式。通過這個遞送技術,我們可以把保護、靶向和運輸的功能都設計在載體裡面,也就是設計在用來包裹這些基因編輯器的物質裡面,然後用作藥物。這既是當前行業的一個痛點,也是一個正在蓬勃發展的細分領網域。
泓君:你覺得AI的發展對基因檢測會有什麼樣的影響?
Janice:AI技術在基因檢測行業的各個環節都會有幫助。首先我們知道AI有非常強大的數據分析能力,它既快又能準确地解讀數據。在基因檢測中,每一次檢測完成後產生的數據量都是非常大的。
當基因檢測產生這些數據時,需要先進行處理,比如清理或進行一些标記等等。如果讓AI來做這個工作,效率會更高、速度更快。接下來,數據處理完成後就要進行分析。我們知道現在這些AI模型非常強大,它分析出來的結果既快又好,所以在這個環節可以提高準确率,同時降低成本。
最後,當我們把這些數據都處理好以後,要在臨床上研究它與疾病風險的關聯時,也面臨着海量數據的挑戰。因為一方面有基因檢測產生的數據,同時還有臨床數據,兩邊都是海量的數據,這時候還是需要依靠AI。
泓君:所以它主要是表現在對數據和數據分析這一塊?
Janice:對,我覺得這是AI最直接能幫助革新的方面。還有很多其他的基因檢測公司大家都聽過名字,有各種各樣的故事。但這些故事并不妨礙這個行業在快速進步,伴随着各種技術、各種分析方法的進步,我非常期待它能夠更快地為人類健康帶來一些改變。