今天小編分享的科學經驗:00後華人大模型創業,組隊7人挑戰langchain,矽谷頂級創始人給了天使投資,歡迎閱讀。
2 個華人牽頭拉起一支 7 人隊伍,創業大模型???
沒錯,Cortex就是這樣一個項目,被曝還拿下了還拿下了 Zoom 系,Getty 家族和快手系的天使投資。
這是一個集成諸多大模型 API 後,讓大模型更懂你的中間件。
主打特色有二:
一是外接私有數據,包括 Notion、Slack、Google Drive 等,做特定領網域的私有版 GPT;
另一件事是在每個企業内部,打造千人千面的 Copilot。
這個工具在國外已經小小火了一把,目前擁有 10 多家付費用戶和上千個人用戶。
還有家網紅 SaaS 公司用上了 Cortex,讓網紅們以特定的人設,和粉絲們激情熱聊。
所謂大模型中間件,是在底層大模型和上層應用之間的基礎軟體,主要解決大模型落地過程中,集成數據、應用、知識庫,以及大模型融合級功能協同這些問題。
比較适合那種正面臨兩難境地,又想在大模型領網域試水的旁友們:
自己造一個通用大模型,又貴又麻煩;那單純訓更垂直的行業大模型,或者調用别人家的大模型的 API 呢?好像又有些不夠用。
這個時候,中間件帶着解決方案閃亮登場了。
随着大模型領網域的愈發深入,大模型中間件的創業項目也先後冒了出來。能入矽谷頂級創始人青眼,Cortex 憑借的是什麼?
Cortex 能夠做什麼?
Cortex,可以将 GPT-4 等多個不同的大模型組合使用,實現語言模型之間的協同應用。
也就是說,它是個大模型應用層的編排器。
主要目的是提高技術人員開發的 " 可拓展性、可訪問性和效率 "。
之所以叫 Cortex,是取這個英文單詞 " 大腦皮層 " 的意思。
大腦是神經中樞,可以看做大模型,而皮層就是大腦上面的結構。
它能做的事情,就是按需調用不同的大模型,并用固定的格式來限制輸出的自由度,從而幫助用戶做些單一大模型解決不了,或自己調用多個大模型 API 會比較麻煩的事情。
具體而言,它的功能主要是以下兩方面:
第一,作為集成許多 API 的工具,外接私有數據庫," 指哪兒打哪兒 " 地變成一個專一領網域大模型。
從這個角度來看,Cortex走的是既 " 廣 " 又 " 深 " 的路子。
廣,是說 Cortex 不與個别行業服務競争,而是可以每個領網域都用它練出大模型應用。
深,是說在大模型通用知識基礎上,可以接入私有數據庫,加深對領網域或用戶企業本身的理解。
為了讓這個專一領網域大模型更實用,Cortex 會采取調用向量數據、實時聯網搜索、調用指定 API 等方式。
Cortex 的第二個功能,是能幫助每個人打造一個私人 copilot。
基礎層面的工作,如撰寫草稿、制作 PPT、編寫電郵、總結會議、查詢網購退貨方式,Cortex 都能搞定。
進一步的,在同一公司内部,喂給它一份原始的信息,Cortex 也能獲取每個人崗位所需要的關鍵點,并以特定格式輸出,即根據業務部門的不同而 " 千人千面 "。
據了解,Cortex 的費用根據實際使用量計算。
就計費方式和服務模式而言,Cortex 似乎可以類比為鏈接數據庫和大模型的 " 雲廠商 ",聚集多種多樣的 API 資源後,保證所有的功能都能一直運作,提供相關服務。
也因為如此,Cortex 還蠻受開發人員的歡迎—— Cortex主要面向的就是有一定技術基礎的開發者和 IT 從業人員,他們可以很快上手,大大減少從調試開始的工作量,節省時間去做更有創造性的事情。
對不擅長寫 prompt 的程式員格外友好
為什麼會選擇做這樣一個功能的大模型中間件?為了弄清楚答案,量子位聯系了 Cortex 背後的團隊。
他們給出的答案是,因為相信未來一定是一個多模态、多模型的世界。如果只有一個模型,哪怕強大如 GPT-4,也無法搞定所有問題。
他們認為,必須 " 把多個模型聯系在一起,才能組織一個真正的 AI 應用 "。
而這樣的功能實現,在團隊核心成員初期想用 Langchain 去做的時候," 越做越發現非常困難 ",AI 領網域目前缺少一個幫助模型層和應用層磨合的中間件來完成它的建設。
Cortex 背後團隊的創始成員(也是背後公司的 CEO)Nemo Yang 對量子位表示:
不管已有的平台還是工具能夠提供的能力,都無法很好地滿足這樣的 idea。
團隊最初也走過其他路子,但随着對領網域的了解,聽到越來越多的用戶反饋稱,大模型挺好用的,但是出一個厲害的大模型就要接入一個 API 太過麻煩,對大模型調控性的掌握也比較困難。
受到這樣的啟發,Cortex 才逐步打磨成了今天的樣子。
Cortex 的成形大概離不開用戶對市場現狀的一個反饋,在與量子位的交流中,Nemo 反復多次提到 " 用戶說 "" 市場反饋 " 這樣的字樣,然後解釋 Cortex 是如何根據這些信息來捏出產品的特點的。
比如随着大模型大火而愈發走到眾人面前的向量數據庫,就有市場反饋如果對上下文關聯很強的文章進行向量分割,檢索匹配後返回的答案,可能因為痛失對上下文的理解而 " 不知所謂 "。
根據這一點,Cortex 調用的向量數據庫是完全自研的,可以根據需要全局檢索,也可以選擇一段一段地部分返回。
再比如,身為團隊裡 " 語文底蘊最好 " 的人,Nemo 實操下來還是覺得,對程式員來說,prompt engineering 看上去簡單,其實要出色完成并不容易。
所以 Cortex 有個設計對不擅長撰寫 prompt 的開發者極其友好:
能夠讓擅長寫 prompt 的同事啥的(也就是俗稱的語文好,能夠對需求進行精準描述),加入工作流程,讓 Cortex 更清晰地了解你需要什麼。
之後還會有什麼功能上新呢?
Nemo 介紹,接下來大概率會接入 Slack confluence、 Microsoft 全家桶、 Google 全家桶等。
一切為了一個最終目的,那就是 Developer first,盡可能減少開發者的開發周期。
團隊介紹
Cortex 背後的公司叫做Kinesys AI,目前團隊 7 人全職,2 名創始人均為華人,多人從斯坦福本碩畢業。
創始人兼 CEO,Nemo Yang,00 後,花了 2 年時間,拿下佐治亞理工學院本碩學位,ML 出身,之前在字節飛書和微軟工作過。
14 歲的時候,Nemo 就因為喜歡計算機,只身前往矽谷留學。高中起,他開始寫網站和 App,參與過 startup 的開發工作。
聯合創始人兼 CTO,Jian Cai,畢業于北京大學計算機系,曾在 Google 工作 8 年。
他的上一份創業項目是在線協作辦公文檔 " 一起寫 ",後來被快手收購。
Cortex 直達:
https://trycortex.ai
— 聯系作者 —
>