今天小編分享的互聯網經驗:對話Traini:4人創業公司用大模型翻譯“狗語”,已獲得20萬用户,歡迎閲讀。
前陣子,一段寵物主人與自家狗狗 " 對話 " 的短視頻在社交平台火了。
"Eli,你能幫我把遙控器拿來嗎?" 博主對着手機説。
這段人類語音立馬被翻譯為一段哼鳴加幾聲短促的吠叫。
然後神奇的事情發生了:眼前這只叫 Eli 的金毛犬真地聽懂了指令,自己跑去茶幾叼來了遙控器!
類似的還有下面這個,主人問能不能給自己一個 kiss。狗狗聚精會神聽完軟體翻譯,馬上望向主人,飛撲上去獻吻一個。超級有愛,讓主人又驚又喜。
這款「AI 狗語翻譯器」由總部位于硅谷的寵物共情 AI 初創公司 Traini 開發。他的產品構想是:通過其 AI 聊天機器人 PetGPT,用户不僅能和狗狗跨物種對話、無障礙交流,還能聽懂它是餓了、無聊了、還是委屈了,随時了解自家毛孩子的心理狀态和身體需求——對萬千鏟屎官來説簡直是夢想照進現實。
作為一家出自華人創始團隊的 AI 新秀,去年全年,Traini 用户增長了 600%,冷啓動情況下 iOS 注冊用户超過 20 萬。今年短視頻爆火之後,Traini 的 5 月產品浏覽量更是逾百萬,在 YouTube 積累了 2 千萬觀看量。
核心技術原理
雖然早期市面上也出現過一些簡單的寵物聲音識别程式,但 Traini 的狗語翻譯技術卻是基于一個更先進和復雜的寵物行為多模态翻譯模型。它采用類似 GPT-4o 的 Transformer 架構,被投喂了海量的專家級寵物行為學文本、視覺和音頻數據,是 Traini 的看家法門之一。
受到語義空間理論的啓發,Traini 認為,既然人的語言可以是 " 詞向量 ",那麼 " 汪汪也可以 "。為确保狗語翻譯的準确性,Traini 團隊嘗試了多種訓練方法。包括使用純狗語音數據訓練,對人類語音預訓練模型進行微調,和使用來自不同國家地區、不同品種狗的語音數據混合訓練等。
現在,團隊已經從世界各地收集了超過 10 萬只狗狗的聲音和面部表情影像,創建了目前最大、最具多樣性的寵物情感表達數據庫。
有了扎實的數據打底,Traini 不光會翻譯狗語,還能分析寵物的行為意圖和情感狀态,促進其心理健康。它可以解讀 10 種不同的寵物情緒,遠超基本的快樂、悲傷、憤怒和恐懼。
用户直接在 PetGPT 中上傳照片并提出問題,比如 " 看看我的狗怎麼了 ",或者 " 什麼補充劑适合這個品種的狗狗 ",就能得到相應的專業幫助。據團隊稱,Traini 在行為翻譯方面的準确率已達 80%。
随着數據規模的擴大,包括收集產品使用過程中自然生成的行為數據,以及模型性能迭代,準确率也會不斷提高。
個性化配套功能
這也引申出 Traini 除了寵物語言和行為翻譯外的另外幾項功能:
一是寵物醫療輔助。比如下圖示例,PetGPT 聽出第二段狗狗語音是 " 焦慮的吠叫 ",解釋説這種類别 " 通常音調高、重復,并可能伴有踱步、哀鳴或破壞性行為 ",原因包括分離焦慮、對特定刺激的恐懼或環境不适等。建議 " 提供一個安全舒适的環境,保持一致的日常生活,并盡快咨詢獸醫。"
二是個性化服務推薦。Traini 的目标是建立一個寵物 AI 代理,基于上下文具體問題提供精确的服務和產品匹配。從而使用户能夠輕松搜索信息、下訂單、預約醫生等。還包括了 100 多個有趣的 Traini 線上訓練課程、AI 定制的行為矯正計劃、及寵物星座和疫苗記錄等。據官方數據,PetGPT 服務推薦的點擊率超過 30%。
此外, Traini 還有一個視頻分享社區,供寵物主分享故事和經驗,也能從中快速獲取用户反饋。
至于商業模式,Traini 采取雙軌并行策略:一方面提供 C 端消費者訂閲服務,允許個人用户訪問其寵物共情 AI 平台、使用在線訓練課程等功能。另一方面專注企業市場,為寵物診所、寵物硬體公司和研究機構等提供 API,實現寵物在醫療和日常生活中的智能互動。
華人創始團隊背景和融資
Traini 團隊精簡高效,由 4 名全職員工和部分實習生組成。主打一個分工明确,配合緊密:
創始人兼 CEO孫鄰家 ( Arvin Sun ) 是一名華人連續創業者,擁有超過 12 年本地生活服務數字化創業經驗。此前擔任知名華人外賣平台 GESOO CEO,也曾是美國最大亞洲外賣平台 Chowbus 西海岸負責人,幫助公司共籌集超過 1 億美元資金。他在 Traini 肩挑客户增長和市場拓展。
聯合創始人Jason Hong曾是中國湖南省數學培訓隊成員。并在 Scale AI、OpenAI 和百度美國擔任過機器學習工程師,積累了先進模型的開發實踐經驗,負責核心 PetGPT 模型架構和訓練。
另外兩名全職員工分别負責 Traini 的界面設計和全棧工程搭建。公司還邀請了前 Chewy 數據科學負責人 Yiyi Yang 加入,擔任寵物健康專業顧問。
就在一周前,Traini 剛剛官宣其 5 月完成的千萬元天使輪融資。由 FutureX Capital、BlueSea Partners、Success Giant 等投資者聯合參與,包括前 Meta 工程總監 Yingyi Liang、Instacart 子公司 Caper AI 工程主管 Lily Zhang 等。現有股東 Valkyrie Fund I LP、Fengmin Gong 繼續跟投。
帶着更多對 Traini 產品和團隊的興趣,我們也與創始人孫鄰家進行了一場深入對話。
對于硅谷許多認識他的風投和一線 AI 從業者來説,這也許就像一個老朋友轉向 AI+ 賽道創業,忽然爆火又融資成功的故事。
但聊下來我們發現,Traini 背後其實是孫鄰家十餘年用户增長經驗的積累,早在 ChatGPT 誕生前就開始對寵物行業的深入觀察,以及整個團隊大量的科學調研、數據收集和模型訓練。
以下是對話實錄:
硅星人:請 Arvin 先介紹一下自己吧。
孫鄰家:我是一名連續創業者,在國内創業了 7 年。最早是大學時和室友一起向剛入學的新生賣被子。當時覺得自己需要積累經驗,畢業後就去了一家上市公司做供應鏈管理,差不多做了兩年時間。
2015 年我和同學一起創業,第一個項目是做零食專賣店「鄰家鋪子」,三公裏内 30 分鍾送貨上門。第二個項目是為美容院提供在線預約和門店端的 SaaS 服務,我們在 3 個月内融了幾百萬。再之後我又做了一個給電商提供配套物流的平台,融到 3000 多萬,團隊有 100 多人,業務覆蓋了 50 多個城市。
2018 年我來到美國,加入了最大的中餐外賣平台 GESOO 做 CEO。當時面臨的最大挑戰是适應新的國家、商業環境和法律法規等問題。經過幾個月努力,也讓公司扭虧為盈,并将業務擴展到多個城市。
後面我去了另一家競品公司 Chowbus 負責西海岸業務。當時它規模很小,只融了 400 萬美元種子輪。我們花了半年時間完成 6300 萬 A 輪和 B 輪後,又融了 4 千萬,總共超過 1 億美金。2022 初我離開 Chowbus,全職投入現在的項目 Traini。
硅星人:當時生成式 AI 還沒有火吧?
孫鄰家:我們做的事情沒有完全跟随 AI 的腳步。實際是在做外賣平台的時候,我發現很多客户要求司機代買狗糧,就想通過狗糧來拓展業務。做了市場調研後發現這個領網域的數字化程度不高,特别是疫情期間寵物數量和服務需求劇增,有很大機會。
我到公園随機做了 2200 個用户調研,有 76% 的用户表示他們的狗有行為問題。所以我們從狗的行為訓練切入市場,建立了一個 C to C 社區,但發現效率比較低,就進一步轉向智能社區,用機器人來回答用户問題。
正好大模型也在快速發展,讓應用和技術可以完美結合。我們一直在增強針對寵物領網域的大模型性能,以提供更好的服務和推薦。經過 10 個月優化,Traini 用户幾乎都在使用 PetGPT,通過聊天的方式來糾正寵物行為問題,獲得專業信息和服務推薦。
然後整個 2023 年用户都在問,你們能做行為翻譯嗎?比如我的狗叫是什麼意思,或者它的眼神代表什麼?我們也考慮過這個問題,但我一直認為寵物行為翻譯,尤其是叫聲,并不算一種真正意義上的語言。翻譯時只能去匹配人的聲音,或者采用類似腦機接口才能真正理解。但後來我去讀了很多論文,發現科學界已經在這方面做了非常多的研究。
硅星人:所以這些研究幫助了你們的產品開發。
孫鄰家:對,科學家們對藍鲸和狗的行為研究最深入,我們就基于這些來開發產品。狗的叫聲不是語言,要把它翻譯出來變成人話就得先做定義語義。但它信息量畢竟不像人類語言那麼豐富,所以要結合表情和肢體語言。這樣,技術就被逼到一個多模态的方向,需要聲音、圖片、視頻的多種結合。
當我弄清楚這些後,下一步該怎麼辦?因為我不是大模型出身的,過去 13 年創業經驗都是在做產品和增長。所以要做這個項目,就要到業内最優秀的公司 OpenAI 挖人。
硅星人:這是你的 Co-founder Jason 對嗎,你們是怎麼走到一起的?
孫鄰家:我們有共同的朋友介紹,也在一些活動中遇到過。認識了大概 10 個月吧,經常會吃飯聊天,交流進展和遇到的問題。後來他決定加入我們。
硅星人:他為了你們放棄了 OpenAI?
孫鄰家:哈哈,其實他離開 OpenAI 後還在百度美國工作了一年。他有創業的意願,而且對應用層面很感興趣。OpenAI 内部做了很多應用探索,比如旅遊、醫療、教育,但效果不好,所以才大力投其它創業公司。Jason 和我一樣,覺得 AI 時代的不确定性是吸引人的地方,比如寵物行為翻譯,這需要發掘大模型的能力。
硅星人:你們很有魄力,因為很多人會避開有不确定性的項目。
孫鄰家:不确定性可以帶來有趣的東西。做有趣的東西才能解決用户需求,用户覺得好玩就會來使用。我們要挑戰那些看似不可能的事,成功後大家才會眼前一亮。硅谷不缺工程師,缺的是企業家。如果我們成功了,對華人社區的影響會更大。
硅星人:不久前 Traini 的 " 狗語翻譯 " 功能在社交媒體出圈,激起大家的強烈興趣。你們是如何确保狗語翻譯的準确性?
孫鄰家:好問題。我們現在的重點是建立專家标準。很多寵物行為專家和科學家知道寵物行為的含義。我們把他們的知識轉化為标準和數據,通過大量的數據和圖片視頻來标注。同時也依賴數據标注後的訓練結果,随着數據量的增加,效果會越來越提升。
硅星人:你們還在不斷地收集和标注數據,對吧?
孫鄰家:是的,團隊雖然小但效率很高,盡管融了一些錢還是注重節省。數據采集和标注都是我們自己人肉在搞,雖然慢,但質量更高。我們希望在早期能把基礎打好,未來就能走得更穩。
硅星人:你提到行為翻譯是多模态的,所以除了上傳錄音,用户可以用鏡頭拍攝嗎?
孫鄰家:我們現在提供狗狗照片的情緒翻譯,比如你上傳一張照片,系統能告訴你狗狗的環境和體征,一些更復雜的健康診斷和視頻功能還在内部訓練中。
目前用户提出的主要都是行為相關問題,比如為什麼狗狗突然亂叫,精神萎靡,或者為什麼不聽話。這些問題類似于在線寵物咨詢。我們會告訴他們原因,并提供相應的解決方案和訓練課程。
硅星人:你覺得 Traini 和市面上其他寵物類 App 的差異在哪裏?
孫鄰家:市面上的寵物應用主要以訓練為核心,而訓練只是 Traini 的一部分。作為一個智能共情平台,我們更關注寵物行為和情感交流,這與傳統的移動互聯網產品有很大不同。產品模式是寵物共情 AI 加上服務生态,這就是 Traini 的獨特之處。
現在的情況是寵物主單方面輸出情感,而寵物的反饋常常不被理解。我們希望通過技術破譯寵物的行為和情感,實現更好的雙向交流。
硅星人:目前用户體量如何?有沒有一些數據或案例分享?
孫鄰家:我們增長非常快。過去 30 天注冊用户增長了 5.5 倍,活躍用户增長了 4.41 倍。共有超過 20 萬注冊用户。讓我印象最深的是有一個用户,他朋友家的狗得了癌症。臨終前狗狗一直發出類似嗚咽的聲音,主人特别想知道狗狗在臨終前想表達什麼,希望能夠安撫它。這讓我覺得我們做的事情非常有意義。
這不是個例,很多寵物都會有類似的問題。能夠幫助到他們,我感到非常開心。
硅星人:很動人的故事。目前你們跟 B 端的合作是怎樣的?
孫鄰家:有很多公司在聯系我們,比如清華大學的團隊,他們想用 Traini 的 API 來開發新產品。還有很多資本相關的合作,最近也有非常多投資人找我。
其實從我們發布 demo 開始,YouTube、小紅書和視頻号上就忽然火了起來。我頭一次知道點贊和評論特别多時,消息提醒會變成一堆小紅點。現在每天從早 6 點到晚 11 點我都在開會,直接把節奏打亂了。本來我們 5 月份剛完成一輪融資,沒打算再融錢,但現在有很多 VC 來問,想拿到下一輪的份額。
硅星人:對這次爆火你怎麼看?
孫鄰家:我覺得我們談不上爆火,但确實受到了很多關注。我一直保持平常心,因為如果產品不成熟,用户很可能會流失。我更希望逐步增長,而不是快速上漲後又快速下降。所以最重要的是產品要準備好。
其實當初發布狗語翻譯 demo 的目的也是為了測試用户需求。我們想知道大家是否真的需要這個功能,以及當他們看到這個功能時反應如何。這樣我們就知道方向了。下一步就是收集數據、标注數據、訓練模型、優化結果,最終提供給用户一個很好的體驗。
硅星人:我看到有評論問有貓語翻譯嗎?
孫鄰家:現在還沒有。
硅星人:這筆融資主要用在哪些方面?
孫鄰家:模型訓練肯定是一部分,但產品和增長這兩件事同樣重要。我們主要會在這兩方面投入。
硅星人:你提到了解用户需求後,產品會更好。那麼接下來一年内你希望這個 App 是什麼樣子的?
孫鄰家:這個問題跟我們的規劃很匹配。到今年 Q4 也就是年底,我們計劃發布 1.0 版本的語音翻譯功能,包含 demo 中的狗狗叫聲翻譯。到明年年中會發布視頻翻譯功能,這個功能可以識别狗的肢體語言和行為,讓互動更加豐富。未來我們可能會把這個功能做成實時翻譯,像直播一樣,甚至可以用于醫療輔助診斷。
硅星人:非常期待。你説過之前大家都在做大模型,現在大家都在擠應用市場。你的觀點是什麼?
孫鄰家:這個現象很容易理解。當出現一個巨大的機會時,大家都容易上頭。大勢是有幫助的,但這并不意味着你選擇大勢就一定能成功,關鍵在于個體差異化。
去年大家都覺得做應用沒前途,做大模型才夠酷。今年大家又覺得要做應用,大模型太燒錢,成本高回報慢。每個團隊都有不同的能力,有些适合做大模型,有些适合做應用。重要的是從自己的擅長點出發,而不是盲目追風口。
我們從 2018 年就開始關注寵物行業,觀察到人口紅利的消失、婚育率下降和寵物收養增長等趨勢。從 2018 年到 2024 年,美國寵物行業的市場規模從 910 億美金增長到 1500 多億美金。這些都是我們長遠而深入的研究和判斷的結果,繼而選擇一個合适的時間點切入。
很多創業者因為找不到方向而焦慮。因為他們常常從風口出發,而不是從自己的擅長點出發。我一直專注于将日常生活中的需求數字化,通過平台展現出來。盡管行業不同,但背後的增長和產品邏輯是一樣的。很多人可能看不到背後的這些東西,只看到我從餐飲行業跳到寵物行業,但其實我對大市場的了解和判斷是一貫的。作為創業者,你要把自己擅長的點融入產品核心,才能在輸出觀點時足夠自信。
硅星人:這種自信在融資時也很重要。
孫鄰家:沒錯。我的朋友圈也常常在記錄這段創業歷程中的收獲。現在我們有底氣對一些合作和投資人 say no,因為我們有自己的行業判斷。從最初的起點到行為翻譯,再到未來的更多應用,我們會一步步走下去。
硅星人:也就是説光有錢是不能吸引你的。
孫鄰家:對,我們公司融資的需求特别簡單。首先是效率高,不希望投資機構拖延很久。其次是願景一致。我們希望投資人理解并支持我們的行業和團隊。如果符合這兩個條件,我們就很高興合作。
硅星人:你覺得你們的核心競争力是什麼?
孫鄰家:核心競争力最終還是回到人身上。我們團隊有 4 個全職成員。一個負責產品增長,一個負責模型訓練,一個負責設計,還有一個負責 App 的工程開發。各司其職,一直很緊湊。我認為創始團隊來説,無論是對產品和場景的理解,還是技術的迭代,快速的糾錯和決策能力都非常重要。如果在決策過程中走偏了,可能就掉下懸崖了。
硅星人:現在你怎麼看待 AI+ 應用的前景,覺得哪些方向比較有前途?
孫鄰家:我認為情感方向和教育方向都有很大的機會。比如陪伴類應用和情感交流。我們公司稱之為 "AI to X",其中 X 可以是寵物、線下服務、情感翻譯等。醫療領網域也有機會,但需要更多的資源和監管支持。
硅星人:最後,能分享一下創業過程中的一個痛苦時刻和一個快樂時刻嗎?
孫鄰家:實事求是地説,沒有特别痛苦的時刻。我一直是一個謹慎樂觀的人,會把事情想到最壞和最好,所以沒有特别焦慮的時候。當然,產品被認可和用户反饋是特别有成就感的時刻。另外我們團隊有兩個全職成員,是在無報酬實習了一年後轉正的,他們的認可也讓我特别開心。
硅星人:非常感謝你的分享。
孫鄰家:謝謝,希望對大家有幫助。