今天小編分享的互聯網經驗:探索 AI 落地場景圖譜:從技術挑戰到商業應用的多元視角,歡迎閲讀。
12 月 7 日,在北京市大興區舉辦的 2024T-EDGE 創新大會暨钛媒體财經年會上,「AI 落地場景圖譜」圓桌由钛媒體集團聯合創始人劉湘明主持,TDK InvenSense 副總裁 Pankaj Aggarwal、Traini 創始人孫鄰家、MascotGO 首席技術官 Peter Avritch、萬魔聲學董事長謝冠宏、紅杉中國合夥人張涵等嘉賓,圍繞 AI 落地應用面臨的挑戰、各公司在 AI 領網域的進展與商業模式、AI 在不同領網域的發展趨勢等話題展開。
Traini 公司通過大量視頻标注理解寵物行為并選擇模型,與寵物行為專家合作确保數據準确性,公司在共情方向投入研發,產品有 C 端用户,且在模型端可輸出,與多家硬體公司合作。
孫鄰家表示,Traini 未來嘗試在醫療端輔助診斷、為具身機器人提供數據。目前主要專注于狗狗領網域,因北美和歐洲狗狗市場大且狗狗行為與人類互動更直接,未來可能延伸到其他領網域。
謝冠宏提到,萬魔聲學在耳機降噪(飛機、火車降噪及通話降噪)、省電方面取得成果,睡眠豆第三代可準确監控心率、呼吸和睡眠狀态。眼鏡產品也在發展,雖市場挑戰大但從一開始就注重差異化。
Peter Avritch 提到,他的開發工作圍繞研究如何使用和獲取數據,為用户提供個性化推薦。
Pankaj Aggarwal 則表示,AI 發展需要更多傳感器,傳感器能讓 AI 變得更智能,如耳機能判斷發言者自動調節聲音,未來機器人将使用更多傳感器,覆蓋消費、工業設備等多領網域,且需關注小設備功能局限、安全及隐私問題。
張涵從投資視角闡述了目前 AI 應用在尋求大規模落地和商業化方面面臨的挑戰,包括落地場景、Token 成本控制、數據安全等。他認為在應用落地的優化方向上,創業者可以尋找和構建對模型以及 Agent 的輸出結果要求不太高的使用場景,實現產品和商業化更快、更早的落地。
以下是圓桌對話實錄,經钛媒體 APP 編輯整理:
劉湘明:特别高興今天有這樣的機會讨論落地的問題,這次在美國參加很多 AI 會議,主要是兩個方向,一是 AI 落地;二是 AI 工具,結合大家在領網域裏的觀察,目前 AI 應用落地面臨有哪些挑戰和障礙是什麼?
Pankaj Aggarwal:數據收集的過程應該是一大挑戰,以及從不同來源收集數據并且進行整合,這也是挑戰。
過去十年,AI 有 100 萬倍的計算成本下降,數據量增加了 1 萬倍,在這個過程中 AI 不斷地應用數據,将數據數字化。
比如對于馬拉松長跑選手,可能配備了不同的傳感器,現在的 AI 技術有沒有能力把所有數據進行收集,并且進行符合需求的數據分析,這是非常重要的。
很多時候,AI 數據沒有很好地被應用。比如很多小的設備,可能在電力或者其它方面有局限,導致沒有辦法在每時每刻收集數據。
智能終端或者智能邊緣也受到行業關注,我們需要有不同的傳感器,比如温度傳感器、水分傳感器,以及其它的像 WiFi、藍牙、雲上設施等,收集并分析數據的過程受到電池的限制。
孫鄰家:AI 落地應用最大的挑戰有三。第一,人們對大模型的期待非常高,大家期待出現能夠颠覆移動互聯網的大模型應用,一般的應用大家會覺得它太薄,不足夠變成殺手級的應用。這會和實際有個 gap(差距),這個 gap 會導致做應用的公司,去融資或者想拿到足夠的錢,再往前的時候難度變得更大。
第二,很多做應用的公司,認為具備工程能力,又對大模型比較了解,就可以做了,過程中會使用現有的開源技術。但實際上這些公司對場景、用户需求的理解,特别是在整個 Workflow(工作流程)上理解比較淺,在做產品或者應用的時候很難切到用户的痛點。
第三,現在的 AI 應用某種程度上等于 AI Agent,需要有自己的模型。建立模型的時候,不論利用開源技術還是自己架構的技術,最後要形成比較獨特的技術優勢,這個技術優勢上邊要疊加無數的數據,在 AI 應用層面,很多數據都是非結構性的,怎麼樣去處理、采集非結構性的數據,達到能夠訓練大量模型的程度,把它變成非常獨特的產品,這對于一般的團隊而言難度非常大,至少有一件事情大家必須要去做,就得去讀論文,讀英文的論文非常難,對于小公司而言非常難。
謝冠宏:AI 終端存在四個主要難點。
省電難點。萬魔聲學幾年來一直在改進和克服省電、輕薄、穿戴舒适等問題,AI 終端需做到不用時省電 stand by 一整天,又能随叫随到,使用時可迅速連接藍牙、wifi 等,且視頻要有高帶寬。
音質難點。要提高聲音質量、消除噪音,讓使用者既能清楚理解對方講話,也能清晰聽到自己説話,還能發出接近人類的聲音給對方,改變傳統 AI 一問一答模式,實現全時間雙向實時對應,能分清不同語言,雙方和動作,目前在眼鏡、耳機上已做到相應程度。
APP 難點。使用 AI 需下載 APP,但跟 Apple、谷歌搶入口較難,未來是萬物互聯時代,可通過直接拉群的方式解決,同時提升使用的便利性。我們使用專利技術為人,AI 與 messager 結合一物 1 号,達成人機互聯。
手機本地 agent 難點。要清楚分辨其能做和不能做的事,比如訂披薩時不能放入銀行賬号和家庭住址等隐私信息,當前模型設有防火牆隔離,但同時還要充分利用雲端的智能跟資訊。
Peter Avritch:談到生成式 AI,我的工作就是研究做哪些工具加入到大語言模型當中,研究如何使用這些數據,如何獲取這些數據,再把這些數據給回到大語言模型,實現個性化的推薦。
比如對于某個人來説,上哪所大學最合适,這不僅僅是學術問題、财務問題,它包含各個方面。對于 16、17 歲的孩子來説,做這樣的決策可能是整個人生最重要的決策,我們希望能夠運用到大模型幫助年輕人來做決策。
張涵:大模型這兩年發展非常快,但能力還相對有限,特别是在内容準确度、輸出能否符合預期等方面,離大規模商用和到基于 Agent 做閉環操作還是有距離的,仍然需要技術側、產品側的人才去不斷想辦法優化。
在應用優化的方向上,可能會有一批優秀的產品經理或者創業者去構建更新的場景,比如他們尋找的用户群體可能對模型和 Agent 的輸出結果預期沒有那麼高。在這種情況下,產品反而變得更容易落地,商業化也更容易形成。
AI 創業者還會普遍碰到 token 的成本問題,這和之前移動互聯網的差别比較大。當你做了一個 AI 產品,這個產品在還沒有形成良好盈利狀态和商業模式的時候,在這上面消耗的 token 以及獲客的成本疊加等等會使得整體成本變得更高。
最後是數據。不同的場景下,企業側可能積累了很多私有數據。如何在最大化保護數據隐私、數據和模型安全的前提下,讓私有數據和自己的業務側結合,與大模型聯接起來,從而提高工作效率,這可能還是個挑戰。
劉湘明:問個小問題,"Traini" 的名字由何而來?商業模式就是把寵物的語言翻譯成人能聽懂的語言,怎麼做到的?
孫鄰家:其實是 training 的縮寫,我們想表達寵物到人類世界被馴化的過程。
我們是全球第一家用生成式 AI 做寵物行為分析的商業公司,通過大量視頻的标注,系統性地理解寵物行為之後,再去選擇模型。我們目前專注在狗上面,會和頂級的寵物行為專家合作,讓他們成為我們的一部分,而且要付出很高的成本,例如股權給他們,來進行專業數據的标注,保證 Ground truth 最後能夠實現。
其次我們在共情方向上進行大量的研究和開發,例如用語音的方式呈現,克隆成狗兒子和狗父母説話的形式,整個體驗對于產品都起到決定性的作用。我們看起來是 C 端產品,但做小模型一旦擁有數據,建立數據壁壘,就有很大的能力可以做 C2B,這個模式可以成立,目前在模型端也可以輸出,在硬體上可以用到。像蘋果、華為、尼桑汽車、上汽等等很多大的硬體公司都在找我們合作。
原來做的非常垂直領網域的小的事情,是個芝麻,我們現在已經把它變成通用,當模型能力變成通用之後,未來我們就可以做成寵物生活的生态,就可以拿到西瓜,這是我們的邏輯。
我們其實還在探索商業模式,但基本的想法在 C 端收取費用費,提供 API 給這些公司。另外,做寵物可穿戴設備,實時進行翻譯。未來嘗試在醫療端,給寵物醫生做醫療輔助診斷,以及給具身機器人提供數據,讓具身機器人在生活中可以和狗狗互動,做成更通用的場景。
我們主要做北美和歐洲,1.6 億條的狗狗,市場足夠大。其次是狗狗的行為和人類的互動更突出、更直接,用這樣的解決方案,對我們的產品突出上會更大,作為創業公司我們只能做選擇,在未來的時候再延伸到其它領網域。
劉湘明:其實音頻耳機是 AI 最早用到的領網域,我現在的問題是在未來,AI 會給我們帶來哪些驚喜,在硬體方面?
謝冠宏:我們專注在小模型,以前用在降噪、輔助睡眠、輔助聽覺,以及運動的器材,這些東西來做學習的終端,會越來越多,而且越來越準确,就像睡眠豆第三代,它對于心率、呼吸和睡眠狀态有非常準确的監控。
一是和健康相關,和運動相關的,逐漸 AI 會提供更多的東西;二是翻譯,我們做的比較大的改變是實時雙向對談,不管什麼語音都共同做。另外的驚喜是這種硬體會越來越多,耳機、眼鏡、戒指、手表、鞋子等,這方面會提供很多驚喜。
降噪分兩方面,一是飛機或者火車上的聲音,把聲音降下來,這和世界一流水平可以媲美,部分效果甚至超越,因為 AI 學習給到我們很大的幫助;二是通話降噪,我在跟他講話,但是我旁邊吵鬧的聲音不要出來,AI 就是要學習這是噪音,這是聲音,再傳送完美的原音的時候,其它噪音不能傳過去,再就是現在的省電越做越好。
劉湘明:簡單進行總結,各個嘉賓我覺得來自于 AI 創業領網域不同的環節,其實我的感覺就是,AI 其實有兩個方向,一是提高效率,做好 " 牛馬 ";二是怎麼去把生活過慢,提供足夠的情緒價值,追求效率的最後也是為了追求更美好的生活,所有的落地,所有的應用都是期待更好的明天,謝謝大家。