今天小編分享的互聯網經驗:AI 2.0時代的商湯智慧城市:穩健中走更遠,歡迎閲讀。
AI 1.0 時代,以卷積神經網絡為代表的深度學習算法的突破,拉開了感知智能時代序幕,這使得計算機視覺技術能夠脱離學術科研界,落到產業做商業化嘗試,「智慧城市」就是在這樣的土壤上生長起來的業務。
過去十年的時間裏,智慧城市業務在所有 AI 相關大類業務中首屈一指。兩年前 ChatGPT 橫空出世,大語言模型一時風頭無兩,智慧城市等傳統業務在 AI 2.0 時代新技術、新場景、新趨勢的映襯下,似乎緩緩淡出聚光燈的焦點。
但實則,智慧城市是一個兼具深度與廣度的命題。在區網域廣泛且包含復雜主體的城市中, AI 技術需要在浩瀚信息中做出基礎的感知與篩選,應對城市愈加豐富場景中細碎的長尾問題,傳統的計算機視覺技術并不能完全滿足城市智能化需求。大語言模型的變革、視覺模型的進步、多模态模型的探索,恰恰為智慧城市的發展提供了又一新技術支撐點,在新格局之下 ,城市治理、交通、園區、企業智能化等各個 To B 的 AI 業務都迎來了新的機遇。
AI 2.0 時代,即使行業更多地将灼熱目光投射在流量潛力驚人的 C 端應用上,但這并不意味着 B 端市場無人問津。相反, To B 業務在新技術的加持下迎來了新的增長可能性。正如商湯科技副總裁、智慧城市與商業事業群總裁張果琲所言,相較于「性感」、爆發力強的 C 端應用,B 端業務更能在積累的行業數據和經驗基礎上做深做厚,在長久性、延續性方面更有優勢。
面對大模型技術浪潮,商湯基于十年視覺技術的深厚積累,加入大模型能力,針對智慧城市領網域新需求進行重新适配,推出了商湯方舟多模态新智平台(SenseFoundry VL),使得已經成熟化、規模化的傳統 AI 業務如虎添翼,實現更強的商業轉化。商湯成立十年間,歷經技術變革,行業洗牌。支撐商湯起家的視覺技術與傳統 AI 業務,在穿越十年技術周期後,也在積極探尋着下一個十年的應變之路。
舊瓶與新酒,智慧城市與大模型
AI 2.0 時代,延續了近十年的傳統智慧城市業務模式發生些許變化。「過去那些因為泛化成本過高而放棄掉的項目、做不出來的業務,現在能夠在同樣的預算條件下做出來了,這是通用視覺模型給智慧城市業務帶來的關鍵差别所在。」張果琲如是理解道。
數量龐大的長尾場景,極高的定制化需求,導致每一個項目都要花大價錢大力氣訓練出特定的小模型,否則無法滿足客户需求,這樣的模式導致一批人工智能企業被迫做成了「勞動密集型」公司——這是上一代技術條件下無法避免的内生性問題,也是弊端。
AI 1.0 時代中,智慧城市平台更類似于一個「感知網」,遍布于城市各角落的數據收集設備是「傳感器」,自動化采集原本需要人為收集的數據,例如實時發現火災、占道經營、垃圾溢出等狀況。雖然也為城市治理帶來了可觀可喜的變化,但彼時的「城市大腦」主要通過專家規定的範式、人為設計的邏輯驅動決策,是一個「沒有成熟的大腦」,不足以應對城市中多樣復雜的情況。
而大模型本身所具備的泛化能力,很大程度上緩解 AI 1.0 時代的痛點,節省了原來高昂的定制化預算。張果琲透露,具備大模型能力的智慧城市業務只需要花原來十分之一甚至更少的成本就可以完成部署,成本甚至能下降一個數量級。
商湯就在方舟城市開放平台基礎上,将多年積累的視覺能力和大模型能力相結合,迭代出了方舟多模态新智平台(SenseFoundry VL)。
AI 2.0 相對于 AI 1.0 時代的技術革新,首先體現在大模型的海量知識和推理思考能力上,這給原有的方舟城市平台單純的視覺能力帶來極大加成,不僅能夠準确地識别城市中實時發生的狀況,更能做出認知判斷。比如,傳統的智慧城市大腦只能識别火情及煙霧,無法判斷是火災還是煙花,而方舟多模态新智平台則能做出準确的認知。
其次,大模型對智慧城市業務的提升也體現在語言和視覺能力的互動上,即能夠整合多模态能力。從前,如果要在城市場景中找到救護車,需要先把大量救護車圖片喂給算法,教會它什麼是救護車,才能成功檢測到目标對象,而現在只需要用自然語言的方式下達指令,就能了解到城市中救護車的數量及位置。
除此之外,大模型的泛化能力能夠處理大規模數據,這天然适配城市這個具備海量數據的場景,提高信息處理效率。在以往,暴雨過後街道積水,可能有成百上千的市民同時致電城市 12345 公共服務便民熱線反饋問題,大量接線員重復地将問題分發給對應的城市管理部門,一方面占用熱線資源,另一方面城市管理部門需要花費大量時間精力處理信息。
如今,大模型可以對來電信息進行信息理解,從而分類分撥,減少接線員及執行部門的重復工作。「方舟多模态新智平台」助力 12345 工單的分類分撥速度提升至原先的 10 倍以上,在一個月内完成超過 30 萬次的分撥訴求,單個分撥員原本一個月的工作量現在僅需一天即可完成。
可以説,「方舟多模态新智平台」所實現的語言和視覺結合,不是做簡單的「 1 + 1」加法 ,而是做倍數放大的乘法,多維度更新智慧水平。目前,這一平台的提升系統地體現在三方面:
一是「需求即指令」。用户可直接自然語言提問輸入查詢,大模型會理解用户意圖并給出相應的答案。例如,在交通運輸場景,交通部門或物流企業可通過構建物流運力分析智能體,提取車輛位置、車流狀況、天氣等相應信息提取派單信息,最終制定更科學合理的物流車輛運輸時空圖譜。
二是「對話即檢索」。讓用户獲得 " 所説即所得 "、" 所問即所應 " 的體驗。例如,在劇烈台風後,城市管理者可通過對話即刻檢索出樹木倒伏、電線杆傾倒等各類危害交通安全的場景,從而進行快速響應處理。
三是「提示即提優」。無需海量定制研發投入,只需少量正負樣例數據和提示詞調整,即可一鍵生成通用模型和特定模型,部分復雜城市事件的識别準确率高達 90% 以上,真正實現模型生產和調優的使用易、落地快、成本低。
方舟城市平台的迭代更新,使得商湯智慧城市業務的技術驅動核心不再是基于人所設定規則的「機械」智能,而是「聽得懂、會交流、擅優化」的多模态平台。
「1+X」戰略下,厚積薄發的智慧城市
過去兩年的時間中,在新舊 AI 技術交替的節點上,商湯作為典型的上一代 AI 企業代表,沒有在跌宕的技術浪潮前遲疑,而是即刻起身,快速轉型。
2023 年,面對生成式 AI 崛起的趨勢,商湯進行了一次業務調整,确立了傳統 AI、生成式 AI 和智能汽車作為新的三大業務板塊。這一轉變意味着商湯科技正在從以智慧城市業務為主要增長點的 AI 1.0 時代,向以生成式 AI 技術為核心驅動力的 AI 2.0 時代轉型。
2024 年 10 月,商湯科技再次進行戰略重組,建立了新的 「1+X」的架構,其中「1」 代表集團核心業務,打造行業領先的 AI 雲,實現大裝置、基礎模型和 AI 應用的無縫集成,在 CV 領網域,打造通用視覺模型深耕各個應用場景;「X」 代表重組拆分的生态企業矩陣,包括智能汽車 " 絕影 "、家庭機器人 " 元蘿卜 "、智慧醫療、智慧零售等。
在大裝置、大模型、應用三位一體的格局中,應用部分的其中一個重要落地形式是将傳統視覺和大模型結合。雖然以商湯為代表的 AI 公司在 1.0 時代,已經在城市板塊做了大量的探索和試錯,并将視覺技術落在了許多長尾場景,但加入大模型能力之後,業務增長空間再次得到激發。商湯在傳統 AI 板塊的看點不只是新技術趨勢下的落地驗證,還将為商東加速實現營收,起到穩定現金流的關鍵作用。
過去十年,商湯智慧城市業務在商業化上經歷了長期探索和驗證。通過深入到智慧城市諸多場景,商湯快速探索到技術邊界,并檢驗出技術在哪些場景中可以立即商業化,為客户帶來長遠價值。
基于這些行業認知,商湯有機會在大模型時代用更短、更直接的路徑有效地實現盈利。目前,商湯的智慧城市業務主要有兩條路:一是,在過去十年已經「摸透」的成熟場景中加入 AI 能力,更好地滿足舊場景中的新需求,達到成本更低、商業化更健康的狀态;二是,挖掘更多場景。在 CV2.0 時代,随着智能視覺的技術範式更新,智慧城市定義也将不僅僅被局限在原來少數的領網域,将有機會滲透到更多更廣泛的城市管理和商業業務中。
無論是哪條路,商湯都有明顯優勢。作為一家 To B 領網域起家的公司,商湯通過方舟城市開放平台在智慧城市場景中累計支持了超 200 萬路實時視頻的智能分析,積累了海量的真實數據和行業知識。相較于在線上互聯網中就能收集到的廣泛數據,線下真實場景中的專業數據對多模态模型在垂類領網域的能力有更快的提升。商湯也會用核心業務積累的技術和資源持續賦能智慧城市及商業業務的拓展。
另外,商湯在 AI 領網域的判斷眼光,不僅表現為大模型爆發後一系列的戰略調整,更表現為爆發前商湯就搶灘算力基座。2019 年,商湯即投資在上海建立智算中心,這就是之後「大裝置」的基礎。據披露,商湯大裝置總算力規模已經達到了 20000P,運營 GPU 數量達到 54000 張卡。算力的前瞻布局,讓商湯的視覺模型有了穩定的後方。
結語
IDC 今年發布的《2023 中國人工智能軟體市場份額》報告顯示,在 2023 年,商湯科技市場份額 25.1%,位居中國計算機視覺市場第一,并且超越第二、三名的總和。
必須要承認的是,商湯的傳統 AI 板塊依然領先。而背後的底氣是商湯在 To B 領網域深耕多年所積累的客户理解、行業認知,這也是商湯這類 AI 1.0 時代就殺出重圍的企業在大模型時代的優勢。
AI 2.0 發展至今,To B 業務與新技術的結合很有可能是 AI 公司們交出商業化答卷,實現技術普惠的一條康莊大道。顯然,商湯的智慧城市業務正在低調但堅定地走在這條路上。
商湯并不擔心近幾年新湧現的大模型創業公司搶占 B 端市場。「首先,這個市場還足夠大。其次,從一個初創公司成長到能夠赢得 B 端客户信任的、能夠高質量做交付的公司并不是一朝一夕的事,這需要一個一個客户去做、一個一個場景去落。」張果琲告訴雷峰網。
當下階段,商湯智慧城市業務側重的方向是把其中的感知數據和認知體系建立起來,讓 AI 輔助人進行高質量的決策、執行。下一步,張果琲透露,商湯智慧城市的發展目标是,将争取讓城市在沒有人參與的情況下實現自閉環,所有感知、認知、決策、執行的過程都由城市平台完成。