今天小編分享的互聯網經驗:為了在AI時代做好“AI助手”,vivo做了哪些努力?,歡迎閲讀。
在當今科技飛速發展的時代,人工智能(AI)無疑是最具變革性的力量之一。從智能語音助手到影像識别技術,AI 已經滲透到我們生活的方方面面。
在智能手機領網域,AI 的應用更是成為了各大廠商競争的焦點。
布局
vivo 作為一家在智能手機領網域具有重要影響力的廠商,早在 2017 年 6 月就已經成立了 AI 研發中心,啓動了人工智能相關研究。
在 2018 年 3 月,vivo 發布了首款搭載人工智能語音助手 Jovi 的 vivo X21,并正式成立了 vivo AI 全球研究院,副總裁周圍出任研究院院長,開始了在 AI 領網域的探索之旅。
vivo X21 圖源:vivo
當時 vivo 判斷,人工智能、芯片和 5G 通訊,是未來幾十年科技創新的底層技術,vivo 想要在未來繼續保持行業第一梯隊的位置,就一定要在這些技術上面成為深度參與者。
vivo 迅速确立了一份 3 到 5 年的中長期發展戰略規劃,并将在全球範圍聘請 AI 專家。研究院的成立為 vivo 匯聚了大量的 AI 人才,到 2019 年時,vivo 已經擁有超過 1000 名 AI 工程師,為後續的技術研發奠定了堅實的基礎。
積累
在組建隊伍後,vivo 開始在 AI 技術研發上加大投入。
2019 年,vivo 推出了自己的 " 智慧 " 手機,周圍也總結出了 " 三自三全 " 的理念,即自學習、自建議、自索引,全互動、全場景和全連接,展示了 vivo 對 AI 在手機應用上的初步探索。
随着技術的不斷發展,大模型的出現成為了 AI 領網域的 " 奇點 "。
在 2023 年,vivo 對外公布了自研通用大模型矩陣 " 藍心大模型 ",該矩陣涵蓋了 10 億、70 億、700 億、1300 億、1750 億等不同參數量級的模型,分别在不同場景下用于處理不同的任務,如自然語意理解、文本摘要擴寫、多維度内容生成以及復雜邏輯推理等。
藍心大模型矩陣 圖源:vivo
這些模型不僅在各大專業機構的綜合評分中名列前茅,更标志着 vivo 在 AI 底層技術上取得了重大突破,為其在 AI 應用層面的創新提供了強大的支撐。
重構
手機作為連接數字世界的橋梁,完全有機會打造成為用户的個人專屬智能管家。基于這個認知,vivo 開展了一系列工作。
vivo 副總裁、OS 產品副總裁、AI 全球研究院院長周圍認為,手機智能管家應具備五個特點:首先,要能感知識别用户意圖;其次,要能形成共同記憶;第三,是具備部分場景下替代用户的決策能力;第四,要能像人一樣懂得如何操作手機裏的眾多應用;第五,要能像助理一樣管理日常事務。vivo 正是基于這些特點在推進手機端 AI 研發的相關工作。
2023 年 11 月初,在 ChatGPT 3.5 正式發布的前夕,深度融合藍心大模型的 OriginOS 4 預覽版與用户見面,通過 " 藍心小 V" 應用展示了 vivo 在 AI 大模型上的應用成果。
而前段時間剛剛發布的 OriginOS 5 則更進一步,不僅局限于在系統中增加 AI 功能點,而是将整套系統基于藍心大模型進行重構,讓 AI 在這套作業系統中變得無處不在,更好地服務用户,讓手機在現實生活中發揮更高效、簡單、主動、智能的作用。
圖源:硅星人
這一轉變體現了 vivo 從單純的功能添加到系統級重構的進化,标志着 vivo 在 AI 應用上進入了一個新的階段。
在未來一到三年内,vivo 将基于用户需求和應用場景,提供更多實際價值。
創新
從 80 年代到現在,每一代偉大的產品在互動上都形成了巨大的變革。
iPhone 的電容屏,讓用户從用指甲蓋變成用指尖去操作,多點觸控也讓用户在放大、縮小圖片時不需要點按相應的按鈕,而是使用雙指張開或并攏。這些看起來微乎其微的差距,帶來的其實是巨大的互動轉變,後來的語音助手 Siri 亦是如此。
在 AI 技術的應用中,vivo 也十分注重構符合用户直覺的互動方式。在 OriginOS 5 中,vivo 采用大量長按、圈選、拖放的互動邏輯,構建了一種新的互動規則。
在 10 月 30 日舉辦的硅星人 2024 AI 創造者大會上,vivo 副總裁、OS 產品副總裁、AI 全球研究院院長周圍表示:"vivo 的人工智能團隊有千人左右模型,手機的軟體團隊也大概是 1000 多人在做應用和創意。2000 人的團隊對于我們接下來要做得這麼大的工作來説還是太渺小了,所以我們肯定要和行業先進的合作夥伴共創共建。"
圖源:硅星人
周圍深刻的認識到,對于 " 讓手機成為專屬私人助理 " 這一理念來説,vivo 只靠自己是遠遠不夠的。為了實現更好的垂類模型體驗,vivo 的目标是創建一個大模型 " 廣場 ",與行業中在各自領網域内的專業團隊展開深度合作,目前百度、阿裏、字節、智譜都是 vivo 的深度合作夥伴。
探索
在 2024 年的開發者大會上,vivo 對未來 AI Phone 應該長什麼樣子,做出了自己的解讀,卻很少對外公布大模型迭代的進度。
一年的時間裏,vivo 技術團隊的工作重點主要撲在搭框架、做基建,做好意圖、智能體平台、感知與決策、記憶和自動執行。其實這裏每一個關鍵詞都代表着一個大團隊至少做了一年的努力,但是因為目前對用户沒有實際的意義和幫助,所以 vivo 對外説得比較少。
但 vivo 也對外展示了一些 " 小成品 "。
比如為了解決傳統大模型無法做到像人一樣的操作手機,在 2024 年開發者大會上,vivo 對外展示了名為「Phone GPT」的一款全新的智能體,它可以在接到指令後像人一樣的操作 App,搜索對應的商家,自動撥打客服電話,用 AI 拟人語音的形式完成訂座指令,整個過程全部在前台完成,無需調用任何三方應用的接口即可實現。
PhoneGPT 圖源:不客觀實驗室
在未來,vivo 将會圍繞框架和基建持續深耕,在研發的過程中會湧現出一批類似「PhoneGPT」一樣的明星級產品,為用户帶來了更加便捷的體驗。
挑戰
盡管 vivo 在 AI 技術研發上取得了不少成果,但在用户需求的把握上仍然面臨挑戰。
AI 技術的發展帶來最大的 " 挑戰 ",就是一系列倫理和隐私問題。而在探讨倫理問題時,價值觀是首要考量因素。
vivo 研發藍心大模型的願景,就在于打造一個最能理解中國人的大模型,這就要求知識供給必須契合中國文化,并且價值觀要與中國文化完全相符。基于此願景,vivo 開展了一系列工作,包括完整的訓練數據建設、數據清洗以及審核流程。
值得一提的是,vivo 在審核方面所具備的能力在行業内具有獨特性。vivo 不僅自行建立了審核能力,所采用的審核模型更是達到了百億級别,更為關鍵的是,vivo 将審核模型實現了端側化。
周圍表示,在全球範圍内尚無其他公司能夠做到這一點。" 如果審核未能實現端側化,那麼所謂的端側化就是不完整的。"
vivo 很早便察覺到這一問題的重要性,并對其懷有敬畏之心,進而開展了一系列與之相關的能力建設工作。
總結
從早期的戰略布局伊始,歷經技術沉澱積累以及模型研發探索,進而邁向系統重構與應用創新的新階段,vivo 在 AI 領網域已然斬獲諸多成果。
在此過程中,vivo 并非一帆風順,同樣面臨着諸如用户需求難以精準把握、技術競争壓力與日俱增、倫理和隐私問題錯綜復雜等一系列挑戰。
盡管如此,vivo 憑借持續創新的精神、不斷深化的合作夥伴關系、積極拓展的應用場景以及對行業标準制定的推動,仍然有望在 AI 領網域維持領先優勢。
這不僅将為用户呈上更為智能、便捷的手機使用體驗,還會為整個手機行業的 AI 應用發展貢獻自身的力量,開啓智能手機與 AI 融合的新篇章,最終實現 AI Phone 成為 " 個人專屬智能管家 " 并惠及所有用户的美好願景。