今天小編分享的财經經驗:有道上線翻譯大模型,CEO稱已經趕超ChatGPT,歡迎閱讀。
圖片來源:視覺中國
ChatGPT 出現之後,網易有道公司内部大吵了一架。
吵架的話題導火索是,有道翻譯這款產品的下一步該如何走。這款產品在 2008 年上線,是網易自主研發的,也是國内首家統計機器翻譯線上引擎。
經過 15 年的技術迭代,有道神經網絡翻譯(NMT)在行業内占據優勢地位。第三方平台的數據顯示,到目前為止,有道詞典月活用戶已經超過 1 億,是國内詞典翻譯市場的第一名。
通常而言,做翻譯相關產品,業内的共識追求是,它能不能替代人工翻譯。一定程度上,現有的翻譯產品,已經實現了這一目标。
目标實現了,然後呢?這之後,應該怎麼辦?換句話說,一項技術一旦超越了傳統能力,甚至超過人類智力表現之後,最大的改變應該是什麼?
網易有道 CEO 周楓想明白了,前沿技術已經在更新,翻譯再這樣做下去不行,必須要迭代。他想用大模型的方式,重新思考翻譯這款產品的邏輯。
最大的改變,應該是讓翻譯產品的使用量大幅上升,就像福特做出了 ModelT 這款改寫全球汽車產業發展的汽車。ModelT 的價格讓普通人都負擔得起,汽車變成所有人都可以用,這個時候,技術就真的改變世界了。
周楓告訴钛媒體 APP,這些争吵在注重技術的網易有道屬于常态,他們内部也經常做這樣的事情。
他認為,技術團隊時常需要轉換腦筋。于是,他把翻譯團隊這幫老同事再度聚集起來,讓大家學習大語言模型的能力,試圖把翻譯這款產品在新的模型上跑起來。
大約過了四五個月之後,團隊評測後發現,這些工作是有效的,現有模型的性能和最後翻譯的質量,已經超過之前用的模型了。
但投入 " 燒錢 " 的大模型,對于尚處于盈利階段掙扎的網易公司來說,是否劃算?公司研發和訓練大模型的成本投入,又是否感到吃力?
今年第一季度,網易有道業績產生波動。财報數據顯示,一季度,網易有道淨收入為 11.6 億元人民币,同比減少 3.1%;淨虧損 2.1 億元,同比增加 101.9%,繼上個季度利潤轉正後再次由盈轉虧;并且,有道一直引以為傲的硬體業務收入也下滑 16%。
" 做公司永遠是這樣的,好東西都要錢,好的也最貴,這不是新問題,我們一定會管理好。" 周楓對钛媒體 APP 表示。
他稱,現在做大模型效率還比較高,一方面是公司之前有一定的基礎,另一方面,有道 Transformer 的優化很強,很早的時候,他們就能把 Transformer 裝到小設備裡面。
并且,大模型的邊際成本非常低,復制模型不需要太多額外的成本。雖然有道的近百人的 AI 團隊,人數也不少,但總體上,不需要增加額外的特别大的投入。
在網易有道首席科學家段亦濤看來,很多技術和資源都是一脈相承的。他告訴钛媒體 APP,有道做大模型的過程,是在之前團隊框架進行的,并沒有額外的組建團隊來做。
從 2016 年開始,有道協同構建 AI 基礎能力,同步組建語言、視覺、聲音等團隊,積累了有道神經網絡翻譯(NMT)、計算機視覺、智能語音 AI 技術、高性能計算 ( HPC)四個底層技術能力。
2017 年,有道就看上了主流技術 Transformer,将 AI 能力統一在大模型之下,重視在端側的落地應用。2019 年,有道詞典筆 2 代的產品中,首次搭載離線 Transformer NMT。2022 年,有道詞典筆 P5 中搭載了自研的離線 ASR,已更新為 Transformer 技術。
用大模型做翻譯產品,周楓公開表示,在内部的測試中,在中英互譯的方向上,已經超越 ChatGPT 的翻譯能力,也超過了谷歌翻譯的水準。
不過,基于大模型的翻譯產品,一個非常現實的問題是,它的成本較之前是有所提升的。周楓對钛媒體 APP 透露,内部經過測算,用大模型做翻譯,因為計算量非常大,查詢一次的成本,要比之前的模型貴近 20 倍,而有道的翻譯產品,現在每天大約要承接幾億次的查詢量。
雖然讓大模型翻譯大量被使用是周楓的目标,但他也發現,大模型的确是燒錢,尤其是在最開始的時候,會有一些成本上的困難。他們目前需要資金,因為确實現有的東西,不滿足他們對產品的要求。
這樣的投入吃緊的現實,也可能改變翻譯這類產品的商業模式。不同于以往翻譯產品的流量轉化廣告變現的邏輯,周楓告訴钛媒體 APP,對大模型翻譯來說,付費會員制是目前比較合理的方案。
不過,大模型也已經引來教育界的 " 封殺 "。美國多所公立學校已經禁用了 ChatGPT, 多家科學期刊也禁止将 ChatGPT 列為論文 " 合著者 "。
周楓也反對學生在學習的過程中用大模型 " 抄答案 " 的行為,在應用端體現為 " 家長管控 " 功能,可以管控識别答案,給出講解,而不是直接給出最後的答案。
不用去把大模型去神聖化。周楓說,我們應當對大模型裡面的產品和技術創新做到具體案例具體分析,不能認為大模型是一切事物的通途,更值得研究的是,在豐富的應用場景。應用和場景是整個變革的過程中,大家應該及早去抓的。因為抓得越早,後邊能抓到的東西越多。
不只是網易有道,教育界也有一些公司對大模型的積極擁抱。今年 5 月,學而思正在研發數學大模型 MathGPT 的消息引發行業熱議。
彼時,學而思方面對钛媒體 APP 表示,MathGPT 以數學領網域的解題和講題算法為核心,目前已經取得階段性成果,并将于年内推出基于該自研大模型的產品級應用。
今年 7 月初,學而思一次發布會上透露可能該月底會有相關成果的對外展示。不過,截至目前,他們還沒有相關進展對外披露。
這背後或許是相對于其他領網域,數學大模型難度頗高。
數學大模型要解決的三個難題在于,第一,題目要解對,現在 GPT 結果經常出現錯誤;第二,解題步驟要穩定、清晰,現在 GPT 的解題步驟每次都不一樣,而且生成内容經常很冗餘;第三,解題要講得有趣、個性化,現在 GPT 的解釋過于 " 學術 " 和機械,對孩子的學習體驗很不友好。
周楓則認為,數學大模型是大家都想投入的方向,但只是給數學大模型 " 投喂 " 再多的内容,都不适用于數學領網域,它背後涉及的是一些數學原理性的問題,現在的大模型還不具備這樣的能力,但這仍是一個值得研究的方向。
钛媒體 APP 了解到,新東方、作業幫等教培巨頭内部,也已經把目光盯緊大模型,但目前暫未有公開落地的成果。
(本文首發钛媒體 APP,作者|李程程)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App