今天小編分享的科技經驗:谷歌最新AI大語言模型數據量擴充5倍,歡迎閲讀。
钛媒體 App 5 月 17 日消息,據報道,谷歌上周發布的最新大語言模型使用的訓練數據,幾乎是 2022 年的上一代模型的 5 倍。得益于此,該模型在編程、數學和創意寫作方面的表現更為優秀。
谷歌是在其 I/O 開發者大會上發布最新通用大語言模型 PaLM2 的。内部檔案顯示,該模型采用了 3.6 萬億個令牌(token)進行訓練。令牌指的是單詞串,這是訓練大語言模型的重要基礎,因為這可以教給模型如何預測字元串中可能出現的下一個單詞。而之前版本的 PaLM 發布于 2022 年,當時使用的令牌為 7800 億個。(新浪科技)