今天小編分享的科技經驗:OpenAI重磅更新,又變強了!API有了恐怖的函數調用能力,能處理更長上下文,價格還又降了75%!,歡迎閱讀。
6 月 13 日 OpenAI 官網突然發布了重磅的 ChatGPT 最新能力更新。重點如下:
1、新功能:在 Chat Completions API 中添加了新的函數調用能力,能讓模型在需要的時候調用函數并生成對應的 JSON 對象作為輸出。這使開發人員能更準确地從模型獲取結構化數據,實現從自然語言到 API 調用或數據庫查詢的轉換,也可以用于從文本中提取結構化數據。
(也就是經過 OpenAI 的微調後,你跟它說人話,它就能識别後給你轉換成函數,進一步不需要編程也能實現編程的能力了,并且還能更方便從混亂結構裡獲取結構化數據)
2、模型更新:更新了更可控制的 gpt-4 和 gpt-3.5-turbo 版本,以及 gpt-3.5-turbo 的新 16k 上下文版本,相比标準的 4k 版本能處理更長的文本。
(可以支持 20 頁文本了!)
3、模型棄用:公布了 gpt-3.5-turbo-0301 和 gpt-4-0314 模型的棄用時間線。這些模型的用戶可以在特定時間之前選擇更新到新的模型,過了這個時間後,舊模型将不再可用。
(一方面,還在使用這些模型的注意了,請跟上瘋狂的 OpenAI 的節奏。另一方面,很多對标 OpenAI 過往版本模型的人們,OpenAI 人家自己已經棄用了。。)
4、價格調整:最先進的嵌入模型的價格降低了 75%,gpt-3.5-turbo 的輸入代币價格降低了 25%。
(Sam Altman 最近在巡遊裡到處說會繼續降價,這不就來了。而且要降就是最強模型腳踝斬式的降價。最新價格,每 1k token,0.0001 美金)
OpenAI 還強調了一下,所有的這些模型都繼續保持在 3 月 1 日推出的數據隐私和安全保證 —— 客戶擁有他們請求生成的所有輸出,他們的 API 數據不會被用于訓練。通過這些更新,我們将邀請更多的等待名單上的人嘗試 GPT-4,我們期待看到你使用 GPT-4 構建的項目!我們鼓勵開發者反饋,以幫助我們确保模型更新的平穩過渡。
以下為公告全文:
今年初我們發布了 gpt-3.5-turbo 和 gpt-4 模型,僅僅幾個月的時間,我們已經看到開發者們在這些模型上構建出了令人難以置信的應用。今天,我們要跟進一些令人興奮的更新:
· Chat Completions API 中新的函數調用功能
· 更新并增加可控制性的 gpt-4 和 gpt-3.5-turbo 版本
· gpt-3.5-turbo 的新 16k 上下文版本(與标準 4k 版本對比)
· 我們最先進的嵌入模型的價格降低了 75%
· gpt-3.5-turbo 輸入令牌的價格降低了 25%
· 公布 gpt-3.5-turbo-0301 和 gpt-4-0314 模型的棄用時間線
所有這些模型都帶有我們在 3 月 1 日推出的相同的數據隐私和安全保證——客戶擁有他們的請求生成的所有輸出,他們的 API 數據不會被用于訓練。函數調用
開發者現在可以描述函數到 gpt-4-0613 和 gpt-3.5-turbo-0613,并讓模型智能地選擇輸出包含調用這些函數的參數的 JSON 對象。這是一種更可靠地将 GPT 的能力與外部工具和 API 連接的新方法。這些模型已經被微調,既能檢測出何時需要調用函數(取決于用戶的輸入),又能回應符合函數籤名的 JSON。函數調用讓開發者能更可靠地從模型獲取結構化數據。例如,開發者可以:
· 創建通過調用外部工具(如 ChatGPT 插件)來回答問題的聊天機器人;
· 将 " 詢問 Anya 是否想在下周五喝咖啡 " 這樣的問題轉換為諸如 send_email ( to: string, body: string ) 的函數調用,或者 " 波士頓現在的天氣怎麼樣?" 轉換為 get_current_weather ( location: string, unit: 'celsius' | 'fahrenheit' ) ;
· 将自然語言轉換為 API 調用或數據庫查詢;
· 将 " 這個月我的前十名客戶是誰?" 轉換為内部 API 調用,如 get_customers_by_revenue ( start_date: string, end_date: string, limit: int ) ,或者 " 上個月 Acme, Inc. 下了多少訂單?" 使用 sql_query ( query: string ) 轉換為 SQL 查詢;
· 從文本中提取結構化數據;
· 定義一個名為 extract_people_data ( people: [ {name: string, birthday: string, location: string} ] ) 的函數,從維基百科文章中提取所有提到的人物。
這些用例都由我們的 /v1/chat/completions 端點中的新 API 參數,functions 和 function_call 實現,這些參數允許開發者通過 JSON Schema 向模型描述函數,并選擇性地要求它調用特定的函數。請開始使用我們的開發者文檔,如果您發現哪些情況下函數調用可以得到改進,請添加評估。
函數調用示例
現在波士頓的天氣怎麼樣?
步驟 1
OpenAI API
使用函數和用戶的輸入調用模型
步驟 2
第三方 API
使用模型的響應調用你的 API
步驟 3
将響應發送回模型進行總結波士頓現在的天氣是晴朗的,溫度為 22 攝氏度。自從 ChatGPT 插件的 alpha 版本發布以來,我們對如何使工具和語言模型安全地協同工作了解了很多。然而,仍然存在一些開放的研究問題。例如,一個概念驗證漏洞說明了如何從工具的輸出中獲取不受信任的數據,使模型執行未預期的行動。我們正在努力減輕這些和其他風險。開發者可以通過只使用來自受信任的工具的信息,并在執行具有現實世界影響的行動,如發送電子郵件,在線發布,或進行購買之前,包括用戶确認步驟來保護他們的應用。
新模型
GPT-4
gpt-4-0613 包括了更新和改進的模型,以及函數調用功能。
gpt-4-32k-0613 包括了與 gpt-4-0613 相同的改進,以及增加的上下文長度,用于更好地理解較大的文本。
有了這些更新,我們将在未來幾周内邀請更多的等待名單上的人來試用 GPT-4,我們的目标是完全取消這個模型的等待名單。感謝所有耐心等待的人們,我們很期待看到你們用 GPT-4 構建的作品!
GPT-3.5 Turbo
gpt-3.5-turbo-0613 包括了與 GPT-4 相同的函數調用功能,以及通過系統消息更可靠地控制性,這兩個特性都允許開發者更有效地引導模型的回應。
gpt-3.5-turbo-16k 提供了 gpt-3.5-turbo 四倍的上下文長度,但價格是雙倍的:每 1K 輸入令牌 $0.003,每 1K 輸出令牌 $0.004。16k 的上下文意味着模型現在可以在一次請求中支持大約 20 頁的文本。
模型棄用
今天,我們将開始為我們在 3 月宣布的 gpt-4 和 gpt-3.5-turbo 的初始版本更新和棄用的過程。使用穩定模型名稱的應用(gpt-3.5-turbo,gpt-4,和 gpt-4-32k)将在 6 月 27 日自動更新為上面列出的新模型。為了比較模型版本之間的性能,我們的 Evals 庫支持公共和私有評估,以展示模型變化将如何影響你的用例。
需要更多時間進行過渡的開發者可以通過在他們的 API 請求的‘ model ’參數中指定 gpt-3.5-turbo-0301,gpt-4-0314,或 gpt-4-32k-0314 來繼續使用舊模型。這些舊模型将在 9 月 13 日之後仍然可以訪問,之後指定這些模型名稱的請求将失敗。你可以通過我們的模型棄用頁面來了解模型棄用的最新信息。這是對這些模型的第一次更新;因此,我們非常歡迎開發者的反饋,以幫助我們确保平穩過渡。
降低價格
我們會繼續提高我們的系統效率,并将這些節省下來的成本傳遞給開發者,即日起生效。
Embeddings
text-embedding-ada-002 是我們最受歡迎的嵌入模型。今天我們将其成本降低了 75%,到每 1K 令牌 $0.0001。
gpt-3.5-turbo 是我們最受歡迎的聊天模型,為數百萬用戶提供 ChatGPT 服務。今天我們将 gpt-3.5-turbo 的輸入令牌成本降低了 25%。開發者現在可以以每 1K 輸入令牌 $0.0015 和每 1K 輸出令牌 $0.002 的價格使用這個模型,這相當于每美元可以處理大約 700 頁。
gpt-3.5-turbo-16k 的價格将是每 1K 輸入令牌 $0.003,每 1K 輸出令牌 $0.004。
開發者的反饋是我們平台演化的基石,我們将根據收到的建議繼續進行改進。我們期待看到開發者如何在他們的應用中使用這些最新的模型和新功能。