OpenAI 12天·第2天：強化微調，用專業數據打造領網域專家級 AI - 大酷樂

今天小編分享的教育經驗：OpenAI 12天·第2天：強化微調，用專業數據打造領網域專家級 AI，歡迎閲讀。

作者 | AI 工作坊管理智慧

來源 | AI 深度研究員 管理智慧

咨詢合作 | 13699120588

文章僅代表作者本人觀點

OpenAI 12 天的第 2 天，強化微調（RFT），通過少量數據，讓模型在專業領網域到達專家水平。

OpenAI 今天宣布了一項創新的強化微調研究計劃。這項革新性的 AI 訓練方法可能目前和普通人關系沒那麼很大，但是為專業領網域的研究人員帶來了豐富的應用前景。

在與 OpenAI Research 高級副總裁 Mark Chen、伯克利實驗室環境基因組學和系統生物學計算研究員 Justin Reese 等專家的研讨中，這項技術的獨特價值得到了充分展示。該計劃允許開發人員在包含數十到數千個高質量任務的數據集上進行訓練，通過參考答案評估模型響應，從而實現 AI 模型在特定領網域的定制化能力提升。

與傳統微調方法不同，這種新型強化微調并非簡單地記憶數據答案，而是着重培養模型在特定領網域的推理能力。這個過程可以類比為向 AI 提供一本棋譜，讓它通過自主學習掌握下棋技巧。具體來説，該方法采用了雙數據集訓練策略：一個用于微調訓練，另一個用于效果驗證，通過反復的自我推理訓練和驗證過程，最終達到較高的專業水準。

這項技術在法律、保險、醫療保健、金融和工程等專業領網域展現出巨大的應用潛力，特别是在那些需要明确定義且專家共識的任務中。OpenAI 計劃在 2025 年初正式發布這一技術，在此之前，參與者将可以優先訪問 alpha API，并有機會通過共享數據集和提供反饋來協助完善這一技術。

示例説明它在開發平台上的樣子。展示了如何在 o1-mini 上選擇 RFT

1. 使用 RFT 時數據是什麼樣子的。使用評分器對模型的答案進行評分。将提供不同的評分器，并能夠使用自定義評分。

2. 儀表板顯示了 RFT 模型（ft:01-mini....）與其他模型相比的評估。

3. 非常酷的儀表板，用于分析 RFT 模型的結果。

展望未來，OpenAI 計劃在 2025 年初将強化微調技術（RFT）作為一款正式產品推向市場，讓更多用户能夠受益于這項創新技術。雖然 RFT 可能并非适用于所有應用場景，但其在科學研究領網域的潛力尤為顯著。

這項技術有望為科學發現帶來突破性進展，推動人工智能在科研領網域的模型創新，為人類知識的開拓提供新的可能。

熱門排行

高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
曹操墓，裏面都有啥？衛青柏 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
解除資格！停止一切合作佼昌翰 | 2023-05-02
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
五一檔沒一個能打的集玲琳 | 2023-05-05
200户連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容温柔郜萌運 | 2023-05-02