OpenAI 12天·第2天：强化微调，用专业数据打造领網域专家级 AI - 大酷樂

今天小编分享的教育经验：OpenAI 12天·第2天：强化微调，用专业数据打造领網域专家级 AI，欢迎阅读。

作者 | AI 工作坊管理智慧

来源 | AI 深度研究员 管理智慧

咨询合作 | 13699120588

文章仅代表作者本人观点

OpenAI 12 天的第 2 天，强化微调（RFT），通过少量数据，让模型在专业领網域到达专家水平。

OpenAI 今天宣布了一项创新的强化微调研究计划。这项革新性的 AI 训练方法可能目前和普通人关系没那么很大，但是为专业领網域的研究人员带来了丰富的应用前景。

在与 OpenAI Research 高级副总裁 Mark Chen、伯克利实验室环境基因组学和系统生物学计算研究员 Justin Reese 等专家的研讨中，这项技术的独特价值得到了充分展示。该计划允许开发人员在包含数十到数千个高质量任务的数据集上进行训练，通过参考答案评估模型响应，从而实现 AI 模型在特定领網域的定制化能力提升。

与传统微调方法不同，这种新型强化微调并非简单地记忆数据答案，而是着重培养模型在特定领網域的推理能力。这个过程可以类比为向 AI 提供一本棋谱，让它通过自主学习掌握下棋技巧。具体来说，该方法采用了双数据集训练策略：一个用于微调训练，另一个用于效果验证，通过反复的自我推理训练和验证过程，最终达到较高的专业水准。

这项技术在法律、保险、医疗保健、金融和工程等专业领網域展现出巨大的应用潜力，特别是在那些需要明确定义且专家共识的任务中。OpenAI 计划在 2025 年初正式发布这一技术，在此之前，参与者将可以优先访问 alpha API，并有机会通过共享数据集和提供反馈来协助完善这一技术。

示例说明它在开发平台上的样子。展示了如何在 o1-mini 上选择 RFT

1. 使用 RFT 时数据是什么样子的。使用评分器对模型的答案进行评分。将提供不同的评分器，并能够使用自定义评分。

2. 仪表板显示了 RFT 模型（ft:01-mini....）与其他模型相比的评估。

3. 非常酷的仪表板，用于分析 RFT 模型的结果。

展望未来，OpenAI 计划在 2025 年初将强化微调技术（RFT）作为一款正式产品推向市场，让更多用户能够受益于这项创新技术。虽然 RFT 可能并非适用于所有应用场景，但其在科学研究领網域的潜力尤为显著。

这项技术有望为科学发现带来突破性进展，推动人工智能在科研领網域的模型创新，为人类知识的开拓提供新的可能。

熱門排行

高露现身上海虹桥机场黑色外套点缀亮色爱惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：处理器更新为天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懒癌”发病率上升，定期体检别忽视幸聽楓 | 2023-05-02
宋慧乔获百想视后韩素希发图手动加爱心表賁芳蕤 | 2023-05-02
曹操墓，里面都有啥？衛青柏 | 2023-05-02
十年了，他们终于要HE！惠惠君 | 2023-05-07
中央部署经济工作，释放5大信号郜萌運 | 2023-05-02
高德上线手机弯道会车预警功能習又夏 | 2023-05-02
《云襄传》终于抬上来啦，男O女A让人好上头！集玲琳 | 2023-05-02
陈自瑶抱病为爱女做蛋糕庆生，王浩信点赞没露賁芳蕤 | 2023-05-02
等比例长大的童星，李兰迪算一个郟君昊 | 2023-05-02
21家A股游戏公司2022年收入651亿今年“游衛青柏 | 2023-05-04
普京签署总统令，批准对俄刑法典相关法条的修集玲琳 | 2023-05-02
这些被抓来做实验的流浪狗，最终拯救了无数糖集玲琳 | 2023-05-02
信用风险释放趋缓，结构性风险需重点关注 — 袁曼雁 | 2023-05-02
与周立波夫妇闹纠纷成老赖，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
高端国产车：军车血统，目前电动车越野的“天花謝飛揚 | 2023-05-02
解除资格！停止一切合作佼昌翰 | 2023-05-02
3699起联想小新mini主机上架 13代酷睿标压習又夏 | 2023-05-05
中银证券给予南京银行增持评级袁曼雁 | 2023-05-03
前董事长被免，天山生物全面进入“中植系”时惠惠君 | 2023-05-02
疯成这样，怎么还能被全网吹捧？郜萌運 | 2023-05-02
狂吼11次“让一下”！交警咆哮开道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收购美国第一共和银行謝飛揚 | 2023-05-02
事关农村土地承包和农民权益，《农村土地承包郟君昊 | 2023-05-02
台剧赢麻了，又来一部8.9 衛青柏 | 2023-05-02
下降45分，上涨35分！34所自划线院校复试分数线袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好这件事是关键習又夏 | 2023-05-05
五一档没一个能打的集玲琳 | 2023-05-05
200户连夜疏散，原因让人愤怒！“损失超一亿”，袁曼雁 | 2023-05-03
恐怖韩剧下神坛，这次胆小可入袁曼雁 | 2023-05-05
这剧是不是用ChatGPT写的呀？惠惠君 | 2023-05-02
性骚扰惯犯，滚出娱乐圈謝飛揚 | 2023-05-05
48岁何炅自曝已老花眼，黄磊睡前认老，《向往的佼昌翰 | 2023-05-02
一个《长月烬明》倒了，《狐妖》《长相思》《惠惠君 | 2023-05-02
当年轻人开始不随份子钱袁曼雁 | 2023-05-02
张天爱假期晒“酷”存照卷发披肩穿黑色吊嬴覓晴 | 2023-05-02
毕滢用8年时间成功逼宫？曾被传已婚生子的她，幸聽楓 | 2023-05-03
宋慧乔获视后首次晒照，拿奖杯笑容温柔郜萌運 | 2023-05-02