OpenAI發表Day2》逆天「強化學習微調」新功能,增強AI專業領域學習準確度
OpenAI 在新產品活動發布 Day2 釋出「強化學習微調」(Reinforcement Fine-Tuning,RFT) 功能,讓用戶能夠在客製化模型在個別領域的推理能力,進而提高模型的準確率,並且這一功能可以沿用在許多領域上,包括科學研究、法律、金融、保險、工程等等。
(前情提要: OpenAI 發表滿血版 o1 模型和新訂閱方案 ChatGPT Pro,月費 200 美元值得嗎? )
(背景補充: OpenAI 宣布將連續 12 天直播:推出許多新功能,AI 概念幣可埋伏? )
ChatGPT 背後開發商 OpenAI 在 5 日預告,將於 6 日凌晨 2 點開始進行為期 12 天的新產品發布。首日登場的是完整版推理模型 o1,取代先前的預覽版本,目前 ChatGPT Plus、Team 和 Pro 用戶已可以使用,同時還推出可以無限制使用 o1 模型的訂閱方案 ——「ChatGPT Pro」。
延伸閱讀: OpenAI 發表滿血版 o1 模型和新訂閱方案 ChatGPT Pro,月費 200 美元值得嗎?
而今(7)日是活動 Day2,OpenAI 準備了哪些驚喜給我們呢?
釋出新功能「強化學習微調」
在第二天的產品發佈中,OpenAI 釋出新功能「強化學習微調」(Reinforcement Fine-Tuning,RFT),讓用戶能夠使用自己的數據集,透過強化學習演算法對 o1 模型進行客製化訓練。另外,活動主持人表示,強化學習微調僅需數十個高品質範例便可迅速提升模型在該特定領域的推理能力。
值得一提的是,這一功能可以沿用在許多領域上,包括科學研究、法律、金融、保險、工程等等。
另外,在發布影片中,柏克萊國家實驗室計算生物學家 Justin Reese 也參與了模型的現場演示,分享「強化學習微調」是如何幫助診斷罕見疾病。
在 Reese 展示的圖片中可以看到,o1 模型原先的識別準確率為 25 %;o1 mini 模型原先的識別準確率為 17%,而在強化學習微調後的 o1 mini 模型準確率提升至 31 %,準確率增幅達到 82% 。
雖然「強化學習微調」功能大幅提升模型在特定領域的準確度與專業性,不過主持人也表示,目前強化學習微調功能仍處於預覽階段,計劃於明年向大眾推出。另外, OpenaAI 目前已啟動 RFT alpha 計畫 ,號召大學、研究機構或企業等單位參與此項功能的測試。
📍相關報導📍
ChatGPT被爆「拒絕回復David Mayer」等人名,OpenAI遭疑刻意封鎖資訊
OpenAI 宣布將連續 12 天直播:推出許多新功能,AI 概念幣可埋伏?
OpenAI 發表滿血版 o1 模型和新訂閱方案 ChatGPT Pro,月費 200 美元值得嗎?
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
Synthetix提議以2700萬美元代幣交換收購期權協議Derive
簡要概述 Synthetix 的貢獻者提議通過 SNX 換取 DRV 代幣的方式收購 Derive(前身為 Lyra)。提議的估值為 2700 萬美元,交換比例為 27 DRV 兌 1 SNX。

FalconX 與渣打銀行合作以提升機構客戶的加密貨幣產品
快速摘要 FalconX 與渣打銀行達成戰略合作夥伴關係,以加強其對機構客戶的加密貨幣服務。渣打銀行將為 FalconX 提供其銀行基礎設施和多種貨幣對,並計劃在目標客戶和地區擴展業務。

美國司法部起訴涉嫌的錫那羅亞販毒集團領導人,區塊鏈公司追查加密貨幣與芬太尼交易的聯繫
快速摘要 美國司法部起訴了據稱是錫那羅亞販毒集團分支的領導人,指控其涉及毒品恐怖主義和毒品走私。區塊鏈調查人員已追蹤到國際犯罪集團利用加密貨幣資助芬太尼活動並洗白非法財富。

CFTC專員Mersinger離職,將擔任區塊鏈協會CEO
快速摘要 夏季·梅辛格計劃於週三辭去CFTC的職務。梅辛格即將在區塊鏈協會擔任領導職務,正值華盛頓的立法者正在努力通過法案以監管穩定幣及整個加密貨幣行業之際。

加密貨幣價格
更多








