品玩10月30日訊,據 Winbuzzer 報道,OpenAI周三發布開源權重AI模型系列gpt-oss-safeguard,含120b和20b兩個版本,已在Hugging Face上線,采用Apache 2.0許可,支持免費商用。
該模型區別于傳統安全工具,通過推理實時解讀開發者自定義的內容安全政策,接收政策與待審核內容雙輸入,以思維鏈過程得出分類結果,推理過程可追溯,適配無標注數據的新興風險場景。模型由OpenAI聯合Discord、ROOST等機構開發,ROOST同步在GitHub發起社區促進技術交流。
此次發布正值OpenAI面臨監管壓力,此前一日其披露每周數十萬用戶在ChatGPT聊自殘等內容。模型源于內部Safety Reasoner工具,但復雜風險識別不及專用分類器,且推理耗資源,低延遲場景需分層部署。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.