Gate News 訊息,4 月 22 日——OpenAI 已發布 Privacy Filter,這是一個開源的語言模型,旨在偵測並遮蔽文字中的個人可識別資訊 (PII)。該模型可在本機運行,並可在單次前向傳遞中處理長文件,支援最多 128,000 個 tokens 的上下文。隱私過濾器共包含 15 億個總參數與 5,000 萬個啟用參數,可識別私人姓名、地址、電子郵件地址、電話號碼、URL、日期、帳號數字、密碼、API 金鑰以及其他敏感資訊。
該模型可在 Hugging Face 與 GitHub 上以 Apache 2.0 授權提供。它能辨識廣泛的 PII 類別,包括個人聯絡資訊、金融資訊與驗證憑證。
OpenAI 表示,Privacy Filter 旨在用於以隱私保護為導向的工作流程,例如訓練資料準備、索引、記錄(logging)與內容審查(content moderation)。