今天小編分享的互聯網經驗:全球首個AI安全“中國方案”落地!360護航大模型安全發展,歡迎閲讀。
當前,以 DeepSeek 為代表的國產大模型發展勢頭迅猛,正重塑全球人工智能技術格局。然而,其背後潛藏的系統漏洞、内容風險、數據安全等隐患也頻頻敲響警鍾,不僅對大模型自身的安全性提出了更高的要求,也對整個行業的規範發展和治理構成嚴峻的考驗。安全不再是附加标籤,而是大模型引領數智時代的原生屬性。基于此,360 集團正式推出 DS 大模型安全解決方案,覆蓋模型訓練、推理、運營等大模型落地應用全過程,滿血守護 DeepSeek 發展,促進國產大模型企業向安全、向善、可信、可控的方向發展,為全球人工智能技術治理提供了可借鑑的 " 中國方案 "。
DeepSeek 發展面臨五大安全挑戰
DeepSeek 以其強大的數據處理能力、精準的算法模型以及深度的用户洞察,重塑了 AI 領網域的遊戲規則。然而,以 DeepSeek 為代表的大模型作為新質生產力推動者的同時,也面臨傳統網絡安全與新型安全風險交織的雙重挑戰。具體而言:
系統安全:此前 DeepSeek 遭遇網絡攻擊導致新用户注冊受阻的事件就暴露了其在大模型系統安全方面的脆弱性。DeepSeek 運行所依賴的硬體設施、軟體框架、作業系統等基礎層以及提示工程、緩存、向量庫等訓練和推理過程中使用的生态鏈工具共同構成龐大復雜的系統,系統中每個環節的缺陷都可能被惡意利用,加之開發運維過程中存在的不當使用和濫用等行為,技術脆弱性與人為風險因素相互疊加,使得大模型面臨嚴峻的系統安全風險。
數據安全:數據在大模型各階段流動創造價值,也帶來數據泄漏、篡改、濫用等各類隐私及合規風險。在數據收集訓練階段,可能使用未經授權版本數據訓練,導致侵權;在部署能力及開發階段,使用不同供應商的服務時,可能存在黑盒以提取大模型記憶隐私數據;在對外提供服務時,可能存在 API 濫用隐患問題;在推理使用階段,用户互動數據可能會泄漏或者濫用,違反隐私合規風險。
内容安全:由于 DeepSeek 依賴大量公開數據進行訓練,模型可能在無意中學習到不當的行為,輸出的内容可能會存在政治敏感、暴力違禁、色情低俗等不良内容,造成信息污染和倫理風險。例如 2024 年,Google 大模型 Gemini 被指無法正确生成白人歷史影像,引發人們對人工智能存在種族歧視問題的擔憂,google 不得不停用人物影像功能。此外,不法分子通過數據投毒、對抗樣本、Prompt 注入等手段,直接模型的 " 認知邏輯 " 予以扭曲,進而引發信息泄露、危害公共安全等嚴重後果。此前,用户以偽裝成開發者的指令,讓 ChatGPT 生成可被用于網絡犯罪的電腦病毒等危險内容,便引發公眾對大模型内容安全的擔憂。
幻覺問題:大模型在運行過程中,其自身的幻覺問題往往會導致生成錯誤信息,不僅造成虛假内容的傳播,還極大降低了模型的可用性。2023 年,美國一位資深律師因在訴訟中引用了 ChatGPT 提供的 6 個完全不存在的判例,而被罰款 5000 美元。除了司法領網域,在金融、醫療、安全等垂直行業應用中,大模型的幻覺問題也可能存在誤導性建議、未經驗證的治療方法、錯誤的防御策略等特定隐患,進而誤導用户判斷和決策。
行為失控:大模型發展過程中,Agent 自主性不斷增強,嵌入到業務工作流中,可能帶來新的安全隐患。Agent 在復雜互動中因邏輯缺陷、環境誤判等原因,可能導致出現指令劫持、任務偏離、資源濫用等非預期行為,即執行一些未經授權的操作,或者導致系統資源的過度消耗,甚至引發系統崩潰等嚴重後果。
對症下藥,首個 DS 版大模型安全解決方案上線
作為兼具數字安全和 AI 雙重能力的科技企業,360 很早開始關注大模型安全風險,提出 " 以模制模 " 理念,利用安全大模型來檢測和防範大模型可能出現的安全風險。針對以 DeepSeek 為代表的國產大模型廠商面臨的安全挑戰,360 推出 DS 大模型安全解決方案,錨定系統安全、内容安全、幻覺問題、Agent 失控、數據安全五大挑戰,對症下藥,守護 DeepSeek 大模型訓練、推理和運營全流程,為全球人工智能技術治理提供 " 中國方案 "。
安全體檢員 360 智鑑:全天候掃描系統安全
針對大模型系統安全問題,360 智鑑以全鏈路、精細化和動态進化的檢測能力為核心,融合紅藍對抗思路和大模型自身技術優勢,為企業提供一套全面、智能、高效的大模型系統安全檢測方案,幫助企業在大模型上線前進行全方位的安全評估,保障大模型系統的可靠性與業務穩定性。
360 智鑑覆蓋了從數據清洗、模型訓練、模型推理、部署上線的整個生命周期中的系統安全檢測,支持近百個組件的 400+ 公開漏洞檢測,覆蓋 RAG、Agent、prompt 等場景的安全性分析,同時,能夠快速集成新的安全檢測技術和方法,适應不斷變化的安全威脅形勢。
數據倉管員 360 智數:守護模型數據使用安全
針對 DeepSeek 面臨的數據安全挑戰,360 基于智能化數據安全管理平台圍繞大模型資產梳理分級、模型邊界審查、模型數據風險監測三大維度構建閉環解決方案 360 智數,全方位護航大模型數據全生命周期,守護大模型數據流動安全,具體而言:
全鏈路數據資產梳理,通過 AI 動态資產識别技術,構建大模型數據地圖。對大模型元數據分析,實現訓練數據合規追溯、知識庫重要數據識别、模型數據隐私内容檢測三重治理;動态數據分級分類,對大模型智能體數據知識庫、向量庫、開放服務、記憶等位置進行動态分類分級,定期檢查合規性和區網域合法性,保證用户及企業使用安全;智能風險監測,通過大模型對數據開放及調用行為進行監測,識别異常調用、算法漏洞、知識庫偏差,通過趨勢分析及預測實現異常發現 - 風險研判 - 流程處置,以模制模,全面防控隐私數據、重要數據泄漏及模型行為失控風險。
信息淨化器 360 智盾:全流程審核内容安全
為保障大模型内容安全,360 智盾打造了全流程、多種類、多模态、場景化的内容安全體系,通過精準的風險檢測、高效的内容攔截與替代機制,幫助企業确保生成内容的合法性、合規性與倫理可靠性,同時提升用户體驗和模型輸出的可信度。
360 智盾支持 100 多類風險内容的識别過濾,涵蓋超 200 種對抗内容防御機制,支持文本、音頻、圖片、視頻等多種模态的風險防護,并通過平台定制化場景風控策略,滿足不同場景的風控需求,檢測識别正确率超 90%。
安全領航員 360 智搜:把模型拉出幻覺泥潭
為避免大模型陷入幻覺泥潭,360 智搜通過精确的知識整合,減少虛假或不準确信息,提升大模型的可信度與可靠性,有效減少大模型生成幻覺内容的可能性。同時,360 智搜支持基于企業私網域數據的知識提煉與總結,為企業提供更安全、更高效的業務支持。
360 智搜整合多領網域精品知識庫,實現全網與私網域知識的無縫對接,提升信息獲取效率。實際應用中,在幻覺檢測 agent 加持下,大模型通用場景下幻覺比例下降 50% 以上。
調度指揮官 360 智控:Agent 流程可控可管
為确保 Agent 在執行任務時嚴格遵循既定流程,避免失控行為的發生,360 智控通過原生安全的 AI Agent 可控框架對大模型場景進行統一編排調用,原生設定安全措施、監督任務規劃全程、監控工具調用過程,把大模型能力關在籠子中,解決大模型不可控的問題。
360 DS 大模型安全解決方案支持多種部署及交付方式,滿足以 DeepSeek 為代表的通用大模型企業對便捷、成本、安全等多種因素個性化需求。此外,360 大模型安全解決方案已在政務、税務、醫療等垂直行業落地應用,守護千行百業智能化轉型。未來,360 将繼續護航大模型安全,為全球人工智能技術治理提供了可借鑑的 " 中國方案 "。