今天小编分享的互联网经验:全球首个AI安全“中国方案”落地!360护航大模型安全发展,欢迎阅读。
当前,以 DeepSeek 为代表的国产大模型发展势头迅猛,正重塑全球人工智能技术格局。然而,其背后潜藏的系统漏洞、内容风险、数据安全等隐患也频频敲响警钟,不仅对大模型自身的安全性提出了更高的要求,也对整个行业的规范发展和治理构成严峻的考验。安全不再是附加标签,而是大模型引领数智时代的原生属性。基于此,360 集团正式推出 DS 大模型安全解决方案,覆盖模型训练、推理、运营等大模型落地应用全过程,满血守护 DeepSeek 发展,促进国产大模型企业向安全、向善、可信、可控的方向发展,为全球人工智能技术治理提供了可借鉴的 " 中国方案 "。
DeepSeek 发展面临五大安全挑战
DeepSeek 以其强大的数据处理能力、精准的算法模型以及深度的用户洞察,重塑了 AI 领網域的游戏规则。然而,以 DeepSeek 为代表的大模型作为新质生产力推动者的同时,也面临传统网络安全与新型安全风险交织的双重挑战。具体而言:
系统安全:此前 DeepSeek 遭遇网络攻击导致新用户注册受阻的事件就暴露了其在大模型系统安全方面的脆弱性。DeepSeek 运行所依赖的硬體设施、軟體框架、作業系統等基础层以及提示工程、缓存、向量库等训练和推理过程中使用的生态链工具共同构成庞大复杂的系统,系统中每个环节的缺陷都可能被恶意利用,加之开发运维过程中存在的不当使用和滥用等行为,技术脆弱性与人为风险因素相互叠加,使得大模型面临严峻的系统安全风险。
数据安全:数据在大模型各阶段流动创造价值,也带来数据泄漏、篡改、滥用等各类隐私及合规风险。在数据收集训练阶段,可能使用未经授权版本数据训练,导致侵权;在部署能力及开发阶段,使用不同供应商的服务时,可能存在黑盒以提取大模型记忆隐私数据;在对外提供服务时,可能存在 API 滥用隐患问题;在推理使用阶段,用户互動数据可能会泄漏或者滥用,违反隐私合规风险。
内容安全:由于 DeepSeek 依赖大量公开数据进行训练,模型可能在无意中学习到不当的行为,输出的内容可能会存在政治敏感、暴力违禁、色情低俗等不良内容,造成信息污染和伦理风险。例如 2024 年,Google 大模型 Gemini 被指无法正确生成白人历史影像,引发人们对人工智能存在种族歧视问题的担忧,google 不得不停用人物影像功能。此外,不法分子通过数据投毒、对抗样本、Prompt 注入等手段,直接模型的 " 认知逻辑 " 予以扭曲,进而引发信息泄露、危害公共安全等严重后果。此前,用户以伪装成开发者的指令,让 ChatGPT 生成可被用于网络犯罪的电腦病毒等危险内容,便引发公众对大模型内容安全的担忧。
幻觉问题:大模型在运行过程中,其自身的幻觉问题往往会导致生成错误信息,不仅造成虚假内容的传播,还极大降低了模型的可用性。2023 年,美国一位资深律师因在诉讼中引用了 ChatGPT 提供的 6 个完全不存在的判例,而被罚款 5000 美元。除了司法领網域,在金融、医疗、安全等垂直行业应用中,大模型的幻觉问题也可能存在误导性建议、未经验证的治疗方法、错误的防御策略等特定隐患,进而误导用户判断和决策。
行为失控:大模型发展过程中,Agent 自主性不断增强,嵌入到业务工作流中,可能带来新的安全隐患。Agent 在复杂互動中因逻辑缺陷、环境误判等原因,可能导致出现指令劫持、任务偏离、资源滥用等非预期行为,即执行一些未经授权的操作,或者导致系统资源的过度消耗,甚至引发系统崩溃等严重后果。
对症下药,首个 DS 版大模型安全解决方案上线
作为兼具数字安全和 AI 双重能力的科技企业,360 很早开始关注大模型安全风险,提出 " 以模制模 " 理念,利用安全大模型来检测和防范大模型可能出现的安全风险。针对以 DeepSeek 为代表的国产大模型厂商面临的安全挑战,360 推出 DS 大模型安全解决方案,锚定系统安全、内容安全、幻觉问题、Agent 失控、数据安全五大挑战,对症下药,守护 DeepSeek 大模型训练、推理和运营全流程,为全球人工智能技术治理提供 " 中国方案 "。
安全体检员 360 智鉴:全天候扫描系统安全
针对大模型系统安全问题,360 智鉴以全链路、精细化和动态进化的检测能力为核心,融合红蓝对抗思路和大模型自身技术优势,为企业提供一套全面、智能、高效的大模型系统安全检测方案,帮助企业在大模型上线前进行全方位的安全评估,保障大模型系统的可靠性与业务稳定性。
360 智鉴覆盖了从数据清洗、模型训练、模型推理、部署上线的整个生命周期中的系统安全检测,支持近百个组件的 400+ 公开漏洞检测,覆盖 RAG、Agent、prompt 等场景的安全性分析,同时,能够快速集成新的安全检测技术和方法,适应不断变化的安全威胁形势。
数据仓管员 360 智数:守护模型数据使用安全
针对 DeepSeek 面临的数据安全挑战,360 基于智能化数据安全管理平台围绕大模型资产梳理分级、模型边界审查、模型数据风险监测三大维度构建闭环解决方案 360 智数,全方位护航大模型数据全生命周期,守护大模型数据流动安全,具体而言:
全链路数据资产梳理,通过 AI 动态资产识别技术,构建大模型数据地图。对大模型元数据分析,实现训练数据合规追溯、知识库重要数据识别、模型数据隐私内容检测三重治理;动态数据分级分类,对大模型智能体数据知识库、向量库、开放服务、记忆等位置进行动态分类分级,定期检查合规性和区網域合法性,保证用户及企业使用安全;智能风险监测,通过大模型对数据开放及调用行为进行监测,识别异常调用、算法漏洞、知识库偏差,通过趋势分析及预测实现异常发现 - 风险研判 - 流程处置,以模制模,全面防控隐私数据、重要数据泄漏及模型行为失控风险。
信息净化器 360 智盾:全流程审核内容安全
为保障大模型内容安全,360 智盾打造了全流程、多种类、多模态、场景化的内容安全体系,通过精准的风险检测、高效的内容拦截与替代机制,帮助企业确保生成内容的合法性、合规性与伦理可靠性,同时提升用户体验和模型输出的可信度。
360 智盾支持 100 多类风险内容的识别过滤,涵盖超 200 种对抗内容防御机制,支持文本、音频、图片、视频等多种模态的风险防护,并通过平台定制化场景风控策略,满足不同场景的风控需求,检测识别正确率超 90%。
安全领航员 360 智搜:把模型拉出幻觉泥潭
为避免大模型陷入幻觉泥潭,360 智搜通过精确的知识整合,减少虚假或不准确信息,提升大模型的可信度与可靠性,有效减少大模型生成幻觉内容的可能性。同时,360 智搜支持基于企业私網域数据的知识提炼与总结,为企业提供更安全、更高效的业务支持。
360 智搜整合多领網域精品知识库,实现全网与私網域知识的无缝对接,提升信息获取效率。实际应用中,在幻觉检测 agent 加持下,大模型通用场景下幻觉比例下降 50% 以上。
调度指挥官 360 智控:Agent 流程可控可管
为确保 Agent 在执行任务时严格遵循既定流程,避免失控行为的发生,360 智控通过原生安全的 AI Agent 可控框架对大模型场景进行统一编排调用,原生設定安全措施、监督任务规划全程、监控工具调用过程,把大模型能力关在笼子中,解决大模型不可控的问题。
360 DS 大模型安全解决方案支持多种部署及交付方式,满足以 DeepSeek 为代表的通用大模型企业对便捷、成本、安全等多种因素个性化需求。此外,360 大模型安全解决方案已在政务、税务、医疗等垂直行业落地应用,守护千行百业智能化转型。未来,360 将继续护航大模型安全,为全球人工智能技术治理提供了可借鉴的 " 中国方案 "。