logo

新闻中心

大模型备案通过率不足 28%:语料、安全、可解释性成三大拦路虎

截至 2026 年第一季度,全国大模型备案通过率不足 28% 的统计数据,折射出中国 AI 产业在合规化进程中面临的严峻挑战。这一数据并非偶然,而是监管层对生成式 AI 服务实施严格安全评估的直接体现,核心症结集中在语料合规性不足、安全防控体系薄弱、模型可解释性缺失三大维度。从《生成式人工智能服务管理暂行办法》到《网络安全技术 生成式人工智能服务安全基本要求》(GB/T 45654-2025),监管框架的逐步完善正在重塑行业生态,迫使企业从追求技术突破转向合规与创新并重的发展路径。



一、语料合规:模型训练的 “地基” 危机

语料作为大模型的 “粮食”,其合规性直接决定备案根基,却成为多数企业的重灾区。备案审查中,语料问题导致的驳回占比高达 35% 以上,远超其他类型问题。
语料合规的核心痛点集中在三个层面。首先是来源合法性证明缺失,大量企业无法提供完整的语料授权链路,特别是历史数据中涉及未明确授权的第三方内容,或使用违反 Robots 协议限制采集的数据,直接触碰合规红线。某头部科技公司因使用未授权的动漫形象作为训练语料,因版权问题被直接驳回备案申请,成为行业典型案例。监管要求自采语料需保留完整采集证明,商业语料需签订正式采购协议并审核来源资质,使用含个人信息的语料必须取得个人同意,敏感个人信息更需单独授权。
其次是内容质量与比例要求不达标。根据 GB/T 45654-2025 标准,语料中违法不良信息占比不得超过 5%,人工抽检 4000 条样本合格率需不低于 96%。部分企业依赖通用过滤工具,忽视人工复核环节,导致政治有害、隐私泄露等风险内容未被有效清除。同时,境外语料占比不得超过 30%、中文语料占比不低于 50% 的硬性指标,成为众多依赖开源数据训练的企业难以跨越的门槛。
最后是隐私保护措施不到位。个人信息去标识化处理不彻底、敏感信息过滤机制缺失,导致训练数据中包含身份证号、手机号等隐私内容,违反《个人信息保护法》相关要求。某创业公司因训练语料中包含未脱敏的用户聊天记录,不仅备案被驳回,还面临行政处罚,凸显了语料隐私保护的重要性。

解决语料合规问题需要建立全流程管理体系,从数据采集前的安全评估,到采集过程中的授权记录留存,再到预处理阶段的内容筛查与隐私脱敏,每个环节都需形成可追溯的文档,确保语料来源合法、内容安全、使用合规。



二、安全防控:技术与管理的双重考验

安全测试不通过成为大模型备案最主要的驳回原因,占比高达 61.2%,远高于材料不全、主体资质不符等其他类型问题。这一数据反映出多数企业对安全评估的理解仍停留在 “一次性合规动作”,而非贯穿模型全生命周期的持续保障机制。
大模型安全防控面临的挑战首先体现在生成内容安全上。监管要求模型必须具备对 11 类违法信息和 9 类不良信息的识别与拒答能力,问题拒答率需达到 100%。然而,实际测试中,部分模型在面对模糊指令、多轮对话诱导时,仍会生成违规内容。某企业提交的模型在测试中对 “如何制作爆炸物” 的变体提问未能有效识别,导致安全评估直接不通过。这一问题的根源在于安全训练数据不足、提示词工程不完善,以及缺乏动态更新的风险关键词库。
其次是模型安全与服务安全漏洞。大模型作为复杂的软件系统,面临着对抗样本攻击、数据泄露、权限滥用等多重风险。监管要求企业建立模型安全评估机制,覆盖模型架构安全、参数安全、推理安全等多个维度。部分企业依赖开源模型进行二次开发,却未对模型进行针对性安全加固,导致原生漏洞被保留,成为安全隐患。同时,服务端的访问控制、数据传输加密、日志审计等基础安全措施缺失,也成为备案驳回的常见原因。
安全防控的第三个难点在于常态化监管适配。监管部门要求企业建立安全监测机制,对生成内容进行实时监控,并留存不少于 90 天的服务日志。多数企业缺乏相应的技术能力和管理流程,无法满足持续监测与快速响应要求。更有企业将安全评估等同于 “一次性考试”,通过备案后便放松安全管理,忽视了大模型在迭代过程中可能出现的新风险。

构建有效的安全防控体系需要技术与管理双管齐下。技术层面,需集成内容安全检测、对抗样本防御、数据加密等多重防护机制;管理层面,要建立安全责任制,制定应急预案,定期开展安全评估与演练,确保模型在全生命周期内的安全可控。



三、可解释性:破解 AI “黑箱” 的技术难题

模型可解释性作为备案审查的新兴重点,正成为众多企业的 “硬伤”。随着大模型在金融、医疗、政务等关键领域的应用拓展,监管层对模型决策透明度的要求日益提高,可解释性已从 “加分项” 变为 “必选项”。
大模型的 “黑箱” 特性是可解释性的核心障碍。千亿级参数的复杂神经网络通过无数矩阵运算及非线性变换实现文本预测,内部数值波动不具备直观含义,即使是模型开发者也难以在具体层面解释 AI 为何做出某一选择。这种特性与监管要求的 “决策可追溯、结果可解释” 形成鲜明矛盾,成为备案审查的难点。
可解释性的技术挑战体现在三个方面。首先是特征叠加问题,不同于传统 AI 中特定神经元对应可识别概念,大模型往往在同一参数中编码多种特征,这种 “特征叠加” 现象导致输入微小变化可能在模型中产生不可预测的连锁反应,增加了解释难度。其次是概率生成机制,大模型基于概率分布生成文本,相同输入可能产生不同输出,使得解释缺乏唯一性和稳定性。最后是计算成本限制,对 Transformer 模型进行细粒度解释需要指数级计算资源,在实际应用中难以实现。
监管层面对可解释性的要求正逐步明确,不仅要求企业提供模型决策的解释机制,还需建立模型行为的审计体系,确保模型在关键决策场景中的透明度与可追溯性。某金融科技公司开发的信贷评估大模型,因无法解释贷款审批拒绝的具体原因,在备案审查中被要求补充可解释性方案,导致备案周期延长 3 个月。

破解可解释性难题需要技术创新与应用场景适配相结合。一方面,研发机制可解释性工具,通过可视化技术揭示模型内部逻辑;另一方面,针对不同应用场景制定差异化解释策略,在保证模型性能的同时,满足监管对透明度的要求。部分企业采用 “事后解释 + 事前约束” 的组合方案,通过注意力权重分析、特征重要性评估等方法提升模型可解释性,取得了较好的备案效果。



四、破局之道:从合规被动应对到主动构建治理体系

大模型备案通过率偏低,既是监管趋严的结果,也是行业发展的必然阶段。对企业而言,破局的关键在于转变合规理念,从被动应对转向主动构建覆盖全生命周期的治理体系。
首先,建立语料管理闭环,实现从采集到使用的全流程可追溯。企业应建立语料来源清单,明确开源、自采、商业语料的比例与授权情况,定期开展语料安全评估,确保违法不良信息占比符合标准。同时,引入自动化工具与人工复核相结合的筛查机制,提升语料质量,为模型训练奠定合规基础。
其次,构建动态安全防护体系,将安全要求融入模型设计、训练、部署全流程。企业应建立安全测试矩阵,覆盖 31 类备案风险点,定期开展渗透测试与对抗样本攻击演练,提升模型的鲁棒性。同时,建立安全监测平台,对生成内容进行实时监控,确保问题拒答率达到 100%,并留存完整的安全日志供监管核查。
最后,推动可解释性技术落地,平衡模型性能与透明性需求。企业应根据应用场景选择合适的可解释性方法,在金融、医疗等高风险领域采用 “决策树 + 大模型” 的混合架构,提升决策透明度;在通用场景中通过注意力机制可视化、特征归因分析等技术,增强模型解释能力。同时,建立模型行为审计机制,记录关键决策过程,为监管审查提供依据。

大模型备案通过率不足 28% 的现状,既是挑战也是机遇。它促使行业从野蛮生长转向规范发展,推动企业在技术创新的同时,更加重视合规与安全。随着监管框架的逐步完善和企业治理能力的提升,大模型备案通过率有望稳步提高,为中国 AI 产业高质量发展奠定坚实基础。


X云擎技术

截屏,微信识别二维码

微信号:18148905161

(点击微信号复制,添加好友)

  打开微信