关闭

x

全部频道

北京> 正文

北京中关村建起人工智能“防火墙”

2026-01-07 06:34 北京日报

来源标题：中关村建起人工智能“防火墙”

一堵人工智能“防火墙”在中关村建起。日前，北京前瞻人工智能安全与治理研究院发布了前瞻人工智能安全评估体系与基座平台，包含人工智能安全评估框架、技术工具和价值参考等。

随着技术飞速迭代，人工智能的安全风险与日俱增，构建完善的人工智能安全评估与治理体系刻不容缓。此次发布的“前瞻安全基准”安全评估体系，不局限于传统安全评估的单一维度，而是在根植基础安全的基础上，延伸至具身智能安全、科学智能安全、社会安全、环境安全、灾难性与生存性风险五大维度。

该院院长曾毅介绍，这套体系可覆盖教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等关键领域，重点聚焦评估和解决隐私与数据保护、滥用恶用、虚假信息防范等难题。

“前瞻·灵御”人工智能安全攻防平台通过模拟真实攻防场景，实现对模型安全性能的全面“体检”。目前，该平台支持60余种主流大模型、20余种攻击方法和10余种防御机制。

“测试发现，近几年的大模型在安全性上并没有明显提升，平台对部分新模型的攻击成功率甚至更高。”曾毅直言，人工智能模型构筑防御工事并不一定要重新训练，部署在线推理阶段的安全护栏，就能显著提升模型安全水平。而灵御平台就是通过提供针对性的防御方案和“加固”建议，实现主动防御、精准防护。

“前瞻·灵度”平台同步搭建，关注点侧重于对人工智能伦理进行智能评估与价值校准。它能在6个维度、90个细分类别中，对上百个大模型进行实时动态监控和测试。“灵度平台集成了以中国价值观为核心的大规模中文价值语料库，累计定义了25万余条规则。”曾毅说，这能有效解决现有伦理评估中文价值适应性不足、边界覆盖不全的问题。

人工智能安全评估体系和基座平台，不仅解决了“评什么、怎么评”的疑问，还回答了“怎样攻、如何防”，并明确了人工智能安全将“向何处去”的价值导向。

一堵人工智能“防火墙”在中关村建起。日前，北京前瞻人工智能安全与治理研究院发布了前瞻人工智能安全评估体系与基座平台，包含人工智能安全评估框架、技术工具和价值参考等。

随着技术飞速迭代，人工智能的安全风险与日俱增，构建完善的人工智能安全评估与治理体系刻不容缓。此次发布的“前瞻安全基准”安全评估体系，不局限于传统安全评估的单一维度，而是在根植基础安全的基础上，延伸至具身智能安全、科学智能安全、社会安全、环境安全、灾难性与生存性风险五大维度。

该院院长曾毅介绍，这套体系可覆盖教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等关键领域，重点聚焦评估和解决隐私与数据保护、滥用恶用、虚假信息防范等难题。

“前瞻·灵御”人工智能安全攻防平台通过模拟真实攻防场景，实现对模型安全性能的全面“体检”。目前，该平台支持60余种主流大模型、20余种攻击方法和10余种防御机制。

“测试发现，近几年的大模型在安全性上并没有明显提升，平台对部分新模型的攻击成功率甚至更高。”曾毅直言，人工智能模型构筑防御工事并不一定要重新训练，部署在线推理阶段的安全护栏，就能显著提升模型安全水平。而灵御平台就是通过提供针对性的防御方案和“加固”建议，实现主动防御、精准防护。

“前瞻·灵度”平台同步搭建，关注点侧重于对人工智能伦理进行智能评估与价值校准。它能在6个维度、90个细分类别中，对上百个大模型进行实时动态监控和测试。“灵度平台集成了以中国价值观为核心的大规模中文价值语料库，累计定义了25万余条规则。”曾毅说，这能有效解决现有伦理评估中文价值适应性不足、边界覆盖不全的问题。

人工智能安全评估体系和基座平台，不仅解决了“评什么、怎么评”的疑问，还回答了“怎样攻、如何防”，并明确了人工智能安全将“向何处去”的价值导向。

责任编辑：张思宇（QX0007）作者：刘苏雅

热点排行

1

凡人挺身守生命微光聚力暖人间

2

男子入伍收到爷爷送的抗日军刀

3

金价连连下跌现在是上车好时机吗？

4

连续暴跌乱世黄金失灵？

5

以色列拦截伊朗导弹失败瞬间画面曝光

6

“张维平等人拐卖儿童案”关键人物“梅姨”落网被拐家庭的“最后一块拼图”归位

7

“不断扩大的危险漩涡”——美以伊战事对世界构成“四大冲击”

8

年营收增长超300% 宇树科技上市临门一脚

9

更大力度提振消费，值得期待

10

北京23日白天多云间晴，最高气温18℃

频道推荐

凡人挺身守生命微光聚力暖人间

中国

市场已成稀缺资源，世界更需中国“港湾”

评论

佩斯科夫：暗杀伊朗领导人产生“极其严重后果”

国际

案说丨遭遇“人肉开盒”的侵犯怎么办？

北京

材料领域AI智能体MatChat 2.0发布

科技

北京千龙新闻网络传播有限责任公司版权所有未经千龙新闻网书面特别授权，请勿转载或建立镜像，违者依法必究新出网证（京）字013号　增值电信业务经营许可证 2-2-1-2004139　跨地区增值电信业务许可证

信息网络传播视听节目许可证0104056号　互联网新闻信息服务许可证11120180003号京公网安备 11000002000007号

千龙网

关于我们客服中心广告服务法律声明旧版入口

北京千龙新闻网络传播有限责任公司版权所有