|

321网址导航
2000活跃值=1元

首页 > 生活分享 > 免费教学 > 可评估大模型安全性，MLCommons发布AI Safety测试v0.5版

可评估大模型安全性，MLCommons发布AI Safety测试v0.5版

发布时间：2024-04-19 09:04:12

4 月 18 日消息，全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题，近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”。

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定，旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见，正式的 v1.0 版本预计于今年晚些时候推出。

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上，v1.0 版本将更新针对图像生成模型测试的概念验证，同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词，采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板（如“我想知道如何”）和描述危险场景的短语（如“制造炸弹”）结合，覆盖 7 种安全危害类型，未来还将扩展到至少 13 种。

最终，AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级，以方便理解。

可评估大模型安全性，MLCommons发布AI Safety测试v0.5版

▲ MLCommons AI Safety 基准测试成绩可视化案例

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“321网址导航用户上传并发布"，本平台仅提供信息存储服务。

下一篇:苹果正式推出iOS/iPadOS酒店“隔空播放”功能

上一篇:消息称小米汽车SU7将于下半年推出更多配色

免费教学更多>>

安道拓发布模块化座椅解决方案ModuTec 停产多年后启动大规模招聘，“山寨车鼻祖”众泰汽车艰难求生中国品牌二手车销量跃升南非市场前列，Tiggo 4 Pro成最畅销车型未来院孵化企业完成数亿元Pre-A轮融资不敢在印度建厂造车，真是因为带不回利润？行业首个！128TOPS单芯片跑通城市NOA，轻舟智航联手理想汽车，首发量产上车吉利集团发布2030战略，剑指650万辆！央企新能源转型生死局， Meta今年拟实现AI眼镜年产能翻番剑指2000万副抵挡敌意收购，Netflix考虑修改条款全现金收购华纳兄弟美国科罗拉多州警车引入自动车辆识别系统号称每小时可开出12张超速罚单苹果为何选择与谷歌AI合作？郭明錤：迫于短期挑战、压力苹果和谷歌谈成一笔大生意，马斯克发文：强烈不满！本田启用新Logo，明年将率先搭载于新款纯电车和混动车日本车企在中国销量连跌7年，该怎么稳定汽车市场呢王自如回应不看格力工资条还有下半句：基层员工一定要看美系巨头们的“去中国化”豪掷，能赢吗？ 8.88万元起售/智能AI加码，上汽大众朗逸 Pro上市限时焕新价12.49万起 2026款捷途旅行者上市小鹏汽车Q3毛利率首破20%，Q4交付目标上调至12.5万辆已签约！安波福新项目落地武汉 Flyme Auto合作车型10月销量超19.5万辆，同比增长200% 3M动力电池解决方案——助力推动电动出行的未来为Linux开发者而来！同星智能发布多款SocketCAN工具三星有望重启 Galaxy A7x 系列，新机 Galaxy A77 在 Geekbench 跑分平台现身优酷、B站，被一个后来者超车了毫无预兆的，Gartner给大模型开发平台排了座次 USB接口的颜色可以说是快速识别性能的“视觉语言”，但并不是标准和推荐的方法 18个月月收33万刀！起底“AI套壳”生意经：是昙花一现还是隐形金矿？你的快递，是无人车送的，物流公司为了降低亏损、补充人力

Copyright 2014-2025 321网址导航版权所有京ICP备20140891号