首页 > 生活分享 > 免费教学 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

免费教学更多>>

机械革命星耀14锐龙版笔记本天猫促销 REDMI K Pad对标iPad mini!做4K以内体验最豪华的小平板 三星 One UI 8 新特性曝光,支持个性化定制即时简报 Now Brief 卡片 华硕天选6 Pro游戏本限时特惠6359元 全国985、211、双一流高校总览! 精泰达取得车载主机测试夹具专利,保证每一块主机的性能达标 43%毕业生是公务员!最强“双非”大学来了 2025年巴彦淖尔市政务服务与数据管理局所属事业单位高层次急需紧缺人才引进进入体检、考察范围人员进行递补的公告 电商美工要凉?零基础小白,也能轻松出图 京东真的找了惠英红!网友:好朴实的商战 公积金能买二手房了,跨城买房却卡壳,年轻人能住上房吗? 广州成为首提全面取消楼市“三限”的一线城市,传递了什么信号? 买了iPhone16Pro才发现降价还没到底,这种纠结你也有过吧? 购买手机的基础参考方案,记住性能手机和拍照手机 真我GT7 Pro体验:刀法精准的性价比战神 贵工商再次斩获华为ICT大赛全球总决赛三等奖 华为公开最新专利!将在Pura80系列上首发应用 从行业先驱到转型先锋 华为云助力华新水泥持续开拓海外市场 国产厂商最新旗舰机激活量排名 华为小米旗鼓相当 机情问答:华为Pura 80会涨价吗 REDMI电竞平板咋样? 时隔两年 OPPO或再推小折叠屏手机 朵薇卫生巾销量位居抖音前三,已引入新产线突破产能瓶颈 “钢铁门神”陆天宇:守好球门,捍卫城市荣耀 荣耀五载,启航新程:太吉之源大健康产业联盟五周年庆典盛大启幕 时尚中国 荣耀东方——2025中国时尚产业盛典即将开幕 手机点点也能办 昆山车驾管服务交出便民利企“暖心答卷” 索尼Alpha 7R V全画幅相机优惠价20003元 最强手感小直屏来了!魅族22系列入网:首次安排潜望长焦 小米MIX Flip 2折叠屏手机即将发布 小米Xiaomi15 5G手机12GB+512GB白 骁龙8至尊版到手价1713元