国内首个专注于大安全领域的算法比赛拉开序幕。
记者获悉,“CCF大数据与计算智能大赛·数字安全公开赛”于8月23日正式开赛,选手可登录大赛官网报名并下载数据集参加比赛。该比赛由中国计算机学会(CCF)主办,大数据协同安全技术国家工程实验室、中国计算机学会大数据与计算智能大赛(CCF BDCI)组委会两大“国字招牌”联合承办,三六零(601360.SH,下称“360”)未来安全研究院、浙江大学网络空间安全学院、清华大学网络科学与网络空间研究院等单位协办。
比赛共设置30万元奖金池,以“悬赏未来安全最优解”为主题,聚焦数据安全、人工智能安全、工业互联网安全等数字化场景中的新型风险问题,设置数据算法赛题,促进安全数据开源共享,广邀各路英雄揭榜挂帅,探索应对“大安全”风险的最优解。
CCF大数据专家委员会副秘书长、中国人民大学教授、CCF大数据与计算智能大赛工作委员会主席窦志成表示,期望大安全赛道能够引起社会对大数据安全问题的重视,一方面对相关领域人才培养起到正向的激励作用,以赛促学;另一方面,让更多的人了解数字安全问题,促进我国相关技术和行业发展。
“通过数字安全公开赛,我们可以发动社会力量,让研究人员能够以互相促进的方式做各种各样的创新,从而为真实场景下的安全问题提供更好的解决方案。同时,我们还能通过本次比赛重点面向学术研究领域开放数据集,并逐渐带动各方开放数据,从而带动技术创新与产业发展。”谈到数字安全公开赛的意义,大数据协同安全技术国家工程实验室常务副主任、360集团副总裁、首席安全官杜跃进博士表示。
三大赛题,聚焦AI如何解决真实场景的安全隐患
数字安全公开赛共设置三道算法赛题,分别针对三个具体真实场景和问题。据介绍,三道赛题是大赛组委会和赛题合作单位从大安全领域产业应用中的业务难点提炼而来。
第一道是基于人工智能的恶意软件家族分类。近年来,勒索软件、木马、病毒、恶意挖矿程序等恶意软件组件中引入了多态性,导致原本隶属同一家族的文件看起来像许多不同的文件,给检测识别的准确性带来了新挑战。在此情形下,该赛题对恶意软件的家族进行区分,将能提升海量恶意软件分析的高效性。
第二道是面向黑灰产治理的恶意短信变体字还原。当前,在为黑灰产引流的恶意短信产业链中,不法分子为逃避手机终端自动拦截检测,越来越多地使用变体字发送恶意短信绕过拦截规则。在本赛题中,参赛团队将通过设计算法,实现对恶意短信中变体字的还原。
第三道是工业安全生产环境违规使用手机的识别。在工业生产环境中,工作人员违规使用手机,屡屡造成安全生产事故,甚至引起人员伤亡。因此,基于工业安全生产和员工人身安全考虑,越来越多的工厂建立起员工手机使用管理规范,限制或禁止员工在生产过程中使用手机。该赛题探究如何通过引入人工智能技术,快速、准确识别员工违规使用手机的行为,加强安全生产监管。
同步开放数据集 产学研推动数据价值安全有序释放
“没有数据就谈不上基于大数据的分析,甚至也谈不上人工智能、工业互联网等数智时代的各种创新。”杜跃进在采访中高度强调数据的重要性。
窦志成则指出,数据开放是一个非常复杂的问题,不应该为了开放而开放,而是应该在保护数据安全的前提下,充分释放数据的衍生价值。合理的数据开放,能够有效促进相关领域问题的研究进展,例如ImageNet数据集,有效促进了CV领域的相关深度学习算法的进步。
数字安全公开赛赛题中用于训练算法模型的数据集,正是以赛促学,推动数据价值有序释放以及产学研协同创新的关键。
一般来说,产学研合作有两种形态,一种是科研为主,产研合作;一种是教学为主,产学合作。“我们提倡以练促学,以赛促学,就是将实际真实问题延伸到教学过程中,这可能会更好地促进人才培养。” 安全大脑国家新一代人工智能开放创新平台工作组副组长、360政企安全集团首席战略观潘柱廷表示。
也正如窦志成所强调,“比赛目的并不仅是数据开放,比赛和数据开放的统一目的都是促进相关技术发展。”因此,该比赛也将成为加强产学研合作,推动产学研协同创新、带动相关产业发展的创新模式。
大数据协同安全技术国家工程实验室与CCF BDCI组委会办赛,希望通过数字安全公开赛撬动赛题合作单位面向学术研究领域开放数据集,为将来计划构建的实验数据联盟沉淀基础,从而发挥大数据分析在应对安全风险方面的更多价值。
作为拥有EB级安全大数据的安全公司,360方面表示自己有责任成为整个安全产业和学术圈的桥梁,在符合国家法规情况下,为科研圈和教学圈提供公共数据集作为研究样本,以带动产学研联动,寻找产业数字化转型过程中所遇到安全问题的最优解。比如此次大赛中,“基于人工智能的恶意软件家族分类”、“面向黑灰产治理的恶意短信变体字还原”的赛题数据,分别是由360高级威胁研究院和360手机卫士团队从多年威胁防御业务和移动反诈业务中提取而来。
“国字招牌”强强联合,探寻大安全风险最优解
本次数字安全公开赛,是具有八年顶级赛事IP的CCF BDCI中首度开设“大安全赛道。其联合承办方大数据协同安全技术国家工程实验室与中国计算机学会大数据与计算智能大赛(CCF BDCI)组委会均为“国字招牌”。大赛催生的开放数据集、开放源码、解决方案、顶级专家与战队等,也都将沉淀在科技部指导下的“安全大脑国家新一代人工智能开放创新平台”上。
大数据协同安全技术国家工程实验室于2017年1月由国家发改委批复成立,是我国大数据安全领域唯一的国家工程实验室。
安全大脑国家新一代人工智能开放创新平台则由科技部批复,由360集团牵头承建,是科技部发布的15 个国家新一代人工智能开放创新平台中,唯一聚焦人工智能与安全的平台。
CCF BDCI由中国计算机学会于2013年创办,迄今已成功举办八届,累计吸引全球1500余所高校、1800家企事业单位及80余所科研机构的12万余人参与。
“CCF BDCI致力于为选手提供展示自己能力的机会,同时为企业孵化、探索和验证新技术,解决实际问题。” 据窦志成介绍, 2020年上半年突发疫情时, CCF BDCI与北京市经信局联合主办了“科技战疫”专题赛,发现了很多优秀项目与作品,在赛中即被挖掘出来投入实际使用,有效助力了疫情防控。
“CCF BDCI是国内最具影响力的计算机赛事之一,我们希望通过共同合作举办竞赛的方式带动协同创新,探索应对‘大安全’风险的最优解。”杜跃进表示,伴随比赛影响力越来越大,数字安全公开赛将变成真场景、真问题汇聚的平台,不断为产业数字化转型过程中的真实安全需求提供更优解,并更好地为数字时代保驾护航。