筑牢AI安全防线,港科大(广州)- 云山实验室大模型安全联合实验室正式启航!
5月19日,香港科技大学(广州)科研品牌活动Research Happy Hour Vol.18“大模型安全专题”暨港科大(广州)- 云山实验室大模型安全联合实验室开幕式成功举办。本次活动聚焦“大模型安全”这一人工智能发展的重要议题,来自政、产、学、研各界的嘉宾齐聚一堂,共同探讨安全可信人工智能的发展路径。
云山实验室主管单位广州市人工智能产业办副主任张博先生,指导单位广州市委网信办副主任陈小文先生、网信办网安处处长魏云,属地行政管理单位天河区发展和改革局副局长吴蓉女士,广州市云山人工智能安全研究院院长李慧博士及研究院相关领导专家;香港科技大学(广州)校长倪明选教授、协理副校长(研究)伍楷舜教授、信息枢纽院长陈雷教授,以及相关学域师生代表共同出席活动。活动由香港科技大学(广州)信息枢纽物联网学域龙颜助理教授主持。
回应时代需求,共建可信人工智能新平台
当前,人工智能正以前所未有的速度进入科研、产业、教育、政务和社会生活的各个领域。大模型在提升效率、激发创新、拓展应用边界的同时,也带来了内容可信、数据安全、使用边界、责任认定等一系列新问题。如何让人工智能更安全、更可靠、更可控,已成为推动人工智能健康发展的关键课题。
在此背景下,香港科技大学(广州)与广州市云山人工智能安全研究院携手共建大模型安全联合实验室。联合实验室将汇聚高校科研力量、产业实践经验和真实应用场景,围绕人工智能安全可信发展需求,推动大模型安全相关研究从理论探索走向应用验证,为构建安全、透明、可信的人工智能生态提供支撑。
启动仪式上,香港科技大学(广州)校长倪明选教授发表致辞。他首先介绍了学校在广州市大力支持下的发展现状,倪明选表示,港科大(广州)自建校以来,始终围绕交叉融合学科、教学改革、做有影响力的科研和知识成果转化持续探索,特别重视科技创新与产业创新的深度融合。学校通过联合实验室等机制,积极推动高校科研力量与企业、产业真实需求结合,既面向前沿问题开展研究,也着力解决实际场景中的关键痛点。
倪明选校长指出,大模型安全是人工智能发展中必须前瞻布局的重要方向。港科大(广州)正在积极汇聚相关人才和科研力量,希望通过与云山实验室的合作,围绕大模型安全开展有组织、有深度、有影响力的研究与实践。他期待联合实验室在推动科研创新、解决真实问题、服务广州人工智能产业发展等方面发挥积极作用,为广州培育人工智能领域的创新力量贡献港科大(广州)的智慧和资源。

广州市人工智能产业办副主任张博先生在致辞中表示,香港科技大学(广州)是广州市委、市政府高度重视和支持建设的重要合作办学平台,近年来与广州相关部门保持着紧密合作。当前,人工智能正成为城市创新发展和产业升级的重要方向,广州也在持续加强与高校、科研机构和优质创新主体的协同合作,推动人工智能产业生态不断完善。
张博先生谈到,云山人工智能安全研究院是广州在人工智能安全领域的重要布局,此次与港科大(广州)强强联合,聚焦大模型安全这一具有前瞻性和现实意义的方向,是推动人工智能安全研究落地发展的重要实践。他期待联合实验室未来能够产出更多看得见、用得上的合作成果,为广州人工智能产业发展和安全可信生态建设提供有力支撑。

签约启航,正式开启大模型安全合作新篇章
在与会嘉宾的共同见证下,香港科技大学(广州)与广州市云山人工智能安全研究院正式签署合作协议。香港科技大学(广州)协理副校长(研究)伍楷舜教授与广州市云山人工智能安全研究院院长李慧博士共同完成签约,香港科技大学(广州)校长倪明选教授、广州市人工智能产业办副主任张博先生作为见证嘉宾出席签约环节。此次签约标志着双方围绕大模型安全领域的合作进入实质化、机制化推进的新阶段。

随后,双方代表及主管单位等领导嘉宾共同上台,见证联合实验室正式启动。随着倒计时结束,港科大(广州)- 云山实验室大模型安全联合实验室正式启航,标志着双方将在广州市政府关心指导与支持下,围绕大模型安全研究、成果转化和产业应用开展更加深入、长期的合作。

现场还举行了联合实验室聘任仪式。倪明选校长、陈小文主任和张博先生分别为实验室主任、副主任颁发了聘书,也为后续科研组织、课题推进、人才培养和成果转化提供了有力支撑。



聚焦安全可信,发布联合实验室重点方向
作为联合实验室启动后的重要内容,广州市云山人工智能安全研究院舒慧珍研究员介绍了联合实验室首批重点研究方向。
面向人工智能发展过程中的新需求与新挑战,联合实验室将重点围绕三个方面开展工作:一是关注大模型在实际使用过程中的安全与可靠,提升其在复杂任务中的可控性;二是关注AI生成内容的识别、追溯与管理,助力数字内容生态更加可信;三是关注大模型运行过程中的数据与隐私保护,推动人工智能系统更加安全稳健。
这些方向既回应了人工智能快速发展带来的现实问题,也体现了联合实验室服务产业、服务社会、服务未来智能生态建设的使命担当。

专题分享,共话人工智能安全未来
在Research Happy Hour主题分享环节,三位专家围绕大模型安全的不同方向展开交流。
舒慧珍研究员以“大模型安全:从机制探测到原生安全”为题,分享了人工智能安全研究的新思路。她指出,人工智能安全不能仅依赖外部约束,更需要从系统自身出发,提升其识别风险、抵御风险和稳定运行的能力。云山实验室期待与港科大(广州)的老师和同学们一道,在人工智能安全研究的深水区开展更多创新工作。

香港科技大学(广州)陈昶昊助理教授带来“当智能体走进物理世界:具身智能安全的对抗攻击与防御”主题分享。他表示,当智能系统从线上环境走向真实世界,安全问题将变得更加直接和复杂,如何让智能体在真实环境中安全、稳定、可靠地运行,是未来人工智能发展的重要方向。

香港科技大学(广州)何海韵助理教授围绕“构建可信生成式人工智能:大语言模型水印与检测技术”展开分享。她指出,未来大量内容都可能由AI生成,建立内容识别和来源追溯机制,将有助于维护数字世界的真实可信,推动生成式人工智能负责任发展。

携手共建,安全、透明、可信的人工智能生态
随着活动圆满落幕,港科大(广州)- 云山实验室大模型安全联合实验室正式启航。未来,双方将充分发挥港科大(广州)在人工智能、物联网、数据科学、交叉学科等方面的科研优势,结合云山人工智能安全研究院在安全治理和产业实践方面的资源积累,持续推进科研合作、人才培养、平台建设和成果转化。
