築牢AI安全防線,港科大(廣州)- 雲山實驗室大模型安全聯合實驗室正式啟航!

5月19日,香港科技大學(廣州)科研品牌活動Research Happy Hour Vol.18「大模型安全專題」暨港科大(廣州)- 雲山實驗室大模型安全聯合實驗室開幕式成功舉辦。本次活動聚焦「大模型安全」這一人工智能發展的重要議題,來自政、產、學、研各界的嘉賓齊聚一堂,共同探討安全可信人工智能的發展路徑。

雲山實驗室主管單位廣州市人工智能產業辦副主任張博先生,指導單位廣州市委網信辦副主任陳小文先生、網信辦網安處處長魏雲,屬地行政管理單位天河區發展和改革局副局長吳蓉女士,廣州市雲山人工智能安全研究院院長李慧博士及研究院相關領導專家;香港科技大學(廣州)校長倪明選教授、協理副校長(研究)伍楷舜教授、信息樞紐院長陳雷教授,以及相關學域師生代表共同出席活動。活動由香港科技大學(廣州)信息樞紐物聯網學域龍顏助理教授主持。

活动回顾

當前,人工智能正以前所未有的速度進入科研、產業、教育、政務和社會生活的各個領域。大模型在提升效率、激發創新、拓展應用邊界的同時,也帶來了內容可信、數據安全、使用邊界、責任認定等一系列新問題。如何讓人工智能更安全、更可靠、更可控,已成為推動人工智能健康發展的關鍵課題。

在此背景下,香港科技大學(廣州)與廣州市雲山人工智能安全研究院攜手共建大模型安全聯合實驗室。聯合實驗室將匯聚高校科研力量、產業實踐經驗和真實應用場景,圍繞人工智能安全可信發展需求,推動大模型安全相關研究從理論探索走嚮應用驗證,為構建安全、透明、可信的人工智能生態提供支撐。

啟動儀式上,香港科技大學(廣州)校長倪明選教授發表致辭。他首先介紹了學校在廣州市大力支持下的發展現狀,倪明選表示,港科大(廣州)自建校以來,始終圍繞交叉融合學科、教學改革、做有影響力的科研和知識成果轉化持續探索,特別重視科技創新與產業創新的深度融合。學校通過聯合實驗室等機制,積極推動高校科研力量與企業、產業真實需求結合,既面向前沿問題開展研究,也着力解決實際場景中的關鍵痛點。

倪明選校長指出,大模型安全是人工智能發展中必須前瞻布局的重要方向。港科大(廣州)正在積極匯聚相關人才和科研力量,希望通過與雲山實驗室的合作,圍繞大模型安全開展有組織、有深度、有影響力的研究與實踐。他期待聯合實驗室在推動科研創新、解決真實問題、服務廣州人工智能產業發展等方面發揮積極作用,為廣州培育人工智能領域的創新力量貢獻港科大(廣州)的智慧和資源。

倪明选校长致辞

廣州市人工智能產業辦副主任張博先生在致辭中表示,香港科技大學(廣州)是廣州市委、市政府高度重視和支持建設的重要合作辦學平台,近年來與廣州相關部門保持着緊密合作。當前,人工智能正成為城市創新發展和產業升級的重要方向,廣州也在持續加強與高校、科研機構和優質創新主體的協同合作,推動人工智能產業生態不斷完善。

張博先生談到,雲山人工智能安全研究院是廣州在人工智能安全領域的重要布局,此次與港科大(廣州)強強聯合,聚焦大模型安全這一具有前瞻性和現實意義的方向,是推動人工智能安全研究落地發展的重要實踐。他期待聯合實驗室未來能夠產出更多看得見、用得上的合作成果,為廣州人工智能產業發展和安全可信生態建設提供有力支撐。

张博先生致辞

在與會嘉賓的共同見證下,香港科技大學(廣州)與廣州市雲山人工智能安全研究院正式簽署合作協議。香港科技大學(廣州)協理副校長(研究)伍楷舜教授與廣州市雲山人工智能安全研究院院長李慧博士共同完成簽約,香港科技大學(廣州)校長倪明選教授、廣州市人工智能產業辦副主任張博先生作為見證嘉賓出席簽約環節。此次簽約標誌着雙方圍繞大模型安全領域的合作進入實質化、機制化推進的新階段。

合作协议签署仪式

隨後,雙方代表及主管單位等領導嘉賓共同上台,見證聯合實驗室正式啟動。隨着倒計時結束,港科大(廣州)- 雲山實驗室大模型安全聯合實驗室正式啟航,標誌着雙方將在廣州市政府關心指導與支持下,圍繞大模型安全研究、成果轉化和產業應用開展更加深入、長期的合作。

联合实验室启动仪式

現場還舉行了聯合實驗室聘任儀式。倪明選校長、陳小文主任和張博先生分別為實驗室主任、副主任頒發了聘書,也為後續科研組織、課題推進、人才培養和成果轉化提供了有力支撐。

伍楷舜教授接受联合实验室主任聘书
李慧博士接受联合实验室副主任聘书
龙颜助理教授接受联合实验室副主任聘书

作為聯合實驗室啟動後的重要內容,廣州市雲山人工智能安全研究院舒慧珍研究員介紹了聯合實驗室首批重點研究方向。

面向人工智能發展過程中的新需求與新挑戰,聯合實驗室將重點圍繞三個方面開展工作:一是關注大模型在實際使用過程中的安全與可靠,提升其在複雜任務中的可控性;二是關注AI生成內容的識別、追溯與管理,助力數字內容生態更加可信;三是關注大模型運行過程中的數據與隱私保護,推動人工智能系統更加安全穩健。

這些方向既回應了人工智能快速發展帶來的現實問題,也體現了聯合實驗室服務產業、服務社會、服務未來智能生態建設的使命擔當。

重点课题发布

在Research Happy Hour主題分享環節,三位專家圍繞大模型安全的不同方向展開交流。

舒慧珍研究員以「大模型安全:從機制探測到原生安全」為題,分享了人工智能安全研究的新思路。她指出,人工智能安全不能僅依賴外部約束,更需要從系統自身出發,提升其識別風險、抵禦風險和穩定運行的能力。雲山實驗室期待與港科大(廣州)的老師和同學們一道,在人工智能安全研究的深水區開展更多創新工作。

舒慧珍研究员主题分享

香港科技大學(廣州)陳昶昊助理教授帶來「當智能體走進物理世界:具身智能安全的對抗攻擊與防禦」主題分享。他表示,當智能系統從線上環境走向真實世界,安全問題將變得更加直接和複雜,如何讓智能體在真實環境中安全、穩定、可靠地運行,是未來人工智能發展的重要方向。

陈昶昊助理教授主题分享

香港科技大學(廣州)何海韻助理教授圍繞「構建可信生成式人工智能:大語言模型水印與檢測技術」展開分享。她指出,未來大量內容都可能由AI生成,建立內容識別和來源追溯機制,將有助於維護數字世界的真實可信,推動生成式人工智能負責任發展。

何海韵助理教授主题分享

隨着活動圓滿落幕,港科大(廣州)- 雲山實驗室大模型安全聯合實驗室正式啟航。未來,雙方將充分發揮港科大(廣州)在人工智能、物聯網、數據科學、交叉學科等方面的科研優勢,結合雲山人工智能安全研究院在安全治理和產業實踐方面的資源積累,持續推進科研合作、人才培養、平台建設和成果轉化。

全体合影
發佈日期
2026年05月20日
分類
科廣新聞
分享到