在教育部發佈會上,港科大(廣州)這個項目受矚目!

3月31日下午,教育部舉行新聞發佈會,介紹深入貫徹落實《教育強國建設規劃綱要(2024—2035年)》,推進語言文字信息化發展情況。會上,教育部語言文字信息管理司司長劉培俊重點介紹了推進語言文字信息化發展和數字中文建設有關情況;教育部語言文字應用管理司副司長王暉針對數智賦能語言文字高質量發展有關情況進行了介紹;廣東省教育廳副廳長朱建華着重介紹了廣東省推進語言文字信息化的發展情況,及廣東省如何實施語言文字智能化的發展思路和行動新範式。

支持香港科技大學(廣州)發揮智算集群力量,研發涉及語言知識學習與生成、跨平台交互與服務集成建設的語言服務大語言模型。

——廣東省教育廳副廳長 朱建華

在教育部、國家語委的指導下,廣東省教育廳按照「五個堅持」的工作思路,深入推進語言文字信息化發展,大力推進教育數字化轉型,實現國家語言文字的智能化發展。依託廣州大學成立國家語言服務與粵港澳大灣區語言研究中心,香港科技大學(廣州)團隊承擔了國家教育部重大項目「基於國家語言服務大模型的國家語言資源服務一體化平台建設」。項目在黨委書記屈哨兵教授的推動下,由信息樞紐院長陳雷教授領銜,香港科技大學(廣州)、廣州大學、華南師範大學、華中師範大學等多家單位共同參與。項目自2024年啟動以來,進展順利,取得了一系列令人矚目的階段性成果。

屈哨兵教授表示,語言文字是人類社會最重要的交際工具和信息載體,是文化的基礎要素和鮮明標誌。語言文字事業具有基礎性、全局性、社會性和全民性特點,事關國民素質提高和人的全面發展,事關歷史文化傳承和經濟社會發展,事關國家統一和民族團結,是國家綜合實力的重要支撐 。教育部、國家語委在廣州建立了國家語言服務與粵港澳大灣區語言研究中心,建立了語言資源服務平台,如何使這個平台能夠在新時期迎頭趕上人工智能時代對服務國家服務社會服務教育方面的需求是擺在中心和平台面前的一個重大課題,依託港科大(廣州)和廣州大學等高校的合作優勢,在教育部國家語委的統籌指導下做好建設工作是題中應有之義。他表示,也特別欣賞港科大(廣州)這種投入資源服務和支持國家語言文字事業發展的眼光和態度,相信團隊合作能夠把這個事情做好,為數字中文建設增添新動力。

堅持國家重大需求牽引築牢語言服務大模型根基

自項目立項以來,團隊在陳雷教授的帶領下,深入調研國家語言資源服務一體化平台的需求,結合當前前沿的大語言模型技術,設計並部署了國家語言資源服務一體化平台。該平台目前部署在香港科技大學(廣州),採用混合專家模型策略與架構,以多智能體的構建方式,融合了包括 Deepseek-R1(671B)、通義千問、LLaMA等在內的各類大模型底座,推出了國家語言服務大模型 。該大模型架構集成了國家語言資源服務平台的各類資源和知識源,能夠實現服務資源的跨平台聯動,自動針對不同的服務請求進行智能路由,精準定位語言服務與數據源,並能對模型輸出進行推理與溯源,確保回答準確性與專業性。同時,平台形成了完整的評測方案和策略,結合漢語言生活相關學術權威報告構建了國家語言服務領域的標註知識庫,可以用於該領域的模型評估與量化分析。

聚焦優化提升深化模型成果

2024年下半年,項目團隊持續發力,對知識庫質量與模型調用效果進行深度優化與創新。通過人工標註數據、後台靜默埋點、多源知識彙集等多種有效方式,顯著提升了國家語言文字專業數據庫的質量和服務調用效率。基於上述紮實的研究與積極的進展,團隊持續推出了國家語言服務大模型V2.0,並且完成了相關專利的申請和論文的發表。在語言文字信息化和智能化的道路上,平台與知識產權相輔相承,工程與技術創新共同推進。

着眼未來發展強化平台推廣效能

項目團隊持續進行平台和技術革新,繼續深化國家語言文字的改革與智能化創新,以精益求精的態度不斷優化服務調用精度,全力提昇平台的穩定性與性能,進一步完善國家語言資源服務一體化平台的建設。同時,隨着對語言服務領域實際應用場景的深入研究和持續性成果輸出,團隊未來將大力推動平台在相關領域與應用場景中的推廣與應用,進一步增強平台的影響力與示範效應,為國家語言資源服務領域的發展貢獻更多力量。

背景資料

2024年3月3日,國家語委重大科研項目「基於國家語言服務大模型的國家語言資源服務一體化平台建設」開題會暨語言文字信息化工作專家座談會在香港科技大學(廣州)召開。據陳雷教授介紹,項目的目的是要將國家語言資源平台的現有資源通過大語言模型整合打通,服務於更多垂直領域的產品。整個項目響應《「十四五」數字經濟發展規劃》和國務院印發的《新一代人工智能發展規劃》,結合國務院辦公廳推出的《關於全面加強新時代語言文字工作的意見》,打造紮實的研究基礎,促進語言文化的發展。了解更多>>

發佈日期
2025年04月02日
分類
科廣新聞
分享到