不到兩年,港科大(廣州)大二本科生從高考考場走到科研頂會!
近期,香港科技大學(廣州)大二本科生吳樂毅和劉博文參與的科研論文,分別在IEEE計算機視覺與模式識別會議(The IEEE/CVF Conference on Computer Vision and Pattern Recognition, 簡稱CVPR)和國際表徵學習大會(International Conference on Learning Representations,簡稱ICLR)發表。
從高考考場到業界頂會,吳樂毅和劉博文在短短一年多的時間裏,便迅速定位到各自感興趣的科研方向、找到合適的導師、加入研究團隊,最終推開了屬於自己的科研之門,他們是怎麼做到的?篤學路1號編輯部對兩位同學進行了訪談,一起走近他們的「科研進階之路」。


「如果說頂會發文是結果,我們更珍視的是參與的過程:它讓我們堅定了自己對科研的熱愛。」
——吳樂毅、劉博文
問:請用一句話解釋你們的研究工作。
吳樂毅:我主要研究生成模型,主要是3D生成和紋理生成。我們讓AI學會給3D模型「穿不同的衣服」——比如對一個球體,生成一個地球的紋理貼圖,讓它瞬間變成「地球儀」,生成一個足球的紋理貼圖,它又能變成「足球」。
劉博文:我的研究集中在大模型領域,特別是強化學習如何指導大模型達到更好的輸出效果。我們通過這種方式期望AI像人類一樣「思考」:通過強化學習提升大模型的數學、規劃、策劃能力,優化訓練算法提升基礎模型的性能。
問:從「小白」到頂會文章作者,你們是如何開啟科研旅程的?
吳樂毅:從「0」到「1」的過程很艱難。剛進組時,我處在什麼都不會的狀態。大一暑假期間,我參加了一個科研項目,花了兩個月「死磕」代碼和論文,每天泡在實驗室學習,打磨基礎。直到有一天,我發現自己論文開始能讀懂了,代碼也能看懂了。
這裡要特別感謝我的導師陳穎聰老師和師兄師姐們。在入門階段,老師會給予明確的任務指導,後期則會給我更多自主探索的空間;同組的師兄師姐會和我一起討論問題、交流想法,逐漸讓我對科研有了更深的理解和興趣,也促使我開始獨立思考並明確自己的研究方向。雖然整個過程中,有過焦慮和壓力,但最終作為團隊成員,看到自己模型跑出來的結果,那種成就感會讓自己覺得一切努力都是值得的。也正是由於這段經歷,我才真正理解如何將課堂知識轉化為科研能力。
劉博文:我是去年秋季開始加入研究組的,通過每周參加導師和師兄師姐的組會,我與他們一起探討新觀點和研究方向,並在寒假期間靜下心來「沉澱」自我,從最前沿的論文中汲取靈感。這段時間,我探索了多個研究領域,閱讀了大量不同方向的論文,過程中也遇到了不少挫折和失望。但在師兄師姐的鼓勵和支持下,我們共同解決問題、優化思路,並不斷挖掘新的科研靈感。我逐漸對大模型推理、大模型對齊和強化學習等領域產生了濃厚興趣。
特別要感謝我的導師李佳老師,他在研究過程中為我們提供了方向上的指引和深刻的洞見,幫助我們清晰地認識到當前研究存在的問題。他的學術品位和嚴謹態度讓我們少走了許多彎路。他常常以「審稿人視角」指出研究的不足之處,帶領我們緊跟前沿技術,追尋學術創新。
問:港科大(廣州)創新的培養模式對你們有何幫助?
吳樂毅:我感覺港科大(廣州)一直希望不論老師還是同學,都可以做「有影響力的科研」這一點評價體系,對我找到科研的樂趣和真諦很有幫助。我們科研組的氛圍很好,陳穎聰老師鼓勵我們不要為了快速發論文或讓論文拿高分去做科研,而是要做真正有可能對社會產生積極影響的科研。他從不催促進度,但每次討論都能一針見血指出問題。我和師兄師姐們平時在一起學習,下午一起健身,他們教會我的不僅僅是科研,還有更多學習以外的事情,我十分感激。除此之外,我還想感謝學校靈活的課程管理,這讓我能自主安排學習節奏,平衡學習和科研之間的關係。
劉博文:我非常認同樂毅的觀點,我們的確應當專註於真正有價值的研究。除了這一點,我認為我們組內部不同研究方向的互補與融合,對我的成長起到了至關重要的作用。我們的師兄師姐們分別專註於圖學習(Graph Learning)、機器學習系統(ML System)以及自然語言處理(NLP)等領域,而我們當前主要聚焦於大語言模型(LLM)的研究。這種不同領域的知識交融激發了諸多創新思路。例如,在學術分享中,師兄分享的圖學習經驗幫助我們優化了LLM中的知識表示,而師姐在NLP方面的洞見則為我們的大模型生成能力提供了新的視角。每次同門師兄師姐的經驗分享都讓我豁然開朗,讓我深刻認識到這些相近領域的技術如何在我們當前研究中找到契合點。我非常感激這種緊密協作的氛圍,它不僅讓我在科研的道路上不再孤單,也讓我對未來的研究方向充滿了信心和期待。
問:從大一開始就能夠接觸科研是什麼感受?
吳樂毅:科研不是「內卷」,而是自我探索。對於有意向搞科研的同學,早早接觸「真實科研」,能幫助他們更加明確未來科研的方向,避免因「不適」而感到「迷茫」。即使最終發現自己不適合科研,本科階段的試錯成本也遠低於研究生階段。
劉博文:學校實驗室的豐富科研資源讓我們「敢想敢做」。比如,數據中心強大的算力支持,讓我們本科生就能夠在科研中使用非常高量級的算力,這讓我們能大膽嘗試前沿實驗。
問:請談談各自的未來規劃,以及對學弟妹的建議。
吳樂毅:我應該會繼續深耕生成式人工智能,繼續解決領域內更多問題。建議學弟妹「先行動再完美」——科研沒有標準答案,但實驗室的門永遠向主動敲門的人敞開。
劉博文:短期內,我希望能夠在大模型領域持續努力,如果有機會,我想去工業界的研究組實習,積累更多實踐經驗。長遠來看,我計劃繼續深造讀博,深入開展學術研究。我想對學弟學妹說,科研的興趣和抗壓能力往往比天賦更加重要。保持好奇心,學會在挫折中成長,你就會發現科研的樂趣和價值。

在港科大(廣州),科研從不是少數人的「特權」,而是每個追夢者的起點。大學始終鼓勵和支持本科生儘早接觸科研,參與到前沿項目的實踐中,並為他們提供與國際接軌的實驗設備、參賽機遇和科研平台。2024年6月,港科大(廣州)首次推出本科生科研「五個一」計劃,由一位教授全程指導一名本科學生,組隊開展一項科研課題,進入一個實驗室接觸先進科研儀器設備,項目完成後通過各種形式產出一項科研實踐成果。全校當時70%本科生踴躍參與,共產出88項研究成果。
為提前培養具有前瞻性思維和實踐能力的科技創新人才,學校今年再次以前瞻性視野,全新推出香港科技大學(廣州)「探索者」本科生科研計劃,秉持「以學生為中心」的創新人才培養舉措,鼓勵學生主動出擊,聯繫教授,通過自主選題開展實踐研究,為本科生提供更加廣闊的科研探索空間,生成創造性思維。
「大一就能參與科研並取得一點小小的成績,是我們的幸運,但相比於發論文,我們更希望解決真實世界的問題。」兩位學子在訪談最後吐露心聲,恰恰與港科大(廣州)的核心使命——培養面向未來的科技創新領軍人才相呼應。
劉博文和吳樂毅的故事只是學校眾多本科生科研成果的縮影,更多港科大(廣州)的本科同學正在科研領域嶄露頭角,創新的種子已然播撒,時光正見證成果發芽。
了解更多
IEEE計算機視覺與模式識別會議(CVPR)是IEEE一年一度的學術性會議,會議的主要內容是計算機視覺與模式識別技術。CVPR是世界頂級的計算機視覺會議(三大頂會之一,另外兩個是ICCV和ECCV),本屆CVPR會議收到了13008篇有效投稿,其中2878篇被錄用,最終錄用率為22.1%。
國際學習表徵會議(ICLR)是公認的深度學習領域國際頂級會議之一,關注有關深度學習各個方面的前沿研究,在人工智能、統計和數據科學領域以及機器視覺、語音識別、文本理解等重要應用領域中發佈了眾多極其有影響力的論文。ICLR採取完全公開評審規則,這使得其論文評審的透明性和廣泛性在深度學習頂級會議中獨樹一幟,同時也大大增加論文被接收的難度。