北理工團隊榮獲CCKS2023大會優秀資源論文獎
發布日期:2023-08-29 供稿:外國語學院 李洪政 攝影:李洪政
編輯:王喆 審核:楊暉 閱讀次數:8月24日至27日,第十七屆全國知識圖譜與語義計算大會(CCKS 2023)在沈陽召開。語言工程與認知計算工信部重點實驗室(下文簡稱“重點實驗室”)“英文科技論文寫作智能批改與評價”團隊提交至大會的論文“Move Structure Recognition in Scientific Papers with Saliency Attribution”榮獲優秀資源論文獎。論文第一作者是北京理工大學計算機學院碩士研究生林金坤,團隊的其他作者分別來自北京理工大學外國語學院、北京理工大學計算機學院和北京工業大學信息學部。
全國知識圖譜與語義計算大會(China Conference on Knowledge Graph and Semantic Computing,CCKS)由中國中文信息學會語言與知識計算專業委員會主辦,目前已經成為國內知識圖譜、語義技術等領域的核心學術會議,聚集了知識表示與推理、自然語言理解與知識獲取、圖數據管理與圖計算、智能問答等相關技術領域的學者和研發人員。
語步(move)是學術論文文本內容的重要結構和單元,語步分析是計算語言學中與語用學相關的一個研究話題,對于分析文本的意圖和連貫性等都具有關鍵作用。論文團隊面向科技論文設計了科技論文語步結構識別的創新任務,同時人工標注了較大規模的高質量數據集Scientific Abstract Moves Dataset (SAMD)。為了解決語步結構內容中的隱性混合和反事實推斷導致語步識別性能不佳等問題,團隊提出了語步顯著性歸因的新概念,它可以闡明單詞對特定語步結構的貢獻。在此基礎上,設計了一種新的語步識別訓練機制,該機制充分考慮了上下文信息,并促使模型專注于與標簽相關的最重要文本。所提方法在SAMD和NLP Contribution Graph共享任務數據集(NCG)上進行實驗,均取得了突出表現。這是團隊在語步識別可解釋性上的首次嘗試,為了解模型如何做出決策并識別模型中的潛在偏差或錯誤提供了可能。
此次榮獲大會優秀資源論文獎表明團隊的研究獲得了學術同行的認可,這也是重點實驗室成立以來,積極推動并開展文理交叉、文工交叉以及多學科創新合作的重要階段成果之一,充分體現了“語言智能+外語教育”協同創新發展的可能性。未來,重點實驗室將繼續開展更加廣泛的交流與合作,實現更高質量和多樣化的成果產出。