引言
自然語言處理(Natural Language Processing,NLP)是人工智能的重點研究方向,其研究目標是賦予計算機理解、解析及生成人類語言的能力,是實現人機自然交互的關鍵技術。早期 NLP 研究主要依賴規則系統與統計方法,隨著深度學習技術的興起,逐步發展為基于神經網絡的表示學習范式,而當前大規模預訓練語言模型已成為該領域的主流研究方向[1-2]。這一系列技術演進推動了智能客服、搜索引擎、智能助手等應用的廣泛落地,顯著革新了人機交互模式[3-5]。
在 NLP 的諸多任務中,意圖識別是對話系統的基礎環節[6]。意圖識別旨在確定用戶輸入的文字中所蘊含的意圖或目的,即對用戶的話語進行語義理解,以便更好地回答用戶的問題或提供相關的服務。然而,意圖識別通常面臨著一系列問題的挑戰,包括用戶語言表達的易混淆性、意圖在不同上下文語境中的差異性以及持續出現的新意圖等。
研究人員針對意圖識別問題開展了大量的研究,主要集中在傳統機器學習方法[4]、深度學習方法[2,7]與基于大模型的意圖識別方法。傳統機器學習方法如支持向量機(Support Vector Machine, SVM)、條件隨機場(Conditional Random Field, CRF)等依賴人工特征工程,難以有效捕捉復雜的語義關系。深度學習方法主要包括基于卷積神經網絡、循環神經網絡(如長短期記憶網絡)、 Transformer模型的方法。盡管這些方法在特征自動提取方面展現出顯著優勢,但仍面臨標注數據依賴性強[8]、上下文建模能力不足[9]、領域遷移適應性弱[5]及跨語言場景泛化能力有限[6]等挑戰。
近年來,意圖識別方法逐漸成為研究熱點[10]。現有工作通常提前設定好所有可能的意圖類別,模型在這些預設的類別中進行識別。然而,在開放環境下,模型需要應對持續出現的新意圖類別帶來的挑戰。在預訓練模型時代,Nogueira等人[11]的研究具有標志性意義,他們系統論證了上下文詞嵌入對意圖表征的增強作用。隨后,Zhang等人[12]針對開放世界假設下的意圖識別問題,提出了基于深度語義特征空間的自適應決策邊界算法,實現了已知與未知意圖的有效區分[13]。隨著大語言模型在動態提示工程與自主推理方面的進展,基于智能體架構的意圖發現方法開始涌現,初步驗證了其在開放域場景下的有效性[14]。隨后Cheng等人[15]構建了交互意圖基準,訓練出可主動評估任務模糊性、與用戶交互以明確意圖的模型,從而明確輸入意圖,進而提升識別的準確性與系統交互性。然而,這些方法的有效性通常依賴于大量標記數據和多階段訓練,實現此類方法需要人類專家注釋來完成定義相關意圖的挑戰性任務。
面對傳統意圖識別方法依賴大量標注數據、難以適應開放環境下新意圖涌現等問題,本文提出基于大語言模型的意圖識別方法AutoIntent,可在少樣本條件下有效識別不斷出現的新意圖。本文主要貢獻包括:
(1)提出基于上下文學習的大模型意圖識別框架AutoIntent,借助提示詞構建與意圖反饋機制,實現在少樣本下高效靈活的意圖識別;
(2)在意圖發現對比實驗的常用數據集上,將AutoIntent與領域內最新方法展開對比,結果顯示出AutoIntent在意圖發現任務上的優勢;
(3)針對意圖識別任務構建了復雜度更高的評測數據集并開展驗證,實驗結果進一步驗證了AutoIntent在復雜場景下的有效性。
本文詳細內容請下載:
http://www.jysgc.com/resource/share/2000006860
作者信息:
孫顥原1,劉瑩君2,于莉娜2,紀濤2,張圳錫1,吳繼冰1
(1.國防科技大學大數據與決策國家級重點實驗室,湖南長沙410073;
2.智能空間信息國家級重點實驗室,北京100029)

