《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于混合表征學習的專利分類方法研究
基于混合表征學習的專利分類方法研究
信息技術與網絡安全 12期
王慶才1,2,劉貴全1,2
(1.中國科學技術大學 計算機科學與技術學院,安徽 合肥230027; 2.大數據分析與應用安徽省重點實驗室,安徽 合肥230027)
摘要: 專利分類是專利分析的基本任務,而基于深度學習的自動化專利分類方法可以有效地執行專利分類任務?,F有研究大多利用自然語言處理方法,基于單個專利的文本內容(如摘要和標題)對專利文本進行分類,而專利及標簽之間的宏觀關系(如專利之間的引用和標簽之間的共現)在很大程度上被忽略。為了緩解專利分類中單一專利信息的問題,構建了三個圖網絡表示專利及其標簽之間的宏觀關系,然后提出一個基于混合表征學習的專利分類框架,將專利及標簽的宏觀關系融入分類中,以提高專利的自動化分類的準確性。在真實的專利數據集的實驗結果表明,該分類方法在多個評價指標上取得了最佳的性能。
中圖分類號: TP181
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.12.009
引用格式: 王慶才,劉貴全. 基于混合表征學習的專利分類方法研究[J].信息技術與網絡安全,2021,40(12):51-59.
Hybrid representation based framework for patent classification
Wang Qingcai1,2,Liu Guiquan1,2
(1.School of Computer Science and Technology,University of Science and Technology of China,Hefei 230027,China; 2.Anhui Province Key Laboratory of Big Data Analysis and Application,Hefei 230027,China)
Abstract: Patent classification is a fundamental task in patent analysis, and automatic patent classification methods based on deep learning can perform effectively. Most existing studies utilize natural language processing methods to classify patent documents based on the textual contents of individual patents(e.g.,abstracts and titles), while the macro-relationships between patents and their labels(e.g.,citations between patents and co-occurrence between labels) are largely ignored. To alleviate the problem of single patent information in patent classification, this paper constructed three graphs to represent the macro-relationships between patents and labels, and then proposed a hybrid representation based framework for patent classification to enhance the automated classification of patents. Extensive experiments conducted on real patent datasets show that the proposed classification method achieves the best performance in several evaluation metrics.
Key words : patent classification;multi-label classification;Graph Neural Network;deep learning

0 引言

專利分類是專利挖掘和管理中重要的基礎任務。其主要目的是通過自然語言處理等方法提取專利文檔中的重要特征,然后將這些特征輸入分類器中,其輸出結果表示專利文檔所屬的標簽。通常一個專利具有一個或多個標簽。面對每年快速增長的專利申請數量,實現高效的、自動化的專利分類算法可以大大減少專利機構的人工成本和時間成本。目前,自動化專利分類算法已被專利機構廣泛使用,為專利檢索[1]、專利價值評估[2]、專利訴訟風險評估[3]等專利智能服務提供支持。

因此,這吸引了許多研究人員來研究自動專利分類問題[4-6],并且這些方法中的大多數將其視為多標簽文本分類任務[4-5]。專利的主要內容為其組件和創新的詳細說明文檔,該任務的目標是針對專利自動化預測一組標準化的類別。傳統的專利分類方法大多基于統計學和自然語言處理方法人工構造特征信息,輸入到機器學習模型中進行訓練,然后預測未知專利的類別信息。這些方法大多屬于淺層模型,僅僅學習了專利文本簡單的詞義信息,無法獲取深層的上下文語義信息。而且專利中包含了大量的非結構化信息,如專利之間的引用信息,通常將專利作為網絡節點構建專利引用網絡,然后基于網絡分析的方法對專利節點進行分類。此類方法專注于學習網絡的結構信息,忽略了專利文本信息對預測專利類別的影響。



本文詳細內容請下載:http://www.jysgc.com/resource/share/2000003896.





作者信息:

王慶才1,2,劉貴全1,2

(1.中國科學技術大學 計算機科學與技術學院,安徽 合肥230027;

2.大數據分析與應用安徽省重點實驗室,安徽 合肥230027)


此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 精品久久久中文字幕一区| 深夜福利视频网站| 护士好爽好深好多水| 五十路老熟道中出在线播放| 欧美激情xxxx| 人与动人物欧美网站| 精品久久久无码人妻中文字幕| 国产一区二区福利久久| 高清欧美性暴力猛交| 国产福利一区二区三区在线观看| 91亚洲精品第一综合不卡播放| 天堂一区二区三区精品| 一个人看的www免费在线视频| 拍拍拍无挡视频免费观看1000| 久久精品aⅴ无码中文字字幕不卡 久久精品aⅴ无码中文字字幕重口 | 男女一边摸一边爽爽视频| 国内大量揄拍人妻精品視頻 | 欧美人牲交a欧美精区日韩| 亚洲欧美日本另类激情| 波多野结衣一区二区三区四区| 人成精品视频三区二区一区| 男孩子和男孩子做到哭泰国| 免费萌白酱国产一区二区三区| 精品国产污污免费网站入口| 又粗又大又爽又紧免费视频| 老师别揉我胸啊嗯上课呢视频| 国产主播在线一区| 蝌蚪视频app下载安装无限看丝瓜苏| 国产在线观看91精品不卡 | 年轻帅主玩奴30min视频| 中国帅男同chinese69| 成年免费A级毛片免费看| 丰满少妇人妻久久久久久| 无码免费一区二区三区免费播放 | 亚洲av无码专区在线观看成人| 欧美丰满大乳高跟鞋| 亚洲中文无码mv| 樱桃视频高清免费观看在线播放| 亚洲av永久青草无码精品| 欧美aaaaaaaa| 亚洲Aⅴ在线无码播放毛片一线天|