《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 針對在線教育情感分析的數據擴充研究
針對在線教育情感分析的數據擴充研究
網絡安全與數據治理 2022年 第1期
黃偉強1,劉 海2,梁韜文2,楊海華2
(1.華南師范大學 網絡中心,廣東 廣州510631;2.華南師范大學 計算機學院,廣東 廣州510631)
摘要: 在互聯網上大量主觀性的評論具有豐富的研究價值,可以通過對評論的分析獲取評論的情感極性。在對大量評論進行情感分析時,存在時間和人力消耗過多等問題,針對該問題,提出了基于聚類分析的文本數據擴充方法:在對少量關鍵數據進行標注的基礎上,通過聚類分析標注大量數據,以減少情感分析在實際應用中的成本。以在線教育平臺的評論為例,對目前多個主流在線教育平臺上爬取的共569 970條中文評論數據進行少量標注,然后使用該方法進行數據擴充,最后基于目前多個主流機器學習模型和卷積神經網絡模型進行情感分析訓練。研究結果表明,數據處理經過聚類后取得較好的數據擴充效果,其中采用卷積神經網絡模型進行的情感分析,準確度可以達到96.5%。
中圖分類號: TP391
文獻標識碼: A
DOI: 10.20044/j.csdg.2097-1788.2022.01.015
引用格式: 黃偉強,劉海,梁韜文,等. 針對在線教育情感分析的數據擴充研究[J].網絡安全與數據治理,2022,41(1):93-100.
A data augmentation method for online education sentiment analysis
Huang Weiqiang1,Liu Hai2,Liang Taowen2,Yang Haihua2
(1.Network Center,South China Normal University,Guangzhou 510631,China; 2.School of Computer Science,South China Normal University,Guangzhou 510631,China)
Abstract: A large number of subjective comments have rich research value on the Internet. The sentiment polarity of the comments can be obtained through the sentiment analysis of the text. However, there are many problems such as excessive time and human resource consumption in sentiment analysis of massive text comments. In response to the above problems, a method of augmenting data based on cluster analysis is proposed to reduce the cost of sentiment analysis in practical applications. The method can label a large amount of data based on a small amount of key data. Taking reviews on online education platforms as an example, in this paper, a small number of data are labelled on a total of 569 970 Chinese comments crawled on many mainstream online education platforms and then augmented using the method mentioned in this paper,four popular machine learning models and the CNN(Convolutional Neural Network) model are used in the sentiment analysis. The experimental results show that the data processing achieves better data expansion effect after clustering,and the Chinese sentiment analysis model based on the convolutional neural network has an accuracy of 96.5%.
Key words : text data augmentation;sentiment analysis;natural language processing;cluster analysis

0 引言

隨著信息技術的飛速發展,在線教育逐漸興起,越來越多的人在在線教育課程中留下了有價值的評論,通過對這些評論進行情感分析可以達到多方面的目的,如分析學生對課程的滿意度、調查老師授課水平、挖掘課程質量等。 

情感分析(Sentiment Analysis),又稱為情感傾向性分析[1],目的是找出文本中情感的正負性,如正面或負面、積極或消極,并且把這種正負性數值化,以百分比或者正負值的方式表現出來。情感分析的研究方法大致可以分為兩種:一是基于情感詞典的情感分析[2],主要通過建立情感詞典或領域詞典及通過文本中帶有極性的情感詞進行計算來獲取文本的極性,由于依賴于情感詞典,存在覆蓋率不足等缺點;二是基于機器學習的情感分析,包括監督學習、無監督學習和半監督學習三種方法,其中與監督學習和無監督學習相比,半監督學習通過少量標注數據和大量無標注數據進行識別,既不用對所有的數據進行標注,也不依賴先驗經驗,有較好的實用性,從而被許多學者應用在情感分析問題上,如陳珂等[3]利用基于分類器集成的self-training方法進行情感分析研究,使用少量標注樣本和大量未標注樣本來進行情感分析訓練,準確率達86%。

數據擴充[4]是一種結合機器學習使用的方法,在訓練樣本不足的情況下,可使模型訓練更好地擬合,通過與半監督的方法相結合,可達到標注少量數據以擴充至大量訓練數據的效果。數據擴充方法目前已被用于圖像、交通、醫療等領域[5-7],目前主流的數據擴充方法有圖像翻轉、隨機噪聲、標簽傳播等[8]。

情感分析目前已被應用于如電影評論、書籍評論、微博短評等多個領域,但在在線教育課程評論領域的應用還較缺乏,把情感分析應用在在線教育課程評論上存在著各種挑戰,如評論數據的獲取、評論數據的標注等。為了解決以上問題,本文借鑒半監督學習的方法,提出基于聚類分析的文本數據擴充方法:對少量關鍵數據進行標注,并通過聚類分析獲得大量已標注數據。在目前主流在線教育平臺爬取的569 970條課程評論中選取1 000條關鍵數據進行標注并使用本文數據擴充方法擴充至10萬條標注數據,分別利用SVM[9]、RandomForest[10]、AdaBoost[11]、GradientBoost[12]和CNN模型對標注數據進行訓練,實驗表明,與目前主流的LabelSpreading算法相比,本文的數據擴充方法均有準確率上的優勢。




本文詳細內容請下載:http://www.jysgc.com/resource/share/2000004618




作者信息:

黃偉強1,劉  海2,梁韜文2,楊海華2

(1.華南師范大學 網絡中心,廣東 廣州510631;2.華南師范大學 計算機學院,廣東 廣州510631)


此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美福利精品| 欧美成人午夜激情在线| 亚洲国产三级| 欧美一区二区| 亚洲欧美日韩另类| 一区二区欧美在线观看| 亚洲人成亚洲人成在线观看图片| 精品av久久707| 激情六月综合| 精品51国产黑色丝袜高跟鞋| 国产手机视频一区二区| 国产日韩欧美一二三区| 国产伦精品一区| 国产精品主播| 国产区精品视频| 国产伦精品一区二区三区照片91 | 欧美精品日韩精品| 欧美激情aⅴ一区二区三区| 欧美国产在线电影| 欧美日本亚洲| 欧美日韩直播| 国产精品麻豆va在线播放| 国产精品视频区| 国产香蕉久久精品综合网| 国内精品久久久久久| 黄色国产精品| 亚洲人成人一区二区在线观看| 亚洲日本理论电影| 国产在线拍揄自揄视频不卡99| 在线亚洲观看| 亚洲午夜精品久久久久久浪潮| 这里只有精品视频| 亚洲欧美日韩在线播放| 亚洲欧美在线看| 欧美一区国产一区| 久久久999| 久久在线免费| 欧美成人性网| 欧美三级韩国三级日本三斤| 国产精品麻豆成人av电影艾秋| 国产人久久人人人人爽| 韩国美女久久| 亚洲美女黄色片| 亚洲欧美中文日韩v在线观看| 久久精品国产亚洲aⅴ| 日韩亚洲不卡在线| 午夜免费日韩视频| 久久资源av| 国产精品s色| 国产亚洲人成网站在线观看| 亚洲电影免费观看高清完整版| 日韩午夜av在线| 亚洲永久精品国产| 91久久线看在观草草青青| 中文国产成人精品| 久久久久久久国产| 欧美久久视频| 国产一区二区三区高清在线观看| 亚洲国产欧美日韩另类综合| 一区二区动漫| 久久福利精品| 一区二区三区免费观看| 欧美专区一区二区三区| 欧美激情免费在线| 国产精品日韩精品| 亚洲成人直播| 亚洲欧美激情视频| 99re6这里只有精品视频在线观看| 亚洲免费视频网站| 欧美aaaaaaaa牛牛影院| 国产精品欧美日韩| 亚洲日本在线观看| 欧美专区在线观看| 亚洲一区二区三区777| 麻豆精品一区二区av白丝在线| 国产精品久久久亚洲一区| 亚洲国产精品999| 欧美亚洲三级| 亚洲一区免费| 欧美大尺度在线| 国产午夜精品视频免费不卡69堂| 亚洲精选大片| 亚洲国产一区二区三区在线播| 亚洲欧美激情在线视频| 欧美国产精品| 国产综合久久久久久鬼色| 一本色道**综合亚洲精品蜜桃冫| 欧美激情一区二区三区四区| 国产日韩一区二区三区在线播放| 亚洲精品视频免费| 亚洲高清不卡在线| 午夜精品成人在线| 欧美三级在线视频| 亚洲日本免费| 亚洲日本va午夜在线电影| 久久久久**毛片大全| 国产精品久久网站| 亚洲日本中文| 亚洲欧洲一区二区三区在线观看| 久久爱www.| 国产精品婷婷| 制服丝袜激情欧洲亚洲| 一本在线高清不卡dvd| 欧美1区视频| 影院欧美亚洲| 欧美亚洲三区| 久久精品视频播放| 国产午夜亚洲精品理论片色戒| 亚洲午夜久久久久久久久电影院| 在线亚洲欧美视频| 欧美日韩国产成人在线| 亚洲国内自拍| 日韩手机在线导航| 欧美激情第8页| 亚洲国产欧美一区| 亚洲欧洲一区二区在线观看| 久久男人资源视频| 国产一区 二区 三区一级| 午夜国产精品影院在线观看| 欧美亚洲一区三区| 国产精品一卡| 亚洲欧美另类久久久精品2019| 亚洲一区图片| 国产精品欧美久久久久无广告| 亚洲性感激情| 欧美一区二区啪啪| 国产日韩欧美二区| 久久xxxx| 嫩草国产精品入口| 亚洲国产日韩在线| 亚洲日本va午夜在线影院| 欧美电影免费观看网站| 亚洲精品日韩在线观看| 一区二区欧美日韩| 国产精品极品美女粉嫩高清在线 | 亚洲欧美日韩直播| 国产欧美亚洲日本| 欧美在线综合视频| 欧美ed2k| 日韩视频在线观看一区二区| 亚洲一区二区在线免费观看视频| 国产精品户外野外| 欧美有码在线观看视频| 乱码第一页成人| 亚洲高清视频的网址| 日韩视频免费观看高清完整版| 欧美日韩高清在线观看| 欧美在线精品一区| av成人国产| 午夜视频久久久| 国产一区亚洲| 亚洲乱码国产乱码精品精天堂| 欧美理论片在线观看| 中日韩视频在线观看| 久久国产一区| 在线成人亚洲| 亚洲色在线视频| 国产日韩精品视频一区二区三区| 亚洲电影av在线| 欧美日本在线观看| 亚洲免费视频成人| 开心色5月久久精品| av成人手机在线| 久久精品女人| 亚洲人午夜精品免费| 欧美一级免费视频| 亚洲国产精品久久久久久女王| 国产精品99久久久久久久女警 | 久久精品国产免费| 欧美精品入口| 欧美一区二区三区视频在线| 午夜在线成人av| 欧美精品免费播放| 香蕉成人伊视频在线观看| 欧美成人资源| 亚洲一级网站| 欧美成人在线免费观看| 亚洲视频中文| 欧美www在线| 午夜激情亚洲| 欧美精品一区二区三区在线播放 | 亚洲精品美女在线| 欧美在线日韩精品| 亚洲日韩欧美一区二区在线| 欧美在线播放高清精品| 亚洲三级视频在线观看| 欧美中文字幕| 99视频热这里只有精品免费| 久久久人成影片一区二区三区观看 | 国产精品成人va在线观看| 亚洲电影网站| 国产精品美女黄网| 亚洲精品视频中文字幕| 国产欧美一区二区三区久久| 一区二区久久久久| 一区精品在线| 欧美中文字幕不卡| 在线视频日韩精品| 欧美精品二区| 亚洲成色777777女色窝|