《電子技術應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 設計應用 > 基于爬蟲和TFIDF-NB算法的微博情感分析
基于爬蟲和TFIDF-NB算法的微博情感分析
2021年電子技術應用第4期
楊 戈1,2,楊麓濤1
1.北京師范大學珠海分校 智能多媒體技術重點實驗室,廣東 珠海519087; 2.北京大學深圳研究生院 深圳物聯(lián)網(wǎng)智能感知技術工程實驗室,廣東 深圳518055
摘要: 針對微博網(wǎng)絡輿情信息量大、無規(guī)則、隨機變化的特點,提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,設計與實現(xiàn)了一個基于Scrapy框架的微博評論爬蟲,將某熱點事件的若干條微博評論進行爬取并存進數(shù)據(jù)庫,然后進行文本分割、LDA(Latent Dirichlet Allocation)主題聚類,最后使用TFIDF-NB算法進行情感分類。實驗結果表明,TFIDF-NB算法平均準確率高于線性支持向量機算法和K近鄰算法,在精確率和召回率方面高于K近鄰算法,具有較好的情感分類效果。
中圖分類號: TN011;TP391.41
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200748
中文引用格式: 楊戈,楊麓濤. 基于爬蟲和TFIDF-NB算法的微博情感分析[J].電子技術應用,2021,47(4):59-62,66.
英文引用格式: Yang Ge,Yang Lutao. Sentiment analysis of Weibo based on TFIDF-NB algorithm[J]. Application of Electronic Technique,2021,47(4):59-62,66.
Sentiment analysis of Weibo based on TFIDF-NB algorithm
Yang Ge1,2,Yang Lutao1
1.Key Laboratory of Intelligent Multimedia Technology,Beijing Normal University(Zhuhai Campus),Zhuhai 519087,China; 2.Engineering Lab on Intelligent Perception for Internet of Things(ELIP),Shenzhen Graduate School,Peking University, Shenzhen 518055,China
Abstract: In view of the large amount of public opinion information on Weibo, irregular and random changes, this paper proposes a Weibo sentiment analysis method based on TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes) algorithm. By coding a Weibo comment crawler based on the Scrapy framework, several Weibo comments on a hot event are crawled and stored in the database. Then text segmentation and LDA(Latent Dirichlet Allocation) topic clustering are performed. And finally the TFIDF-NB algorithm is used for sentiment classification. Experimental results show that the accuracy of the algorithm is higher than that of the standard linear Support Vector Machine algorithm and the K-Nearest Neighbor algorithm, and it is higher than the K-Nearest Neighbor algorithm in terms of accuracy and recall, and it has a better effect on sentiment classification.
Key words : Weibo public opinion;web crawler;sentiment classification

0 引言

    網(wǎng)絡輿情是指網(wǎng)絡用戶對社會各方面熱點問題所發(fā)表的見解和建議的輿論,是社會輿情的一種體現(xiàn),是公眾對社會中各種熱點事件和問題所表達的態(tài)度、想法、情緒等的集合。互聯(lián)網(wǎng)的快速發(fā)展使得網(wǎng)絡輿情的形成和傳播速度不斷提升,對社會的影響巨大。

    文獻[1]證明了網(wǎng)絡輿情的發(fā)展具有混沌的特性,即表現(xiàn)為亂序、無規(guī)則、隨機變化。在網(wǎng)絡輿情傳播的過程中,微博給網(wǎng)絡輿情的形成、發(fā)酵和傳播提供了一個強大的互聯(lián)網(wǎng)平臺,給其用戶提供了一個向全世界分享信息、發(fā)表評論和表達訴求的平臺,這些輿論內容在短時間內會大規(guī)模地擴散,甚至會影響事件的走向。

    本文首先實現(xiàn)一個基于Scrapy框架的微博評論爬蟲,將某熱點事件的若干條微博評論進行爬取并存進數(shù)據(jù)庫,然后進行文本分割和LDA(Latent Dirichlet Allocation)主題聚類,最后采用TFIDF-NB(Term Frequency Inverse Document Frequency-Navie Bayes)算法進行文本情感分類

    (1)爬蟲

    爬蟲全稱為網(wǎng)絡爬蟲,是一種可以對互聯(lián)網(wǎng)上的信息進行自動化瀏覽的網(wǎng)絡腳本或程序,可實現(xiàn)對海量互聯(lián)網(wǎng)信息進行瀏覽、爬取等操作,并將抓取到的信息存儲于本地中。

    網(wǎng)絡爬蟲可以分為4種[2]:通用網(wǎng)絡爬蟲[3]、主題網(wǎng)絡爬蟲[4]、增量式網(wǎng)絡爬蟲[5]、深層網(wǎng)絡爬蟲[6-7]

    (2)情感分類

    情感分析是指識別文本中潛在的想法、情感和態(tài)度的方法[8]。情感分類是情感分析的核心內容,情感分類的作用是識別文本數(shù)據(jù)中的觀點,對情感的積極或消極情緒進行分類[9]

    目前情感分類主要有兩種方法,一種是基于詞典的方法[10-13],另一種是基于機器學習的方法[14-16]




本文詳細內容請下載:http://www.jysgc.com/resource/share/2000003464




作者信息:

楊  戈1,2,楊麓濤1

(1.北京師范大學珠海分校 智能多媒體技術重點實驗室,廣東 珠海519087;

2.北京大學深圳研究生院 深圳物聯(lián)網(wǎng)智能感知技術工程實驗室,廣東 深圳518055)

此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
午夜在线电影亚洲一区| 欧美日韩日本国产亚洲在线 | 亚洲精品资源| 久久精品国产在热久久| 香蕉精品999视频一区二区| 亚洲一区二区精品在线观看| 一区二区三区国产在线| 99国产精品久久久久老师| 亚洲精品免费网站| 亚洲精品系列| 亚洲伦理在线免费看| 亚洲日韩欧美视频一区| 亚洲精品美女久久久久| 亚洲精品国产精品国自产在线| 亚洲国产高清一区二区三区| 在线观看亚洲视频啊啊啊啊| 在线电影一区| 亚洲欧洲日本专区| 99精品国产一区二区青青牛奶 | 夜夜爽99久久国产综合精品女不卡| 亚洲精品免费网站| 日韩性生活视频| 亚洲调教视频在线观看| 亚洲一区网站| 久久av一区二区三区| 亚洲第一中文字幕| 亚洲精品视频免费在线观看| 一区二区三区久久网| 亚洲淫性视频| 久久激情综合网| 久热re这里精品视频在线6| 欧美.日韩.国产.一区.二区| 欧美精品一区二区久久婷婷| 欧美日一区二区在线观看| 国产精品久久久久久妇女6080| 国产精品热久久久久夜色精品三区| 国产乱码精品1区2区3区| 国产一区二区三区网站| 在线欧美一区| 一本大道久久a久久精二百| 亚洲你懂的在线视频| 久久国产毛片| 夜夜嗨av一区二区三区四区| 亚洲欧美区自拍先锋| 久久青草福利网站| 欧美日韩福利| 国产精品中文在线| 亚洲国产精品久久久久秋霞蜜臀 | 一区二区三区高清| 久久av一区二区| 欧美风情在线| 国产精品高潮久久| 国精品一区二区| 亚洲日本在线视频观看| 亚洲一区二区欧美日韩| 亚洲国产天堂久久国产91| 亚洲视频在线免费观看| 久久久久欧美| 欧美视频不卡中文| 黄色亚洲网站| 亚洲视频在线观看| 亚洲人永久免费| 欧美一区2区三区4区公司二百| 欧美va天堂| 国产免费亚洲高清| 亚洲精品一区中文| 久久精品91| 亚洲欧美另类综合偷拍| 欧美岛国激情| 国产亚洲精品v| 一本色道久久综合亚洲精品不卡| 久久精品成人| 亚洲欧美日韩区| 欧美精品大片| 狠狠色狠狠色综合日日91app| 宅男精品视频| 亚洲精品乱码久久久久久蜜桃91| 午夜精品久久久久久久99热浪潮| 欧美+日本+国产+在线a∨观看| 国产精品每日更新在线播放网址| 在线电影一区| 欧美一区二区黄| 亚洲性图久久| 欧美激情精品久久久久久蜜臀| 国产日韩欧美在线一区| 99精品国产在热久久婷婷| 91久久在线| 久久免费高清视频| 国产美女精品免费电影| 一区二区久久| 亚洲免费电影在线| 女女同性精品视频| 韩日欧美一区| 亚洲欧美日韩一区二区| 亚洲夜间福利| 欧美欧美在线| 亚洲高清网站| 亚洲成色777777在线观看影院| 欧美一区二区三区四区视频| 国产精品a久久久久| 亚洲免费观看高清在线观看 | 亚洲欧美久久久| 亚洲一区日本| 欧美日韩和欧美的一区二区| 有码中文亚洲精品| 亚洲第一在线综合在线| 久久久久久久999精品视频| 国产精品美女久久久久久2018 | 国产精品视频成人| 在线视频精品一| 亚洲视频视频在线| 欧美日韩一区二区高清| 亚洲人成网站999久久久综合| 亚洲国产成人精品久久| 久久人人九九| 激情小说亚洲一区| 亚洲国产美女精品久久久久∴| 久久亚洲一区| 一区二区在线视频观看| 亚洲电影欧美电影有声小说| 久久久视频精品| 激情视频亚洲| 久久国产精品亚洲77777| 久久久夜精品| 在线观看亚洲精品| 亚洲九九爱视频| 欧美激情视频一区二区三区免费 | 一区二区三区日韩欧美| 欧美欧美天天天天操| 亚洲黄色成人| 亚洲精品日韩精品| 欧美成人精品一区二区| 亚洲国产日本| 亚洲视频免费在线观看| 国产精品扒开腿爽爽爽视频 | 国产精品视频成人| 亚洲欧美日本日韩| 久久国产精品一区二区| 国产午夜精品全部视频在线播放| 欧美在线在线| 欧美国产视频在线| 亚洲精品小视频在线观看| 亚洲免费视频在线观看| 国产欧美日韩在线 | 久久亚洲二区| 亚洲国产精品999| 亚洲视频网在线直播| 国产精品久久久久9999高清| 亚洲一区视频在线观看视频| 久久精品国产2020观看福利| 樱桃成人精品视频在线播放| 亚洲乱码久久| 欧美午夜不卡在线观看免费| 亚洲一线二线三线久久久| 久久精品观看| 亚洲国产精品一区二区www| 亚洲视屏在线播放| 国产精品视频内| 亚洲第一综合天堂另类专| 欧美日韩成人综合天天影院| 亚洲尤物精选| 美国十次成人| 宅男精品视频| 久久亚洲综合色一区二区三区| 亚洲国产一区二区在线| 亚洲欧美怡红院| 一区二区在线看| 亚洲香蕉在线观看| 黑人一区二区三区四区五区| 一区二区三区久久网| 国产亚洲一区二区三区在线播放| 亚洲看片网站| 国产日韩一区二区三区| 亚洲人久久久| 国产欧美一区二区三区视频| 亚洲欧洲综合| 国产精品视频免费观看| 亚洲精品美女在线| 国产精品一区二区视频| 亚洲精品一级| 国产日韩一区二区三区| 一区二区冒白浆视频| 国产一区二区三区在线观看精品 | 伊甸园精品99久久久久久| 亚洲一区二区3| 在线看国产日韩| 欧美一级片在线播放| 亚洲国产精品一区在线观看不卡 | 在线综合亚洲| 在线观看91精品国产入口| 亚洲免费一区二区| 亚洲国产美女久久久久| 久久精品盗摄| 亚洲黄色一区二区三区| 久久成人在线| 亚洲视频在线播放| 欧美女同在线视频| 亚洲国产精品一区二区久| 国产欧美日韩91| 亚洲午夜日本在线观看|