輿情監控系統

概述

輿情監控系統通過對微信公眾號、傳統媒體網絡版(含中央媒體、地方媒體、市場化媒體、部分海外媒體) 、新聞網站、網絡社區/論壇/BBS/、社交網站、QQ群、搜索引擎、視頻網站、知道、貼吧、"意見領袖"的個人博客、微博等,進行多語言全年7*24小時監控與本單位相關的敏感信息,特別是負面信,在第一時間將信息通知到指定責任人,主動掌握輿情進展及未來趨勢,為業務決策分析做支撐。另外通過結合數字傳播解決方案實現正面信息的有效傳播、負面信息的有效抑制。

重點功能介紹

信息采集:

自動采集系統是輿情監測系統的核心與基礎,因此評價一個輿情監測系統是否優秀的重要指標就是自動采集子系統能否將目標信息及時全面地采集到系統中。

信息采集子系統的職責是對全部網站進行自動采集.系統內置重點網站有:

(1)新聞類門戶網站:如新浪網、網易、人民網、雅虎......

(2)政府機構門戶網站:如首都之窗、中國政府網、各地政府網......

(3)信息資訊網站:各地信息港、行業咨詢網......

(4)交互性質網站:如強國論壇、天涯社區、西祠社區、網易區、新浪論壇、搜狐社區、BBS貼吧......

(5)傳統媒體:人民日報、參考消息、中國日報、解放軍報、各省市地區報紙、各地新聞網等媒體網絡版......

(6)博客:新浪博客、騰訊博客、網易博客、博客中國、博客網.......

(7)微博:Twitter、新浪微博、騰訊微博、網易微博、搜狐微博......

(8)視頻網站:Youtube、優酷、土豆網、56視頻、酷6網......

(9)搜索引擎:Google、BaiDu、Bing、Yahoo、搜搜、有道......

(10)社交網站:FaceBook、Google、人人網、豆瓣、開心網、QQ群、QQ空間......

信息采集了系統可以抽取所有新聞文章或主題貼或著最新主題貼內容,還可以抽取某個主題貼的所有回復貼或著最新回復貼的內容.即可指定某個目標網站進行監測,也可以不指定目標網站對于全球范圍內網站進行監測,或著進行兩者混合監測.即可以監測國內網站,也可以監測國外網站如BBC,CNN等。

信息采集了系統還可以對于基于應用程序的聊天室程序監測,如QQ群聊天室。

全網爬蟲系統:自主研發了專為輿情系統設計的智能網絡爬蟲(spider)系統,可以實現高質量和快速的抓取,還支持對微信公眾號、朋友圈、新浪微博、騰訊微博、搜狐微博、網易微博等主要微博平臺信息的實時抓取。

定向抓取源:輿情監測系統對于人工定義的重點站點的新聞、論壇、博客等實現全面的抓取,同時支持對主流新聞網站分頁、評論內容的采集以及對論壇點擊數、回貼數、回帖內容的抓取。

搜索引擎結果:智能爬蟲系統還可以自動跟蹤多個搜索引擎的搜索結果,對于系統抓取進行補充,確保信息全面無遺漏。

多采集線程并行處理:本子系統可以部署在多臺計算機上,實現高效的多線程同時并行處理,減少單一服務器采集壓力。

強大的多語言統一處理功能:可自動處理并保存中文,英文,阿拉伯語,法文,德文,日語,韓語等多國語言,且有多國語言同時并存監測的實際案例。

智能文章提取:對于文章類型網頁,可以無需配置,直接自動提取文章正文與標題,以及作者發布日期,來源等,自動去除廣,欄目,版權等無關的垃圾內容.這個功能對于輿情監測非常重要,可以大大免除配置的負擔.該功能經過我們的多年測試,對于絕大部分文章型頁面都可自動準確識別。

可無人值守全天候自動采集:可定時行,也可7*24小時運行,可設置采集時間間隔最短為1分鐘。

信息處理:

垃圾信息過濾:

基于機器學習的垃圾過濾機制可以自動過濾廣告、水貼等無效垃圾信息。

智能去重:

采用"文章相似性技術",根據文檔內容的匹配程度確定是否重復.去重的級別;根據不同的需要特點分為:URL去重、標題去重、正文去重三個級別。

HTML內容提取:

采用自主知識產權的HTML網頁文本萃取技術自動提取任意復雜網頁中的標題、內容、作者、發布時間等信息,自動跟蹤文章分頁;對于論壇信息自動分析主貼、回帖以及作者等信息。

快照保存:

對于每個經過抓取和處理的網頁,系統都存有一個純文本的備份,方便用戶快速瀏覽,也方便用戶查看被刪除的文章或帖子。

輿情分析

文章權重計算:

綜合網站重要程度、文章出現位置、主題相關度、點擊回復次數、傳播數量以及用戶自定義規則等復雜參數計算的文章權重,加上基于自然語言處理技術的訓練系統,能準確分析出重要輿情信息。

傳播軌跡分析:

系統可以對于一段時間(自定義范圍)內的輿情信息走勢進行分析展示,同時可以以不同的載體如論壇、新聞等分類呈現。

自動分類與情感分析:

將自然語言處理技術(SLP)應用與輿情監測領域,對信息精準分類并自動做情感分析。

相似文章算法:

基于自然語言處理技術,系統根據文章內容相似程度計算相似文章,方便獲取同一內容文章的所有傳播網站。

爆發趨勢分析:

對于重要的熱點新聞信息,系統會進行分析和追蹤,自動統計相關的新聞和論壇傳播情況以及輿情的走勢,進行爆發趨勢分析。

輿情展示:

基于云計算模式,用戶可以使用WEB瀏覽器隨時登陸系統,在客戶界面對輿情狀況進行全面的了解。

客戶界面包含了如輿情走勢、輿情詳細信息、最新微博信息、載體覆蓋情況等主要內容,并以列表以及圖表展示等可視化方式呈現,方便客戶查看。

導航欄清晰明了,方便用戶查看各種分類;欄目定制功能,用戶可以在首頁自行刪、減、增添所需要的功能模塊。

實時搜索功能,用戶可以自定義搜索條件查看系統內抓取的最新監測信息;支持關鍵詞組分類、媒體類型分類、信息屬性分類查看。

輿情預警:

預警級別顯示,顯示當日輿情級別,方便用戶整體把握,同時呈現預警信息走勢和預警信息列表。

建立多個輿情指示,對于突發輿情自動發出預警信號,在最短時間內通過短信或郵件方式通知用戶,輔助進行輿情干預和引導。

輿情分析報告:

根據輿情分析引擎處理后的結果庫生成報告,用戶可通過瀏覽器瀏覽,并且可以到處生成為word、PDF等格式的本地文檔。

專業行業分析師輔助提供相關日報、周報、月報,方便客戶對不同時段的重點和熱點進行把握。對于突發事件提供詳細的事件專題分析報告,對時間輿情數據進行有針對性的解讀。

王者荣耀城市赛