《面向大數據的高效能垃圾文本分類》全面介紹了大數據時代垃圾信息的爆發(fā)態(tài)勢和文本特性,并根據信息文檔的多域結構特性和文本Token頻率分布的冪律特性,提出了多域學習的思想。研究了一整套面向大數據的高效能垃圾文本分類方法?!睹嫦虼髷祿母咝芾谋痉诸悺饭卜?章,第1章分析大數據時代垃圾信息態(tài)勢,第2章概述垃圾信息過濾方法,第3章研究電子郵件文檔和手機短信文檔的文本特性,第4章研究多域學習總體框架,第5章提出基于Token頻率索引的文本分類算法,第6章研究有監(jiān)督反饋代價問題,第7章設計面向大數據的高效能垃圾文本過濾系統(tǒng)。《面向大數據的高效能垃圾文本分類》可以作為普通高等院校、科研機構大數據計算技術相關專業(yè)高年級本科生或研究生的實驗教材,也可供網絡信息技術公司高級研究人員參考。