目 錄
第1章 Java套接字編程技術
套接字家族
網絡編程
Java I/O編程技術
代理的問題
Java中的套接字編程
客戶端套接字
服務器套接字
小結
第2章 分析超文本傳輸協議
地址格式
使用套接字進行HTTP編程
Bot包的HTTP類組
實現細節(jié)
小結
第3章 通過HTTPS訪問加密站點
HTTP與HTTPS
通過Java使用HTTPS
HTTP用戶認證
安全訪問
實現細節(jié)
小結
第4章 解析HTML
使用HTML
Bot關心的標簽
需要特殊處理的HTML
使用Bot類解析HTML
使用Swing類解析HTML
Bot包HTML解析例子
實現細節(jié)
小結
第5章 發(fā)送表單
使用表單
用于普通發(fā)送的Bot類
實現細節(jié)
小結
第6章 解釋數據
CSV文件的結構
QIF文件的結構
XML文件格式
小結
第7章 探索Cookie
分析Cookie
用于Cookie處理的Bot類
實現細節(jié)
小結
第8章 編寫Spider程序
網站的結構
Spider程序的結構
構造Spider程序
小結
第9章 編寫大型Spider程序
多線程
用Java實現多線程
線程同步
使用數據庫
高性能的Spider程序
實現細節(jié)
小結
第10章 編寫B(tài)ot程序
構造典型的Bot程序
使用CatBot程序
CatBot實例
實現細節(jié)
小結
第11章 編寫Aggregator程序
在線匯總與離線匯總
構造底層Bot
構造氣象Aggregator程序
小結
第12章 負責任地使用Bot程序
與網站協商
Web站點管理員的措施
負責任的Spider程序
實現細節(jié)
小結
第13章 Bot程序的未來
Internet信息的傳送
理解XML
傳送XML數據
Bot和SOAP
小結
附錄A Bot包
附錄B 各種與HTTP相關的字符
附錄C 故障診斷
附錄D 安裝Tomcat系統
附錄E 在Windows下編譯實例
附錄F 在Unix下編譯實例
附錄G 重新編譯Bot包
術語表