伴随互联网的快速发展,互联网逐渐成为大众获取各类型信息的主要渠道。同时当今互联网信息分类也在不断进行细化,网络信息的主题化也日益明显。针对目前通用搜索引擎搜所搜索到的结果过多,与主题相关性不强等情况,本文提出设计一个面向教育舆情的的主题网络爬虫,也是主题舆情监测系统的重要组成部分。当前主题网络爬虫的研究已成为热点,但针对教育舆情的主题网络爬虫研究还较少,因此针对教育舆情数据采集的主题网络爬虫研究是具有一定意义的。 本文从当前我国互联网教育舆情监测为背景出发,通过分析当前搜索引擎相关知识、主题网络爬虫系统的主要工作模式、搜索算法、主题信息识别等...