详细信息
一种基于爬虫的BBS数据获取与分析框架设计
文献类型:会议论文
中文题名:一种基于爬虫的BBS数据获取与分析框架设计
作者:苏利敏[1];杨延嵩[1];薛永毅[1];
第一作者:苏利敏
机构:[1]北京联合大学信息学院 北京 100101;
第一机构:北京联合大学智慧城市学院
会议论文集:中国计算机用户协会网络应用分会2008年网络新技术与应用研讨会论文集
会议日期:2008-10-1
会议地点:青岛
主办单位:中国计算机用户协会,北京联合大学
语种:中文
中文关键词:电子公告板系统;数据获取;网络爬虫;框架设计
摘要:来网络安全问题日益严重,针对BBS数据的安全监管成为一个重要的应用需求。而获取BBS上的各种数据并加以过滤、分析则是BBS数据监管关键技术。针对这一问题,提出了一种基于爬虫的BBS数据获取与分析框架,并设计实现了一个系统原型。实验系统能够有效地获取BBS上的数据内容,并根据要求进行分类,把获得的数据存储在数据库中为其他应用提供数据。实验结果表明本文提出的框架可行、有效。
参考文献:
正在载入数据...