详细信息
文献类型:期刊文献
中文题名:网络信息时效技术
英文题名:Network Information Currency Technology Based on Web Semantic Extraction Method
作者:陈默[1,2];杨小平[1];柳增[1];孙丹雯[2]
第一作者:陈默
机构:[1]中国人民大学信息学院;[2]北京联合大学商务学院
第一机构:中国人民大学信息学院,北京100872
年份:2014
卷号:23
期号:8
起止页码:1-9
中文期刊名:计算机系统应用
外文期刊名:Computer Systems & Applications
收录:CSTPCD
基金:国家自然科学基金(71271209);北京市优秀人才培养项目(2012D005022000013);北京市教育委员会社科计划面上项目(SM201311417008);北京联合大学人才强校计划人才资助项目(BPHR2012A02)
语种:中文
中文关键词:Web语义提取;网络信息时效性;语义相似度;语义距离
外文关键词:Web semantic extraction;network information currency;semantic similarity;semantic distance
摘要:随着大数据时代的到来,对网络信息的时效性进行评价已成为当今研究的热点.将以Web新闻作为研究对象,对大数据环境下的Web信息提取和中文分词处理等技术进行研究,并在此基础上,提出一种基于Web语义信息提取的网络信息时效性评价算法.实验结果将充分体现算法实现的有效性,既可引导网络用户关注更有价值的Web信息,也可帮助网站管理者构建一个时效性更高的网站.
With the arrival of the big data era, the currency evaluation of network information has become a spot for today’s research. This paper will take Web news as the object of study and study the technology of Web information extraction and Chinese word segmentation in big data environment. On the basis of the above, this paper proposes an algorithm of network information currency evaluation based on Web semantic extraction method. The experimental results fully reflect the validity of the algorithm implementation. The study of technology plays a very important role in leading network users pay attention to more valuable Web information and helping Web site managers build a higher currency network.
参考文献:
正在载入数据...