Please wait a minute...
J4  2005, Vol. 39 Issue (10): 1507-1501    
论文     
Web站点层次结构抽取算法的分析和实现
冯雁,王申康(浙江大学计算机学院, 浙江 杭州 310027 )
 全文: PDF 
摘要:

为了提高搜索引擎、网站管理及推荐系统的运行效率,提出了一种重构网站层次结构的方法,该方法以人工智能 及图论为基础,通过对标记信息、网站的目录信息以及链接信息等的分析,定义和建立了网站的数据模型:结构标记图 ,并采用最短路径算法(Dijkstral),完成Web站点的层次结构抽取.算法体系由5层构成:显示层、网站层、页面分析 层、预处理层和连接层.实验结果证明该方法能正确地建立网站的层次结构,并具有较快的运行时间.

关键词: Web结构挖掘标记图目录信息    
出版日期: 2005-10-20
作者简介: 冯雁(1964-),女,浙江杭州人,副教授,主要从事数据库技术、Web数据挖掘、CSCW等研究.E mail:fengyan@cs.zju.edu.cn
服务  
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章  
冯雁
王申康

引用本文:

冯雁 王申康. Web站点层次结构抽取算法的分析和实现[J]. J4, 2005, 39(10): 1507-1501.

FENG Yan, WANG Shen-Kang. . J4, 2005, 39(10): 1507-1501.

链接本文:

http://www.zjujournals.com/xueshu/eng/CN/        http://www.zjujournals.com/xueshu/eng/CN/Y2005/V39/I10/1507

[1] 任迪, 万健, 殷昱煜, 周丽, 高敏. 基于贝叶斯分类的Web服务质量预测方法研究[J]. 浙江大学学报(工学版), 2017, 51(6): 1242-1251.
[2] 王继奎. 贝叶斯冲突Web数据可信度算法[J]. 浙江大学学报(工学版), 2016, 50(12): 2380-2385.
[3] 苏凯, 马良荔, 孙煜飞, 郭晓明. 面向Web服务QoS预测的非负矩阵分解模型[J]. 浙江大学学报(工学版), 2015, 49(7): 1358-1366.
[4] 万志远, 周波. 基于静态信息流跟踪的输入验证漏洞检测方法[J]. 浙江大学学报(工学版), 2015, 49(4): 683-691.
[5] 俞东进,殷昱煜,吴萌萌,刘愉. 基于混合协同过滤的Web服务QoS预测方法[J]. 浙江大学学报(工学版), 2014, 48(11): 2039-2045.
[6] 朱凡微, 吴明晖, 应晶. 面向大规模无结构数据的Web方面搜索方法[J]. J4, 2013, 47(6): 990-999.
[7] 黄沈权, 徐福缘, 代风, 张勇为, 顾新建, 祁国宁. 基于知识网络的TRIZ集成框架及其关键技术[J]. J4, 2011, 45(8): 1337-1345.
[8] 杨迷影,徐福缘,顾新建,张勇为,代风,毕经元. 基于认知导航模式的企业知识网络[J]. J4, 2011, 45(7): 1181-1186.
[9] 尹可挺, 周波, 张帅, 徐斌, 陈一稀, 江丹. Web服务组合中基于QoS的自底向上服务替换[J]. J4, 2010, 44(4): 700-709.
[10] 贝毅君, 陈刚, 董金祥. 面向Web活跃用户的树型访问模式挖掘算法[J]. J4, 2009, 43(6): 1005-1013.
[11] 代风, 袁特, 顾新建, 等. 基于Wiki的企业标准制修订系统[J]. J4, 2009, 43(12): 2254-2258.
[12] 胡恒杰, 顾新建, 吕艳, 等. 知识本体协同建立和应用[J]. J4, 2009, 43(12): 2300-2304.
[13] 胡昔祥. 基于语义的发布订阅系统匹配算法研究[J]. J4, 2009, 43(1): 63-68.
[14] 尹建伟, 张璇, 尹瑛, 等. 支持语义耦合的设备自适应网页布局算法[J]. J4, 2009, 43(09): 1561-1567.
[15] 张登荣 俞乐 邓超 狄黎平. 基于OGC WPS的Web环境遥感图像处理技术研究[J]. J4, 2008, 42(7): 1184-1188.