Please wait a minute...
浙江大学学报(理学版)  2018, Vol. 45 Issue (5): 589-594    DOI: 10.3785/j.issn.1008-9497.2018.05.011
地理信息系统     
多源异构土地基础数据一体化管理检索方法研究
张书瑜1, 张定祥2, 王荣彬2, 季宏伟2
1. 浙江大学 地球科学学院, 浙江 杭州 310027;
2. 中国土地勘测规划院, 北京 100035
Research on integrated management and retrieval method of multi-source heterogeneous land basic data
ZHANG Shuyu1, ZHANG Dingxiang2, WANG Rongbin2, JI Hongwei2
1. School of Earth Sciences, Zhejiang University, Hangzhou 310027, China;
2. China Land Surveying and Planning Institute, Beijing 100035, China
 全文: PDF(1407 KB)   HTML  
摘要: 为了从多源异构的复杂土地基础数据中快速准确地提取用户所需信息,提出了基于元数据的一体化管理检索方法.在元数据信息提取、元数据加权索引、实体同义词扩展检索3个环节中,结合土地领域专业知识和用户实际需求,设计和开发了共享元数据表结构、加权元数据中字段相对重要性和信息熵因子,构建地名实体和专题数据层实体同义词库,并集成到包括中文分词、实体识别、同义词扩展、索引检索和相似度计算的一体化管理检索框架中,解决了多源异构土地基础数据统一管理和精确检索的问题.实践表明,该方法较传统的通用信息检索方法具有更好的适用性和更高的准确率.
关键词: 多源异构土地基础数据管理检索一体化元数据信息提取元数据加权索引实体同义词扩展检索    
Abstract: In order to obtain the required information quickly and accurately from the complex multi-source heterogeneous land basic data, an integrated management and retrieval method based on metadata is proposed. More concretely, during the process of metadata information extraction, metadata weighted indexing and entity synonyms extended retrieval, three optimized methods are performed combined with the field expertise of land and the actual needs of users, which are design and development of sharing metadata structure, construction of weighted index based on relative importance of metadata columns and information entropy factor, and building synonym database of geographic name entities and thematic data layer entities. An integrated management and retrieval method is proposed, including features of word segmentation, entity recognition, synonym extension, index retrieval and similarity computation. And, the optimized methods mentioned above are integrated into the framework for unified management and precise retrieval for multi-source and heterogeneous land basic data. Experimentation and practical application show that the proposed method presents higher accuracy and better applicability than the traditional general information retrieval method.
Key words: multi-source heterogeneous land basic data    integrated management and retrieval method    metadata information extraction    metadata weighted index    entity synonyms extended retrieval
收稿日期: 2017-03-06 出版日期: 2018-09-12
CLC:  TP391  
基金资助: “十二五”国土资源调查评价——土地基础数据库整合集成与共享平台建设项目(DCPJ131707-01).
作者简介: 张书瑜(1994-),ORCID:http://orcid.org/0000-0003-2038-0349,女,博士研究生,主要从事大规模地理空间数据关联挖掘研究,E-mail:shuyu_zhang@zju.edu.cn.
服务  
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章  
张书瑜
张定祥
王荣彬
季宏伟

引用本文:

张书瑜, 张定祥, 王荣彬, 季宏伟. 多源异构土地基础数据一体化管理检索方法研究[J]. 浙江大学学报(理学版), 2018, 45(5): 589-594.

ZHANG Shuyu, ZHANG Dingxiang, WANG Rongbin, JI Hongwei. Research on integrated management and retrieval method of multi-source heterogeneous land basic data. Journal of ZheJIang University(Science Edition), 2018, 45(5): 589-594.

链接本文:

https://www.zjujournals.com/sci/CN/10.3785/j.issn.1008-9497.2018.05.011        https://www.zjujournals.com/sci/CN/Y2018/V45/I5/589

[1] 谢锋珠,王建民. 土地综合信息管理系统研究[J]. 测绘通报,2012(8):76-78. XIE F Z, WANG J M.On land integrated information management system[J]. Bulletin of Surveying and Mapping, 2012(8):76-78.
[2] 张定祥,安琼,季宏伟,等. 基于Hadoop的土地时空大数据集成框架设计研究[J]. 国土资源信息化, 2016(2):3-8. ZHANG D X, AN Q, JI H W, et al.Design and implementation of the integration framework for spatiotemporal land data based on Dadoop platform[J]. Land and Resources Informatization, 2016(2):3-8.
[3] 刘畅. 综合搜索引擎与垂直搜索引擎的比较研究[J]. 情报科学,2007,25(1):97-102. LIU C.Comparative study on vertical and comprehensive search engines[J]. Information Science, 2007, 25(1):97-102.
[4] 范红丹. 基于垂直搜索引擎的结构化信息处理技术研究[D]. 杭州:浙江理工大学, 2013. FAN H D.The Research on Structured Information Processing Technology Based on Vertical Search Engines[D]. Hangzhou:Zhejiang Sci-Tech University, 2013.
[5] 刘晓华. 面向土地变更调查与遥感监测业务的元数据库构建研究[D]. 焦作:河南理工大学, 2015. LIU X H.Research on Constructing the Metadatabase Orienting to Land Change Investigation and Remote Sensing Monitoring Operation[D]. Jiaozuo:Henan Polytechnic University, 2015.
[6] 李海平,李卫,张爱娟. 基于土地管理系统数据库的建设与应用研究[J]. 测绘与空间地理信息,2013,36(3):86-89. LI H P, LI W, ZHANG A J.Research on construction and application of the database based on land management system[J]. Geomatics & Spatial Information Technology, 2013, 36(3):86-89.
[7] 张莉. 垂直搜索引擎中分词和排序技术的研究与应用[D]. 成都:西南交通大学, 2014. ZHANG L.The Research and Application of Segmentation and Sorting in Vertical Search Engine[D]. Chengdu:Southwest Jiaotong University, 2014.
[8] 赵彦锋,周晓红. 基于本体的语义信息检索模型研究[J]. 软件工程师,2015,18(8):6-9. ZHAO Y F, ZHOU X H.Research on semantic information retrieval model based on ontology[J]. Software Engineer, 2015, 18(8):6-9.
[9] 徐建民,唐万生. 基于查询术语同义词的扩展信念网络检索模型[J]. 计算机工程,2007,33(10):28-30. XU J M, TANG W S.Using synonym-relations of query terms to extend belief network retrieval model[J]. Computer Engineering, 2007, 33(10):28-30.
[10] 陶跃华,王锡钢. 信息检索向量空间模型特征提取的研究[J]. 云南师范大学学报(自然科学版),2000(6):18-20. TAO Y H, WANG X G.The research of characters extraction in the information retrieval vector space model[J]. Journal of Yunan Normal University(Natural Sciences Edition), 2000(6):18-20.
[11] 田文颖. 面向专业领域的文本特征提取技术研究[D]. 长沙:国防科学技术大学,2009. TIAN W Y.Research on Text Feature Extraction Oriented to Professional Fields[D]. Changsha:National University of Defense Technology, 2009.
[12] 刘群,张华平,俞鸿魁,等. 基于层叠隐马模型的汉语词法分析[J]. 计算机研究与发展,2004(8):1421-1429. LIU Q, ZHANG H P, YU H K, et al.Chinese lexical analysis using cascaded hidden Markov model[J]. Computer Research and Development, 2004(8):1421-1429.
[13] 周炎涛,唐剑波,王家琴. 基于信息熵的改进TFIDF特征选择算法[J]. 计算机工程与应用,2007,43(35):156-158. ZHOU Y T, TANG J B, WANG J Q.Improved TFIDF feature selection algorithm based on information entropy[J]. Computer Engineering and Applications, 2007, 43(35):156-158.
[1] 罗月童, 韩承村, 杜华, 严伊蔓. 基于拉伸特征的B-Rep→CSG转换算法及其应用[J]. 浙江大学学报(理学版), 2021, 48(2): 151-158.
[2] 吕德生, 孙煜超, 王嘉忆. 虚拟场景中图形化交互组件的深度冲突缓解研究[J]. 浙江大学学报(理学版), 2020, 47(5): 564-571.
[3] 李君轶, 任涛, 陆路正. 游客情感计算的文本大数据挖掘方法比较研究[J]. 浙江大学学报(理学版), 2020, 47(4): 507-520.
[4] 宋建文, 罗江林, 王博, 张倩, 王献悦. 基于故事情景链语法的偶动画短片分析与建模[J]. 浙江大学学报(理学版), 2020, 47(3): 284-296.
[5] 吕欣, 程雨夏. 基于语义相似度与XGBoost算法的英语作文智能评价框架研究[J]. 浙江大学学报(理学版), 2020, 47(3): 329-336.
[6] 潘志庚, 袁庆曙, 陈胜男, 张明敏. 文化遗产数字化展示与互动技术研究与进展[J]. 浙江大学学报(理学版), 2020, 47(3): 261-273.
[7] 陈佳舟, 王宇航, MohammedAmal Ahmed Hasan, 黄可妤, 卢周扬, 彭群生. 基于图像的二维剪纸自动生成方法[J]. 浙江大学学报(理学版), 2020, 47(3): 274-283.
[8] 焦清局, 刘永革, 仇利萍, 金园园, 熊晶, 刘国英, 高峰. 网络驱动的未识甲骨字特性及场景语义预测[J]. 浙江大学学报(理学版), 2020, 47(2): 142-150.
[9] 张迪, 查东东, 刘华勇. 三次DP曲线定义区间的扩展及其形状优化[J]. 浙江大学学报(理学版), 2020, 47(2): 178-190.
[10] 卢家品, 罗月童, 黄兆嵩, 张延孔, 陈为. 基于排名学习和多源信息的地图匹配方法[J]. 浙江大学学报(理学版), 2020, 47(1): 27-35.
[11] 赵喆, 张天野, 黄彦浩, 郑文庭, 陈为. 面向仿真数据的电网运行方式可视分析[J]. 浙江大学学报(理学版), 2020, 47(1): 36-44.
[12] 刘一璟, 张旭斌, 张建伟, 周哲磊, 冯元力, 陈为. DenseNet-centercrop: 一个用于肺结节分类的卷积网络[J]. 浙江大学学报(理学版), 2020, 47(1): 20-26.
[13] 李军成, 李兵, 易叶青. 保参数方向的形状可调过渡曲线与曲面[J]. 浙江大学学报(理学版), 2019, 46(4): 422-430.
[14] 李丽, 高若婉, 梅树立, 赵海英. 基于Shannon-Cosine小波精细积分法的壁画降噪修复方法[J]. 浙江大学学报(理学版), 2019, 46(3): 279-287.
[15] 郑锐, 钱文华, 徐丹, 普园媛. 基于卷积神经网络的刺绣风格数字合成[J]. 浙江大学学报(理学版), 2019, 46(3): 270-278.