k近邻查询,类超球,质心距离,始点距离," /> k近邻查询,类超球,质心距离,始点距离,"/>
为了提高高维数据相似查询的效率,提出一种基于双重距离尺度(DDM)的新型高维索引结构.通过建模得到该DDM的四元组数据结构, 对于高维空间中的数据点,通过k平均聚类算法将数据点聚成若干类,分别计算每个点对应的始点和质心距离,得到基于加权的质心距离, 并将加权的质心距离作为每个数据点的索引键值,且用基于分片的B+树建立索引,得到了该索引的创建算法.高维空间的查询就转变成对一维空间的检索,并研究了数据点的维数、数据量和查询请求参数对查询性能的影响.结果表明, 该DDM能更有效地缩小搜索空间,减少距离计算的开销,特别适合海量高维数据的查询.
国家自然科学基金资助项目(60533090,60272031); 国家杰出青年基金资助项目(60525108);中美百万册数字图书馆资助项目.
庄毅 翁建广 庄越挺 吴飞. 一种基于双重距离尺度的高维索引结构[J]. J4, 2007, 41(3): 380-385.
PENG Yi, WENG Jian-An, PENG Huo-Ting, TUN Fei. . J4, 2007, 41(3): 380-385.
http://www.zjujournals.com/xueshu/eng/CN/ 或 http://www.zjujournals.com/xueshu/eng/CN/Y2007/V41/I3/380
Cited