局部信息和全局信息相结合的点云处理网络

doi:10.3785/j.issn.1008-9497.2023.06.012

[1]

QI

C R

， SU

H

， MO

K

， et al.

PointNet： Deep learning on point sets for 3D classification and segmentation

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Honolulu： IEEE， 2017： 652-660. DOI：10.1109/CVPR.2017.16

[本文引用: 6]

[2]

QI

C R

， YI

L

， SU

H

， et al.

PointNet++： Deep hierarchical feature learning on point sets in a metric space

［J］. Advances in Neural Information Processing Systems， 2017： 5099-5108.

[本文引用: 7]

[3]

HORNIK

K

.

Approximation capabilities of multilayer feedforward networks

［J］. Neural Networks， 1991， 4（2）： 251-257. DOI：10.1016/0893-6080（91）90009-T

[本文引用: 2]

[4]

KOMARICHEV

A

， ZHONG

Z C

， HUA

J

.

A-CNN： Annularly convolutional neural networks on point clouds

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach： IEEE， 2019： 7421-7430. DOI：10.1109/CVPR.2019.00760

[本文引用: 4]

[5]

ZHAO

H S

， JIANG

L

， FU

C W

， et al.

Pointweb： Enhancing local neighborhood features for point cloud processing

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach： IEEE， 2019： 5565-5573. DOI：10.1109/CVPR.2019.00571

[本文引用: 1]

[6]

SIMONOVSKY

M

， KOMODAKIS

N

.

Dynamic edge-conditioned filters in convolutional neural networks on graphs

［C］// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Honolulu： IEEE， 2017： 3693-3702. DOI：10.1109/CVPR.2017.11

[7]

LIU

Y C

， FAN

B

， XIANG

S M

， et al.

Relation-shape convolutional neural network for point cloud analysis

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach： IEEE， 2019： 8895-8904. DOI：10.1109/CVPR.2019.00910

[8]

JIANG

L

， ZHAO

H S

， LIU

S

， et al.

Hierarchical point-edge interaction network for point cloud semantic segmentation

［C］// Proceedings of the IEEE/CVF International Conference on Computer Vision. Seoul： IEEE， 2019： 10433-10441. DOI：10. 1109/ICCV.2019.01053

[9]

LIU

Y C

， FAN

B

， MENG

G F

， et al.

Densepoint： Learning densely contextual representation for efficient point cloud processing

［C］// Proceedings of the IEEE/CVF International Conference on Computer Vision. Seoul： IEEE，2019： 5239-5248. DOI：10. 1109/ICCV.2019.00534

[本文引用: 3]

[10]

LI

Y Y

， BU

R

， SUN

M C

， et al.

PointCNN： Convolution on x-transformed points

［J］. Advances in Neural Information Processing Systems， 2018， 31.

[本文引用: 4]

[11]

XU

Y F

， FAN

T Q

， XU

M Y

， et al.

SpiderCNN： Deep learning on point sets with parameterized convolutional filters

［C］// Proceedings of the European Conference on Computer Vision （ECCV）. 2018： 87-102. doi:10.1007/978-3-030-01237-3_6

[本文引用: 3]

[12]

XU

M T

， DING

R Y

， ZHAO

H S

， et al.

PAConv： Position adaptive convolution with dynamic kernel assembling on point clouds

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Nashville： IEEE， 2021： 3173-3182. DOI：10.1109/CVPR46437.2021.00319

[本文引用: 4]

[13]

SU

H

， MAJI

S

， KALOGERAKIS

E

， et al.

Multi-view convolutional neural networks for 3D shape recognition

［C］// Proceedings of the IEEE international Conference on Computer Vision. Santiago： IEEE， 2015： 945-953. DOI：10.1109/ICCV.2015.114

[本文引用: 2]

[14]

QI

C R

， SU

H

， NIESSNER

M

， et al.

Volumetric and multi-view CNNs for object classification on 3D data

［C］// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas： IEEE， 2016： 5648-5656. DOI：10.1109/CVPR.2016.609

[15]

WANG

C

， PELILLO

M

， SIDDIQI

K

.

Dominant set clustering and pooling for multi-view 3D object recognition

［Z］. （2019-06-04）. https：//arxiv.org/abs/1906.01592. doi:10.5244/c.31.64

[16]

MA

C

， GUO

Y L

， YANG

J G

， et al.

Learning multi-view representation with LSTM for 3D shape recognition and retrieval

［J］. IEEE Transactions on Multimedia， 2018， 21（5）： 1169-1182. DOI：10. 1109/TMM.2018.2875512

[本文引用: 2]

[17]

WANG

Y

， SUN

Y B

， LIU

Z W

， et al.

Dynamic graph cnn for learning on point clouds

［J］. ACM Transactions on Graphics， 2019， 38（5）： 1-12. DOI：10.1145/3326362

[本文引用: 8]

[18]

ZHAO

H S

， JIANG

L

， JIA

J Y

， et al.

Point transformer

［C］// Proceedings of the IEEE/CVF International Conference on Computer Vision. Montreal： IEEE， 2021： 16259-16268. DOI：10.1109/ICCV48922. 2021.01595

[本文引用: 2]

[19]

GUO

M H

， CAI

J X

， LIU

Z N

， et al.

PCT： Point cloud transformer

［J］. Computational Visual Media， 2021， 7： 187-199. DOI：10.1007/s41095-021-0229-5

[本文引用: 1]

[20]

VASWANI

A

， SHAZEER

N

， PARMAR

N

， et al.

Attention is all you need

［J］. Advances in Neural Information Processing Systems， 2017：30.

[本文引用: 1]

[21]

XU

M Y

， ZHOU

Z P

， QIAO

Y

.

Geometry sharing network for 3D point cloud classification and segmentation

［C］// Proceedings of the AAAI Conference on Artificial Intelligence. Palo Alto： AAAI Press， 2020， 34（7）： 12500-12507. DOI：10. 1609/aaai.v34i07.6938

[本文引用: 3]

[22]

YAN

X

， ZHENG

C D

， LI

Z

， et al.

PointASNL： Robust point clouds processing using nonlocal neural networks with adaptive sampling

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle： IEEE， 2020： 5589-5598. DOI：10.1109/CVPR42600.2020.00563

[本文引用: 4]

[23]

XU

M T

， ZHANG

J H

， ZHOU

Z P

， et al.

Learning geometry-disentangled representation for complementary understanding of 3D object point cloud

［C］// Proceedings of the AAAI Conference on Artificial Intelligence. Palo Alto： AAAI Press， 2021， 35（4）： 3056-3064. DOI：10.1609/aaai.v35i4.16414

[本文引用: 3]

[24]

YANG

J C

， ZHANG

Q

， NI

B B

， et al.

Modeling point clouds with self-attention and gumbel subset sampling

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach： IEEE， 2019： 3323-3332. DOI：10.1109/CVPR.2019.00344

[本文引用: 1]

[25]

XIANG

T

， ZHANG

C Y

， SONG

Y

， et al.

Walk in the cloud： Learning curves for point clouds shape analysis

［C］// Proceedings of the IEEE/CVF International Conference on Computer Vision. Montreal： IEEE， 2021： 915-924. DOI：10.1109/ICCV48922. 2021.00095

[本文引用: 6]

[26]

FAN

S Q

， DONG

Q L

， ZHU

F H

， et al.

SCF-Net： Learning spatial contextual features for large-scale point cloud segmentation

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Nashville： IEEE， 2021： 14504-14513. DOI：10.1109/CVPR46437.2021.01427

[本文引用: 2]

[27]

HU

Q Y

， YANG

B

， XIE

L H

， et al.

RandLA-Net： Efficient semantic segmentation of large-scale point clouds

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle： IEEE， 2020： 11108-11117. DOI：10.1109/CVPR42600.2020.01112

[本文引用: 1]

[28]

CHEN

J T

， KAKILLIOGLU

B

， REN

H T

， et al.

Why discard if you can recycle？ A recycling max pooling module for 3D point cloud analysis

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. New Orleans： IEEE， 2022： 559-567. DOI：10.1109/CVPR52688.2022. 00064

[本文引用: 1]

[29]

GAO

H Y

， JI

S W

.

Graph U-nets

［C］// Proceedings of the 36th International Conference on Machine Learning， in Proceedings of Machine Learning Research. California： IEEE， 2019， 97： 2083-2092. DOI：10. 1109/TPAMI.2021.3081010

[本文引用: 1]

[30]

SZEGEDY

C

， LIU

W

， JIA

Y Q

， et al.

Going deeper with convolutions

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Boston： IEEE， 2015： 1-9. DOI：10. 1109/CVPR.2015.7298594

[本文引用: 1]

[31]

SHI

S

， WANG

X

， LI

H

.

PointrCNN： 3D object proposal generation and detection from point cloud

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach： IEEE， 2019： 770-779. DOI：10.1109/CVPR.2019.00086

[本文引用: 1]

[32]

WANG

D Z

， POSNER

I

.

Voting for voting in online point cloud object detection

［J］. Robotics： Science and Systems. 2015， 1（3）： 10-15. DOI：10.15607/RSS.2015.XI.035

[本文引用: 1]

[33]

LIU

Z

， ZHOU

S B

， SUO

C Z

， et al.

LPD-Net： 3D point cloud learning for large-scale place recognition and environment analysis

［C］// Proceedings of the IEEE/CVF International Conference on Computer Vision. Seoul： IEEE， 2019： 2831-2840. DOI：10.1109/ICCV.2019.00292

[本文引用: 1]

[34]

MATURANA

D

， SCHERER

S

.

VoxNet： A 3D convolutional neural network for real-time object recognition

［C］// 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems （IROS）. Hamburg： IEEE， 2015： 922-928. DOI：10. 1109/IROS.2015.7353481

[本文引用: 1]

[35]

WU

Z R

， SONG

S R

， KHOSLA

A

， et al.

3D ShapeNets： A deep representation for volumetric shapes

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Boston： IEEE， 2015： 1912-1920. DOI：10.1109/CVPR. 2015.7298801

[36]

RIEGLER

G

， OSMAN ULUSOY

A

， GEIGER

A

.

OctNet： Learning deep 3D representations at high resolutions

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Honolulu： IEEE， 2017： 3577-3586. DOI：10.1109/CVPR.2017.701

[本文引用: 1]

[37]

SHEN

Y R

， FENG

C

， YANG

Y Q

， et al.

Mining point cloud local structures by kernel correlation and graph pooling

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City： IEEE， 2018： 4548-4557. DOI：10.1109/CVPR.2018.00478

[38]

LIU

J X

， NI

B B

， LI

C Y

， et al.

Dynamic points agglomeration for hierarchical point sets learning

［C］// Proceedings of the IEEE/CVF International Conference on Computer Vision. Seoul： IEEE， 2019： 7546-7555. DOI：10.1109/ICCV.2019.00764

[本文引用: 1]

[39]

WU

Z R

， SONG

S R

， KHOSLA

A

， et al.

3D ShapeNets： A deep representation for volumetric shapes

［C］// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Boston： IEEE， 2015： 1912-1920. DOI：10.1109/CVPR. 2015.7298801

[本文引用: 1]

[40]

UY

M A

， PHAM

Q H

， HUA

B S

， et al.

Revisiting point cloud classification： A new benchmark dataset and classification model on real-world data

［C］// Proceedings of the IEEE/CVF International Conference on Computer Vision. Seoul： IEEE， 2019： 1588-1597. DOI：10.1109/ICCV.2019.00167

[本文引用: 1]

[41]

YI

L

， KIM

V G

， CEYLAN

D

， et al.

A scalable active framework for region annotation in 3D shape collections

［J］. ACM Transactions on Graphics （ToG）， 2016， 35（6）： 1-12. DOI：10.1145/2980179. 2980238

[本文引用: 1]

[42]

QIU

S

， ANWAR

S

， BARNES

N

.

Dense-resolution network for point cloud classification and segmentation

［C］// Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision. Waikoloa： IEEE， 2021： 3813-3822. DOI：10. 1109/WACV48630.2021.00386

[本文引用: 1]

[43]

QIU

S

， ANWAR

S

， BARNES

N

.

Geometric back-projection network for point cloud classification

［J］. IEEE Transactions on Multimedia， 2021， 24： 1943-1955. DOI：10.1109/TMM.2021.3074240

[本文引用: 2]

[44]

MA

X

， QIN

C

， YOU

H X

， et al.

Rethinking network design and local geometry in point cloud： A simple residual MLP framework

［Z］. （2022-02-15）. .

URL [本文引用: 1]

[45]

QIAN

G C

， LI

Y C

， PENG

H W

， et al.

PointNeXt： Revisiting pointnet++ with improved training and scaling strategies

［J］. Advances in Neural Information Processing Systems， 2022， 35： 23192-23204.

[本文引用: 1]

PointNet： Deep learning on point sets for 3D classification and segmentation

6

2017

... 解决点云数据的非结构化问题主要有两种思路：一种是将点云数据结构化，用二维视觉任务中的常用方法对点云进行处理；另一种是为点云的非结构化数据提出专用的神经网络模块.将点云数据结构化常用的方法有点云体素化^［34-36］和多视图投影^［13-16］，但易损失大量局部细节信息，不利于点云的分割、配准等任务.在深度学习领域，作为直接处理点云数据的先驱者——PointNet^［1］，通过网络学习每个点的空间编码，采用多层感知机将所有的点聚合为全局特征，但未考虑点与点之间隐藏的几何关系，不能捕获局部上下文信息，在处理点云分割等精细任务时存在不足.为获得更加丰富的局部特征，相继出现了许多局部特征提取的神经网络模块，可分为基于邻域点特征池化的方法^［4，9］、基于图卷积的方法^{［17，38］}和基于三维卷积的方法^［12］，这些方法只考虑了邻域中的局部信息交互，忽略了邻域之间的特征交互.基于邻域点特征池化和基于图卷积的方法在特征聚合过程中均使用了最大值池化聚合特征，只有一小部分点对中心点特征有贡献，导致特征对局部几何信息描述不准确. ...

... 点云的非结构化数据形式一直是点云处理领域的难点.由于PointNet^［1］使用共享MLPs^［3］学习每个点的特征，无法获得局部结构特征.为解决此问题，相继出现通过设计算法获取邻域并聚合邻域信息、学习局部上下文信息的工作.根据是否通过欧式距离获取邻域，将相关研究划分为局部特征聚合、非局部特征聚合以及局部和全局相结合的特征聚合3种方法，如图1所示. ...

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

... The accuracy of different methods on ScanObjectNN dataset

Table 2

方法	MA/%	OA/%
PointNet^［1］	63.2	68.2
PointNet++^［2］	75.4	77.9
DGCNN^［17］	73.6	78.1
SpiderCNN^［11］	69.8	73.7
PointCNN^［10］	75.1	78.5
DRNet^［42］	78.0	80.3
GBNet^［43］	77.8	80.5
LGANet	78.1	81.5

注粗体为最优值. ...

... Comparison of mIoU by category and overall ShapeNet part

Table 3

类别	mIoU/%
类别	PointNet^［1］	PointNet++^［2］	DGCNN^［17］	SpiderCNN^［11］	PointASNL^［22］	GS-Net^［21］	PointCNN^［10］	LGANet
飞机	83.4	82.4	84.0	83.5	84.1	82.9	84.1	85.1
书包	78.7	79.0	83.4	81.0	84.7	84.3	86.5	85.1
帽子	82.5	87.7	86.7	87.2	87.9	88.6	86.0	90.1
汽车	74.9	77.3	77.8	77.5	79.7	78.4	80.8	80.0
椅子	89.6	90.3	90.6	90.7	92.2	89.7	90.6	91.6
耳机	73.0	76.8	74.7	76.8	73.7	78.3	79.7	77.6
吉他	91.5	91.0	91.2	91.1	91.0	91.7	92.3	92.0
刀	85.9	85.9	87.5	87.3	87.2	86.7	88.4	87.8
灯	80.8	83.7	82.8	83.3	84.2	81.2	85.3	85.3
电脑	95.3	95.3	95.7	95.8	95.8	95.6	96.1	96.1
摩托	65.2	71.6	66.3	70.2	74.4	72.8	77.2	73.2
杯子	93.0	94.1	94.9	93.5	95.2	94.7	95.2	95.5
手枪	81.2	81.3	81.1	82.7	81.0	93.1	84.2	81.6
火箭	57.9	58.7	63.5	59.7	63.0	62.3	64.2	59.0
滑板	72.8	76.4	74.5	75.8	76.3	81.5	80.0	77.0
桌子	80.6	82.6	82.6	82.8	83.2	83.8	83.0	83.9
整体	83.7	85.1	85.2	85.3	86.1	85.3	86.1	86.5

注粗体为最优值. ...

... Comparison of complexity of classification models

Table 7

方法	参数量/M	OA/%
PointNet^［1］	3.50	89.2
PointNet++^［2］	1.48	90.7
GS-Net^［21］	1.51	92.9
GBNet^［43］	8.39	93.8
LGANet	2.20	94.0

注粗体为最优值. ...

PointNet++： Deep hierarchical feature learning on point sets in a metric space

7

2017

... 其中，

F

表示特征聚合后点的特征，

f

表示邻域内点的特征，

Θ (f)

表示边缘函数^［17］，常见的形式有

(f_{i}^{k} - f_{i})

^［2-25］，

(f_{i}^{k} - f_{i}, f_{i})

^［17］，其中，

f_{i}

表示中心点i的特征，

f_{i}^{k}

表示中心点i邻域内第

k

个点的特征.这些特征聚合方式一定程度能描述局部几何信息，但不能充分描述深层的语义信息^［25］.如图2所示，A和B两点位于椅子不同的部位，两点的邻域分布却具有很高的相似性.因此在网络浅层，通过特征聚合方式能够描述平面的几何信息，但无法区分椅背和椅座的语义信息.受文献［26-27］启发，本文用全局信息丰富局部特征，使局部特征更好地描述深层语义信息. ...

... 对于给定的点云

P

和特征

F

，为描述局部几何信息，需将邻域点特征聚合至中心点.当前局部特征聚合的主流方法^［2-17］如图3所示，点

P_{i}

通过分组得到邻域点的特征，在特征聚合过程中只保留含有通道最大值的邻域点特征，将筛选后的特征进行最大值池化，聚合得到中心点的特征.如此，不含有通道最大值的邻域点特征都会被丢弃，造成大量信息损失.为减少信息损失，提出了LIACA模块，具体如图4所示.计算邻域内同一通道点的特征

C_{i} = {c_{i}^{1}, c_{i}^{2}, \dots, c_{i}^{k}}

，得到注意力分数

S_{i} = {s_{i}^{1}, s_{i}^{2}, \dots, s_{i}^{k}}

（其中

i

表示邻域点特征的第

i

个通道，

k

表示邻域内第

k

个点）. ...

... 全局信息主要通过对目标点云下采样提取，从而获取关键点描述物体整体的几何信息，用提取的全局信息补充局部特征，增加特征多样性，从而解决网络浅层物体不同部位特征相似性的问题.最远点采样（farthest point sampling，FPS）是点云表征学习^［2］中常用的下采样方法之一，由于其初始点的随机性和仅依靠欧式距离选取关键点，获得的关键点无法充分代表整体上下文信息.CurveNet^［25］含复杂的构造曲线算法，通过曲线算法实现下采样得到关键点，并将得到的关键点通过线间聚合和线内聚合得到全局特征，取得了很好的效果，但构造曲线算法需要消耗大量时间资源.受文献［29］启发，本文设计了动态模块学习关键点（dynamic learning key points，DLK）用其提取全局特征.DLK模块在点云物体的分类任务中展现了出色的性能，且计算效率较高. ...

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

... The accuracy of different methods on ScanObjectNN dataset

Table 2

方法	MA/%	OA/%
PointNet^［1］	63.2	68.2
PointNet++^［2］	75.4	77.9
DGCNN^［17］	73.6	78.1
SpiderCNN^［11］	69.8	73.7
PointCNN^［10］	75.1	78.5
DRNet^［42］	78.0	80.3
GBNet^［43］	77.8	80.5
LGANet	78.1	81.5

注粗体为最优值. ...

... Comparison of mIoU by category and overall ShapeNet part

Table 3

类别	mIoU/%
类别	PointNet^［1］	PointNet++^［2］	DGCNN^［17］	SpiderCNN^［11］	PointASNL^［22］	GS-Net^［21］	PointCNN^［10］	LGANet
飞机	83.4	82.4	84.0	83.5	84.1	82.9	84.1	85.1
书包	78.7	79.0	83.4	81.0	84.7	84.3	86.5	85.1
帽子	82.5	87.7	86.7	87.2	87.9	88.6	86.0	90.1
汽车	74.9	77.3	77.8	77.5	79.7	78.4	80.8	80.0
椅子	89.6	90.3	90.6	90.7	92.2	89.7	90.6	91.6
耳机	73.0	76.8	74.7	76.8	73.7	78.3	79.7	77.6
吉他	91.5	91.0	91.2	91.1	91.0	91.7	92.3	92.0
刀	85.9	85.9	87.5	87.3	87.2	86.7	88.4	87.8
灯	80.8	83.7	82.8	83.3	84.2	81.2	85.3	85.3
电脑	95.3	95.3	95.7	95.8	95.8	95.6	96.1	96.1
摩托	65.2	71.6	66.3	70.2	74.4	72.8	77.2	73.2
杯子	93.0	94.1	94.9	93.5	95.2	94.7	95.2	95.5
手枪	81.2	81.3	81.1	82.7	81.0	93.1	84.2	81.6
火箭	57.9	58.7	63.5	59.7	63.0	62.3	64.2	59.0
滑板	72.8	76.4	74.5	75.8	76.3	81.5	80.0	77.0
桌子	80.6	82.6	82.6	82.8	83.2	83.8	83.0	83.9
整体	83.7	85.1	85.2	85.3	86.1	85.3	86.1	86.5

注粗体为最优值. ...

... Comparison of complexity of classification models

Table 7

方法	参数量/M	OA/%
PointNet^［1］	3.50	89.2
PointNet++^［2］	1.48	90.7
GS-Net^［21］	1.51	92.9
GBNet^［43］	8.39	93.8
LGANet	2.20	94.0

注粗体为最优值. ...

Approximation capabilities of multilayer feedforward networks

2

1991

... 点云的非结构化数据形式一直是点云处理领域的难点.由于PointNet^［1］使用共享MLPs^［3］学习每个点的特征，无法获得局部结构特征.为解决此问题，相继出现通过设计算法获取邻域并聚合邻域信息、学习局部上下文信息的工作.根据是否通过欧式距离获取邻域，将相关研究划分为局部特征聚合、非局部特征聚合以及局部和全局相结合的特征聚合3种方法，如图1所示. ...

... PointNet++^［2］采用球查询分组、共享MLPs^［3］编码和最大值池化方法提取局部特征，并通过最远点采样进行下采样，以实现多尺度学习获取目标物体的特征，但仍存在信息损失问题，不能很好地表示局部几何结构.文献［4-9］关注局部点之间和多尺度不同层之间的关系，以改善局部特征提取效果.例如，A-CNN^［4］基于局部点到中心点的距离进行特征编码；PointWeb^［5］则考虑每对局部点，使用自适应特征调整模块改进点的特征，获得更具代表性的局部特征；DensePoint^［9］则根据多尺度不同层之间的关系，密集地学习上下文信息.这些方法从不同角度改进了对局部特征的提取，但在深度网络的浅层，物体不同部件的特征存在相似性.为此，本文提出引入全局特征的方法，以进一步丰富局部特征，并使用注意力机制将全局特征和局部特征相融合，以增大物体不同部件的类间差异，更好地描述局部几何结构. ...

A-CNN： Annularly convolutional neural networks on point clouds

4

2019

... 解决点云数据的非结构化问题主要有两种思路：一种是将点云数据结构化，用二维视觉任务中的常用方法对点云进行处理；另一种是为点云的非结构化数据提出专用的神经网络模块.将点云数据结构化常用的方法有点云体素化^［34-36］和多视图投影^［13-16］，但易损失大量局部细节信息，不利于点云的分割、配准等任务.在深度学习领域，作为直接处理点云数据的先驱者——PointNet^［1］，通过网络学习每个点的空间编码，采用多层感知机将所有的点聚合为全局特征，但未考虑点与点之间隐藏的几何关系，不能捕获局部上下文信息，在处理点云分割等精细任务时存在不足.为获得更加丰富的局部特征，相继出现了许多局部特征提取的神经网络模块，可分为基于邻域点特征池化的方法^［4，9］、基于图卷积的方法^{［17，38］}和基于三维卷积的方法^［12］，这些方法只考虑了邻域中的局部信息交互，忽略了邻域之间的特征交互.基于邻域点特征池化和基于图卷积的方法在特征聚合过程中均使用了最大值池化聚合特征，只有一小部分点对中心点特征有贡献，导致特征对局部几何信息描述不准确. ...

... PointNet++^［2］采用球查询分组、共享MLPs^［3］编码和最大值池化方法提取局部特征，并通过最远点采样进行下采样，以实现多尺度学习获取目标物体的特征，但仍存在信息损失问题，不能很好地表示局部几何结构.文献［4-9］关注局部点之间和多尺度不同层之间的关系，以改善局部特征提取效果.例如，A-CNN^［4］基于局部点到中心点的距离进行特征编码；PointWeb^［5］则考虑每对局部点，使用自适应特征调整模块改进点的特征，获得更具代表性的局部特征；DensePoint^［9］则根据多尺度不同层之间的关系，密集地学习上下文信息.这些方法从不同角度改进了对局部特征的提取，但在深度网络的浅层，物体不同部件的特征存在相似性.为此，本文提出引入全局特征的方法，以进一步丰富局部特征，并使用注意力机制将全局特征和局部特征相融合，以增大物体不同部件的类间差异，更好地描述局部几何结构. ...

... ［4］基于局部点到中心点的距离进行特征编码；PointWeb^［5］则考虑每对局部点，使用自适应特征调整模块改进点的特征，获得更具代表性的局部特征；DensePoint^［9］则根据多尺度不同层之间的关系，密集地学习上下文信息.这些方法从不同角度改进了对局部特征的提取，但在深度网络的浅层，物体不同部件的特征存在相似性.为此，本文提出引入全局特征的方法，以进一步丰富局部特征，并使用注意力机制将全局特征和局部特征相融合，以增大物体不同部件的类间差异，更好地描述局部几何结构. ...

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

Pointweb： Enhancing local neighborhood features for point cloud processing

1

2019

... PointNet++^［2］采用球查询分组、共享MLPs^［3］编码和最大值池化方法提取局部特征，并通过最远点采样进行下采样，以实现多尺度学习获取目标物体的特征，但仍存在信息损失问题，不能很好地表示局部几何结构.文献［4-9］关注局部点之间和多尺度不同层之间的关系，以改善局部特征提取效果.例如，A-CNN^［4］基于局部点到中心点的距离进行特征编码；PointWeb^［5］则考虑每对局部点，使用自适应特征调整模块改进点的特征，获得更具代表性的局部特征；DensePoint^［9］则根据多尺度不同层之间的关系，密集地学习上下文信息.这些方法从不同角度改进了对局部特征的提取，但在深度网络的浅层，物体不同部件的特征存在相似性.为此，本文提出引入全局特征的方法，以进一步丰富局部特征，并使用注意力机制将全局特征和局部特征相融合，以增大物体不同部件的类间差异，更好地描述局部几何结构. ...

Dynamic edge-conditioned filters in convolutional neural networks on graphs

0

2017

Relation-shape convolutional neural network for point cloud analysis

0

2019

Hierarchical point-edge interaction network for point cloud semantic segmentation

0

2019

Densepoint： Learning densely contextual representation for efficient point cloud processing

3

2019

... 解决点云数据的非结构化问题主要有两种思路：一种是将点云数据结构化，用二维视觉任务中的常用方法对点云进行处理；另一种是为点云的非结构化数据提出专用的神经网络模块.将点云数据结构化常用的方法有点云体素化^［34-36］和多视图投影^［13-16］，但易损失大量局部细节信息，不利于点云的分割、配准等任务.在深度学习领域，作为直接处理点云数据的先驱者——PointNet^［1］，通过网络学习每个点的空间编码，采用多层感知机将所有的点聚合为全局特征，但未考虑点与点之间隐藏的几何关系，不能捕获局部上下文信息，在处理点云分割等精细任务时存在不足.为获得更加丰富的局部特征，相继出现了许多局部特征提取的神经网络模块，可分为基于邻域点特征池化的方法^［4，9］、基于图卷积的方法^{［17，38］}和基于三维卷积的方法^［12］，这些方法只考虑了邻域中的局部信息交互，忽略了邻域之间的特征交互.基于邻域点特征池化和基于图卷积的方法在特征聚合过程中均使用了最大值池化聚合特征，只有一小部分点对中心点特征有贡献，导致特征对局部几何信息描述不准确. ...

... PointNet++^［2］采用球查询分组、共享MLPs^［3］编码和最大值池化方法提取局部特征，并通过最远点采样进行下采样，以实现多尺度学习获取目标物体的特征，但仍存在信息损失问题，不能很好地表示局部几何结构.文献［4-9］关注局部点之间和多尺度不同层之间的关系，以改善局部特征提取效果.例如，A-CNN^［4］基于局部点到中心点的距离进行特征编码；PointWeb^［5］则考虑每对局部点，使用自适应特征调整模块改进点的特征，获得更具代表性的局部特征；DensePoint^［9］则根据多尺度不同层之间的关系，密集地学习上下文信息.这些方法从不同角度改进了对局部特征的提取，但在深度网络的浅层，物体不同部件的特征存在相似性.为此，本文提出引入全局特征的方法，以进一步丰富局部特征，并使用注意力机制将全局特征和局部特征相融合，以增大物体不同部件的类间差异，更好地描述局部几何结构. ...

... ［9］则根据多尺度不同层之间的关系，密集地学习上下文信息.这些方法从不同角度改进了对局部特征的提取，但在深度网络的浅层，物体不同部件的特征存在相似性.为此，本文提出引入全局特征的方法，以进一步丰富局部特征，并使用注意力机制将全局特征和局部特征相融合，以增大物体不同部件的类间差异，更好地描述局部几何结构. ...

PointCNN： Convolution on x-transformed points

4

2018

... 另外，文献［10-12］关注于学习三维卷积提取局部特征.例如，PointCNN^［10］利用点云数据的空间局部相关性，学习

χ

变换并将其作为卷积核，但仍无法解决点云排列不变性问题.SpiderCNN^［11］将卷积定义为k 个最近邻阶跃函数和泰勒展开的乘积，在一定程度上解决了点云排列不变性问题，但学习过程需要消耗大量计算和内存资源.PAConv^［12］通过计算中心点和邻域点之间的相似性，用获得的注意力权重调整卷积核权重，从而更高效地获取局部信息. ...

... ［10］利用点云数据的空间局部相关性，学习

χ

变换并将其作为卷积核，但仍无法解决点云排列不变性问题.SpiderCNN^［11］将卷积定义为k 个最近邻阶跃函数和泰勒展开的乘积，在一定程度上解决了点云排列不变性问题，但学习过程需要消耗大量计算和内存资源.PAConv^［12］通过计算中心点和邻域点之间的相似性，用获得的注意力权重调整卷积核权重，从而更高效地获取局部信息. ...

... The accuracy of different methods on ScanObjectNN dataset

Table 2

方法	MA/%	OA/%
PointNet^［1］	63.2	68.2
PointNet++^［2］	75.4	77.9
DGCNN^［17］	73.6	78.1
SpiderCNN^［11］	69.8	73.7
PointCNN^［10］	75.1	78.5
DRNet^［42］	78.0	80.3
GBNet^［43］	77.8	80.5
LGANet	78.1	81.5

注粗体为最优值. ...

... Comparison of mIoU by category and overall ShapeNet part

Table 3

类别	mIoU/%
类别	PointNet^［1］	PointNet++^［2］	DGCNN^［17］	SpiderCNN^［11］	PointASNL^［22］	GS-Net^［21］	PointCNN^［10］	LGANet
飞机	83.4	82.4	84.0	83.5	84.1	82.9	84.1	85.1
书包	78.7	79.0	83.4	81.0	84.7	84.3	86.5	85.1
帽子	82.5	87.7	86.7	87.2	87.9	88.6	86.0	90.1
汽车	74.9	77.3	77.8	77.5	79.7	78.4	80.8	80.0
椅子	89.6	90.3	90.6	90.7	92.2	89.7	90.6	91.6
耳机	73.0	76.8	74.7	76.8	73.7	78.3	79.7	77.6
吉他	91.5	91.0	91.2	91.1	91.0	91.7	92.3	92.0
刀	85.9	85.9	87.5	87.3	87.2	86.7	88.4	87.8
灯	80.8	83.7	82.8	83.3	84.2	81.2	85.3	85.3
电脑	95.3	95.3	95.7	95.8	95.8	95.6	96.1	96.1
摩托	65.2	71.6	66.3	70.2	74.4	72.8	77.2	73.2
杯子	93.0	94.1	94.9	93.5	95.2	94.7	95.2	95.5
手枪	81.2	81.3	81.1	82.7	81.0	93.1	84.2	81.6
火箭	57.9	58.7	63.5	59.7	63.0	62.3	64.2	59.0
滑板	72.8	76.4	74.5	75.8	76.3	81.5	80.0	77.0
桌子	80.6	82.6	82.6	82.8	83.2	83.8	83.0	83.9
整体	83.7	85.1	85.2	85.3	86.1	85.3	86.1	86.5

注粗体为最优值. ...

SpiderCNN： Deep learning on point sets with parameterized convolutional filters

3

2018

... 另外，文献［10-12］关注于学习三维卷积提取局部特征.例如，PointCNN^［10］利用点云数据的空间局部相关性，学习

χ

变换并将其作为卷积核，但仍无法解决点云排列不变性问题.SpiderCNN^［11］将卷积定义为k 个最近邻阶跃函数和泰勒展开的乘积，在一定程度上解决了点云排列不变性问题，但学习过程需要消耗大量计算和内存资源.PAConv^［12］通过计算中心点和邻域点之间的相似性，用获得的注意力权重调整卷积核权重，从而更高效地获取局部信息. ...

... The accuracy of different methods on ScanObjectNN dataset

Table 2

方法	MA/%	OA/%
PointNet^［1］	63.2	68.2
PointNet++^［2］	75.4	77.9
DGCNN^［17］	73.6	78.1
SpiderCNN^［11］	69.8	73.7
PointCNN^［10］	75.1	78.5
DRNet^［42］	78.0	80.3
GBNet^［43］	77.8	80.5
LGANet	78.1	81.5

注粗体为最优值. ...

... Comparison of mIoU by category and overall ShapeNet part

Table 3

类别	mIoU/%
类别	PointNet^［1］	PointNet++^［2］	DGCNN^［17］	SpiderCNN^［11］	PointASNL^［22］	GS-Net^［21］	PointCNN^［10］	LGANet
飞机	83.4	82.4	84.0	83.5	84.1	82.9	84.1	85.1
书包	78.7	79.0	83.4	81.0	84.7	84.3	86.5	85.1
帽子	82.5	87.7	86.7	87.2	87.9	88.6	86.0	90.1
汽车	74.9	77.3	77.8	77.5	79.7	78.4	80.8	80.0
椅子	89.6	90.3	90.6	90.7	92.2	89.7	90.6	91.6
耳机	73.0	76.8	74.7	76.8	73.7	78.3	79.7	77.6
吉他	91.5	91.0	91.2	91.1	91.0	91.7	92.3	92.0
刀	85.9	85.9	87.5	87.3	87.2	86.7	88.4	87.8
灯	80.8	83.7	82.8	83.3	84.2	81.2	85.3	85.3
电脑	95.3	95.3	95.7	95.8	95.8	95.6	96.1	96.1
摩托	65.2	71.6	66.3	70.2	74.4	72.8	77.2	73.2
杯子	93.0	94.1	94.9	93.5	95.2	94.7	95.2	95.5
手枪	81.2	81.3	81.1	82.7	81.0	93.1	84.2	81.6
火箭	57.9	58.7	63.5	59.7	63.0	62.3	64.2	59.0
滑板	72.8	76.4	74.5	75.8	76.3	81.5	80.0	77.0
桌子	80.6	82.6	82.6	82.8	83.2	83.8	83.0	83.9
整体	83.7	85.1	85.2	85.3	86.1	85.3	86.1	86.5

注粗体为最优值. ...

PAConv： Position adaptive convolution with dynamic kernel assembling on point clouds

4

2021

... 解决点云数据的非结构化问题主要有两种思路：一种是将点云数据结构化，用二维视觉任务中的常用方法对点云进行处理；另一种是为点云的非结构化数据提出专用的神经网络模块.将点云数据结构化常用的方法有点云体素化^［34-36］和多视图投影^［13-16］，但易损失大量局部细节信息，不利于点云的分割、配准等任务.在深度学习领域，作为直接处理点云数据的先驱者——PointNet^［1］，通过网络学习每个点的空间编码，采用多层感知机将所有的点聚合为全局特征，但未考虑点与点之间隐藏的几何关系，不能捕获局部上下文信息，在处理点云分割等精细任务时存在不足.为获得更加丰富的局部特征，相继出现了许多局部特征提取的神经网络模块，可分为基于邻域点特征池化的方法^［4，9］、基于图卷积的方法^{［17，38］}和基于三维卷积的方法^［12］，这些方法只考虑了邻域中的局部信息交互，忽略了邻域之间的特征交互.基于邻域点特征池化和基于图卷积的方法在特征聚合过程中均使用了最大值池化聚合特征，只有一小部分点对中心点特征有贡献，导致特征对局部几何信息描述不准确. ...

... 另外，文献［10-12］关注于学习三维卷积提取局部特征.例如，PointCNN^［10］利用点云数据的空间局部相关性，学习

χ

变换并将其作为卷积核，但仍无法解决点云排列不变性问题.SpiderCNN^［11］将卷积定义为k 个最近邻阶跃函数和泰勒展开的乘积，在一定程度上解决了点云排列不变性问题，但学习过程需要消耗大量计算和内存资源.PAConv^［12］通过计算中心点和邻域点之间的相似性，用获得的注意力权重调整卷积核权重，从而更高效地获取局部信息. ...

... ［12］通过计算中心点和邻域点之间的相似性，用获得的注意力权重调整卷积核权重，从而更高效地获取局部信息. ...

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

Multi-view convolutional neural networks for 3D shape recognition

2

2015

... 解决点云数据的非结构化问题主要有两种思路：一种是将点云数据结构化，用二维视觉任务中的常用方法对点云进行处理；另一种是为点云的非结构化数据提出专用的神经网络模块.将点云数据结构化常用的方法有点云体素化^［34-36］和多视图投影^［13-16］，但易损失大量局部细节信息，不利于点云的分割、配准等任务.在深度学习领域，作为直接处理点云数据的先驱者——PointNet^［1］，通过网络学习每个点的空间编码，采用多层感知机将所有的点聚合为全局特征，但未考虑点与点之间隐藏的几何关系，不能捕获局部上下文信息，在处理点云分割等精细任务时存在不足.为获得更加丰富的局部特征，相继出现了许多局部特征提取的神经网络模块，可分为基于邻域点特征池化的方法^［4，9］、基于图卷积的方法^{［17，38］}和基于三维卷积的方法^［12］，这些方法只考虑了邻域中的局部信息交互，忽略了邻域之间的特征交互.基于邻域点特征池化和基于图卷积的方法在特征聚合过程中均使用了最大值池化聚合特征，只有一小部分点对中心点特征有贡献，导致特征对局部几何信息描述不准确. ...

... 经典的非局部特征聚合基于多视图的方法^［13-16］，即将三维物体投影到不同视图，使用二维卷积提取视图特征，并将不同视图的特征聚合为全局特征，但忽略了三维物体的几何特征，直接对其进行视图投影会丢失大量信息.以DGCNN^［17］为代表的动态图卷积，在特征空间对点进行分组，构建图聚合特征.在基于Transformer^［20］的方法^{［18-19，24］}中，Transformer的核心自注意力模块本质上是对集合的处理，点云是一个无序的点集，使得Transformer非常适合处理点云的无序性和排列不变性等问题. ...

Volumetric and multi-view CNNs for object classification on 3D data

0

2016

Dominant set clustering and pooling for multi-view 3D object recognition

0

2019-06-04

Learning multi-view representation with LSTM for 3D shape recognition and retrieval

2

2018

... 解决点云数据的非结构化问题主要有两种思路：一种是将点云数据结构化，用二维视觉任务中的常用方法对点云进行处理；另一种是为点云的非结构化数据提出专用的神经网络模块.将点云数据结构化常用的方法有点云体素化^［34-36］和多视图投影^［13-16］，但易损失大量局部细节信息，不利于点云的分割、配准等任务.在深度学习领域，作为直接处理点云数据的先驱者——PointNet^［1］，通过网络学习每个点的空间编码，采用多层感知机将所有的点聚合为全局特征，但未考虑点与点之间隐藏的几何关系，不能捕获局部上下文信息，在处理点云分割等精细任务时存在不足.为获得更加丰富的局部特征，相继出现了许多局部特征提取的神经网络模块，可分为基于邻域点特征池化的方法^［4，9］、基于图卷积的方法^{［17，38］}和基于三维卷积的方法^［12］，这些方法只考虑了邻域中的局部信息交互，忽略了邻域之间的特征交互.基于邻域点特征池化和基于图卷积的方法在特征聚合过程中均使用了最大值池化聚合特征，只有一小部分点对中心点特征有贡献，导致特征对局部几何信息描述不准确. ...

... 经典的非局部特征聚合基于多视图的方法^［13-16］，即将三维物体投影到不同视图，使用二维卷积提取视图特征，并将不同视图的特征聚合为全局特征，但忽略了三维物体的几何特征，直接对其进行视图投影会丢失大量信息.以DGCNN^［17］为代表的动态图卷积，在特征空间对点进行分组，构建图聚合特征.在基于Transformer^［20］的方法^{［18-19，24］}中，Transformer的核心自注意力模块本质上是对集合的处理，点云是一个无序的点集，使得Transformer非常适合处理点云的无序性和排列不变性等问题. ...

Dynamic graph cnn for learning on point clouds

8

2019

... 解决点云数据的非结构化问题主要有两种思路：一种是将点云数据结构化，用二维视觉任务中的常用方法对点云进行处理；另一种是为点云的非结构化数据提出专用的神经网络模块.将点云数据结构化常用的方法有点云体素化^［34-36］和多视图投影^［13-16］，但易损失大量局部细节信息，不利于点云的分割、配准等任务.在深度学习领域，作为直接处理点云数据的先驱者——PointNet^［1］，通过网络学习每个点的空间编码，采用多层感知机将所有的点聚合为全局特征，但未考虑点与点之间隐藏的几何关系，不能捕获局部上下文信息，在处理点云分割等精细任务时存在不足.为获得更加丰富的局部特征，相继出现了许多局部特征提取的神经网络模块，可分为基于邻域点特征池化的方法^［4，9］、基于图卷积的方法^{［17，38］}和基于三维卷积的方法^［12］，这些方法只考虑了邻域中的局部信息交互，忽略了邻域之间的特征交互.基于邻域点特征池化和基于图卷积的方法在特征聚合过程中均使用了最大值池化聚合特征，只有一小部分点对中心点特征有贡献，导致特征对局部几何信息描述不准确. ...

... 经典的非局部特征聚合基于多视图的方法^［13-16］，即将三维物体投影到不同视图，使用二维卷积提取视图特征，并将不同视图的特征聚合为全局特征，但忽略了三维物体的几何特征，直接对其进行视图投影会丢失大量信息.以DGCNN^［17］为代表的动态图卷积，在特征空间对点进行分组，构建图聚合特征.在基于Transformer^［20］的方法^{［18-19，24］}中，Transformer的核心自注意力模块本质上是对集合的处理，点云是一个无序的点集，使得Transformer非常适合处理点云的无序性和排列不变性等问题. ...

... 其中，

F

表示特征聚合后点的特征，

f

表示邻域内点的特征，

Θ (f)

表示边缘函数^［17］，常见的形式有

(f_{i}^{k} - f_{i})

^［2-25］，

(f_{i}^{k} - f_{i}, f_{i})

^［17］，其中，

f_{i}

表示中心点i的特征，

f_{i}^{k}

表示中心点i邻域内第

k

个点的特征.这些特征聚合方式一定程度能描述局部几何信息，但不能充分描述深层的语义信息^［25］.如图2所示，A和B两点位于椅子不同的部位，两点的邻域分布却具有很高的相似性.因此在网络浅层，通过特征聚合方式能够描述平面的几何信息，但无法区分椅背和椅座的语义信息.受文献［26-27］启发，本文用全局信息丰富局部特征，使局部特征更好地描述深层语义信息. ...

... ［17］，其中，

f_{i}

表示中心点i的特征，

f_{i}^{k}

表示中心点i邻域内第

k

个点的特征.这些特征聚合方式一定程度能描述局部几何信息，但不能充分描述深层的语义信息^［25］.如图2所示，A和B两点位于椅子不同的部位，两点的邻域分布却具有很高的相似性.因此在网络浅层，通过特征聚合方式能够描述平面的几何信息，但无法区分椅背和椅座的语义信息.受文献［26-27］启发，本文用全局信息丰富局部特征，使局部特征更好地描述深层语义信息. ...

... 对于给定的点云

P

和特征

F

，为描述局部几何信息，需将邻域点特征聚合至中心点.当前局部特征聚合的主流方法^［2-17］如图3所示，点

P_{i}

通过分组得到邻域点的特征，在特征聚合过程中只保留含有通道最大值的邻域点特征，将筛选后的特征进行最大值池化，聚合得到中心点的特征.如此，不含有通道最大值的邻域点特征都会被丢弃，造成大量信息损失.为减少信息损失，提出了LIACA模块，具体如图4所示.计算邻域内同一通道点的特征

C_{i} = {c_{i}^{1}, c_{i}^{2}, \dots, c_{i}^{k}}

，得到注意力分数

S_{i} = {s_{i}^{1}, s_{i}^{2}, \dots, s_{i}^{k}}

（其中

i

表示邻域点特征的第

i

个通道，

k

表示邻域内第

k

个点）. ...

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

... The accuracy of different methods on ScanObjectNN dataset

Table 2

方法	MA/%	OA/%
PointNet^［1］	63.2	68.2
PointNet++^［2］	75.4	77.9
DGCNN^［17］	73.6	78.1
SpiderCNN^［11］	69.8	73.7
PointCNN^［10］	75.1	78.5
DRNet^［42］	78.0	80.3
GBNet^［43］	77.8	80.5
LGANet	78.1	81.5

注粗体为最优值. ...

... Comparison of mIoU by category and overall ShapeNet part

Table 3

类别	mIoU/%
类别	PointNet^［1］	PointNet++^［2］	DGCNN^［17］	SpiderCNN^［11］	PointASNL^［22］	GS-Net^［21］	PointCNN^［10］	LGANet
飞机	83.4	82.4	84.0	83.5	84.1	82.9	84.1	85.1
书包	78.7	79.0	83.4	81.0	84.7	84.3	86.5	85.1
帽子	82.5	87.7	86.7	87.2	87.9	88.6	86.0	90.1
汽车	74.9	77.3	77.8	77.5	79.7	78.4	80.8	80.0
椅子	89.6	90.3	90.6	90.7	92.2	89.7	90.6	91.6
耳机	73.0	76.8	74.7	76.8	73.7	78.3	79.7	77.6
吉他	91.5	91.0	91.2	91.1	91.0	91.7	92.3	92.0
刀	85.9	85.9	87.5	87.3	87.2	86.7	88.4	87.8
灯	80.8	83.7	82.8	83.3	84.2	81.2	85.3	85.3
电脑	95.3	95.3	95.7	95.8	95.8	95.6	96.1	96.1
摩托	65.2	71.6	66.3	70.2	74.4	72.8	77.2	73.2
杯子	93.0	94.1	94.9	93.5	95.2	94.7	95.2	95.5
手枪	81.2	81.3	81.1	82.7	81.0	93.1	84.2	81.6
火箭	57.9	58.7	63.5	59.7	63.0	62.3	64.2	59.0
滑板	72.8	76.4	74.5	75.8	76.3	81.5	80.0	77.0
桌子	80.6	82.6	82.6	82.8	83.2	83.8	83.0	83.9
整体	83.7	85.1	85.2	85.3	86.1	85.3	86.1	86.5

注粗体为最优值. ...

Point transformer

2

2021

... 经典的非局部特征聚合基于多视图的方法^［13-16］，即将三维物体投影到不同视图，使用二维卷积提取视图特征，并将不同视图的特征聚合为全局特征，但忽略了三维物体的几何特征，直接对其进行视图投影会丢失大量信息.以DGCNN^［17］为代表的动态图卷积，在特征空间对点进行分组，构建图聚合特征.在基于Transformer^［20］的方法^{［18-19，24］}中，Transformer的核心自注意力模块本质上是对集合的处理，点云是一个无序的点集，使得Transformer非常适合处理点云的无序性和排列不变性等问题. ...

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

PCT： Point cloud transformer

1

2021

... 经典的非局部特征聚合基于多视图的方法^［13-16］，即将三维物体投影到不同视图，使用二维卷积提取视图特征，并将不同视图的特征聚合为全局特征，但忽略了三维物体的几何特征，直接对其进行视图投影会丢失大量信息.以DGCNN^［17］为代表的动态图卷积，在特征空间对点进行分组，构建图聚合特征.在基于Transformer^［20］的方法^{［18-19，24］}中，Transformer的核心自注意力模块本质上是对集合的处理，点云是一个无序的点集，使得Transformer非常适合处理点云的无序性和排列不变性等问题. ...

Attention is all you need

1

2017

... 经典的非局部特征聚合基于多视图的方法^［13-16］，即将三维物体投影到不同视图，使用二维卷积提取视图特征，并将不同视图的特征聚合为全局特征，但忽略了三维物体的几何特征，直接对其进行视图投影会丢失大量信息.以DGCNN^［17］为代表的动态图卷积，在特征空间对点进行分组，构建图聚合特征.在基于Transformer^［20］的方法^{［18-19，24］}中，Transformer的核心自注意力模块本质上是对集合的处理，点云是一个无序的点集，使得Transformer非常适合处理点云的无序性和排列不变性等问题. ...

Geometry sharing network for 3D point cloud classification and segmentation

3

2020

... GS-Net^［21］采用通过欧氏距离分组和在特征空间通过在全局范围内寻找与中心点特征相似的点分组2种分组算法，丰富了局部特征，尽管能在一定程度上提高局部特征的丰富度，但仍未解决网络浅层处于物体不同部位的点具有特征相似性的问题.为克服此问题，PointASNL^［22］通过自适应采样获得关键点，并将其提取为全局特征以丰富局部特征.GDANet^［23］使用谱域滤波将物体分为尖锐部分和平滑部分，获得全局上下文信息，并通过构图学习局部上下文信息.CurveNet^［25］通过构造曲线描述全局特征，通过注意力机制融合局部和全局信息.然而，采用自适应采样的方法^［22］无法充分表示全局信息，而GDANet^［23］和CurveNet^［25］需要通过复杂计算获得全局信息，耗费的计算资源巨大.为此，本文提出一种动态学习关键点的方法，能兼顾效率和精度获取全局特征. ...

... Comparison of mIoU by category and overall ShapeNet part

Table 3

类别	mIoU/%
类别	PointNet^［1］	PointNet++^［2］	DGCNN^［17］	SpiderCNN^［11］	PointASNL^［22］	GS-Net^［21］	PointCNN^［10］	LGANet
飞机	83.4	82.4	84.0	83.5	84.1	82.9	84.1	85.1
书包	78.7	79.0	83.4	81.0	84.7	84.3	86.5	85.1
帽子	82.5	87.7	86.7	87.2	87.9	88.6	86.0	90.1
汽车	74.9	77.3	77.8	77.5	79.7	78.4	80.8	80.0
椅子	89.6	90.3	90.6	90.7	92.2	89.7	90.6	91.6
耳机	73.0	76.8	74.7	76.8	73.7	78.3	79.7	77.6
吉他	91.5	91.0	91.2	91.1	91.0	91.7	92.3	92.0
刀	85.9	85.9	87.5	87.3	87.2	86.7	88.4	87.8
灯	80.8	83.7	82.8	83.3	84.2	81.2	85.3	85.3
电脑	95.3	95.3	95.7	95.8	95.8	95.6	96.1	96.1
摩托	65.2	71.6	66.3	70.2	74.4	72.8	77.2	73.2
杯子	93.0	94.1	94.9	93.5	95.2	94.7	95.2	95.5
手枪	81.2	81.3	81.1	82.7	81.0	93.1	84.2	81.6
火箭	57.9	58.7	63.5	59.7	63.0	62.3	64.2	59.0
滑板	72.8	76.4	74.5	75.8	76.3	81.5	80.0	77.0
桌子	80.6	82.6	82.6	82.8	83.2	83.8	83.0	83.9
整体	83.7	85.1	85.2	85.3	86.1	85.3	86.1	86.5

注粗体为最优值. ...

... Comparison of complexity of classification models

Table 7

方法	参数量/M	OA/%
PointNet^［1］	3.50	89.2
PointNet++^［2］	1.48	90.7
GS-Net^［21］	1.51	92.9
GBNet^［43］	8.39	93.8
LGANet	2.20	94.0

注粗体为最优值. ...

PointASNL： Robust point clouds processing using nonlocal neural networks with adaptive sampling

4

2020

... GS-Net^［21］采用通过欧氏距离分组和在特征空间通过在全局范围内寻找与中心点特征相似的点分组2种分组算法，丰富了局部特征，尽管能在一定程度上提高局部特征的丰富度，但仍未解决网络浅层处于物体不同部位的点具有特征相似性的问题.为克服此问题，PointASNL^［22］通过自适应采样获得关键点，并将其提取为全局特征以丰富局部特征.GDANet^［23］使用谱域滤波将物体分为尖锐部分和平滑部分，获得全局上下文信息，并通过构图学习局部上下文信息.CurveNet^［25］通过构造曲线描述全局特征，通过注意力机制融合局部和全局信息.然而，采用自适应采样的方法^［22］无法充分表示全局信息，而GDANet^［23］和CurveNet^［25］需要通过复杂计算获得全局信息，耗费的计算资源巨大.为此，本文提出一种动态学习关键点的方法，能兼顾效率和精度获取全局特征. ...

... ［22］无法充分表示全局信息，而GDANet^［23］和CurveNet^［25］需要通过复杂计算获得全局信息，耗费的计算资源巨大.为此，本文提出一种动态学习关键点的方法，能兼顾效率和精度获取全局特征. ...

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

... Comparison of mIoU by category and overall ShapeNet part

Table 3

类别	mIoU/%
类别	PointNet^［1］	PointNet++^［2］	DGCNN^［17］	SpiderCNN^［11］	PointASNL^［22］	GS-Net^［21］	PointCNN^［10］	LGANet
飞机	83.4	82.4	84.0	83.5	84.1	82.9	84.1	85.1
书包	78.7	79.0	83.4	81.0	84.7	84.3	86.5	85.1
帽子	82.5	87.7	86.7	87.2	87.9	88.6	86.0	90.1
汽车	74.9	77.3	77.8	77.5	79.7	78.4	80.8	80.0
椅子	89.6	90.3	90.6	90.7	92.2	89.7	90.6	91.6
耳机	73.0	76.8	74.7	76.8	73.7	78.3	79.7	77.6
吉他	91.5	91.0	91.2	91.1	91.0	91.7	92.3	92.0
刀	85.9	85.9	87.5	87.3	87.2	86.7	88.4	87.8
灯	80.8	83.7	82.8	83.3	84.2	81.2	85.3	85.3
电脑	95.3	95.3	95.7	95.8	95.8	95.6	96.1	96.1
摩托	65.2	71.6	66.3	70.2	74.4	72.8	77.2	73.2
杯子	93.0	94.1	94.9	93.5	95.2	94.7	95.2	95.5
手枪	81.2	81.3	81.1	82.7	81.0	93.1	84.2	81.6
火箭	57.9	58.7	63.5	59.7	63.0	62.3	64.2	59.0
滑板	72.8	76.4	74.5	75.8	76.3	81.5	80.0	77.0
桌子	80.6	82.6	82.6	82.8	83.2	83.8	83.0	83.9
整体	83.7	85.1	85.2	85.3	86.1	85.3	86.1	86.5

注粗体为最优值. ...

Learning geometry-disentangled representation for complementary understanding of 3D object point cloud

3

2021

... GS-Net^［21］采用通过欧氏距离分组和在特征空间通过在全局范围内寻找与中心点特征相似的点分组2种分组算法，丰富了局部特征，尽管能在一定程度上提高局部特征的丰富度，但仍未解决网络浅层处于物体不同部位的点具有特征相似性的问题.为克服此问题，PointASNL^［22］通过自适应采样获得关键点，并将其提取为全局特征以丰富局部特征.GDANet^［23］使用谱域滤波将物体分为尖锐部分和平滑部分，获得全局上下文信息，并通过构图学习局部上下文信息.CurveNet^［25］通过构造曲线描述全局特征，通过注意力机制融合局部和全局信息.然而，采用自适应采样的方法^［22］无法充分表示全局信息，而GDANet^［23］和CurveNet^［25］需要通过复杂计算获得全局信息，耗费的计算资源巨大.为此，本文提出一种动态学习关键点的方法，能兼顾效率和精度获取全局特征. ...

... ［23］和CurveNet^［25］需要通过复杂计算获得全局信息，耗费的计算资源巨大.为此，本文提出一种动态学习关键点的方法，能兼顾效率和精度获取全局特征. ...

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

Modeling point clouds with self-attention and gumbel subset sampling

1

2019

... 经典的非局部特征聚合基于多视图的方法^［13-16］，即将三维物体投影到不同视图，使用二维卷积提取视图特征，并将不同视图的特征聚合为全局特征，但忽略了三维物体的几何特征，直接对其进行视图投影会丢失大量信息.以DGCNN^［17］为代表的动态图卷积，在特征空间对点进行分组，构建图聚合特征.在基于Transformer^［20］的方法^{［18-19，24］}中，Transformer的核心自注意力模块本质上是对集合的处理，点云是一个无序的点集，使得Transformer非常适合处理点云的无序性和排列不变性等问题. ...

Walk in the cloud： Learning curves for point clouds shape analysis

6

2021

... GS-Net^［21］采用通过欧氏距离分组和在特征空间通过在全局范围内寻找与中心点特征相似的点分组2种分组算法，丰富了局部特征，尽管能在一定程度上提高局部特征的丰富度，但仍未解决网络浅层处于物体不同部位的点具有特征相似性的问题.为克服此问题，PointASNL^［22］通过自适应采样获得关键点，并将其提取为全局特征以丰富局部特征.GDANet^［23］使用谱域滤波将物体分为尖锐部分和平滑部分，获得全局上下文信息，并通过构图学习局部上下文信息.CurveNet^［25］通过构造曲线描述全局特征，通过注意力机制融合局部和全局信息.然而，采用自适应采样的方法^［22］无法充分表示全局信息，而GDANet^［23］和CurveNet^［25］需要通过复杂计算获得全局信息，耗费的计算资源巨大.为此，本文提出一种动态学习关键点的方法，能兼顾效率和精度获取全局特征. ...

... ［25］需要通过复杂计算获得全局信息，耗费的计算资源巨大.为此，本文提出一种动态学习关键点的方法，能兼顾效率和精度获取全局特征. ...

... 其中，

F

表示特征聚合后点的特征，

f

表示邻域内点的特征，

Θ (f)

表示边缘函数^［17］，常见的形式有

(f_{i}^{k} - f_{i})

^［2-25］，

(f_{i}^{k} - f_{i}, f_{i})

^［17］，其中，

f_{i}

表示中心点i的特征，

f_{i}^{k}

表示中心点i邻域内第

k

个点的特征.这些特征聚合方式一定程度能描述局部几何信息，但不能充分描述深层的语义信息^［25］.如图2所示，A和B两点位于椅子不同的部位，两点的邻域分布却具有很高的相似性.因此在网络浅层，通过特征聚合方式能够描述平面的几何信息，但无法区分椅背和椅座的语义信息.受文献［26-27］启发，本文用全局信息丰富局部特征，使局部特征更好地描述深层语义信息. ...

... ［25］.如图2所示，A和B两点位于椅子不同的部位，两点的邻域分布却具有很高的相似性.因此在网络浅层，通过特征聚合方式能够描述平面的几何信息，但无法区分椅背和椅座的语义信息.受文献［26-27］启发，本文用全局信息丰富局部特征，使局部特征更好地描述深层语义信息. ...

... 全局信息主要通过对目标点云下采样提取，从而获取关键点描述物体整体的几何信息，用提取的全局信息补充局部特征，增加特征多样性，从而解决网络浅层物体不同部位特征相似性的问题.最远点采样（farthest point sampling，FPS）是点云表征学习^［2］中常用的下采样方法之一，由于其初始点的随机性和仅依靠欧式距离选取关键点，获得的关键点无法充分代表整体上下文信息.CurveNet^［25］含复杂的构造曲线算法，通过曲线算法实现下采样得到关键点，并将得到的关键点通过线间聚合和线内聚合得到全局特征，取得了很好的效果，但构造曲线算法需要消耗大量时间资源.受文献［29］启发，本文设计了动态模块学习关键点（dynamic learning key points，DLK）用其提取全局特征.DLK模块在点云物体的分类任务中展现了出色的性能，且计算效率较高. ...

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

SCF-Net： Learning spatial contextual features for large-scale point cloud segmentation

2

2021

... 其中，

F

表示特征聚合后点的特征，

f

表示邻域内点的特征，

Θ (f)

表示边缘函数^［17］，常见的形式有

(f_{i}^{k} - f_{i})

^［2-25］，

(f_{i}^{k} - f_{i}, f_{i})

^［17］，其中，

f_{i}

表示中心点i的特征，

f_{i}^{k}

表示中心点i邻域内第

k

个点的特征.这些特征聚合方式一定程度能描述局部几何信息，但不能充分描述深层的语义信息^［25］.如图2所示，A和B两点位于椅子不同的部位，两点的邻域分布却具有很高的相似性.因此在网络浅层，通过特征聚合方式能够描述平面的几何信息，但无法区分椅背和椅座的语义信息.受文献［26-27］启发，本文用全局信息丰富局部特征，使局部特征更好地描述深层语义信息. ...

... 用LIACA模块、DLK模块和SAFA模块搭建的局部和全局注意力（local and global attention，LGA）模块见图6.通过LIACA模块学习局部上下文信息，利用DLK模块提取关键点表示全局信息，并用SAFA模块将局部信息和全局信息融合形成局部特征.受文献［26］启发，为扩大点的感受野，对每层LGA模块进行2次局部特征聚合.另外，在LGA模块中引入瓶颈结构^［30］，以提高模型的训练和推理速度以及模型的泛化能力和鲁棒性.本文通过堆叠4个LGA模块形成LGANet（图7），在分类任务中，前2个LGA模块使用了LIACA模块、DLK模块和SAFA模块（如图6虚线框所示），后2个LGA模块仅使用图卷积进行特征聚合.在分割任务中，将LGA模块嵌入标准编码器-解码器架构，搭建LGANet. ...

RandLA-Net： Efficient semantic segmentation of large-scale point clouds

1

2020

... 其中，

F

表示特征聚合后点的特征，

f

表示邻域内点的特征，

Θ (f)

表示边缘函数^［17］，常见的形式有

(f_{i}^{k} - f_{i})

^［2-25］，

(f_{i}^{k} - f_{i}, f_{i})

^［17］，其中，

f_{i}

表示中心点i的特征，

f_{i}^{k}

表示中心点i邻域内第

k

个点的特征.这些特征聚合方式一定程度能描述局部几何信息，但不能充分描述深层的语义信息^［25］.如图2所示，A和B两点位于椅子不同的部位，两点的邻域分布却具有很高的相似性.因此在网络浅层，通过特征聚合方式能够描述平面的几何信息，但无法区分椅背和椅座的语义信息.受文献［26-27］启发，本文用全局信息丰富局部特征，使局部特征更好地描述深层语义信息. ...

Why discard if you can recycle？ A recycling max pooling module for 3D point cloud analysis

1

2022

... 当前大多数三维点云模型均用最大值池化解决置换不变性问题，但在此过程中只有一小部分点参与特征聚合，大部分点的信息都会被遗弃^［28］.为减少信息损失，提出了基于通道自注意力的局部信息聚合（local information aggregation based on channel self-attention，LIACA）模块. ...

Graph U-nets

1

2019

... 全局信息主要通过对目标点云下采样提取，从而获取关键点描述物体整体的几何信息，用提取的全局信息补充局部特征，增加特征多样性，从而解决网络浅层物体不同部位特征相似性的问题.最远点采样（farthest point sampling，FPS）是点云表征学习^［2］中常用的下采样方法之一，由于其初始点的随机性和仅依靠欧式距离选取关键点，获得的关键点无法充分代表整体上下文信息.CurveNet^［25］含复杂的构造曲线算法，通过曲线算法实现下采样得到关键点，并将得到的关键点通过线间聚合和线内聚合得到全局特征，取得了很好的效果，但构造曲线算法需要消耗大量时间资源.受文献［29］启发，本文设计了动态模块学习关键点（dynamic learning key points，DLK）用其提取全局特征.DLK模块在点云物体的分类任务中展现了出色的性能，且计算效率较高. ...

Going deeper with convolutions

1

2015

... 用LIACA模块、DLK模块和SAFA模块搭建的局部和全局注意力（local and global attention，LGA）模块见图6.通过LIACA模块学习局部上下文信息，利用DLK模块提取关键点表示全局信息，并用SAFA模块将局部信息和全局信息融合形成局部特征.受文献［26］启发，为扩大点的感受野，对每层LGA模块进行2次局部特征聚合.另外，在LGA模块中引入瓶颈结构^［30］，以提高模型的训练和推理速度以及模型的泛化能力和鲁棒性.本文通过堆叠4个LGA模块形成LGANet（图7），在分类任务中，前2个LGA模块使用了LIACA模块、DLK模块和SAFA模块（如图6虚线框所示），后2个LGA模块仅使用图卷积进行特征聚合.在分割任务中，将LGA模块嵌入标准编码器-解码器架构，搭建LGANet. ...

PointrCNN： 3D object proposal generation and detection from point cloud

1

2019

... 点云数据是由三维传感器、激光雷达等设备扫描得到的一种三维空间数据的表现形式，由大量分布在空间的散乱点组成，包括每个点在空间的坐标信息.点云是对现实世界物体的数字化采集，能高精度和高密度表现物体的形状信息.这些数据特性使其在自动驾驶^［31］、位置识别^［33］和机器人视觉^［32］等领域有广泛应用.然而点云数据是不规则的和无序的，没有固定的拓扑结构，使得在二维视觉任务中常用的卷积等方法难以直接应用于点云数据.因此，针对点云数据分析设计有效的特征聚合方法以及信息传递方法仍具有挑战性. ...

Voting for voting in online point cloud object detection

1

2015

... 点云数据是由三维传感器、激光雷达等设备扫描得到的一种三维空间数据的表现形式，由大量分布在空间的散乱点组成，包括每个点在空间的坐标信息.点云是对现实世界物体的数字化采集，能高精度和高密度表现物体的形状信息.这些数据特性使其在自动驾驶^［31］、位置识别^［33］和机器人视觉^［32］等领域有广泛应用.然而点云数据是不规则的和无序的，没有固定的拓扑结构，使得在二维视觉任务中常用的卷积等方法难以直接应用于点云数据.因此，针对点云数据分析设计有效的特征聚合方法以及信息传递方法仍具有挑战性. ...

LPD-Net： 3D point cloud learning for large-scale place recognition and environment analysis

1

2019

... 点云数据是由三维传感器、激光雷达等设备扫描得到的一种三维空间数据的表现形式，由大量分布在空间的散乱点组成，包括每个点在空间的坐标信息.点云是对现实世界物体的数字化采集，能高精度和高密度表现物体的形状信息.这些数据特性使其在自动驾驶^［31］、位置识别^［33］和机器人视觉^［32］等领域有广泛应用.然而点云数据是不规则的和无序的，没有固定的拓扑结构，使得在二维视觉任务中常用的卷积等方法难以直接应用于点云数据.因此，针对点云数据分析设计有效的特征聚合方法以及信息传递方法仍具有挑战性. ...

VoxNet： A 3D convolutional neural network for real-time object recognition

1

2015

... 解决点云数据的非结构化问题主要有两种思路：一种是将点云数据结构化，用二维视觉任务中的常用方法对点云进行处理；另一种是为点云的非结构化数据提出专用的神经网络模块.将点云数据结构化常用的方法有点云体素化^［34-36］和多视图投影^［13-16］，但易损失大量局部细节信息，不利于点云的分割、配准等任务.在深度学习领域，作为直接处理点云数据的先驱者——PointNet^［1］，通过网络学习每个点的空间编码，采用多层感知机将所有的点聚合为全局特征，但未考虑点与点之间隐藏的几何关系，不能捕获局部上下文信息，在处理点云分割等精细任务时存在不足.为获得更加丰富的局部特征，相继出现了许多局部特征提取的神经网络模块，可分为基于邻域点特征池化的方法^［4，9］、基于图卷积的方法^{［17，38］}和基于三维卷积的方法^［12］，这些方法只考虑了邻域中的局部信息交互，忽略了邻域之间的特征交互.基于邻域点特征池化和基于图卷积的方法在特征聚合过程中均使用了最大值池化聚合特征，只有一小部分点对中心点特征有贡献，导致特征对局部几何信息描述不准确. ...

3D ShapeNets： A deep representation for volumetric shapes

0

2015

OctNet： Learning deep 3D representations at high resolutions

1

2017

... 解决点云数据的非结构化问题主要有两种思路：一种是将点云数据结构化，用二维视觉任务中的常用方法对点云进行处理；另一种是为点云的非结构化数据提出专用的神经网络模块.将点云数据结构化常用的方法有点云体素化^［34-36］和多视图投影^［13-16］，但易损失大量局部细节信息，不利于点云的分割、配准等任务.在深度学习领域，作为直接处理点云数据的先驱者——PointNet^［1］，通过网络学习每个点的空间编码，采用多层感知机将所有的点聚合为全局特征，但未考虑点与点之间隐藏的几何关系，不能捕获局部上下文信息，在处理点云分割等精细任务时存在不足.为获得更加丰富的局部特征，相继出现了许多局部特征提取的神经网络模块，可分为基于邻域点特征池化的方法^［4，9］、基于图卷积的方法^{［17，38］}和基于三维卷积的方法^［12］，这些方法只考虑了邻域中的局部信息交互，忽略了邻域之间的特征交互.基于邻域点特征池化和基于图卷积的方法在特征聚合过程中均使用了最大值池化聚合特征，只有一小部分点对中心点特征有贡献，导致特征对局部几何信息描述不准确. ...

Mining point cloud local structures by kernel correlation and graph pooling

0

2018

Dynamic points agglomeration for hierarchical point sets learning

1

2019

... 解决点云数据的非结构化问题主要有两种思路：一种是将点云数据结构化，用二维视觉任务中的常用方法对点云进行处理；另一种是为点云的非结构化数据提出专用的神经网络模块.将点云数据结构化常用的方法有点云体素化^［34-36］和多视图投影^［13-16］，但易损失大量局部细节信息，不利于点云的分割、配准等任务.在深度学习领域，作为直接处理点云数据的先驱者——PointNet^［1］，通过网络学习每个点的空间编码，采用多层感知机将所有的点聚合为全局特征，但未考虑点与点之间隐藏的几何关系，不能捕获局部上下文信息，在处理点云分割等精细任务时存在不足.为获得更加丰富的局部特征，相继出现了许多局部特征提取的神经网络模块，可分为基于邻域点特征池化的方法^［4，9］、基于图卷积的方法^{［17，38］}和基于三维卷积的方法^［12］，这些方法只考虑了邻域中的局部信息交互，忽略了邻域之间的特征交互.基于邻域点特征池化和基于图卷积的方法在特征聚合过程中均使用了最大值池化聚合特征，只有一小部分点对中心点特征有贡献，导致特征对局部几何信息描述不准确. ...

3D ShapeNets： A deep representation for volumetric shapes

1

2015

... 在点云分类实验中使用ModelNet40数据集^［39］和 ScanObjectNN数据集^［40］，在点云部件分割实验中使用ShapeNetPart数据集.ModelNet40数据集由人工合成，是点云分析广泛使用的基准测试数据集之一，包含40个类别，共有12 311个由CAD生成的对象，其中9 843个用于训练，其余2 468个用于测试.ScanObjectNN是最近发布的点云基准测试数据集，包含15个类别，共15 000个对象，在现实世界有2 902个唯一对象实例，由于存在背景，遮挡等，是一个具有挑战性的点云数据集.ShapeNetPart数据集^［41］用于3D形状分割测试，包含16个不同类别的17 000个对象，每个对象被分为2~6个部分. ...

Revisiting point cloud classification： A new benchmark dataset and classification model on real-world data

1

2019

... 在点云分类实验中使用ModelNet40数据集^［39］和 ScanObjectNN数据集^［40］，在点云部件分割实验中使用ShapeNetPart数据集.ModelNet40数据集由人工合成，是点云分析广泛使用的基准测试数据集之一，包含40个类别，共有12 311个由CAD生成的对象，其中9 843个用于训练，其余2 468个用于测试.ScanObjectNN是最近发布的点云基准测试数据集，包含15个类别，共15 000个对象，在现实世界有2 902个唯一对象实例，由于存在背景，遮挡等，是一个具有挑战性的点云数据集.ShapeNetPart数据集^［41］用于3D形状分割测试，包含16个不同类别的17 000个对象，每个对象被分为2~6个部分. ...

A scalable active framework for region annotation in 3D shape collections

1

2016

... 在点云分类实验中使用ModelNet40数据集^［39］和 ScanObjectNN数据集^［40］，在点云部件分割实验中使用ShapeNetPart数据集.ModelNet40数据集由人工合成，是点云分析广泛使用的基准测试数据集之一，包含40个类别，共有12 311个由CAD生成的对象，其中9 843个用于训练，其余2 468个用于测试.ScanObjectNN是最近发布的点云基准测试数据集，包含15个类别，共15 000个对象，在现实世界有2 902个唯一对象实例，由于存在背景，遮挡等，是一个具有挑战性的点云数据集.ShapeNetPart数据集^［41］用于3D形状分割测试，包含16个不同类别的17 000个对象，每个对象被分为2~6个部分. ...

Dense-resolution network for point cloud classification and segmentation

1

2021

... The accuracy of different methods on ScanObjectNN dataset

Table 2

方法	MA/%	OA/%
PointNet^［1］	63.2	68.2
PointNet++^［2］	75.4	77.9
DGCNN^［17］	73.6	78.1
SpiderCNN^［11］	69.8	73.7
PointCNN^［10］	75.1	78.5
DRNet^［42］	78.0	80.3
GBNet^［43］	77.8	80.5
LGANet	78.1	81.5

注粗体为最优值. ...

Geometric back-projection network for point cloud classification

2

2021

... The accuracy of different methods on ScanObjectNN dataset

Table 2

方法	MA/%	OA/%
PointNet^［1］	63.2	68.2
PointNet++^［2］	75.4	77.9
DGCNN^［17］	73.6	78.1
SpiderCNN^［11］	69.8	73.7
PointCNN^［10］	75.1	78.5
DRNet^［42］	78.0	80.3
GBNet^［43］	77.8	80.5
LGANet	78.1	81.5

注粗体为最优值. ...

... Comparison of complexity of classification models

Table 7

方法	参数量/M	OA/%
PointNet^［1］	3.50	89.2
PointNet++^［2］	1.48	90.7
GS-Net^［21］	1.51	92.9
GBNet^［43］	8.39	93.8
LGANet	2.20	94.0

注粗体为最优值. ...

Rethinking network design and local geometry in point cloud： A simple residual MLP framework

1

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

PointNeXt： Revisiting pointnet++ with improved training and scaling strategies

1

2022

... The accuracy of different methods on ModelNet40 dataset

Table 1

方法	MA/%	OA/%
PointNet^［1］	86.0	89.2
PointNet++^［2］	-	90.7
PointCNN^［10］	88.1	92.3
A-CNN^［4］	90.3	92.6
DGCNN^［17］	90.2	92.9
PAConv^［12］	-	93.6
PointASNL^［22］	-	92.9
GDANet^［23］	-	93.4
CurveNet^［25］	-	93.8
Point Trans^［18］	90.6	93.7
PointMLP^［44］	91.3	94.1
PointNeXt^［45］	-	94.0
LGANet	91.7	94.0

注粗体为最优值. ...

模型	模块				OA/%
模型	LIACA-1	LIACA-2	DLK	SAFA	OA/%
A					92.5
B	🗸				93.0
C	🗸	🗸			93.3
D	🗸		🗸	🗸	93.7
E			🗸	🗸	92.9
F	🗸	🗸	🗸	🗸	94.0

局部信息和全局信息相结合的点云处理网络

A point cloud processing network combining global and local information

1　相关工作

图1

1.1　局部特征聚合

1.2　非局部特征聚合

1.3　局部和全局相结合的特征聚合

2　本文方法

2.1　局部特征聚合分析

图2

2.2　基于通道自注意力的局部信息聚合

图3

图4

2.3　动态学习关键点

2.4　基于空间注意力的特征融合

图5

2.5　局部和全局信息注意力网络

图6

图7

3　实验

3.1　数据集与实验环境

3.2　实验结果与分析

3.2.1　分类结果分析

3.2.2　分割结果分析

图8

3.2.3　消融实验

3.2.4　关键点选择策略

3.2.5　超参数实验

3.2.6　模型复杂度

4　结论

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

策略	OA/%
FPS	93.1
Random	92.7
DLK	94.0

局部信息和全局信息相结合的点云处理网络

A point cloud processing network combining global and local information

1 相关工作

图1

1.1 局部特征聚合

1.2 非局部特征聚合

1.3 局部和全局相结合的特征聚合

2 本文方法

2.1 局部特征聚合分析

图2

2.2 基于通道自注意力的局部信息聚合

图3

图4

2.3 动态学习关键点

2.4 基于空间注意力的特征融合

图5

2.5 局部和全局信息注意力网络

图6

图7

3 实 验

3.1 数据集与实验环境

3.2 实验结果与分析

3.2.1 分类结果分析

3.2.2 分割结果分析

图8

3.2.3 消融实验

3.2.4 关键点选择策略

3.2.5 超参数实验

3.2.6 模型复杂度

4 结 论

参考文献 View Option 原文顺序 文献年度倒序 文中引用次数倒序 被引期刊影响因子

1　相关工作

1.1　局部特征聚合

1.2　非局部特征聚合

1.3　局部和全局相结合的特征聚合

2　本文方法

2.1　局部特征聚合分析

2.2　基于通道自注意力的局部信息聚合

2.3　动态学习关键点

2.4　基于空间注意力的特征融合

2.5　局部和全局信息注意力网络

3　实验

3.1　数据集与实验环境

3.2　实验结果与分析

3.2.1　分类结果分析

3.2.2　分割结果分析

3.2.3　消融实验

3.2.4　关键点选择策略

3.2.5　超参数实验

3.2.6　模型复杂度

4　结论

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子