Acta Armamentarii ›› 2023, Vol. 44 ›› Issue (9): 2611-2621.doi: 10.12382/bgxb.2022.1166
Special Issue: 智能系统与装备技术
Previous Articles Next Articles
ZHANG Kaige, LU Zhigang*(), NIE Tianchang, LI Zhiwei, GUO Yuqiang
Received:
2022-11-30
Online:
2023-05-30
Contact:
LU Zhigang
CLC Number:
ZHANG Kaige, LU Zhigang, NIE Tianchang, LI Zhiwei, GUO Yuqiang. Analysis of Soft Intelligent Edge Computing Technologies for Unmanned Systems[J]. Acta Armamentarii, 2023, 44(9): 2611-2621.
Add to citation manager EndNote|Ris|BibTeX
方法 | 优点 | 缺点 | 子类方法 | 子类方法优点 | 子类方法缺点 |
---|---|---|---|---|---|
知识蒸馏 | 精度损失较低 | 加速倍数受限于学生网络结构 | 基于反应 | 使用简单 | 没有考虑对应中间层之间的学习,精度损失大 |
基于特征 | 精度损失较小 | 难以确定哪些层之间可以建立对应关系 | |||
基于关系 | 精度损失较小 | 需要额外的关系特征提取过程 | |||
参数量化 | 精度损失较低,加速倍数大 | 不能大幅减少参数数量,加速倍数有上限 | QAT | 精度损失较小 | 训练难度大 |
PTQ | 易于训练 | 精度损失较大 | |||
模型剪枝 | 加速倍数较大,可以大幅减少参数数量 | 精度损失较大 | 结构化剪枝 | 易于实施 | 需要确定哪些层需要被剪枝,精度丢失较大 |
非结构化剪枝 | 精度丢失较小 | 实施困难 |
Table 1 Advantages and disadvantages of common model compression methods
方法 | 优点 | 缺点 | 子类方法 | 子类方法优点 | 子类方法缺点 |
---|---|---|---|---|---|
知识蒸馏 | 精度损失较低 | 加速倍数受限于学生网络结构 | 基于反应 | 使用简单 | 没有考虑对应中间层之间的学习,精度损失大 |
基于特征 | 精度损失较小 | 难以确定哪些层之间可以建立对应关系 | |||
基于关系 | 精度损失较小 | 需要额外的关系特征提取过程 | |||
参数量化 | 精度损失较低,加速倍数大 | 不能大幅减少参数数量,加速倍数有上限 | QAT | 精度损失较小 | 训练难度大 |
PTQ | 易于训练 | 精度损失较大 | |||
模型剪枝 | 加速倍数较大,可以大幅减少参数数量 | 精度损失较大 | 结构化剪枝 | 易于实施 | 需要确定哪些层需要被剪枝,精度丢失较大 |
非结构化剪枝 | 精度丢失较小 | 实施困难 |
方法 | 参数 数量/ 106 | 加速 倍数 | Top-1 误差率 增加/% | Top-5 误差率 增加/% |
---|---|---|---|---|
VGG-16 | 138.4 | 1.0 | 0 | 0 |
L1-GAP[ | 9.2 | 2.5 | 4.62 | 3.10 |
APoZ-GAP[ | 9.2 | 2.5 | 3.72 | 2.65 |
TE[ | 135.7 | 2.7 | 4.12 | 3.94 |
ThiNet[ | 9.5 | 2.3 | 1.00 | 0.52 |
ThiNet-T[ | 1.3 | 4.35 | 9.00 | 6.47 |
GReg[ | 10.6 | 8.81 | 6.71 | 5.34 |
DepGraph[ | 8.61 | 9.05 | 5.20 | 4.83 |
EarlyCroP[ | 8.5 | 8.53 | 5.85 | 5.22 |
Table 2 Performance comparison of model pruning methods
方法 | 参数 数量/ 106 | 加速 倍数 | Top-1 误差率 增加/% | Top-5 误差率 增加/% |
---|---|---|---|---|
VGG-16 | 138.4 | 1.0 | 0 | 0 |
L1-GAP[ | 9.2 | 2.5 | 4.62 | 3.10 |
APoZ-GAP[ | 9.2 | 2.5 | 3.72 | 2.65 |
TE[ | 135.7 | 2.7 | 4.12 | 3.94 |
ThiNet[ | 9.5 | 2.3 | 1.00 | 0.52 |
ThiNet-T[ | 1.3 | 4.35 | 9.00 | 6.47 |
GReg[ | 10.6 | 8.81 | 6.71 | 5.34 |
DepGraph[ | 8.61 | 9.05 | 5.20 | 4.83 |
EarlyCroP[ | 8.5 | 8.53 | 5.85 | 5.22 |
方法 | 教师网络/ 参数量/ million | 教师网 络精 度/% | 学生网络/ 参数量/ million | 学生网 络精 度/% |
---|---|---|---|---|
FT[ | ResNet56/0.85 | 72.34 | ResNet20/0.27 | 69.84 |
NST[ | WRN-40-2/4.4 | 75.61 | WRN-40-1/0.6 | 72.24 |
AB[ | WRN-40-20/4.4 | 75.61 | WRN-40-1/0.6 | 72.38 |
PKT[ | ResNet110/1.7 | 74.31 | ResNet20/0.27 | 70.25 |
CRD[ | ResNet56/0.85 | 72.34 | ResNet20/0.27 | 71.16 |
HSAKD[ | ResNet56/0.85 | 72.34 | ResNet20/0.27 | 73.26 |
Table 3 Performance comparison of knowledge distillation methods
方法 | 教师网络/ 参数量/ million | 教师网 络精 度/% | 学生网络/ 参数量/ million | 学生网 络精 度/% |
---|---|---|---|---|
FT[ | ResNet56/0.85 | 72.34 | ResNet20/0.27 | 69.84 |
NST[ | WRN-40-2/4.4 | 75.61 | WRN-40-1/0.6 | 72.24 |
AB[ | WRN-40-20/4.4 | 75.61 | WRN-40-1/0.6 | 72.38 |
PKT[ | ResNet110/1.7 | 74.31 | ResNet20/0.27 | 70.25 |
CRD[ | ResNet56/0.85 | 72.34 | ResNet20/0.27 | 71.16 |
HSAKD[ | ResNet56/0.85 | 72.34 | ResNet20/0.27 | 73.26 |
方法 | 加速 倍数 | Top-1误差率 增加/% | Top-5误差率 增加/% |
---|---|---|---|
ResNet-18(原网络) | 1 | 0 | 0 |
BWN[ | 2 | 8.50 | 6.2 |
XNOR-Net[ | 58 | 18.10 | 16.0 |
DQ[ | 41 | 4.72 | 2.8 |
IntraQ[ | 33 | 5.31 | 3.16 |
BRECQ[ | 29 | 2.23 | 1.06 |
Table 4 Impact of parameter quantification methods on accuracy
方法 | 加速 倍数 | Top-1误差率 增加/% | Top-5误差率 增加/% |
---|---|---|---|
ResNet-18(原网络) | 1 | 0 | 0 |
BWN[ | 2 | 8.50 | 6.2 |
XNOR-Net[ | 58 | 18.10 | 16.0 |
DQ[ | 41 | 4.72 | 2.8 |
IntraQ[ | 33 | 5.31 | 3.16 |
BRECQ[ | 29 | 2.23 | 1.06 |
[1] |
刘谋黎. 深度卷积神经网络在计算机视觉中的应用研究综述[J]. 科学大众(科技创新), 2021(7): 55-57.
|
|
|
[2] |
冯志伟, 丁晓梅. 自然语言处理中的神经网络模型[J]. 当代外语研究, 2022(4):98-110.
|
|
|
[3] |
孙长银, 穆朝絮. 多智能体深度强化学习的若干关键科学问题[J]. 自动化学报, 2020, 46(7):1301-1312.
|
|
|
[4] |
doi: 10.1016/j.patcog.2019.01.006 URL |
[5] |
|
[6] |
石磊, 王毅, 成颖, 等. 自然语言处理中的注意力机制研究综述[J]. 数据分析与知识发现, 2020, 4(5):1-14.
|
|
|
[7] |
马瑶, 智敏, 殷雁君, 等. CNN和Transformer在细粒度图像识别中的应用综述[J]. 计算机工程与应用, 2022, 58(19): 53-63.
doi: 10.3778/j.issn.1002-8331.2201-0374 |
doi: 10.3778/j.issn.1002-8331.2201-0374 |
|
[8] |
|
[9] |
薛俊韬, 马若寒, 胡超芳. 基于MobileNet的多目标跟踪深度学习算法[J]. 控制与决策, 2021, 36(8): 1991-1996.
|
|
|
[10] |
doi: 10.1109/ACCESS.2022.3215665 URL |
[11] |
李屹, 魏建国, 刘贯伟. 模型剪枝算法综述[J]. 计算机与现代化, 2022(9):51-59.
|
|
|
[12] |
黄震华, 杨顺志, 林威, 等. 知识蒸馏研究综述[J]. 计算机学报, 2022, 45(3): 624-653.
|
|
|
[13] |
高晗, 田育龙, 许封元, 等. 深度学习模型压缩与加速综述[J]. 软件学报, 2021, 32(1): 68-92.
|
|
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
doi: 10.1109/TNNLS.5962385 URL |
[28] |
胡干, 梁兴柱. 一种高效的基于互学习的在线蒸馏系统[J]. 电子世界, 2021(23):132-134.
|
|
|
[29] |
田加林, 徐行, 沈复民, 等. 基于跨模态自蒸馏的零样本草图检索[J]. 软件学报, 2022, 33(9): 3152-3164.
|
|
|
[30] |
程祥鸣, 邓春华. 基于无标签知识蒸馏的人脸识别模型的压缩算法[J]. 计算机科学, 2022, 49(6):245-253.
doi: 10.11896/jsjkx.210400023 |
|
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
doi: 10.1109/TNNLS.2021.3063265 URL |
[40] |
|
[41] |
|
[42] |
|
[43] |
|
[44] |
|
[45] |
doi: 10.1007/s11263-021-01453-z |
[46] |
|
[47] |
|
[48] |
|
[49] |
李姜楠, 伍星, 刘竞升, 等. 基于知识蒸馏的YOLOv3算法研究[J]. 计算机工程与应用, 2022, 58(17):174-180.
doi: 10.3778/j.issn.1002-8331.2101-0089 |
doi: 10.3778/j.issn.1002-8331.2101-0089 |
|
[50] |
楚玉春, 龚航, 王学芳, 等. 基于YOLOv4的目标检测知识蒸馏算法研究[J]. 计算机科学, 2022, 49(6A):337-344.
doi: 10.11896/jsjkx.210600204 |
|
|
[51] |
|
[52] |
|
[53] |
|
[54] |
|
[55] |
|
[56] |
|
[57] |
|
[58] |
|
[59] |
|
[60] |
|
[61] |
|
[62] |
|
[63] |
|
[64] |
|
[1] | LIU Chang, LEI Hongbo, LIN Shiyao, FAN Shipeng, WANG Jiang. Firing Data Calculation Method for Laser Terminal Guidance Projectile Based on Multi-model Network [J]. Acta Armamentarii, 2023, 44(9): 2745-2755. |
[2] | MU Weiwei, HE Binbing, QI Yao, LI Zixian, ZHANG Zhichao, XU Youchun. Interference Suppressionin Ground Unmanned Equipment Cluster Communication Based on Circular Array [J]. Acta Armamentarii, 2023, 44(5): 1414-1421. |
[3] | PANG Yiqiong, XU Hua, ZHANG Yue, ZHU Huali, PENG Xiang. Modulation Recognition Algorithm Based on Transfer Meta-Learning [J]. Acta Armamentarii, 2023, 44(10): 2954-2963. |
Viewed | ||||||
Full text |
|
|||||
Abstract |
|
|||||