Please wait a minute...

当期目录

    2024年 第42卷 第5期    刊出日期:2024-09-30
    目录
    中文目录
    2024, 42(5):  0-0. 
    摘要 ( 113 )   PDF (86KB) ( 103 )  
    相关文章 | 多维度评价
    英文目录
    2024, 42(5):  1-0. 
    摘要 ( 70 )   PDF (46KB) ( 26 )  
    相关文章 | 多维度评价
    信号与信息处理
    数字图像隐写分析综述
    王子驰, 李斌, 冯国瑞, 张新鹏
    2024, 42(5):  723-732.  doi:10.3969/j.issn.0255-8297.2024.05.001
    摘要 ( 391 )   PDF (2695KB) ( 438 )  
    参考文献 | 相关文章 | 多维度评价
    数字隐写是机密信息安全传递的重要方式,将机密信息隐藏于普通多媒体数据(图像或视音频)中可以实现隐蔽传输。而发现机密信息的隐蔽传输可采用隐写分析技术,隐写分析根据隐写引起的载体数据统计异常来判断多媒体数据是否含有秘密信息。近年来,隐写与隐写分析在相互对抗中不断进步与发展。随着社交网络的兴起,数字图像已成为社交媒介之一并广泛传播。本文以数字图像为例,梳理了近十余年数字图像隐写分析研究的发展现状;综述了传统隐写分析与深度学习隐写分析;探讨了各类方法面临的挑战,并展望了隐写分析的发展趋势。
    一种基于LiDAR多视轮廓点的三维壁画变化检测方法
    肖开荣, 孟庆祥, 杨鹤, 龚元夫
    2024, 42(5):  733-746.  doi:10.3969/j.issn.0255-8297.2024.05.002
    摘要 ( 156 )   PDF (7260KB) ( 76 )  
    参考文献 | 相关文章 | 多维度评价
    提出了一种三维壁画表面变化检测方法。首先通过点云配准和主成分分析算法处理壁画点云数据,利用高斯球映射在多视线方向提取特征轮廓线;然后结合体素网格移动和四维曲面拟合技术,实现对壁画几何变化的精确检测。实际应用结果证明,该方法在检测精度和效率上均有明显优势,对古文物保护与修复具有重要价值。
    SAR-ATR系统复数对抗样本生成方法
    张梦君, 熊邦书
    2024, 42(5):  747-756.  doi:10.3969/j.issn.0255-8297.2024.05.003
    摘要 ( 144 )   PDF (4752KB) ( 64 )  
    参考文献 | 相关文章 | 多维度评价
    针对现有对抗攻击方法只能用于攻击实数卷积神经网络这一限制,提出了一种基于生成对抗网络的复数对抗样本生成方法。首先,设计了一种产生有效对抗样本的复数模型,并引入了复数计算模块;其次,利用残差神经网络作为基本骨架,将预训练的复数网络作为判别器实现对抗训练,以增强对抗样本的攻击能力;最后,通过替代模型实现可迁移的对抗攻击,以此实现了更高的攻击成功率。实验结果表明,所提方法在有目标攻击和无目标攻击任务下的成功率分别达到了76.338%和87.841%,迁移的成功率更高且对抗样本与原始干净样本更为接近。所提方法将对抗攻击扩展到复数神经网络后,避免了合成孔径雷达目标信息和精度的丢失,为实际合成孔径雷达自动目标识别系统的安全性和鲁棒性提供了参考方案。
    融合局部和全局特征的铸件缺陷检测
    栗莎, 王永雄, 王哲, 陈旭, 何嘉欣
    2024, 42(5):  757-768.  doi:10.3969/j.issn.0255-8297.2024.05.004
    摘要 ( 159 )   PDF (4221KB) ( 65 )  
    参考文献 | 相关文章 | 多维度评价
    铝合金铸件已经广泛应用于汽车、飞机等重要工业,其质量直接影响到机械零部件的安全使用。针对铝合金铸件的X射线图像表面和内部缺陷多样化和细微问题,提出了一种融合局部和全局特征的X射线图像铸造缺陷检测方法。首先,将高效通道注意力模块和经典网络ResNet-50进行融合构成新的基础卷积神经网络,以新的网络为骨干构建双分支网络模型。然后,提出了细节信息定位提取(detailed information location and extraction,DILE)模块,该模块定位到包含丰富判别性信息的局部区域。最后,将由DILE得到的局部图像结合原始图像作为网络的输入,构建了一个融合局部和全局特征的双分支网络模型。对全局区域的学习有助于在复杂背景下提取有意义的细微信息,对局部区域的学习可以进一步提高分类效果。该方法在真实汽车铸件的X射线图像数据集上进行测试训练,测试集准确率达98.3%。实验结果表明,该方法相较于其他常规方法更有效。
    基于模糊广义去重的图像轻量安全云存储方法
    陈海欣, 唐鑫, 金路超, 付耀文, 周艺腾
    2024, 42(5):  769-781.  doi:10.3969/j.issn.0255-8297.2024.05.005
    摘要 ( 158 )   PDF (3100KB) ( 68 )  
    参考文献 | 相关文章 | 多维度评价
    广义去重是实现云数据安全去重的一种重要手段。现有的广义去重方法仅支持精确去重,且无法与图像加密技术有机结合。而图像加密技术本身也将给用户带来巨大的计算开销。针对以上挑战,本文提出一种基于模糊广义去重的图像轻量级安全云存储方法。首先对图像数据开展整数小波变换并提取低频分量作为基,高频分量作为偏移量,通过提出一种基于异或的轻量级加密算法,把图像的机密性保护方法与广义去重技术有机结合。此外,本文还对偏移量进行云端模糊去重,使得云端仅保存高度相似的偏移量数据的单个副本,实现了图像云数据的模糊广义去重。在相关的图像数据集上开展实验,结果表明在实现安全性的前提下,本文所提方法在改善通信效率和存储效率上有显著效果。
    基于深度声纹特征转换网络的说话人识别攻击方法
    陶子钰, 苏兆品, 廉晨思, 王年松, 张国富
    2024, 42(5):  782-794.  doi:10.3969/j.issn.0255-8297.2024.05.006
    摘要 ( 133 )   PDF (7730KB) ( 88 )  
    参考文献 | 相关文章 | 多维度评价
    目前主流说话人识别(speaker identification,SID)系统的攻击方法主要基于快速梯度下降或映射式梯度下降算法,这些方法存在攻击效果不稳定、生成的攻击语音听觉质量不高等问题。为此提出一种基于深度声纹特征转换网络的自动说话人识别攻击方法,生成具有目标说话人音色的攻击语音。首先分析了SID系统的攻击流程,确定了攻击语音生成的过程;然后基于二维卷积神经网络设计攻击音频生成器,以有效融合源说话人的语音内容和目标说话人的声纹特征,并基于对抗学习设计了攻击音频的判别器,以提高语音攻击音频的质量。最后分别在基于广义端到端损失和基于AMSoftmax损失的两个自动说话人识别系统上进行对比实验。实验结果表明,所提方法不但提高了攻击效果的稳定性,提升了攻击音频的人耳感受质量,而且适用于短时长数据,满足了实际攻击场景的需求。
    计算机科学与应用
    基于元学习和强化学习的自动驾驶算法
    金彦亮, 范宝荣, 高塬, 汪小勇, 顾晨杰
    2024, 42(5):  795-809.  doi:10.3969/j.issn.0255-8297.2024.05.007
    摘要 ( 175 )   PDF (5419KB) ( 101 )  
    参考文献 | 相关文章 | 多维度评价
    针对基于强化学习的自动驾驶算法存在收敛困难、训练效果不理想、泛化性能差等问题,提出了一种基于元学习和强化学习的自动驾驶系统。该系统首先将变分自编码器(variational auto-encoder,VAE)与具有梯度惩罚的Wasserstein生成对抗网络(Wasserstein generative adversarial network with gradient penalty,WGAN-GP)相结合形成VWG (VAE-WGAN-GP)模型,提高了所提取特征的质量;然后用元学习算法Reptile训练VWG特征提取模型,进一步得到MVWG(meta-VWG)特征提取模型,以提高模型的训练速度;最后将特征提取模型与近端策略优化(proximal policy optimization,PPO)决策算法相结合,对PPO算法中的奖励函数进行改进,提高了决策模型的收敛速度,最终得到MVWG-PPO自动驾驶模型。实验结果表明,该文提出的MVWG特征提取模型与VAE、VW(VAE-WGAN)、VWG基准模型相比,重构损失分别降低了60.82%、44.73%和29.09%,收敛速度均提高约5.00倍,重构图像更加清晰,并且在自动驾驶任务中的表现也更好,能够为智能车提供更高质量的特征信息。同时,改进奖励函数后的决策模型与基准决策模型相比,收敛速度也提高了11.33%,充分证明了该文方法的先进性。
    融合标题情感和话题特征的新闻推荐算法
    艾均, 洪星琦
    2024, 42(5):  810-822.  doi:10.3969/j.issn.0255-8297.2024.05.008
    摘要 ( 187 )   PDF (1748KB) ( 271 )  
    参考文献 | 相关文章 | 多维度评价
    文本是新闻最主要的媒介,传统基于情感词典的新闻推荐算法在分析情感词汇时,通常会忽略词典外的词汇情感,使得情感词汇标记不全,导致预测准确度不高和排序性能不佳等问题。针对这些问题,提出了一种推断未知词汇情感的启发式方法,设计了一种对应的新闻推荐算法来验证其有效性。构建标题-情感词-情感字三部图模型,将情感词典中的词汇情感扩散到单个的字,通过情感词和情感字得到了标题情感。首先,用词袋模型提取出标题的话题特征。然后,计算标题之间的情感相似度和话题相似度,并将两种相似度融合作为综合的相似度评价指标。接着,选取与目标新闻相似度较高的新闻作为邻居。算法通过邻居新闻的时均点击量,预测出目标新闻的时均点击量,将时均点击量视为目标新闻的预测评分,最终将评分排序实现对用户的新闻推荐。在真实的网易热榜新闻数据集上验证了该方法的可行性与有效性。对比其他算法,本文算法的平均绝对误差最优准确度提升了2.2%~3.4%,均方根误差最优准确度提升了2.3%~2.9%,归一化折损累计增益平均得分提升了0.7%~1.8%。
    多尺度特征融合注意力机制的滤棒质检算法
    刁悦钦, 李志文, 山子岐, 李凡
    2024, 42(5):  823-836.  doi:10.3969/j.issn.0255-8297.2024.05.009
    摘要 ( 170 )   PDF (2494KB) ( 68 )  
    参考文献 | 相关文章 | 多维度评价
    为解决卷烟滤棒生产过程中需要人工对滤棒指标进行监测并调整设备参数,导致成本高昂且效率低下的问题,提出一种多尺度特征融合注意力机制的滤棒质检算法。该算法利用不同大小的一维卷积获取滤棒多尺度的特征,降低了滤棒局部特征遗漏的可能性。为进一步增强特征表示,本文引入注意力机制使算法模型聚焦于更重要的特征。实验结果表明,与一维卷积神经网络(1D convolutional neural network, 1DCNN)、反向传播(back propagation, BP)神经网络、循环神经网络等5种方法相比较,本文提出的算法模型在测试集上的性能更加突出,尤其是与1DCNN、BP神经网络和分布式梯度增强库这3种方法相比,模型的准确率分别提高了3.27%、4.28%和5.70%;精确率分别提高了3.12%、4.68%和5.10%;召回率分别提高了3.28%、4.57%和2.97%; F1-Score分别提高了3.20%、4.13%和4.33%。本文提出的算法不仅可以提高滤棒的生产效率,还可以降低人工成本,具有良好的工程实用价值。
    面向大规模飞行自组网的NBATMAN-ADV路由协议
    王聪, 赵几航, 吴霞, 马文峰, 田辉
    2024, 42(5):  837-846.  doi:10.3969/j.issn.0255-8297.2024.05.010
    摘要 ( 161 )   PDF (3107KB) ( 119 )  
    参考文献 | 相关文章 | 多维度评价
    飞行自组网是当前研究的热点,当无人机节点规模较大时,大量的路由开销可能会导致网络瘫痪,因此路由协议的设计具有挑战性。针对大规模无人机场景,首先提出利用统一连通支配集算法构建虚拟骨干网,目的是减少路由洪泛的节点数;其次在骨干节点上部署和运行NBATMAN-ADV路由协议,利用物理层数据的接收信号强度指标和信噪比评价链路质量,在减少路由开销的同时,能够快速感知链路的变化情况。仿真结果表明,较传统的先验式路由协议如优化链路状态路由和目的节点序列距离矢量,该路由协议在数据包交付率、端到端时延和吞吐量上均有明显的提升。在通信模块上的实验结果表明,该路由协议在多跳时延方面有较好的性能。
    融合Transformer的剩余使用寿命预测模型
    郑红, 刘文, 邱俊杰, 余金浩
    2024, 42(5):  847-856.  doi:10.3969/j.issn.0255-8297.2024.05.011
    摘要 ( 223 )   PDF (711KB) ( 145 )  
    参考文献 | 相关文章 | 多维度评价
    剩余使用寿命(remaining useful life,RUL)预测对大型设备的故障预测与健康管理十分重要。然而,一些设备监测数据具有维度高、规模大、强耦合、参数时变等非线性特征,这些特征会导致RUL预测的准确性较低。为此引入Transformer解码器,并通过多头注意力机制综合全局信息,提出了一种基于多尺度双向长短期记忆网络和Transformer的神经网络模型,以提高模型预测精度。选取航空发动机作为研究对象,使用各个模型在NASA的C-MPASS数据集上进行对比实验,结果表明,在剩余使用寿命预测方面,该文提出的融合Transformer模型的多尺度双向长短期记忆网络模型在准确率和均方根误差指标上均优于其他对比模型。
    基于RFE-OPTUNA-XGBoost模型的高速公路逃费模式识别
    马飞虎, 雷皓安, 孙翠羽, 罗佳洁
    2024, 42(5):  857-870.  doi:10.3969/j.issn.0255-8297.2024.05.012
    摘要 ( 134 )   PDF (1156KB) ( 92 )  
    参考文献 | 相关文章 | 多维度评价
    受经济利益驱动,中国高速公路逃费行为频繁发生。为此,该文选取了2020年某研究区域的脱敏通行数据,通过数据挖掘分析逃费车辆的行为特征,提出一种基于递归特征消除算法和OPTUNA优化框架的极限梯度提升树(recursive feature elimination-OPTINA-extreme gradient boosting,RFE-OPTUNA-XGBoost)的逃费模式识别模型,该识别模型准确率达到了0.945,各逃费方式的平均接受者操作特性曲线下面积值(area under curve,AUC)分别为:大车小标0.997、U/J型0.980、假绿通0.969、冲岗0.924。结果证明,基于RFE-OPTUNA-XGBoost的模型对于逃费模式识别的准确程度及各逃费模式的AUC值都更高。综上所述,提出的基于RFE-OPTUNA-XGBoost的高速公路逃费车辆逃费的识别模型能精准识别逃费模式。在实际应用中,对于高速公路管理部门展开稽查工作具有重大现实意义。
    基于CNN和Transformer混合网络模型的车道线检测
    唐洪, 邓锋, 张恺, 聂学方, 李光辉
    2024, 42(5):  871-883.  doi:10.3969/j.issn.0255-8297.2024.05.013
    摘要 ( 195 )   PDF (1647KB) ( 75 )  
    参考文献 | 相关文章 | 多维度评价
    车道线检测技术在自动驾驶系统中发挥着重要作用,目前基于深度学习的车道线检测方法通常在主干网络提取特征之后分别获取车道线关键点的置信度以及这些点相对车道线起始点的偏移。但由于车道线是细长结构,现有的主干网络无法有效提取这种结构特征,偏移网络也难以回归车道线上关键点相对起始点的偏移。鉴于注意力机制在提取空间结构特征、表征长距离图像序列间依赖关系方面的优越性能,在基于点的车道线检测方法的基础上提出了一种基于卷积神经网络(convolutional neural network, CNN)和Transformer的混合网络(CNN-Transformer hybrid network, CTNet)模型,该模型通过特征金字塔和增强的坐标注意力机制提高特征的表征能力,使用基于视觉Transformer的偏移网络回归关键点的偏移量,因此,CTNet能够提取细长车道线特征、捕获长距离点间的偏移,有效提升车道线检测的精度。实验对比了CTNet和6种常用车道线检测算法在数据集TuSimple和CULane上的效果,在TuSimple上CTNet各项精度指标均优于现有方法,在CULane数据集的9种不同车道场景中,CTNet在6个场景中取得了最佳精度。
    跨通道交互注意力机制驱动的双流网络跨模态行人重识别
    何磊, 栗风永, 秦川
    2024, 42(5):  884-892.  doi:10.3969/j.issn.0255-8297.2024.05.014
    摘要 ( 197 )   PDF (4390KB) ( 391 )  
    参考文献 | 相关文章 | 多维度评价
    现有的跨模态行人重识别方法不能同时兼顾模态间与模态内的目标行人差异,很难提升检索准确度。为解决这一问题,引入跨通道交互的注意力机制,增强行人特征的鲁棒提取能力,有效抑制冗余特征的提取并获得更具辨别力的特征表达。进一步,联合异质中心三元组损失、三元组损失和身份损失进行监督学习,有效结合了行人特征的跨模态类间差异和类内差异。实验证明了所提方法的有效性。与7个已有的经典方法相比,所提方法在两个标准数据集RegDB与SYSU-MM01上都取得了较好的性能效果。
    电子技术
    电磁近场测试平面扫描系统设计
    贾洪川, 程鑫, 万发雨, RAVELO Blaise
    2024, 42(5):  893-902.  doi:10.3969/j.issn.0255-8297.2024.05.015
    摘要 ( 199 )   PDF (6118KB) ( 130 )  
    参考文献 | 相关文章 | 多维度评价
    设计了一种测量电子器件电磁场分布的近场扫描系统,用于电磁兼容测试。首先,设计了一种四层印刷电路板结构的磁场探头,其工作频率达12 GHz,空间分辨率为2 mm,仿真与实测结果吻合较好,并对探头进行了校准。其次,实现了近场扫描的自动化,采用LabVIEW设计上位机软件,STM32作为运动控制核心,通过串口接收上位机数据,并控制步进电机带动探头移动,实现定点扫描,上位机通过局域网与矢量网络分析仪实现通信,完成数据的读取与保存。最后,通过上位机对数据进行可视化处理,在扫描完成时对结果进行校准,并实时生成被测物体的场强分布图,实现电磁场分布数据可视化。场强测试结果与电磁仿真结果吻合较好,可用于分析电磁耦合路径及实现近场与远场的转换。