近日,电子学院杨光临副教授课题组在计算机生成全息图(Computer Generated Hologram, CGH)压缩传输技术领域取得重要突破,提出了一种基于遗传算法优化量子启发式卷积神经网络的高效计算机生成全息图压缩传输方法,显著提升了全息三维图像数据的压缩率与重建图像质量,为未来电子全息图像实时立体显示技术的发展提供了新思路。
计算机生成全息图(CGH)能够完整记录和再现三维场景的光子波场信息,是未来立体显示技术的主要发展方向。然而,CGH数据量巨大,导致其在实时传输与存储方面面临巨大挑战。传统图像压缩算法因忽略全息图的全局衍射特性和复振幅信息,导致重建图像质量下降;而现有深度学习方法虽能自适应特征提取,但随机权重初始化易使模型陷入局部最优,限制了压缩性能的提升。因此,研究适用于CGH的高效压缩传输技术具有重要的科学意义与应用价值。如何在保证计算效率的同时提高压缩性能,成为该领域的关键科学问题。
针对上述挑战,杨光临副教授课题组提出了一种融合遗传算法全局优化与量子启发式神经网络的新型压缩传输方法。该方法的核心创新包括:
使用量子启发式卷积神经网络提取特征,通过引入复数卷积运算和相位编码,更精准地建模匹配全息图的振幅-相位关系,提升图像特征表达能力。
利用遗传算法的全局寻优能力优化神经网络初始权重,避免传统随机初始化导致的局部最优问题,显著提升模型收敛速度和计算性能。该方法仅在权重初始化阶段引入遗传算法优化,推理阶段不增加额外计算负担,在保持与传统方法相同计算复杂度的同时,实现更高的压缩率和重建图像保真度。

图1 基于遗传算法优化量子启发式卷积神经网络压缩传输计算全息图的方案图

图2 量子启发式卷积神经网络模型架构(CR=4)
实验结果表明,在相同实验条件下,该方法相比于传统深度学习方法,能够以更高的压缩率实现更优的全息图重建图像质量,同时保持计算效率。这一突破不仅验证了量子启发式人工智能与遗传算法优化在解决CGH压缩传输瓶颈方面的潜力,也为高效全息数据压缩提供了新途径。有望推动电子全息实时立体显示技术的发展,在虚拟现实(VR)、增强现实(AR)、医学成像、远程教育等领域具有广阔的应用前景。

图3 测试集中“zebra”使用不同方案全息图压缩处理重建的图像
上述工作以题为《基于遗传算法的量子启发卷积神经网络压缩计算全息图优化方案》(Optimized scheme of CGH compression using quantum-inspired convolutional neural network with genetic algorithm)的论文在线发表于美国光学学会(OSA)的《光学快报》(Optics Express)。北京大学电子学院2022级硕士研究生姚宇轩为第一作者,电子学院杨光临副教授为通讯作者,相关研究工作得到国家自然科学基金(No.62071009)支持。
论文链接:https://doi.org/10.1364/OE.562844