精确的信道状态信息(CSI)是B5G/6G MIMO-OFDM无线通信系统设计的基石,在预编码和资源分配等关键任务中发挥着决定性作用。然而,传统的基于信道估计的CSI获取方式在高速移动等复杂场景中易受到“信道老化”等问题影响,严重制约系统性能。相比之下,信道预测技术通过预测获取CSI,大大降低了信道估计和反馈开销,显著提升了系统频谱效率,因而在过去几十年中得到了广泛研究,如图1所示。早期工作探索了基于参数化模型的信道预测方案,但其性能严重依赖于信道模型的准确度。而基于深度学习小模型的方案在高动态等复杂环境下性能受限,且泛化能力较差,难以满足未来通信系统高速率和低开销的要求。
近年来,基座模型的兴起推动了深度学习范式的变革,即通过在大规模数据集上进行自监督预训练,基座模型可以在多种下游任务中展现出卓越的泛化能力,并大幅超越任务专用模型。基座模型在自然语言处理等领域取得了突破性进展,催生了以ChatGPT和DeepSeek为代表的大语言模型(LLM)。前期LLM赋能通信物理层的相关工作局限于语言形式和语义提取等相关任务,难以直接处理非语言形式的信道预测任务。突破语言局限,团队前期工作(LLM4CP)首次将LLM应用于信道预测任务,通过微调技术实现预训练LLM的通用知识迁移,提升了预测精度和泛化能力。然而,由于语言域和信道域的天然差异,LLM4CP在面临超高速移动场景时仍然性能不足。当迁移到新场景时,LLM4CP只能降低而无法完全避免额外的数据收集和训练开销。此外,现有基于深度学习小模型和LLM的方案均针对时域和频域两种信道预测任务单独设计网络,大大增加了基站侧模型部署开销。
综上所述,由于并非针对信道域进行构建,基于通用基座模型(LLM)的信道预测方案在预测精度和泛化能力方面存在局限,无法从根本上突破传统深度学习设计范式,无法打破新场景需重新训练和模型分立设计的瓶颈。那么,能否针对信道域构建专用的无线基座模型,在大幅提升预测精度的同时实现一模多用,并能够直接应用于新场景而不加任何微调?团队对该问题首次进行了初步探索和系统回答,提出了首个面向信道预测的无线基座模型WiFo(WirelessFoundation Model),开辟了全新的信道预测设计范式,从根本上克服了现有基于深度学习小模型和LLM信道预测方案的局限性,开创了信道预测技术的基座模型时代。

图1 信道预测技术发展历史
打破分立设计的瓶颈,WiFo首次将时域和频域的MIMO-OFDM信道预测统一建模为信道重建任务。为解决信道预测任务和CSI数据的异构性,提出了一种基于掩码自编码器(MAE)的网络架构,从而可以处理任意尺寸的三维CSI数据并应用于异构的信道预测任务。同时,设计了一种新的空时频位置编码结构,以学习CSI样本的三维位置信息。为充分捕获通用的信道空时频特征,设计了三种自监督预训练任务,即随机掩码重建,时域掩码重建和频域掩码重建。预训练后的WiFo可直接零样本用于信道预测任务,而无需额外训练。

图2 WiFo网络架构图
团队基于QuaDRiGa仿真器构建了大规模异构CSI数据集,包括16个预训练数据集(包括16万条CSI训练样本)和3个泛化性测试数据集,覆盖多种场景、用户速度、频点、天线和时间等配置,并考虑了5种参数量大小(从0.3M到86.1M)的模型,如表1和表2所示。WiFo在16个预训练数据集的时域和频域预测结果分别如表3和表4所示,WiFo的平均NMSE(归一化均方根误差)性能达到SOTA,并且在大多数数据集上实现最优或次优,说明WiFo能够同时在多个异构数据集上训练,并同时掌握时域和频域预测,实现“一模多用”。值得注意的是,为完成上述16个数据集上的时域和频域信道预测任务,每种对比方案需要训练32个单独的模型,而WiFo仅需训练1个模型。以D17数据集为例,WiFo的零样本泛化性能如图3所示。对比方案的零样本泛化能力较差,难以有效预测,而WiFo的零样本泛化性能超越了所有对比方案的全样本训练性能,有望不加微调直接部署于新场景。此外,WiFo-Base的参数量仅为LLM4CP的1/4,而推理时间与普通小模型相当,有望实际部署。
表1 大规模仿真CSI数据集

表2 WiFo的5种模型参数配置

表3 WiFo-Base和其他对比方案在D1-D16数据集上时域信道预测的NMSE

表4 WiFo-Base和其他对比方案在D1-D16数据集上频域信道预测的NMSE


图3 D17数据集:WiFo零样本预测NMSE和对比方案的全样本/零样本预测NMSE
该工作的主要亮点如下:
(1)首个面向信道预测的无线基座模型和首个零样本信道预测方案,首次实现一个模型同时解决异构的信道预测任务和多样的CSI数据。
(2)设计了基于MAE的无线基座模型架构以解决任务与数据异构性,并设计多种掩码重建自监督预训练任务以充分捕获空时频信道特征。
(3)构建了大规模异构数据集用于预训练(训练样本数16万),仿真结果说明WiFo具备优越的多数据集联合学习能力,在新场景上的零样本预测性能超越对比方案的全样本性能,并具备与普通深度学习小模型相当的推理开销。
文章信息:
该研究成果以“WiFo: Wireless Foundation Model for Channel Prediction”为题被期刊SCIENCE CHINA Information Sciences(IF=7.3,JCR Q1,CCF-A类期刊)接收。北京大学为该研究工作的第一完成单位,合作单位包括香港科技大学(广州)。程翔教授为该论文的通讯作者,北京大学博士生刘伯珣为第一作者。这项工作得到了国家自然科学基金委杰出青年科学基金、国家重点研发计划、新基石科学基金会科学探索奖等项目的支持。
论文地址:
https://www.sciengine.com/SCIS/doi/10.1007/s11432-025-4349-0
代码和数据开源地址:
https://github.com/liuboxun/WiFo