分享

通信中基于学习的主动感知

 浪逸书生 2022-06-07 发布于江苏

写在前面本期推送是IEEE JSAC通感一体专题计划的第十九篇,介绍近期在IEEE JSAC发表的论文“Active Sensing for Communications by Learning”。本文致力于研究无线通信中的主动感知问题,将智能体与环境互动所得的信息用于感知或其他任务以最大化某些效用函数。具体而言,为了解决历史观测值的维度随着时间增加这一挑战性问题,本文提出利用长短期记忆网络(LSTM)和深度神经网络(DNN)结合的方法,将其应用于毫米波波束对准中的自适应波束成形问题和反射对准中的自适应可重构智能表面(RIS)感知问题。

通信中基于学习的主动感知

Foad Sohrabi  Tao Jiang(蒋涛)  Wei Cui (崔巍)   Wei Yu (郁炜)

(多伦多大学)

Citation: F. Sohrabi, T. Jiang, W. Cui and W. Yu, 'Active Sensing for Communications by Learning,' IEEE J. Sel. Areas Commun., vol. 40, no. 6, pp. 1780-1794, June 2022

论文版权归属IEEE JSAC期刊及IEEE版权方,本文分享只体现学术贡献,未经许可禁止用于商业用途。

文章链接:

https://ieeexplore./document/9724252

一、背景介绍

对环境的主动序列感知通常是指智能体主动地,有顺序地查询环境以积累关于问题实例的认知,以此来产生最终的最优解决方案。也就是说,在查询过程的每一个时间帧内,智能体都可以根据前面所有步骤获得的信息自适应地设计自己的感知策略。主动感知策略的设计是一项非常重要的任务,本文的目标是开发一个统一的深度学习框架,以数据驱动的方式设计主动感知程序。

主动学习在无线通信中的一个重要应用是信道估计。对于许多无线协议来说,在初始信道感知阶段中基站需要为后续的通信阶段获取信道状态信息(CSI)。但无线信道通常是高维的,基站往往只能在探测信道特定方向的基础上进行低维观测。本文旨在证明与预先固定感知方向的传统方法相比,采用数据驱动的主动信道感知策略可以显著提高系统性能。

二、系统模型和优化问题

设主动感知模型在T个时间帧内要估计的参数为θ,在每个时间帧t内智能体将设计一个感知向量wt,并在随后观测到一个观测量yt,其中yt是关于wtθ和系统额外的随机参数ut的函数:

图片

智能体可以基于时间帧t +1之前的所有历史观测数据循序地设计感知向量:

图片

其中图片是智能体在时间帧t内的主动感知策略。对参数的最终估计可以由所有个时间帧内的感知向量和观测向量得到:

图片

假设存在失真度量图片,则参数估计问题可以写成:

图片

本文提出的体系结构不止限制于参数估计问题,也可适用于其他应用。例如,智能体可能对设计一个控制动作v以最大化关于vθ的效用函数更感兴趣,而不是仅仅估计系统参数θ。基于以上,优化的问题可以写成:

图片

三、深度主动学习结构

为了解决历史数据的维度随着时间不断增加的问题,我们可以从历史观测值中提取固定维度的状态信息向量st。本文提出在主动感知问题中利用LSTM网络自动生成合适的状态信息st。也就是说,在每个时间帧t内应用一个LSTM单元,将新的观测量yt作为输入向量,更新单元状态向量ct和隐藏的状态(信息)向量st,可以写成以下式子:

图片

其中,Ab分别是LSTM网络中的训练权重和偏差。遗忘门激活向量ft,输入门激活向量it和输出门激活向量ot是在LSTM单元内产生的用于更新单元状态向量ct和隐藏的状态(信息)向量st的中间向量。接着利用一个L层DNN将当前状态向量st映射到下一时间帧的感知向量wt+1

图片

本文提出的在时间帧内的深度主动学习单元如图1所示:

图片

图1:深度主动学习单元

整体的深度主动感知框架如图2所示:

图片

图2:深度主动学习总体结构

最终的参数估计或输出的控制向量将由最后时间帧内的另一个DNN所产生。

四、毫米波波束对准中的主动感知

毫米波通信系统中单射频链路的多天线基站服务单天线用户可以由图3表示:

图片

图3:毫米波通信系统模型

将均方误差(MSE)作为性能指标的情况下,毫米波环境下初始阶段波束对准中的到达角(AOA)估计问题可以写成以下主动学习问题的形式:

图片

其中yt为基站通过模拟波束成形(感知)观测到的回波导频信号。可以看出该问题符合(4)中的参数优化问题形式。

基站也可能对基于上行链路的信道状态信息设计下行链路的预编码器的问题感兴趣,这种情况下目标函数将变为最大化下行链路的波束成形增益:

图片

可以看出该问题符合(5)中的控制动作设计问题形式。

图4展示的是不同波束对准方法下AOA估计的平均MSE仿真结果图。DNN作为基准算法,其假设为衰落系数已知,也就是说其后验分布可以提供足够的统计信息用于准确计算AOA。由此可以看出本文提出的主动学习方法非常接近假设衰落系数已知的DNN的表现,在AOA参数估计问题中有效。

图片

图4:不同波束对准方法的平均MSE

图5展示的是不同方法下平均波束成形增益的仿真结果图。可以看出,基于DNN的方法优于基于传统下行链路预编码设计的两步信道估计的方法。本文提出的基于主动感知的方法优于基于DNN的方法。

图片

图5:不同方法的平均波束成形增益

图6展示了在AoA估计问题中每个时间帧内基站收到导频信号后AoA的后验分布,与深度主动学习框架设计的感知向量所形成的波束图案。可以看出,随着时间帧增加,AoA的后验分布从均匀分布逐渐收敛到在真实AoA附近概率最大的分布。同时,神经网络设计的感知向量也从比较平坦的波束成形图案收敛到在真实AoA附近波束成形增益最大的图案,也就是说基站逐渐学会形成窄波束来将更多的感知能量对准真实的AoA方向。这说明本文提出的深度主动学习框架学到的感知策略具有可解释性。

图片

图6:AoA估计问题中深度主动学习框架的感知策略

五、毫米波波束对准以及RIS反射系数优化的主动感知

毫米波通信系统中基于RIS的反射路径可以由图7表示:

图片

图7:基于RIS反射的毫米波通信系统模型

目标函数为通过设计RIS的反射系数以最大化下行链路的波束成形增益:

图片

图片

其中hc为发射端和接收端之间的级联有效信道。可以看出该问题符合(5)中的控制动作设计问题形式。

图8展示的是不同方法下平均波束成形增益的仿真结果图。可以看出,随着感知阶段数量的增长,三种基于深度学习的方法比传统先估计信道然后预编码的方法有更好的表现。这得益于绕过信道估计阶段,利用数据驱动的方法直接最大化波束成形增益。本文提出的基于主动学习的方法可达到最优的表现。

图片

图8:不同方法的平均波束成形增益

六、总结

本文提出了一种基于深度学习的主动感知方法,使得智能体在多个时间帧内主动与环境交互以最大化系统效用函数。本文提出的架构为利用DNN和LSTM单元将到目前为止的观测量提取成状态变量,并利用其设计下一时间帧的感知向量。在感知的最后阶段,利用另一个DNN将最终状态映射成为所需的结果。本文提出的深度主动学习框架在多个无线通信应用中表现极佳。数值结果表明,所提出的深度主动感知框架在基于射频链路的大规模天线阵列系统和RIS辅助网络中的反射对准方面都优于现有的信道估计方法。除此之外,本文所提出的深度主动学习框架也同样具有除无线通信之外的其他应用。

图片

图片
 ISAC通信感知一体化公众号简介 

ISAC通信感知一体化公众号由IEEE通信学会通信感知一体化新兴技术倡议委员会(ISAC-ETI)成立,由ISAC-ETI Online Content Working Group (WG4) 负责维护并运行。

ISAC通信感知一体化公众号组委会:

刘凡,南方科技大学

韩霄,华为技术有限公司

崔原豪,北京邮电大学

许杰,香港中文大学(深圳)

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多