享受科研，心怀远方：刘元玮学术采访纪实-公司新闻-北京天坦智能科技有限责任公司

天坦动态

享受科研，心怀远方：刘元玮学术采访纪实

2022 年 1 月，AMiner 团队推出 AI 2000榜单，旨在通过 AMiner 学术数据在全球范围内遴选过去十年间，人工智能学科最有影响力、最具活力的顶级学者，赞扬他们对于人工智能研究领域的卓越贡献，刘元玮博士，由于其在人工智能+通信与物联网领域做出的杰出贡献入选此榜单，近日他受邀接受了AMiner团队的学术专访，以下为专访全文：

儒雅、谦和、自信、真诚，目前任职于英国伦敦玛丽女王大学（Queen Mary University of London）的副教授刘元玮正是一位朝气蓬勃又具有英伦绅士气质的青年学者。

在“AI+通信”的研究领域中，他是一颗冉冉升起的明日之星。自 2015 年至今，他已在非正交多址接入、可重构智能表面、无人机通信以及机器学习等领域发表了近 200 篇高质量论文，其中包括多篇 ESI 高被引论文和 IEEE ComSoc best Reading 论文。

据谷歌学术统计，其所有论文的总被引次数已达到 1.3 万余次，获评 2021 年科睿唯安全球高被引科学家全球高被引研究者，IEEE 车载技术学会杰出讲师。由于其在物联网领域做出的杰出贡献，入选由 AMiner 评选的 2022 AI 2000。

近日，他向 AMiner 介绍了其代表性工作 STAR: Simultaneous Transmission And Reflection for 360° Coverage by Intelligent Surfaces，并分享了他的求学的经历、研究的感悟，以及在学生培养方面的心得。

求学英伦，乘风破浪

2013 年，刘元玮告别了母校北京邮电大学，来到了位于伦敦的玛丽女王大学，攻读博士学位。在博士生涯初期，他也经历过短暂的迷茫，尝试过许多研究方向。

直到 2014 年，在兰卡斯特大学访问期间，他遇到了自己求学路上的一位重要的“领路人”——Zhiguo Ding 教授。

从那时起，他将自己的主要研究方向确定为非正交多址接入（Non-Orthogonal Multiple Access，NOMA）技术，并一直钻研至今。在研究热点风云变幻的信息科学领域，一名研究者能够在求学初期找到能够为之奋斗十年的研究课题，实属一件幸事。

在他看来，Zhiguo Ding 教授对他的最大影响莫过于向他传授了“快乐科研”的思想，即享受科研、相信自己、为自己的研究成果而自豪。

2015 年，他结识了自己学术生涯中的另一座“灯塔”——南安普顿大学教授、英国皇家工程院院士 Lajos Hanzo。“生活中温文尔雅、平易近人，工作上一丝不苟、认真负责”，这是他对 Lajos Hanzo 教授的评价。Lajos Hanzo 教授在学术写作上给予了他极大的帮助和指导。时至今日，他还会时常拿出当年保存的 Hanzo 教授的手稿，来回味学习。

回首一路走来的研究之路，他总结道：开展某个方向的工作需要“天时、地利、人和”等条件，更为重要的是，研究者自身需要具有足够的精力，储备足够成熟的研究技能。

拥抱 AI，融会贯通

近年来，人工智能技术（AI）在计算机视觉（CV）等领域的应用取得了突飞猛进的发展。目前，在人工智能领域中，美英等国仍然处于优势地位，中国的研究者也正迎头赶上。除了高校，国外的 FLAG、国内的 BAT 等互联网巨头，以及三星、华为、高通等传统的通信公司都对 AI 技术研发有所布局。一些新的 AI 独角兽企业也纷纷开始崭露头角。

伦敦玛丽女王大学在 CV 领域也做出了许多重要的工作。受到来自世界各地研究者的启发，刘元玮萌生了将 AI 与通信技术相结合的想法。

2016 年前后，他开始了博士后阶段的工作。在此期间，他首先尝试将 AI 用于自己熟悉的非正交频分多址通信场景。之后，他又尝试将 AI 应用于无人机通信、可重构智能超表面（Reconfigurable Intelligent Surface，RIS）辅助通信等场景下。

之所以持续从事 AI in 6G 方面的研究，是因为现代通信系统需要优化的参数和系统指标非常多，系统关切的指标会随着场景、用户的改变而变化。而 AI 技术可以同时优化多项参数，并且针对具体场景、结合用户的行为规律进行预测，最终做出智能决策。相较于传统算法能搞好地适应场景的快速变化，基于 AI 的通信系统将更适用于车联网、高铁通信、室内通信等新场景。

通信系统的智能化是目前学术界和工业界普遍看好的大趋势。然而，AI in 6G 的研发也面临重重的挑战，例如：

（1）通信系统中的用户调度，资源分配等问题要求我们设计高维离散优化方法；

（2）对于深度学习在通信中的应用，训练和测试数据集合的获取和构建也成为了一大挑战，需要考虑数据的时效性、一致性、以及训练复杂度。相比于深度学习，深度强化学习对数据的依赖程度较低，是一种适合在通信系统中应用的解决方案；

（3）由于通信系统自身的复杂度较高，待优化变量较多，且通信系统对算法和决策的时延非常敏感，AI 算法的处理速度可能难以应对用户对实时性的要求；

（4）统一的测试环境和指标。AI+6G 的研究缺乏像 CV、NLP 等领域中的标准化测试环境。

为了促进该领域的发展，刘元玮团队正基于 OpenAI 的标准化 API 构建深度强化学习环境，平台将在不久的将来开源共享。

目前，他们正大力推进以下两个方面的研究：（1）AI for NGMA（Next Generation Multiple Access），即通过 AI 技术满足无线通信场景下的一些需求；（2）NGMA for AI，即通过资源分配等设计，满足分布式人工智能计算对于时延等指标的要求。

笑对疫情，探索 STAR

“在新冠肺炎疫情爆发之初，伦敦很快就进入了封城状态，学校、餐厅等公共设施普遍都被封闭了起来，人们的生活一时间慢了下来。” 回忆起那段经历，刘元玮感慨万千。

起初，他的工作受到了相当程度的影响，由于在家会受到一些生活琐事的干扰，很难保持亢奋的工作状态，工作效率直线下降。面对这种情况，他及时做出了调整，强迫自己将工作和生活分开，通过出门散步调整心态。

渐渐地，他发现从另一个角度来看，疫情之后的工作模式也产生了一些积极的变化。对于教职人员来说，原先的一些招生、开会、作报告、社交等杂事占用的时间变少了，反而留给研究的时间变多了，每天都有时间可以打开 arxiv 跟进最新的研究进展。也正是在此时，他可以查阅大量文献，着手大力推进 STAR 项目，静下心来研究电磁、物理、麦克斯韦方程组，对研究中的“硬骨头”发起攻关。

6G 通信的无线接入部分被广泛认为需要在原理和范式上取得革命性进步。在诸多候选技术中，RIS 及其营造的智能电磁环境获得了大量专家学者的青睐。简而言之，在传统观念中，电磁波等无线信号的传播环境被认为是不可控的。幸而，RIS 技术的出现使得我们可以在无线信号传播的路径中实现对电磁波的控制。

然而，传统的 RIS 大多只支持对信号的反射。刘元玮团队受到玻璃对光的部分反射、部分透射的启发，提出了融合反射和透射于一体的智能超表面（Simultaneously Transmitting And Reflecting Surface，STARS）。在硬件层面的实现上，刘元玮团队考虑使用“块阵列“和“超材料”两种方法实现 STARS。

就 STARS 的控制而言，STARS 需要同时考虑每个单元折射和反射信号的控制，于是 STARS 的控制相比传统 RIS 更加复杂。每个 STARS 阵元需要具备独立可调的表面电、磁阻抗，这样，每个单元中的面电流强度（对应电阻抗）和涡旋电流强度（对应磁阻抗）才可以被改变，从而人为的控制其产生的反射和透射信号的幅值与相位，对无线信号的传播环境进行“人工配置”。

然而，由于用户的移动和外部自然传播条件的不断变化，如何智能地根据当前的自然传播条件和用户分布智能地控制 STARS 成为了决定系统性能优劣的重要因素。针对这一问题，刘元玮团队提出了多种基于机器学习算法（强化学习、深度学习、元学习等）的智能控制方案。

之所以选择使用强化学习技术进行 STAR 的智能控制，是因为强化学习对于训练集的依赖程度较低，天然地适用于通信系统中的决策与控制问题。为此，刘元玮团队设计了两种方案：

（1）在多个基站进行采样，制作数据集，训练强化学习智能体；

（2）每一个智能体周围的传播环境较为稳定，使用自己基站的历史数据训练。

奖励函数是强化学习的“指挥棒”，设计奖励函数需要考虑的衡量通信系统性能的指标很多，比如速率、能量效率、时延等。在设计强化学习奖励函数时，需要根据具体场景进行分析，确定各指标的系数，在保证有效性的同时，使优化难度可接受，训练可收敛。

另外，为了训练能够通用于不同基站的人工智能代理，刘元玮团队提出了元学习方案。通俗地讲，元学习本质上是教会机器如何学习。在基于元强化学习的通信场景下，不再需要针对单一的样本来训练智能体，而是需要通过迁移学习在通信系统中训练具有普适性的智能体。这种新兴方案可以充分利用基站之间存在的相似性，从而通过知识迁移降低训练的时间和成本。

STARS 具有非常广泛的应用场景，比如在 STAR: Simultaneous Transmission and Reflection for 360° Coverage by Intelligent Surfaces 中所列举的 STARS-NOMA 蜂窝网络，工业通信场景，室内/室外信号增强以及海上通信等诸多应用场景。例如：

（1）从室外到室内的信号连接是一个重要的通信问题，通过把 STARS 安装在窗户上可以有效增强室外到室内信号的传输质量，尤其是对于高频段的毫米波/太赫兹信号；

（2）在通信感知一体化任务中，STARS 可以有效增加信号维度，以便于利用信号完成识别，感知等任务；

（3）STARS 还可以被用于增强通信的物理层安全，通过增强目标用户和发射机之间的信道，可以允许发射机使用较小的发射功率，从而有效降低信号被非合作用户窃听的风险。

6G 与后疫情时代

在后疫情时代，网络通信技术的重要性更加凸显了出来，越来越复杂的网络交互场景对 6G 技术的发展提出了要求。以学术交流为例，越来越多的报告、演讲、授课活动，甚至学术会议都以 Zoom、腾讯会议等形式进行，从线下物理空间走向了线上空间，提高了交流的效率，拓宽了知识传播的受众，使沟通的渠道更加畅通。

此外，就医疗行业而言，6G 、数字孪生、通感一体化等技术将推动值回病房、家庭医生问诊、数字病房、数字床位等概念的落地。未来，数字医疗领域将会呈现井喷式的增长。

值得一提的是，跨学科交叉研究对来自不同学科背景的研究人员的合作效率提出了很高的要求。以 IT+医疗为例，刘元玮指出：在与医疗机构的合作伙伴合作的过程中，需要以具体的工作为载体，让研究机构和医疗机构的合作者在工作中增进对各自领域的熟悉程度，互利共赢。

质效兼备，科研人员成长三部曲

相较于 CV、NLP 等较为成熟的领域，AI in 6G 的研究往往更具有突破性意义，然而数据积累、平台建设、系统构建等工作纷繁冗杂，可能会消耗大量时间。如何在学术成果的产出数量与质量取得平衡成为了许多 AI 研究者必须面对的问题。

在刘元玮看来，研究的数量和质量之前确实存在一些矛盾，但是二者并非完全对立，在某种程度上是可以兼顾的。但相对而言文章的创新性和质量更加重要。他对于博士生的培养一般分为以下三个阶段：

（1）基础训练（博士第 1 年)：在开始阶段，由于博士新生缺乏对整个领域的了解，他会将系统模型亲自交给学生设计，让学生在模型实现、论文写作、应对同行评审、论文修改还的实践中学习知识，获得正反馈，享受研究的过程，培养研究的兴趣。

（2）科研进阶（博士第 2-3 年）：当学生积累一定的经验后，开始尝试沿着导师给出的大方向自己寻找课题、构建模型。他在这个阶段通过密集的讨论帮助学生分辨出具有研究前景的课题和模型，打磨出 “Clean & Tidy” 的研究思路。此时，他会根据学生的强项为其指出具体的攻关方向（比如理论推导、工程应用、数值优化），做到因材施教。在这个过程中，他会帮助学生将“天马行空”的想法落地。

（3）独顶大梁（博士后期或博后阶段）：学生在某些方面的技能已经成熟甚至开始超越老师，成为了合格的科研助手，帮助导师实现宏伟的研究构想。这时，他的学生已经可以帮助他将其“天马行空”的想法落地。

精品论文-有三个特质

作为多篇 ESI 高被引论文的作者，刘元玮认为，精品论文往往具备 3 个特质：

（1）选题简洁而明确。2016 年，他发表了自己第一篇 IEEE JSAC 论文 Cooperative Non-orthogonal Multiple Access With Simultaneous Wireless Information and Power Transfer。在该论文中，他基于随机几何理论提出了一种环形模型，十分简洁明了。该模型是一项基础性的研究，随后被 NOMA、UAV认知无线电等领域的工作大量引用。

（2）具有较大的数学贡献。他于 2017 年发在 IEEE TWC 上发表了一篇题为 Enhancing the Physical Layer Security of Non-orthogonal Multiple Access in Large-scale Networks 的论文。其中，刘元玮推导出来了一种新的数学分布，可以被应用于 NOMA、物理层安全等多个领域，具有很强的普适性。

（3）文章叙述与表达精辟。2017 年，他与英国皇家科学院院士 Lajos Hanzo 合著了一篇题为 Nonorthogonal Multiple Access for 5G and Beyond 的论文，该论文被发表在 Proceeding of IEEE 上。论文撰写期间，Lajos Hanzo 院士花费了大量精力修改论文引言部分，将其视为艺术品仔细雕琢，达到了娓娓道来的效果。

快乐科研，高效比勤奋更重要

刘元玮一直对自己的学生倡导“快乐科研”的理念。他认为，研究者应该对研究感兴趣（be interested in the research），对自己的研究充满信心（be confident in the research），最终为自己的研究而自豪（be proud of the research）。

为了释放压力，研究者们可以培养自己的一些兴趣爱好，比如健身、跑步、艺术鉴赏。体育运动可以让研究者拥有健康的体魄，这对于可持续的科研工作十分重要。在伦敦这样的大都市里，公园、剧院、博物馆等公共设施可以为研究者们提供丰富的业余生活，做到劳逸结合。

此外，积极融入研究社区也是十分重要的。研究者们应该多参加学术会议，感受到自己融入科研大家庭的温暖与乐趣，与同行们交换意见，取长补短。“如果你在一个地方呆得太久，可能会忘记时间”。

“我们要多与他人交流，认清差距和优势，不能闭门造车。对于研究而言，高效比勤奋更重要。” 他有一个习惯——在上班的地铁上回复邮件，然后在工作时间内聚精会神，不被打断，保持高效率。

此外，他还坚持每周与自己的每位博士生进行半小时的“一对一”讨论，掌握学生的研究进度，为学生提供指导建议，帮助其提升研究的效率。

注：刘元玮每年 9 月至次年 1 月份招收博士研究生，研究方向为 6G 智能通信，可重构智能表面，通信感知一体化，感知与视觉融合等，欢迎有志于“AI+通信”的学子踊跃申请。详情查看他的个人主页（http://www.eecs.qmul.ac.uk/~yuanwei/）。

刘元玮博士，天坦智能首席科学家

英国伦敦大学玛丽女王学院长聘副教授，通信与计算机科学博士，(Artificial Intelligence and Big Data Enhanced Communication) ABC@QM 实验室负责人（团队16人，均为在读博士及博士后）, 伦敦大学玛丽女王学院和北京邮电大学智能通信实验室联合负责人，IEEE 高级会员，任通信顶级期刊IEEE Communication Letter高级编委，IEEE TWC和IEEE TCOM编委，IEEE JSAC/JSTSP等客座编委。获2020IEEE ComSoc EMEA杰出研究员奖, 2020IEEE 信号处理协会（SPCC）早期杰出成就奖，2021 IEEE 通信理论技术协会（CTTC）早期杰出成就奖，获2021 IEEE通信协会Young Professional杰出提名奖，2021 入选全球2021高被引科学家名单（Top 1%），入选斯坦福大学公布的世界Top 2% 科学家名单（2020，2021）。

北京邮电大学本科及硕士学位，伦敦大学博士学位，长期专注于通用人工智能框架及算法，未来5G/6G通信，非正交多址接入（NOMA），通信感知一体化, 可重构反射面通信，无人机通信，物联网通信和人工智能的研究，在相关领域发表英文专著/章节四部，顶级期刊会议220 余篇，其中ESI高被引论文15篇，IEEE ComSoc Best Reading论文17篇，谷歌引用率10,000+ (h-idex 47)。受邀国际报告60余次。