我12年的工程师生涯都在做“超前一点的事情”
扫描二维码
随时随地手机看文章
从小到大我都不是因循守旧的人,总是喜欢应对各种未知。2006年进华为的时候,面试官问我想去什么部门,我说“想做超前一点的事情”,于是就来到了无线研究部。
期间虽然部门几经变迁,但是做的事情一直是和创新有关。这些项目有成功的,也有不那么成功的。但即使不成功的项目也可以从中吸取教训,为更大概率的成功增添知识和经验。
毛头小伙和白胡子老头的PK
做WiMAX(全球微波接入互操作性)标准制定工作是一段比较愉快的时光。我经常有机会参加各种国际标准会议,除了可以增加见闻,还可以提高英语水平,虽然标准会议的各国方言口音经常搞得人不知所云。
2007年,我们在标准上的经验和影响力不像现在那么强大,基本上是作为跟随者。标准的重要职位如主席/副主席、报告人等,我们也很少占据席位。年龄的差别也相当明显,一个有趣的场面就是,国外厂商的参会代表很多都是白胡子老头,而我司的参会代表个个都是小年轻。这也让我们更加谨慎认真,如履薄冰。
当时我们不少人做标准创新的方式是先熟读协议前期的文档,然后找找有什么漏洞或不完善的地方,提个方案把“洞”补了,比如改了一个字段或者新增一个字段。这种查漏补缺的创新方式虽然简单,但不是系统性的解决方案。在后来的5G标准制定过程中,我司的标准影响力和系统方案设计能力有了根本改善,我想这也是得益于在早期标准活动中吸取的经验教训。
WiMAX后来并不成功,除了几个少数运营商有部署之外,基本上完败于LTE。究其原因,很多人分析是一些IT厂商想颠覆传统电信架构,按照IT的思路来制定标准,但完全抛弃传统并不符合运营商的利益。不过,IT企业试图进入电信领域的尝试从未停止,最近Facebook主导的电信基础设施联盟(TIP)就在往这方面发展。
尽管有些遗憾,但对于我而言,经历一次完整的标准制定过程是人生中非常宝贵的财富。
选了最难走的那一条路
IT跟电信领域结合的另一个例子就是Cloud RAN,这个概念在2010年还非常新,其云化的思想对后来的网络架构发展影响非常大。
我们当时走的研究路线跟常规思路相比也是差异巨大,是用纯软件和通用CPU架构来实现Cloud RAN的基带以及高层处理,而友商仅仅是传统专用硬件BBU堆叠的方式。选择走这条最难的路,一方面是部门对创新要求比较高,另一方面也是因为IT厂商的支持。
这个创新路线带来非常大的挑战:首先,用纯软件实现基带处理对处理的实时性要求非常高,操作系统、软件代码、并行化调度框架等都需要进行针对性的优化,还需要对物理层协议非常熟悉。其次,当时我们的团队在上述能力上基本上是零基础,大部分同事甚至都不知道怎么使用linux操作系统。
没有基础,那就从基本功开始练起。大家开始研究各种《7小时掌握linux》、《3天精通c语言》、《深入浅出设计模式》、《LTE从入门到精通》等快速上手的书籍。一边啃协议,一边学习实时系统编程和效率优化。努力带来了回报,经过一段时间之后,LTE的基线版本搞出来了。
在Cloud RAN架构下,引入一个问题,BBU和RRU之间的传输走什么形式,是用CPRI(通用公共无线接口)光纤,还是别的方式?可不可以重用城域网的分组传输网络?针对这一设想,部门专门成立了一个研究分组化传输CPRI信号的小组,由我来负责。我们小组把Cloud RAN组网情况下的传输带宽、时延、丢包率、时钟同步等要求都捋了一遍,发布了一个白皮书,同时在软基带LTE原型上做了分组化传输CPRI的验证。
事实证明,当时的研究方向相当地具有前瞻性:Cloud RAN架构目前在日本、韩国等大规模部署,分组化传输的思想也已经发展成为当前的eCPRI架构。
但我们当时不知道,软基带样机的基础,在后来跟运营商联合进行的5G标准化前夕的大规模技术验证过程中,会起到非常关键的作用。
两个战场的5G测试
2015年,我司和运营商D进行5G技术的联合验证。由于彼时产品线还没有5G样机,但我们的软基带样机具备条件,因此最后拍定由我们研究团队来承接第一波5G标准前技术大规模验证。
是机遇,更是挑战。和D的联合技术验证包含了很多技术方面,如Massive MIMO(高维多天线)等,而当时还没有一个具备条件的机房和实验外场可以同时支撑上述验证。
机房需要规划和建设,由于我对样机的硬件架构比较熟悉,这个任务就落在了我头上,而我也没有任何建设大规模机房的经验,只能一步步摸索:布局规划、光纤、网络、大规模E9000系统安装和配置、数字中频集群安装和配置、10GE交换机集群配置和流量均衡……系统规模是如此庞大,涉及的设备是如此的繁杂,除了连续的加班赶工之外,也幸亏得到有经验同事的帮助,机房顺利建设起来并投入使用。原型设计相当复杂,光纤和网络数不胜数,以至于有段时间机房的光纤和网络没有别人敢动,有人想要改配置或者连接都来找我。出差的我被误以为是实验室的管理员。
最终的验证采用了Cloud RAN架构,中射频放在10公里外的一个高校,而软基带则在机房。第一次拉这么远的光纤,也碰上了很多问题,光纤不通、闪断、对号错误、施工挖断等。
最折磨人的还是Massive MIMO系统的校正,这个过程是对整个系统的验证,但总是无法通过测试。记得有一个时钟不稳定的问题,怎么都找不到原因,大家先是猜测“是不是板上晶振指标不够?”可换上了时钟源,效果还是不行。怎么回事?是不是换的时钟源太旧了?我们找来了指标最好的时钟源,结果还是一样。甚至后来借来了原子钟,问题也依旧没有进展。
直到有一天,我巡查机房的时候,仔细检查了设备之间的连接,发现有个时钟线的主从关系接反了,一调整异常现象竟然消失了,苦苦寻求的答案终于在最后一刻解开了真相。
在这个过程中,基带、数字中频、分组前端交换、光纤交换、射频、干扰等各个方面都轮番发生过故障。历经了1个多月的调试磨合,十几个通宵排查,我们摸清了规律,系统逐渐稳定下来了。出差3个多月时间里,从春夏之交到秋天,除了一次端午节强制下电休假,其他的日子没有休息日,连续工作时间很长。换来的结果是好的,第一阶段的测试取得了圆满成功。
和D的第二阶段测试在海外进行。外场测试的时间只有3周,包括2周调试和1周正式测试。虽然在国内有一套镜像环境,但是海外的环境跟国内环境很不一样,站架得很高,测试终端的位置比在国内要远得多。我们通过反复测试验证发现,之前申请的测试场地范围远远达不到最佳峰值的要求,只能反复跟海外运营商员工沟通,拿出详细分析和验证,紧急申请到新的测试场地。
场地有了,没有电和网络怎么办?我们跟海外代表处的同事一块想办法,搞柴油发电机、租车、电力猫、Wifi自组织网络,能想到的招都用上了。最后的性能居然超越了在国内镜像环境测到的峰值,这是所有人都没有想到的。
在战火的洗礼中成长是一件幸运的事,经历前两个阶段的大规模测试,为后来的IMT-2020中国5G测试中最高峰值,以及最近的业界最高频谱效率的突破,积累了大量的实战经验。
这些年,公司的研究能力在逐步增强,从早期的单点技术,到后来的系统化的技术体系,在5G的研究和标准化过程中表现的特别明显。我司在5G的编码、复用、多天线、波形、垂直行业应用等方面都有系统性的产出。随着5G NR标准的演进和商用化进程的逼近,我们的研究和创新还将向着纵深方向发展。
关于创新,我觉得需要一点点超前的思维,很多点超前的准备。尽管入门需要花不少精力学习,但随着知识的积累,百宝箱里的东西会越来越多,渐渐有一种融会贯通的感觉。就像一个武学高手,前面若干年苦练内功和外功,最后任督二脉打通,内外功夫随心所欲为我所用。
我的境界离打通任督二脉还有不少距离,但不断丰富自己的经验和阅历,不断地向更新更深的领域进发,探索未知,挑战未来,始终能让人精力充沛,乐此不疲。
来源:心声社区