站在冰岛雷克雅未克的海边,当梦寐以求的极光终于出现,我心中的雀跃竟奇异般地沉淀下来。极光像被女神吹动的巨大纱幔,在天幕与海水中流转,连带着海风都温柔下来。
不远处有人举着手机,想要将极光实时分享给远方的人。这份跨越山海的传递,让我看到了网络连接的意义:即使身处“世界尽头”,也能让此时此刻的所见所感,传播到世界每一个角落。而这也正是我此行的目标——为冰岛的客户升级网络,让这片极地的对外连接更加高效、稳定,让“天涯若比邻”成为现实。

在冰岛的钻石沙滩
来冰岛之前,我经历了三年的技术磨砺。时间拨回2022年1月初,为了提升用户上网体验,全光家庭系统集成开发部计划在光猫上搭载2.5G高速网口,这是一个全新的需求。
因为我曾在DQ ONT(光网络终端)创新样机项目中边学习边开发,并提前完成了项目目标,展现了快速学习和端到端交付的能力,被指定为项目负责人。此时我刚入职一年,能接到这个重点项目我深感荣幸。
原方案中的主芯片不支持直出2.5G网口,我们决定外置一颗芯片来分担重任。通过对市面上芯片的筛选,我们最终锁定了Q芯片作为“外挂”,目标是在2022年3月初导入专为提速而生的Q芯片。时间仅剩一个月,对我来说极具挑战。
研发初期,在组内专家罗杰指导下,我顺利完成了芯片驱动适配。在千兆速率传输测试中,芯片也表现得一切正常。但当流量下降到百兆时,芯片突然出现持续丢包,严重影响正常使用。能扛住高速传输,怎么反而在低速时掉链子?
芯片表现完全不符合预期,让我内心焦灼起来。我没日没夜地定位问题,多轮排查后将问题范围锁定在了芯片接收端,但由于接收端涉及到软件、硬件、芯片等多个领域,复杂程度远超预期。最艰难的时刻,主管协调硬件、芯片专家组成联合攻关组。
在首次的攻关会议上,其他领域专家口中的专业术语让我一头雾水。我跟不上讨论节奏,只能迅速记下关键词,会后抱着技术文档连夜恶补,希望尽快打通知识壁垒,把握排查方向。
第一周,我们“扫雷”般试过了所有常规路径,却没能定位到问题根源。第二周,我们开始重新审视那些曾被搁置的边缘猜想,此时最初被认为发生概率低的“芯片逻辑缺陷”,又重新回到我们的视野。然而,对芯片内部底层问题,我们定位手段有限,主管当晚就请来芯片专家李俊杰支援,加速定位。
我们通过高速示波器捕捉信号波形,无序起伏的波形让我这个软件出身的程序员一时不知所措,而李俊杰在旁,沉稳安慰道:“别怕,我们一步步来。”
我看着他先将原始波形解码成“01”序列,再根据编码规则“解密”,手动将波形一步步还原成“加密”前的状态。他不停在纸上手写着公式,边写边在示波器上补充测试,一通操作后,他抬起头,在纷繁复杂的波形和数据中精准指出了波形畸变的位置:“问题就在这里!”
这番操作让我佩服不已,原来这就是专家的魅力!我在心里暗暗决定,也要努力成为这样的技术专家。
就在我以为问题定位完成时,他保持着一贯的严谨,手动计算了丢包率,并与实际测试结果做比对,完全吻合,验证了结论。原来是我们使用的通信协议版本与芯片底层不一致,导致芯片无法完全兼容,进而引发了丢包。
问题来源锁定后,在SE(系统工程师)朱滔的指导下,软硬件联合团队共同制定出了电子开关解决方案,让芯片自动适配传输通道,维持稳定传输。
2022年3月,耗时两个月,我们提前完成了方案测试与商用交付。随着 Q 芯片的顺利导入,2.5G网口在光猫上成功搭载,我们达成了升级网络体验的目标,为用户修建了一条畅通无阻的“高速”,让承载着精彩与未知的“信息快车”瞬息即达。
“高速”的贯通,解决了提升速率的核心挑战。2022年11月底,正是某新方案主芯片大规模上量的关键时期,河北省沧州市却传来现网报障:部分用户家中频繁断网,需要手动重启才能临时恢复,严重影响用户体验。
我们在实验室远程分析现场日志后,初步断定是用户家中光信号较差导致的设备假上线,于是当即推出带有自动恢复功能的软件版本,让一线给用户升级。但现网报障量仍在持续增加,供应商紧急要求华为派专家去现场解决问题。
为了了解清楚情况,我买了次日一大早的火车票。到达沧州后,我联系了各地市的装维师傅,拿到了报障用户的电话,挨个打电话询问用户是否接受上门走访。当时沧州正处于小规模疫情中,有些用户比较谨慎,婉言拒绝,好在有部分用户同意了。
走访初期,我们发现有些报障用户家中的光信号的确较差,这与实验室的分析吻合,升级了光猫后,问题便迅速解决了;还有些用户只是使用不当,如设备叠放过热、Wi-Fi位置摆放不当等,问题也迅速解决了。但有些用户家里光信号很好,也没有任何使用问题,却还是出现了频繁卡顿甚至断网的情况,这让我感到很不安。
就在我边走访边思考时,一位刚刚走访过的用户打来电话说:“你们的光猫在升级后网络还是会频繁卡顿。”我心头一沉,立刻折返到用户家,发现在光信号正常的情况下,用户家的光猫1小时内出现了十几次 LOS(信号丢失)告警,这让我警觉起来,背后一定还有隐藏问题!
我立刻同步信息,团队迅速组建了多领域专家攻关组。在这个过程中,又有多个装维师傅向我反映:“产品初次安装就激活失败。”我马不停蹄地跟着师傅排查了两天,却毫无收获,甚至有用户失去耐心,提出更换其他厂家的光猫,这让我内心低落。
主管田涛特意打来电话,安慰我:“攻关组一直在连轴转分析现网数据,测试团队也正尝试在实验室复现问题,你不是一个人在扛。你在一线要稳住,你背后有我们整个团队。”挂断他的电话,我安定了不少。
现在的迫切需求是复现问题,我想,既然实验室一直无法复现,我可以在问题发生的当地试试。我找到装维师傅协调了一个小基站里的两颗暂时闲置的光模块,用于搭建复现环境,然后一头扎进了这间仅二十平的简易机房中。
起初屋里连坐的地方都没有,我就坐在一卷废弃的电线上,累了就蹲一会,后来我在屋后找到了一把塑料椅子,才算有了临时“工位”。
我在小屋中边把走访收集到的现场数据整理出来比对,边搭建环境复现问题,进行组合测试,找到多台光猫反复注册验证、模拟不同光衰值、调整上电注册顺序、切换带宽分配模式。连续三天“苦战”后,我成功复现了问题。
我把这个好消息告诉研发团队,他们马上远程协助我一起定位问题。但数据很奇怪,仅从软件层面来看,很难看出根因,于是团队又紧急协调了一位光领域的同事柯雄伟前来支撑,负责对现场光路环境进行分析,并“人肉”带来一台协议分析仪。这是软件分析领域的“高级”设备,我们都没接触过,只能边照着说明书学边操作。幸运的是,在仪表的帮助下,我们很快找到了异常。
顺着异常抽丝剥茧,我们最终定位到问题是沧州当地的网络带宽配置与我们预期不符,没有给光猫留出足够的“通话时间”,导致通信中断。我们迅速给出了软件解决方案并落地,成功解决这次危机。
问题解决那天晚上,我和柯雄伟一起走出小屋,这才发现沧州的冬日户外其实很冷。我们一直在小屋里,周围布满了不停发热的设备,所以没感觉。我裹紧衣服,暗自数了数日子,居然还有几天就是元旦了。来到沧州这一个月,我对时间都没有概念了,有一种“洞中刚数日,世上已千年”的不真实感。

在机房复现问题
问题解决后,我们的工作还未结束,为确保现网稳定,我继续走访了沧州的周边村落,给光猫做升级。此时部门考虑到我出差时间较长,多次询问要不要换个人过来,但我还是拒绝了,毕竟这个问题是我从头跟进的,万一出什么状况我比别人更清楚,能快速定位。
接下来我天天换着各种交通工具前往不同的村落,有一次我还误上了一辆“黑车”,在村口被几辆警车拦下,司机被当场扣押。好在我表明来意后没有被牵连。但是我只能下车,徒步进村完成排查工作。
元旦当天,我在县城酒店吃着德克士外卖,通过视频回应着远方父母的关心。一周后,确认所有问题都已解决,我才安心踏上归途。
没想到,一个月后的2023年2月,临近春节,广西现网又出现了客户报障。我经历了沧州的现网定位,已经有了一些心得,于是主动请缨。主管有些犹豫,他看我刚出差一个多月,在外面过了元旦,这次的问题还不明朗,可能要在外面过春节,所以想换个人去。但是我知道,团队每个人都有工作和家庭事务缠身,只有我既有现网定位经验,又是单身,是最佳人选。
最终,硬件主管增派了一位硬件同事与我一起去。我俩当天坐着火车赶到广西玉林的一个小山村。走访用户时,我们排查了所有可能,但都没什么头绪,直到一个细节引起了我的注意:用户家的电灯好像会时明时暗。会不会是供电不稳?我立刻在现场做起对比试验,同步联系研发实验室也挂测供电不稳场景下的产品表现,很快两边都复现了问题,我的猜想得到证实。
我们确认是当地不稳定的电压无法满足新产品要求,产品本身并没有问题,用户在增加稳压源后网络就顺畅了。于是赶在春节假期前的最后一个工作日,我风尘仆仆地回到部门。迎接我的是同事们的笑脸和主管如释重负的感叹:“你在外面我一直不放心,你回来了我才能安心过年!”
两次出差现网的经历,让我切身感受到了断网给用户带来的困扰:有的学生在上网课时被反复打断,有的老人因为无法跟家人视频而心急……这些场景让我跳出了研发视角,读懂了“网络稳定”四个字的重量。
2024年,在积累了芯片研发和现网保障的经验后,我先后完成了两款芯片的导入落地,为后续应对复杂技术难题筑牢了底气与自信。在上半年L运营商集采中,系统芯片遭遇性能功耗瓶颈,多种优化方案均未达预期。我依托前期芯片适配的经验,创新调试手段,仅用两周便突破了性能和功耗指标,最终助力产品拿下集采第一名的好成绩。
凭借在多个核心项目中的攻坚表现与成果交付,2024年8 月,我顺利通过光产品线选拔年轻人才的“西点技术任职”,也因此得到了更多机会。
2024年10月,冰岛客户提出了升级库房的需求,部门想借此机会实现产品收编,为后续版本长期演进减轻负担。得知有出差见客户的机会,我第一时间报名。
这是我第一次出国,而且途径国家的官方语言都不是英语,这让我有些不安。在比利时办理转机时,工作人员的英语口音很重,我以为她在说法语,用英语小心翼翼地说:“请问可以用英语复述一遍吗?”她有点生气地说:“我已经在说英语了!”我连忙道歉。这些令人啼笑皆非的经历也成了这次出差途中的小插曲。

在教堂顶层俯瞰雷克雅未克
抵达冰岛后,我们迅速与客户敲定方案细节,新版本也顺利通过测试。方案落地阶段,我们用自带的两台交换机,在客户的仓库空地搭起临时升级区域,在团队专家的远程协助下,优化组播配置,提高升级效率,用5天完成了近千台光猫的升级,为后续版本持续演进奠定了可靠基础。
工作之余,我和同事在雷克雅未克的特色餐厅里感受当地风味,还去了冰川湖、钻石沙滩。站在广袤的冰川前,走在散落着“冰川钻石”的沙滩上,我不禁生出奇妙的感叹:我们的产品竟能跨越大半个地球,在这样的极寒之地稳定运行,真的很有价值。

在轮船上拍摄的冰河湖浮冰
来冰岛之前,我对“年发货量5800万”并没有实感,也没有切身体会其对客户带来的深远影响。来到这远隔重洋的世界尽头,站在客户库房,面对着海量的现网,我才将“5800万”这个数字与现实画上等号。从冰岛回来后我更加明白,研发人员站在产品的起点,更应该慎之又慎,因为哪怕只有一个小问题,也会对海量用户造成困扰,这也成为了我之后写好每一行代码的信念基石。
极光终会消散,纱幔缓缓收拢,夜空重归沉寂。但我知道,有些连接一旦建立,便不会随着光晕的褪去而消失。我们在实验室与现网中的每一次调试和优化,最终都会凝结为用户家中光猫的一点指示灯,在某个角落安静的亮着,守护信号的通畅,也守护数字时代里人与人的连接。

部门合照(第一排右一为作者)