華為硬件工程師:做了10多年研發(fā)后才真正懂得師父的話
發(fā)布時間:2023-10-30作者:admin點擊:329
電源研發(fā)精英圈 2023-10-27 20:02
發(fā)表于湖南十年硬件時光,如白駒過隙,記憶中那個青澀而倔強的少年迎著風(fēng)雨一路走來,眼角多了幾絲皺紋,雙鬢添了幾絲華發(fā),胸中唯有“堅持”二字,致敬無悔青春。
01
師父的一句話讓我震驚很久
25歲那年,大學(xué)畢業(yè)的我加入了一家華為合資的公司。五一后的第一個星期一,我來公司報到,領(lǐng)導(dǎo)安排一位資深的單板工程師做我?guī)煾?。師父沒跟我講具體的業(yè)務(wù),只是淡淡地說了一句話:“做單板工程師,特別是我們搞硬件的,要學(xué)習(xí)的東西很多,要經(jīng)得起失敗,耐得住寂寞,一步一步走扎實?!蹦贻p氣盛的我,除了口頭“嗯嗯”地應(yīng)付著,心里卻不服氣:我的字典里就沒有“失敗”這個詞。
一周后,我接到了第一項工作,將一塊已經(jīng)完成的單板做一次改板,原因是這塊單板的時鐘方案有問題。這么快就有活干了?第一次就是做一塊自己的單板?我高興壞了,但接下來開始犯難,憑借我在學(xué)校做過的那點單板,以及對時鐘的了解,根本不知道時鐘會出啥問題。沒辦法,拼命學(xué)唄。
我感覺渾身有使不完的勁兒,除了自學(xué),遇到不懂的就不斷請教,很快就弄清楚了時鐘抖動、鎖相環(huán)、精度、頻偏等基礎(chǔ)名詞,找出了問題的根因。之后,我做的單板上電調(diào)通,一次歸檔。
很快,第二件事情來了——為一家運營商定制全系列交換機產(chǎn)品。這是一個非常巨大的定制BOM(物料清單)方案,涉及整機的近50種形態(tài),上百種BOM清單。我的內(nèi)心有點崩潰,但也沒什么好辦法,扎扎實實學(xué)唄。
每個BOM清單中的每一個物料,大到整機機柜,小到一顆螺釘,我都不停地問自己:我弄清楚每個細節(jié)了嗎?所幸,最后所有的清單無任何紕漏,達到100%準(zhǔn)確。這也讓我養(yǎng)成了保持至今的一個習(xí)慣,就是經(jīng)常問自己:這件事情我到底明白了沒?如果哪個細節(jié)我還回答不上來,有時候還會莫名地嚇出一身冷汗。
很快,2年過去了,期間我完成了3塊單板的設(shè)計,全部一版歸檔,我也當(dāng)選部門的年度最佳新人。
02
一次認清自我的出走
新員工時期的順風(fēng)順?biāo)屛议_始有些飄飄然,對自己有些盲目的認知,更沒有將師父那句話放在心上。當(dāng)時的我,認定自己完全可以勝任更高的工作,可以打破人生的條條框框,交換機硬件相關(guān)的設(shè)計我都一清二楚了,已經(jīng)沒什么挑戰(zhàn)了,于是我選擇了離職,希望找一個更具挑戰(zhàn)的平臺去進一步發(fā)掘自己的潛力。
我去了一家小公司擔(dān)任硬件總負責(zé)人,希望自己可以獨立完成一些設(shè)計。但說易行難,之前的我也就是一名只會把原理圖上的器件簡單拼接的“連連看”硬件工程師,對大硬件領(lǐng)域的知識和結(jié)構(gòu)完全一知半解。而現(xiàn)在,沒有結(jié)構(gòu),沒有互連,更沒有熱設(shè)計和工藝,所有和硬件相關(guān)的設(shè)計都要自己一肩挑,技術(shù)上的短板一下凸顯出來。
我開始反思,以前自己做得多好,很大程度上是依賴于公司的大平臺,離開了平臺,又缺少個人的技術(shù)積累,如何能確保自己在硬件領(lǐng)域做到最好呢?
就這樣頂著壓力工作了兩年,雖然算不上成功,但至少對自己有了更清晰準(zhǔn)確的認知,硬件領(lǐng)域博大精深,而我資歷尚淺,想要有一番作為還需沉下心來,摒棄浮躁,穩(wěn)扎穩(wěn)打,提升自我。
03
重新出發(fā)證明自己
經(jīng)過慎重的考慮,我入職了當(dāng)時的華賽,后來華賽并入華為,我成為華為的一員。回到大平臺的我,決定“重新做人”,一步一個腳印打牢自己的基本功,在多個版本的洗禮中逐漸成長起來。
入職的第一年某一天,領(lǐng)導(dǎo)突然找我,問我:“有個緊急的項目,半年內(nèi)完成一套存儲產(chǎn)品的交付,你愿不愿意做?”以往一個產(chǎn)品的交付需要大概一年的時間,這次只有半年,我還要身兼SE(架構(gòu)設(shè)計)和硬件開發(fā),挑戰(zhàn)巨大。但我想都沒想就應(yīng)承下來,因為我一直希望能有機會重新做出最好的單板來證明自己。
開發(fā)過程壓力非常大,但我們5人的小團隊始終朝氣沖天,所有人都非常期待能交付出一套精品。當(dāng)時碰到最棘手的事是硬件EMC(電磁兼容)問題,我們第一次做EMCRE(輻射騷擾測試),輻射量超出設(shè)計標(biāo)準(zhǔn)10%,完全沒想到結(jié)果這么嚴重。以前其他單板的設(shè)計也用過這顆芯片,知道該芯片的輻射量有些偏大,因此在單板和結(jié)構(gòu)設(shè)計上已經(jīng)做了屏蔽優(yōu)化,但實際測試后發(fā)現(xiàn)芯片的輻射能量完全超出我們預(yù)期。這個測試如果不通過,我們的產(chǎn)品是無法上市銷售的。
我們和EMC工程師泡在實驗室一個多月,一直在尋找破解的方法。首先想到的是“堵”,簡單來說,就是想盡辦法讓設(shè)備輻射的能量封閉在產(chǎn)品空間內(nèi)部,減小對外的輻射。但我們反復(fù)測試發(fā)現(xiàn),產(chǎn)品通過結(jié)構(gòu)進行輻射屏蔽的難度很大,結(jié)構(gòu)縫隙其實非常難以控制,往往這邊堵住,那邊又泄漏出來。實驗的過程中,有時候第一次測試通過了,重新插拔了模塊,或者機箱做了一些搬動,再重新測試,輻射量又超標(biāo)了。而且如果堵得非常嚴密,又對生產(chǎn)結(jié)構(gòu)裝配精度要求非常高,結(jié)構(gòu)專家認為這種設(shè)計生產(chǎn)加工難度太大,無法量產(chǎn)。就在我們反復(fù)測試,百思不得其解之時,有個同事說了一句,“堵”行不通的話,那我們可不可以考慮從源頭解決?芯片的輻射大,是不是因為我們設(shè)計忽略了某些問題?
一語驚醒夢中人,之前我們都陷入在常規(guī)的思維里,太關(guān)注一種方法,完全沒考慮芯片優(yōu)化這個方向。我找到芯片廠家,了解到該芯片對電源和時鐘均比較敏感,如果能降低電源紋波并適當(dāng)?shù)貎?yōu)化時鐘信號質(zhì)量,就有可能解決問題。通過不斷的優(yōu)化和嘗試,在芯片上做了一定程度的優(yōu)化,再加上結(jié)構(gòu)屏蔽作用,問題得到了圓滿解決。
解決問題的方法有很多,有時候思維上會存在一些先入為主的想法,這個時候發(fā)散思維很重要,認真了解問題并多集思廣益,才有可能找到解題之道。
04
往前多走一步也許就是勝利
2016年開始,我開始接手硬件DE的工作。在還沒完全熟悉DE工作時,一個全新的項目開始了,是下一代存儲系統(tǒng)的預(yù)研?;仡櫳弦淮a(chǎn)品在現(xiàn)網(wǎng)暴露的一個個可靠性、可維護性的問題,想想客戶的抱怨和維護兄弟的無奈,我暗暗下定決心,下一代產(chǎn)品一定要給大家一個交代。
項目經(jīng)過多輪討論后確立了總體框架,但是剩下的方案評估進展異乎尋常的艱難。作為硬件DE的我,常常為了一個方案,陷入長時間的思考,決斷過程非常糾結(jié)。比如硬件架構(gòu),我們要在一定密度內(nèi)實現(xiàn),什么密度最合理?容量性能如何配置?我和團隊反復(fù)權(quán)衡了不下10種方案才確定。
背板設(shè)計是開發(fā)階段最大的“攔路虎”。因為背板有源器件(需供給電源的器件)的問題,生產(chǎn)環(huán)節(jié)和現(xiàn)網(wǎng)已經(jīng)出了好幾個相關(guān)的硬件問題,盡管我們也針對性地修改了背板設(shè)計,但是治標(biāo)不治本,設(shè)計團隊面臨巨大的壓力。維護人員提出訴求:新方案能不能做背板無源化設(shè)計?
一開始我的內(nèi)心是拒絕的,之前幾個版本的相關(guān)人員都想做,但都沒成功,我們能成嗎?但心底又有另一個聲音提醒我,不能慫,怎么能還未開戰(zhàn)就承認失敗呢?我們開始剖析背板上的有源部分電路的功能并逐步將背板上大部分有源功能移除,一開始進展很順利,可就在我以為曙光到來之前,發(fā)現(xiàn)背板的電子標(biāo)簽功能難以移除。這也是之前幾次無源化設(shè)計的難點所在。以前電子標(biāo)簽放在背板上,存在失效問題,但是誰也沒想過拿走這個電子標(biāo)簽,因為明顯不符合常理嘛!我們嘗試把電子標(biāo)簽放在其他部件上,都沒有成功,唯一可行性的替代方案是轉(zhuǎn)移到可拆卸的掛耳上。但如果轉(zhuǎn)移到掛耳上,以前更換背板的過程,電子標(biāo)簽的存儲位置更改,勢必會帶來生產(chǎn)流程變化以及軟件流程的變化。
我拉通制造、裝備、驅(qū)動和硬件集體討論,大家集思廣益,分析了整個電子標(biāo)簽加載以及現(xiàn)網(wǎng)備件更換等多個場景,經(jīng)過技術(shù)反復(fù)論證,修改了生產(chǎn)裝備加工流程,解決了掛耳上電子標(biāo)簽應(yīng)用的可靠性問題,實現(xiàn)了背板無源化,開啟了業(yè)界存儲無源背板的先河。
初戰(zhàn)告捷,我們采用的4U16刀片設(shè)計方案也得到了周邊團隊的認可,但樣機展示過程中我們又發(fā)現(xiàn)系統(tǒng)盤的維護方式不甚理想,目前主要是將系統(tǒng)盤安裝單板進行翻轉(zhuǎn)的方式維護下面的業(yè)務(wù)盤,配置和維護方式不靈活。怎么改善維護方式,讓方案更具競爭力呢?我想到了免螺釘扣板方案。硬件扣板一般都是有螺釘固定的,此前并沒有免螺釘?shù)南壤瑘F隊很多人認為方案不可行。通過激烈的爭論,我站在客戶的角度說服了大家,我們不能總是讓客戶現(xiàn)場拿螺絲刀來拆裝扣板吧,為什么不嘗試一下?
我們試了多種不同緊固件的組合和拆裝方案,扳手的設(shè)計尺寸、連接器的選型和插拔力評估、公差分析、PCB的布局等等。一次次制定嘗試新方案,又一次次地推翻重來,不同組合試了十多次,大家都有點麻木了,但是心中那份對技術(shù)的執(zhí)念支撐著我們沒有放棄。一次又一次,堅持終于有了回報,采用新型卡扣和扳手的方案完美地解決扣板安裝插拔力的問題,免螺釘扣板是可行的!
一開始,我還不太敢相信,真的能行嗎?我們與結(jié)構(gòu)專家反復(fù)確認這種安裝方式,確認扳手設(shè)計和插拔力數(shù)據(jù),結(jié)構(gòu)專家都快受不了我的“嘮叨”了,只是一遍遍驗證確認沒有問題。團隊每個人都非常興奮,我也充滿了成就感。是的,我們做到了!
解決問題沒有捷徑,碰到問題多往前走一步,再堅持一下,說不定就柳暗花明了。幸運的是,我們從沒有輕言放棄,終被成功眷顧。
十幾年來,我一直在硬件開發(fā)的崗位上耕耘,沒有考慮調(diào)整發(fā)展方向,因為我總能從一個又一個難題中找到解題的樂趣,不斷收獲價值感和成就感。任總說過,決勝取決于堅如磐石的信念,信念來自專注。什么是專注?也是在十年后的今天,我才深切領(lǐng)悟到師父那句話的含義,就是堅持做好一件事情,經(jīng)得起摔打,耐得住寂寞。
在專注和堅持中追尋夢想的燈塔,終會點亮希望之光。期待在下一個下下個十年繼續(xù)成為那個更好的自己,加油!