大學畢業(yè)被分配到某研究所工作,入職后先后跟著羅、高以及張師傅學習電子硬件設計以及匯編、C語言等編程。在各位老師的精心指導下,通過實踐和培訓,終于開始成長為一名電子技術工程師。
進所第二年,盛夏,開始參與一項系統(tǒng)的研發(fā)工作,項目當時很急,系統(tǒng)的技術負責人是張主任,其他的成員包括小柴、小倪等,都比較年輕。系統(tǒng)采用多DSP分布式控制,通過總線插卡擴展。我主要負責底層的數據采集、處理并存儲到雙口RAM中。
項目一開始進展良好,硬件設計調試和軟件編寫調試都按照預期進行。在進入系統(tǒng)聯調后,項目被卡住了。我設計的板卡存儲到雙口RAM后,上位機讀取錯誤,上位機通過雙口RAM發(fā)給我的數據讀取出來也不正確。這個問題整整折磨了我們好幾天,期間做了大量的測試和仿真,始終找不出任何頭緒。隨著時間推移,項目組的氣氛開始越來越緊張。問題是各自檢查自己的設計和仿真數據都是正確的,一旦聯調就不正確。開分析會時除了張主任依然是樂呵呵的調節(jié)氣氛外,其他人都很焦慮。由于我的資歷最淺,無形之中承擔更大壓力。
洛陽的夏天,白天很熱,晚上沒有空調的宿舍也是悶熱難耐。夜里快12點了和老婆在宿舍樓下小花園乘涼。聊到項目被卡,數據總是出錯時,老婆不經意說了一句“會不會是數據放錯地方了”,突然靈光一現,馬上騎上自行車直奔實驗室,幾分鐘后就找到問題并得到驗證,其實這只是因為系統(tǒng)設計中一個小疏忽導致的,很難說是誰的問題。問題找到了一切迎刃而解,第二天系統(tǒng)聯調順利過關,項目按照計劃準時移交給需求方。
二十多年了,這件事始終縈繞在我腦海,讓我獲益良多:
1)項目越緊,項目負責人越要有定力,每當我負責的項目卡殼項目組人心浮動時,我就想起張主任的微笑,心情也馬上會平靜下來;
2)團隊協助工作,涉及到系統(tǒng)級別的設計和聯調時,表面上很奇怪的問題可能只是一點點的疏忽導致,既不能輕易懷疑別人的問題,也不能不信任自己的分析。遇到問題還是需要一點點抽絲剝繭,共同應對。現在不管遇到多么詭異的問題,我都會告誡團隊成員,不要輕易說“絕不可能”等類似的話;
3)有時遇到技術上特別難理解和解決的問題,和所謂的外行聊聊天,沒準會有意想不到的收獲;其實在和外行解釋的過程遠比和內行解釋困難,一件事情你能和外行解釋清楚,必然要求你自己深入理解,在解釋的過程中有些問題的答案自然就跑出來了。這些年來我經常采用打比方舉例子等方式和非專業(yè)人士交流,效果往往很好。
4)勤奮真的很重要,特別是年輕人,不輕言放棄,遇事有鉆研精神是技術上能有所成就的基本要求。只有親身經歷過一些磨難,才能終身受用。
2001年3月,因機緣巧合,我入職了A公司,主要從事指紋識別算法研究和相關產品開發(fā)銷售。在美國911事件之前,指紋識別產品屬于比較高冷的行業(yè),屬于很小眾的高科技行業(yè),單臺產品售價和毛利率很高,但是銷量很小。
我剛入職時是硬件工程師,參與指紋考勤門禁系統(tǒng)的研發(fā)工作,門禁系統(tǒng)研發(fā)完成后開始負責指紋門鎖的軟硬件研發(fā)工作。經過一段時間的研發(fā)后,基于指紋技術的門禁考勤機開始小規(guī)模生產銷售。而且有兩臺銷往東北地區(qū),好像是沈陽的一家國企采購的。剛開始一切都很完美,畢竟有了客戶而且每臺有好幾千元的利潤。
沒多久客戶就打電話來投訴說考勤機壞了,因為涉及很多人的考勤問題,客戶要求立即派人帶上備用機器盡快趕過去更換。公司領導立即派了兩個現場技術支持工程師乘飛機趕往東北,同時我們研發(fā)團隊也緊急研討故障的原因,但一時之間也沒有頭緒。
經過緊急處理更換后,兩個人帶著故障機趕回公司。拆開外殼后,大家發(fā)現原來是因為模具設計存在缺陷,電路板線纜的固定方式不太合理。加上裝配工的疏忽,其中一根導線沒有固定好,在扣上外殼時被壓在卡槽里。由于卡槽扣合的力度很大,這根導線外皮已經破損,部分銅芯已經斷裂,但沒有完全斷掉。因此出廠檢驗時一切正常。經過長途運輸顛簸,加上考勤機是用在室外,東北地區(qū)的夜晚很冷,塑料外殼的收縮率遠高于導線。就這樣,一段時間后,這根導線就徹底斷了,整個考勤機就壞掉了。
查明原因后,令人撓頭的是沒人知道剛剛更換的那臺機器是否也存在同樣的問題,不得已,公司領導又派人帶著改進后的產品再赴東北進行更換。事后領導說這次兩臺機器的利潤還不夠人員兩次往返的費用。
從此以后,但凡有電路板上接插件和導線需要和外殼配合時,我都會要求結構工程師一定要認真考慮線纜的走向和線束的固定問題,而且對于生產線的裝配工藝反復核查,裝配人員進行專業(yè)培訓。
這些年來,看過很多故障電子產品,發(fā)現因結構裝配不合理導致線纜松動、斷裂等問題依然比較常見,電子產品的不良率中源于接插件和導線的部分占比很高。用過翻蓋手機的很多人應該都有過換線的經歷,家中的很多電器故障往往都是接插件松動接觸不良。這類看似不起眼的小事從小處說可能是產品故障,客戶投訴,從大處說可能導致機毀人亡。
作為電子工程師,這件事給我上了非常重要的一課,讓我從此重視結構和線纜等小細節(jié)對產品的影響。
2005年,我在B公司擔任hardware leader,負責寬帶通信局端及終端設備硬件研發(fā)工作。B公司是日本C公司的全資子公司,也是它在國內設立的唯一的研發(fā)中心,日本C公司當時是全球最大的寬帶通信設備供應商。
我們采用博通的方案成功開發(fā)出工業(yè)級ADSL局端和終端設備,該設備基于日本標準并主要應用于日本市場,當時已完成VCCI ClassA測試認證,正準備在日本工廠批量試生產。不過按照日本總部的要求,我們的任何設計或技術圖紙改進完成后,都需要發(fā)送到總部進行資料初審,審核通過后再通過電話會議進行技術評審。VDSL項目設計圖紙發(fā)到總部后很快收到一些改進要求和建議。記憶最深的一項是,總部工程師覺得得我們的保險絲熔斷電流選擇過大,要求更改保險絲規(guī)格,比如系統(tǒng)最大允許的工作電流是10A,我們的保險絲選擇11A,而日方工程師建議選擇9A。我們都知道保險絲的電流不能低于最大工作電流,因此我們團隊成員包括我在內都覺得很不理解,甚至覺得提建議的工程師水平太低。
因為ADSL產品在日本工廠的試生產過程中發(fā)現有些問題,公司安排我立即趕赴工廠分析原因,經過現場分析測試后問題當天得到解決,而我也有機會見到那個提出保險絲建議的工程師。
提建議的是一位老工程師,據說在住友電工已經工作了幾十年。當我說明來意后他帶我到旁邊的會議坐下后,又抱了好大一摞資料過來。他的英文水平在日本工程師中還算不錯,不過日式發(fā)音確實比較難懂,而且有點磕磕巴巴,而我對日語的了解不超過從《地道戰(zhàn)》等電影里鬼子軍官說的幾句話。好在大家都是工程師,技術資料有些是英文的,日文版本的很多漢字也能明白,再加上圖表等,交流不存在障礙。
他很有耐心,不停的給我講解各種資料,包括了保險絲供應商提供的規(guī)格書,不同系列的保險絲的工藝、特性、溫度曲線等,可以看到很多資料關鍵點上都有標注。幾乎整整一下午,從他那里我學習到大量的關于保險絲的知識及選取原則,技術溝通變成虛心討教,對他的不屑變成了由衷的敬佩和尊重。
他是這么解釋的:選取保險絲的目的是在系統(tǒng)工作狀態(tài)異常時及時斷開電源;保險絲因材料工藝不同種類各異,特性差異很大,我們選擇的那款保險絲屬于慢速響應性的熱熔斷絲,而熱熔斷的本質是流過保險絲的電流在期望的時間內熱量的累積超過保險絲的熔斷要求,這是一個關于電流的積分過程,而且重要的是熔斷效應是非線性的,需要先根據期望熔斷時間和規(guī)格書查找曲線圖上合適的點后反推到合適電流;他經過仔細分析計算,我們這個項目最大電流持續(xù)時間極短,按照那個持續(xù)時間和最大電流的積分效應根本不足以熔斷我們選擇的保險絲,換句話說我們選擇的保險絲根本達不到保險的目的;他是經過分析、查表最終計算出比較合適的規(guī)格并據此提出建議;
雖然這位老工程師的面容早已忘記,姓名也壓根記不起,卻唯獨依舊記得那厚厚的資料,他詳細的分析,嚴謹的推導計算,以及我當時的震撼和羞愧。從此之后,我努力去理解接觸到的每一種元器件的基本原理,對別人設計中不理解的部分不敢妄加評議。
這些年,我接觸過很多硬件工程師,也面試過許多硬件工程師,很遺憾很少有硬件工程師深入理解各種器件的原理和特性,每每看到那種無知而不屑的笑容,我仿佛就看到自己當年的影子。
2005年四月,我們研發(fā)的工業(yè)級ADSL局端和終端設備完成功能樣機貼片和硬件測試,開始和軟件團隊進行系統(tǒng)聯調。順利開機、初始化完成、網絡連接正常,一起順利,大家紛紛開始憧憬起美妙的黃金周長假了。
不幸的消息很快從軟件部反饋過來,經過初步測試,發(fā)現ASDL終端設備上行數據速率正常,但是下行數據速率遠低于設計要求,和芯片規(guī)格書給出的指標相差甚遠。按照常規(guī)流程,硬件團隊馬上進行電路測試,信號分析,供電檢查等;軟件團隊進行驅動檢查,特別是寄存器配置和數據分析等。大家樂觀的認為,解決這種問題應該不算難事。
接下來幾天,大家做了大量的工作。首先就是對問題進行定位,看看是因為硬件不良還是軟件驅動存在問題。硬件方面首先對電路板進行完整的靜態(tài)和動態(tài)測試,驗證信號時序、邏輯、電平等,未發(fā)現明顯異常。接著擴大硬件測試樣品數量,確認同一批次的板子測試結果和不良現象高度一致,基本排除了因物料差異和貼裝工藝導致的個體差異;軟件工程師將各種可能導致Bug的問題進行模擬驗證,對不同版本的驅動進行對比,對相關寄存器進行逐一排查,也未發(fā)現任何有價值的線索。一番折騰下來,沒有什么進展,而五一長假開始了,沒有什么好說的,取消一切出行計劃,開始加班加點解決問題。
各種常規(guī)的方法無法突破后,我們開始進行各種交叉測試:將阿爾卡特和中興等幾家采用相同硬件方案的Flash芯片取下來,和我們板子上Flash芯片互換進行交叉試驗,盡管采用的標準不一樣,但除了啟動時各家Logo不同外,其它功能基本沒問題。別的公司的板子更換Flash前后均正常,而我們的板子更換前后下行速率始終不能達到指標要求。這基本確定了問題是出在硬件的設計上。
明確了問題范圍,我們開始對硬件進行新一輪測試排查,測試的重點從時域轉換到頻域,果然通過頻譜分析儀測試分析,發(fā)現在600KHz附近有嚴重的干擾,而這一頻帶正是是下行通道的主力通帶范圍,0到4KHz是音頻通帶,是低通濾波后接電話機用于語音通信的,25KHz到200KHz是數據上行頻帶,200KHz到1.1MHz是數據下行通帶。
找到干擾頻點后就繼續(xù)追查干擾源,發(fā)現在距離通信驅動接口芯片比較遠的的一顆DC-DC芯片的功率電感處存在2倍頻600KHZ的較強干擾,繼續(xù)分析發(fā)現該電源芯片的振蕩頻率為300KHz,而原來參考設計上的是同一家公司的非常接近的料號的一顆料,但原來的芯片振蕩頻率是600KHz,2倍頻后是1.2MHz,已經超出了ADSL的1.1MHz的頻帶范圍,但這顆料即將停產,所以后來電源供應商的FAE和我們的工程師溝通時極力推薦這顆新料,由于新老物料參數一致而且價格更低,工程師就選擇了新料,由于料號幾乎相同,工程師在送樣測試時覺得輸出電壓、紋波系數和負載能力等指標都和老料一致,因而就選擇了新料。
因為該芯片距離通信接口芯片較遠,干擾源不是通過線間串擾過來而是通過空間耦合過來的,在時域范圍內極難發(fā)現分析。問題定位后,通過在功率電感上增加屏蔽罩徹底解決了這個問題。但是七天長假已經過去了六天,而我也落下了腰肌勞損的毛病,直到幾年后采用朋友的偏方才慢慢痊愈。
細細反思,至少有幾方面的教訓:細節(jié)真的很重要,任何物料的跟更換都要慎之又慎,每個參數都要搞清楚;基礎知識真的很重要,如通信類的頻帶劃分,調制方式,時域和頻域的測試分析能力等;思路開闊、靈活應變,需要多維度思考問題。
在成長實錄之教訓系列之三中我有提到,2005年五一期間我們解決了ADSL局端及終端設備的頻帶干擾問題,初步測試下來功能正常,性能滿足要求,終于可以交付到測試部門進行完整的測試。不出意料的,新問題來了。
測試工程師測試下來發(fā)現一個問題,設備正常工作一段時間后會莫名奇妙的自動重啟,從開機到重啟的時間每次不固定,而且手上的5臺樣機都存在同一問題。
接到測試報告后,軟硬件團隊開始聯手進行系統(tǒng)調試。有系統(tǒng)開發(fā)經驗的都知道,這個問題對工程師調試來說喜憂參半,喜的是這是一個必現的bug,相對來說問題比較容易復現和定位,問題是否得到解決比較好驗證;憂的是這個問題出現的時間長短是隨機的,功能都已實現,性能也達到要求,這種情況下的問題往往不簡單,需要調試的工作量很大。
這個問題對于硬件部分比較常見的問題一般有電源設計不良、復位電路、晶振電路、過熱保護、元器件不良、生產制程不良等;軟件部分可能存在的問題有系統(tǒng)配置不正確、異常流程處理不當、內部看門狗不正確觸發(fā)等。
硬件團隊首先排查了可能存在制程問題,通過目視檢查和X-ray照射,未發(fā)現明顯異常;
全面監(jiān)測復位、供電和晶振等,均未發(fā)現自動重啟時存在異常狀態(tài),通過對電路板全面的熱監(jiān)測也未發(fā)現存在過熱區(qū)域;軟件團隊也對可能存在的問題逐一排除,未發(fā)現任何異常。調試陷入僵局,項目一時無法進展。
沒辦法,軟硬件團隊再次回到對故障現象的分析梳理,重新擬定測試方案,尋找重啟時的共同點。經常大量的測試,終于發(fā)現當系統(tǒng)傳輸大容量數據時出現重啟概率要大很多,而那種很輕負載狀態(tài)的設備重啟幾率較小,時間間距也會拉開更大。找到規(guī)律不代表就能找到確切問題點,甚至更加讓人迷茫。
當所有的分析測試都沒有結果時,我們重新回到對生產制程的分析,由于主控芯片和MAC芯片都是BGA封裝,電路板本身是10層板,大部分走線都是走在內層,對我們的排查來說困難重重。經過不懈努力,發(fā)現主控芯片到MAC的16根地址線因走線和貼裝工藝存在瑕疵而有虛短路現象,其中一根和地之間的阻抗由正常的10兆歐左右降為1兆歐左右,由于檢查BGA貼裝質量的X-ray主要檢查是否存在短路或斷路問題,對于虛短是很難檢查出來的。由于該地址線并未短路,在初始化或低速率傳輸數據時問題不大,但當大容量數據高速傳輸時,地址線之間的差異就會顯現出來,導致程序運行異常而觸發(fā)內部看門狗,從現象上看就是系統(tǒng)自動重啟。
經驗教訓:不是能夠正常工作了硬件就萬事大吉,還要關注壓力測試和長時間測試;阻抗匹配很重要,對于很多問題,數據線和地址線等對地阻抗測試會告訴我們很多信息;嵌入式系統(tǒng)的調試一定要有系統(tǒng)概念,軟硬件及測試團隊的通力協作是快速發(fā)現問題、定位問題和解決問題的前提和保證,很多現象是多種因素引起的,只有經多細致分析,大膽推測、反復驗證才能解決問題。
原文標題:電子工程師成長之教訓系列故事(上)
文章出處:【微信公眾號:電子發(fā)燒友網】歡迎添加關注!文章轉載請注明出處。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。
舉報投訴
原文標題:電子工程師成長之教訓系列故事(上)
文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網】歡迎添加關注!文章轉載請注明出處。
相關推薦
硬件工程師
揚興科技
發(fā)布于 :2024年10月30日 18:39:16
硬件工程師
安泰小課堂
發(fā)布于 :2024年09月25日 18:47:52
電子工程師
安泰小課堂
發(fā)布于 :2024年07月25日 11:31:02
電子工程師行業(yè)資訊
安泰小課堂
發(fā)布于 :2024年06月03日 17:58:52
硬件工程師
揚興科技
發(fā)布于 :2024年05月29日 18:23:29
技術。與之相比,嵌入式硬件工程師更注重硬件設計和電路原理,需要掌握電子工程學、數字電路、模擬電路等知識??偟膩碚f,嵌入式軟件工程師的技能需求更加偏重于軟件開發(fā),而嵌入式硬件
發(fā)表于 05-16 11:00
電子工程師
安泰小課堂
發(fā)布于 :2024年05月13日 17:29:54
電子工程師
揚興科技
發(fā)布于 :2024年05月04日 01:33:18
電子工程師電路
安泰小課堂
發(fā)布于 :2024年04月30日 17:33:15
即將走馬上任電源工程師這個崗位,請問各位大佬,這個崗位的職業(yè)路徑一般是怎樣的?
發(fā)表于 04-08 14:19
電子工程師示波器
安泰小課堂
發(fā)布于 :2023年12月18日 17:36:12
硬件工程師揚興科技
揚興科技
發(fā)布于 :2023年11月21日 18:27:20
電子發(fā)燒友網站提供《電子工程師必備基礎知識.pdf》資料免費下載
發(fā)表于 11-20 11:29
?36次下載
電子工程師
jf_55975348
發(fā)布于 :2023年11月18日 01:09:06
電子工程師
jf_55975348
發(fā)布于 :2023年11月18日 01:02:31
評論