0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一只發(fā)生概率小于萬(wàn)分之一的Bug

程序人生 ? 來(lái)源:程序新視界 ? 作者:二師兄 ? 2022-05-05 09:36 ? 次閱讀

在開(kāi)始這篇文章之前想先說(shuō)一句:如果一套系統(tǒng)暫時(shí)沒(méi)問(wèn)題,那只是因?yàn)樗牟l(fā)量不夠而已。

上周在查看系統(tǒng)日志時(shí),發(fā)現(xiàn)了一條與眾不同的日志。日志中有一半內(nèi)容是正常的報(bào)文數(shù)據(jù),而另一半內(nèi)容是0x00這樣的空數(shù)據(jù)。

雖然系統(tǒng)沒(méi)拋出任何異常,但這些日志肯定是反常的。多年的經(jīng)驗(yàn)告訴我,這其中一定有什么不對(duì)的地方,加上好奇心的驅(qū)使,終于揭開(kāi)了一個(gè)隱藏非常深的Bug。

有時(shí)候找到Bug,解決Bug很容易,難的是如何發(fā)現(xiàn)Bug,并推理出哪里出問(wèn)題解決。下面就帶大家來(lái)剖析一下這個(gè)Bug。

奇怪的日志輸出

一個(gè)調(diào)用外部接口的基礎(chǔ)類(lèi),打印出類(lèi)似如下的日志:

abcdabcdabcdabcdabcdabcdabcd《0x00》《0x00》《0x00》《0x00》《0x00》

其中前面的abcd是正常的業(yè)務(wù)數(shù)據(jù),后面莫名其妙的多出了很多《0x00》。

那么,這個(gè)基礎(chǔ)工具類(lèi)有多基礎(chǔ)?多處使用該方法,每天大約被調(diào)用幾十萬(wàn)次吧,而上面的情況一天只會(huì)出現(xiàn)幾次。就是那么巧,恰好被看到了。

查看代碼,初步推斷,可能是byte數(shù)組轉(zhuǎn)String時(shí),byte數(shù)組后半部分為空或存在一些無(wú)法轉(zhuǎn)換的數(shù)據(jù)導(dǎo)致的。

舊代碼分析

這里先把業(yè)務(wù)代碼脫敏,寫(xiě)成一個(gè)demo展示給大家看看:

public static void oldCode() throws IOException

{

// 通過(guò)HttpURLConnection讀取的外部系統(tǒng)返回的流

InputStream in = new ByteArrayInputStream(“abc”.getBytes());

// 明確知道的報(bào)文長(zhǎng)度(解析Header獲得)

int bodyLen = 2048;

byte[] body = new byte[bodyLen];

int recvLen = 0; while (recvLen 《 bodyLen)

{

recvLen = in.read(body, recvLen, bodyLen - recvLen);

if(recvLen == -1){

break;

}

}

System.out.println(new String(body, “GBK”));}

上述代碼進(jìn)行了業(yè)務(wù)脫敏處理,僅為還原基本的使用過(guò)程。

業(yè)務(wù)場(chǎng)景的大概使用流程是:第一,通過(guò)HTTP調(diào)用遠(yuǎn)程接口;第二,讀取接口返回的字節(jié)流,Inputstream;第三,解析字節(jié)流,存入字節(jié)數(shù)組;第四,將字節(jié)數(shù)組轉(zhuǎn)換為String。

而日志中看到的異常內(nèi)容,便是打印String時(shí)出現(xiàn)的。前面我們已經(jīng)推斷,出現(xiàn)《0x00》的可能性是字節(jié)數(shù)組有一部分為空導(dǎo)致或數(shù)據(jù)錯(cuò)誤導(dǎo)致的。

上述代碼有一個(gè)明顯的錯(cuò)誤,你是否能夠看出來(lái)?根據(jù)代碼原始的寫(xiě)法,推測(cè)之所以出現(xiàn)這個(gè)錯(cuò)誤是因?yàn)槭褂谜邔?duì)InputStream的read方法并不熟悉導(dǎo)致的。

這里讀者先自行閱讀看看上述代碼的Bug在哪里,下面我們來(lái)介紹一下InputStream的read方法。

InputStream的read方法

InputStream這個(gè)抽象類(lèi)是表示字節(jié)輸入流的所有類(lèi)的超類(lèi),它提供了3個(gè)經(jīng)常被使用的read()方法:

read(),無(wú)參方法。該方法從輸入流中讀取數(shù)據(jù)的下一個(gè)字節(jié)。返回0到255范圍內(nèi)的int字節(jié)值。如果因?yàn)橐呀?jīng)到達(dá)流末尾而沒(méi)有可用的字節(jié),則返回值 -1 。該方法會(huì)處于阻塞狀態(tài),等待數(shù)據(jù)的到達(dá),直到返回值為-1或拋出異常。

read(byte b[], int off, int len):將輸入流中最多l(xiāng)en個(gè)數(shù)據(jù)字節(jié)讀入byte數(shù)組。嘗試讀取len個(gè)字節(jié),但讀取的字節(jié)也可能小于該值。以整數(shù)形式返回實(shí)際讀取的字節(jié)數(shù)。

read (byte[] b):從輸入流中讀取一定數(shù)量的字節(jié),并將其存儲(chǔ)在緩沖區(qū)數(shù)組b中。以整數(shù)形式返回實(shí)際讀取的字節(jié)數(shù)。

分析一下上面的三個(gè)方法。

其中第一個(gè)方法,本質(zhì)上來(lái)說(shuō)后兩個(gè)方法都是調(diào)用第一個(gè)方法來(lái)實(shí)現(xiàn)的,但第一個(gè)方法直接使用缺點(diǎn)很明顯,就是處理效率低下,一個(gè)字節(jié)一個(gè)字節(jié)的讀。而后兩個(gè)方法都加入了byte數(shù)組,用來(lái)作為緩存區(qū)。

而第三個(gè)方法又相當(dāng)于第二個(gè)方法被如下方式調(diào)用:

read(b, 0, b.length)

而有Bug的代碼中使用的是第二個(gè)方法。

Bug分析

看了read方法的API說(shuō)明,你是不是已經(jīng)找到Bug了?對(duì)的,當(dāng)初寫(xiě)這段代碼的人把read方法返回值理解錯(cuò)了。

recvLen = in.read(body, recvLen, bodyLen - recvLen);

最初寫(xiě)代碼的人可能把read方法的返回值當(dāng)中參數(shù)off經(jīng)過(guò)讀取之后新的位置了。這樣在調(diào)用read方法之后,獲得了填充的位置,然后拿總長(zhǎng)度減去已經(jīng)填充的位置,再繼續(xù)讀取后面的內(nèi)容,繼續(xù)填充。

但實(shí)際上read方法的返回結(jié)果是:以整數(shù)形式返回實(shí)際讀取的字節(jié)數(shù),可能與off的位置值相同,但并不是off的位置。

下面來(lái)分析一下while循環(huán)中的邏輯處理情況:

while (recvLen 《 bodyLen)

{

recvLen = in.read(body, recvLen,

bodyLen - recvLen);

if(recvLen == -1){

break;

}}

我們舉個(gè)例子來(lái)推演一下2種情況(為了方便推算,暫且用比較小的數(shù)來(lái)舉例)。

情況一:假設(shè)bodyLen長(zhǎng)度為10,read一次性讀完。

在這種情況中,先進(jìn)入while循環(huán),read一次性讀完,返回值為10,此時(shí)recvLen賦值為10,不再滿足循環(huán)條件(recvLen 《 bodyLen),退出循環(huán),繼續(xù)執(zhí)行。此時(shí),代碼沒(méi)問(wèn)題。這種情況可能占到99.9%-99.99%(取決于請(qǐng)求頻次和報(bào)文大?。?。

情況二:假設(shè)bodyLen長(zhǎng)度為10,read 2次讀完(發(fā)生粘包拆包現(xiàn)象)。

第一次循環(huán),read讀取6個(gè)字節(jié)長(zhǎng)度,返回值為6,recvLen賦值為6。第二次循環(huán),off參數(shù)取recvLen的值為6,讀取剩余4個(gè)字節(jié)(10 - 6)。完成第二次讀取,循環(huán)本應(yīng)該結(jié)束的,但你會(huì)發(fā)現(xiàn)此時(shí)recvLen被賦值為4,依舊滿足while循環(huán)的判斷條件(recvLen 《 bodyLen),進(jìn)行下一輪讀取。

下一輪讀取時(shí),off變?yōu)?,len變?yōu)椋?0 - 4)。本來(lái)經(jīng)過(guò)第二輪循環(huán)off已經(jīng)讀取到10了,現(xiàn)在又指定為4,又去流中讀取。這就造成了日志中出現(xiàn)很多《0x00》。

Bug原因

經(jīng)過(guò)上述分析,我們已經(jīng)找到Bug,并獲得了Bug原因。

首先,Bug之所以沒(méi)有大面積爆發(fā),那是因?yàn)榇蠖鄶?shù)請(qǐng)求都是一次性讀完流中的數(shù)據(jù),循環(huán)直接結(jié)束,當(dāng)不會(huì)進(jìn)入第二次循環(huán)時(shí),這個(gè)Bug就被隱藏了。

其次,Bug之所以發(fā)生除了使用者對(duì)API的返回值不了解,更重要的原因是對(duì)于read方法可能會(huì)將結(jié)果分多次返回(粘包拆包現(xiàn)象)不了解。

Bug改造

找到原因,改造起來(lái)就非常容易了。針對(duì)demo我們重新改造一下:

public static void oldCode()

throws IOException

{

// 通過(guò)HttpURLConnection讀取的外部系統(tǒng)返回的流

InputStream in = new ByteArrayInputStream(“abc”.getBytes());

// 明確知道的報(bào)文長(zhǎng)度(解析Header獲得)

int bodyLen = “abc”.getBytes().length;

System.out.println(bodyLen);

byte[] body = new byte[6];

int recvLen = 0; while (recvLen 《 bodyLen)

{

// 改造點(diǎn)1

int currentLen = in.read(body, recvLen, bodyLen - recvLen);

if(currentLen == -1){

break;

}

// 改造點(diǎn)2

recvLen += currentLen;

}

System.out.println(new String(body, “GBK”));}

上述改造只改動(dòng)了兩處,將read方法的返回值用新變量接收,然后讓recvLen每次累加read讀取的字節(jié)數(shù)。

改造是不是非常簡(jiǎn)單?正應(yīng)了那句話:改bug很容易,難的是如何找到bug。

小結(jié)

有時(shí)候我們對(duì)自己寫(xiě)的代碼很自信,有時(shí)候總以為代碼之前能夠正常運(yùn)行,以后也能夠正常運(yùn)行。但往往事與愿違,誰(shuí)能想到一直“運(yùn)行良好”的代碼中深藏著這樣的Bug?所以,還是那句話,如果你覺(jué)得你的代碼沒(méi)問(wèn)題,那只是因?yàn)橄到y(tǒng)的并發(fā)量還不夠而已。代碼不僅要實(shí)現(xiàn)功能,還要滿足性能和健壯性。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)組
    +關(guān)注

    關(guān)注

    1

    文章

    412

    瀏覽量

    25881
  • BUG
    BUG
    +關(guān)注

    關(guān)注

    0

    文章

    155

    瀏覽量

    15639

原文標(biāo)題:捕獲了一只發(fā)生概率小于萬(wàn)分之一的Bug

文章出處:【微信號(hào):coder_life,微信公眾號(hào):程序人生】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    APS54083,輸出10A大電流,帶65536無(wú)頻閃調(diào)光,調(diào)光深度可達(dá)萬(wàn)分之一

    APS54083 采用外部供電,需要提供約 680uA的電流才能保證芯片的正常工作,外部供電壓電阻可以根據(jù)這個(gè)電流參數(shù)設(shè)計(jì),同時(shí)注意選擇合適的電阻封裝適應(yīng)不同輸入電壓情況。 ◆過(guò)溫保護(hù)
    的頭像 發(fā)表于 11-06 09:56 ?93次閱讀

    谷歌:超四分之一新代碼由人工智能生成

    10月30日最新消息顯示,谷歌正積極投身于系列人工智能產(chǎn)品的開(kāi)發(fā)中,并且在其構(gòu)建過(guò)程中,人工智能也扮演著舉足輕重的角色。谷歌首席執(zhí)行官桑達(dá)爾?皮查伊在公司2024年第三季度財(cái)報(bào)電話會(huì)議上透露:“我們超過(guò)四分之一的新代碼現(xiàn)由人工智能自動(dòng)生成,隨后經(jīng)過(guò)工程師的審核與接納?!?/div>
    的頭像 發(fā)表于 10-30 15:13 ?263次閱讀

    傳諾基亞大裁員,大中華區(qū)占五分之一

    諾基亞(Nokia Corporation)正在積極推進(jìn)其成本削減計(jì)劃,以應(yīng)對(duì)當(dāng)前的市場(chǎng)挑戰(zhàn)。據(jù)最新消息,諾基亞已在大中華區(qū)裁減了近2000名員工,占該地區(qū)員工總數(shù)的五分之一,這數(shù)字令人震驚。
    的頭像 發(fā)表于 10-18 17:16 ?773次閱讀

    金天弘科技“萬(wàn)分之一級(jí)”高精度MEMS諧振式壓力芯片和傳感器全面實(shí)現(xiàn)國(guó)產(chǎn)自主可控

    金天弘科技(北京)有限公司完成了萬(wàn)分級(jí)高精度MEMS諧振式壓力芯片和傳感器的研制,為新代軍事裝備和先進(jìn)工業(yè)領(lǐng)域?qū)崿F(xiàn)全國(guó)產(chǎn)自主可控和升級(jí)換代提供核心關(guān)鍵芯片產(chǎn)品。
    的頭像 發(fā)表于 10-10 15:26 ?303次閱讀
    金天弘科技“<b class='flag-5'>萬(wàn)分之一</b>級(jí)”高精度MEMS諧振式壓力芯片和傳感器全面實(shí)現(xiàn)國(guó)產(chǎn)自主可控

    中國(guó)人工智能大模型占全球的三分之一

    大模型領(lǐng)域的全球占比已突破三分之一大關(guān),具體數(shù)值高達(dá)36%,這成就不僅彰顯了我國(guó)在該領(lǐng)域的深厚積累與快速發(fā)展,也標(biāo)志著中國(guó)在全球AI競(jìng)賽中緊隨美國(guó)之后,穩(wěn)居第二的堅(jiān)實(shí)地位。
    的頭像 發(fā)表于 07-08 15:21 ?419次閱讀

    中國(guó)大陸晶圓制造產(chǎn)能飆升,預(yù)計(jì)2025年占全球三分之一

    制造產(chǎn)能將在未來(lái)幾年內(nèi)實(shí)現(xiàn)顯著增長(zhǎng),預(yù)計(jì)到2025年,其月產(chǎn)能將達(dá)到驚人的1010萬(wàn)片,占據(jù)全球晶圓制造總產(chǎn)能的近三分之一。
    的頭像 發(fā)表于 06-26 11:49 ?994次閱讀

    2030年RISC-V將占全球市場(chǎng)四分之一

    據(jù)Omdia的最新研究,預(yù)計(jì)到2030年,RISC-V處理器將占據(jù)全球近四分之一的市場(chǎng)份額。盡管工業(yè)領(lǐng)域仍將是該技術(shù)最大的應(yīng)用領(lǐng)域,但預(yù)計(jì)開(kāi)放標(biāo)準(zhǔn)指令集架構(gòu)(ISA)將在汽車(chē)領(lǐng)域?qū)崿F(xiàn)最強(qiáng)勁的增長(zhǎng)
    的頭像 發(fā)表于 05-23 08:36 ?347次閱讀
    2030年RISC-V將占全球市場(chǎng)四<b class='flag-5'>分之一</b>

    臺(tái)積電前4月?tīng)I(yíng)收增26.2%,預(yù)計(jì)二季度營(yíng)收再增三分之一

    自3月份以來(lái),臺(tái)積電收入增長(zhǎng)加快至34.3%,預(yù)計(jì)第二季度營(yíng)收將再增長(zhǎng)約三分之一,這主要得益于人工智能半導(dǎo)體的旺盛需求。全球智能手機(jī)行業(yè)在今年前三個(gè)月實(shí)現(xiàn)恢復(fù)性增長(zhǎng)
    的頭像 發(fā)表于 05-10 16:18 ?343次閱讀

    求助,關(guān)于STM8S003F3串口問(wèn)題求解

    的數(shù)據(jù)幀,也就是丟包。丟包率大概在1%左右,不知道有沒(méi)有朋友遇到過(guò)這種情況并有解決的辦法。由于設(shè)備比較特殊,預(yù)期丟包率不應(yīng)該高于萬(wàn)分之一,通信模式為自定義協(xié)議 485 8bit 9600 1stopBit parity-none
    發(fā)表于 05-10 06:38

    怎么用電容電感來(lái)代替四分之一波長(zhǎng)微帶線呢?

    前陣子,有號(hào)友問(wèn)過(guò)我關(guān)于怎么用電容電感來(lái)代替四分之一波長(zhǎng)微帶線的問(wèn)題。微波工程上有個(gè)現(xiàn)成的結(jié)論,所以就推薦過(guò)去了,沒(méi)有去仔細(xì)推導(dǎo)那個(gè)結(jié)論是怎么來(lái)的。
    的頭像 發(fā)表于 05-06 11:45 ?1787次閱讀
    怎么用電容電感來(lái)代替四<b class='flag-5'>分之一</b>波長(zhǎng)微帶線呢?

    預(yù)測(cè):2024年全球電動(dòng)汽車(chē)銷(xiāo)量將占總銷(xiāo)量五分之一以上

    預(yù)計(jì)中國(guó)市場(chǎng)仍將保持領(lǐng)先地位,至2024年電動(dòng)車(chē)銷(xiāo)量將達(dá)約1000萬(wàn)輛,占中國(guó)汽車(chē)總銷(xiāo)量的45%。美國(guó)市場(chǎng)方面,預(yù)計(jì)今年電動(dòng)汽車(chē)銷(xiāo)量將占新車(chē)銷(xiāo)售的九分之一
    的頭像 發(fā)表于 04-23 16:22 ?756次閱讀

    Mozilla重啟Firefox原生標(biāo)簽頁(yè)組研發(fā)?

    查閱IT之家2015年報(bào)導(dǎo)顯示,早在2009年,F(xiàn)irefox即開(kāi)始提供款名為Panorama的標(biāo)簽頁(yè)組功能。然而,根據(jù)Mozilla的數(shù)據(jù)分析,這功能的實(shí)際使用率僅為萬(wàn)分之一,故而在2016年被去除,Mozilla當(dāng)時(shí)推薦
    的頭像 發(fā)表于 03-19 14:16 ?307次閱讀

    電力模塊電源常見(jiàn)的幾個(gè)小問(wèn)題深度剖析

    高壓尖脈沖(highvoltagespikes):指峰值達(dá)6000v,持續(xù)時(shí)間從萬(wàn)分之一秒至二分之一周期(10ms)的電壓。這主要由于雷擊、電弧放電、靜態(tài)放電或大型電氣設(shè)備的開(kāi)關(guān)操作而產(chǎn)生。
    發(fā)表于 03-13 11:27 ?265次閱讀

    AD5422無(wú)法滿足千分之一的精度要求怎么解決?

    我研發(fā)的項(xiàng)目用到AD5422芯片做模擬量輸出4-20mA,碰到如下問(wèn)題: 通過(guò)配置控制寄存器,讓AD5422工作在4-20mA輸出模式,外置的Rset選用的千分之一的15K電阻。但是實(shí)測(cè)的時(shí)候發(fā)現(xiàn)
    發(fā)表于 11-23 06:35