0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳解C語言二分查找算法細(xì)節(jié)

如意 ? 來源:CSDN ? 作者:CaspianSea ? 2020-06-22 09:05 ? 次閱讀

思路

我相信對很多讀者朋友來說,編寫二分查找的算法代碼屬于玄學(xué)編程,雖然看起來很簡單,就是會(huì)出錯(cuò),要么會(huì)漏個(gè)等號(hào),要么少加個(gè) 1。

不要?dú)怵H,因?yàn)槎植檎移鋵?shí)并不簡單。看看 Knuth 大佬(發(fā)明 KMP 算法的那位)怎么說的:

Although the basic idea of binary search is comparatively straightforward,

the details can be surprisingly tricky.。.

這句話可以這樣理解:思路很簡單,細(xì)節(jié)是魔鬼。

本文以問答的形式,探究幾個(gè)最常用的二分查找場景:尋找一個(gè)數(shù)、尋找左側(cè)邊界、尋找右側(cè)邊界。第一個(gè)場景是最簡單的算法形式,解決 這道題,后兩個(gè)場景就是本題。

而且,我們就是要深入細(xì)節(jié),比如不等號(hào)是否應(yīng)該帶等號(hào),mid 是否應(yīng)該加一等等。分析這些細(xì)節(jié)的差異以及出現(xiàn)這些差異的原因,保證你能靈活準(zhǔn)確地寫出正確的二分查找算法。

零、二分查找框架

int binarySearch(int[] nums, int target) {

int left = 0, right = 。..;

while(。..) {

int mid = (right + left) / 2;

if (nums[mid] == target) {

。..

} else if (nums[mid] 《 target) {

left = 。..

} else if (nums[mid] 》 target) {

right = 。..

}

}

return 。..;

}

分析二分查找的一個(gè)技巧是:不要出現(xiàn) else,而是把所有情況用 else if 寫清楚,這樣可以清楚地展現(xiàn)所有細(xì)節(jié)。本文都會(huì)使用 else if,旨在講清楚,讀者理解后可自行簡化。

其中 。.. 標(biāo)記的部分,就是可能出現(xiàn)細(xì)節(jié)問題的地方,當(dāng)你見到一個(gè)二分查找的代碼時(shí),首先注意這幾個(gè)地方。后文用實(shí)例分析這些地方能有什么樣的變化。

另外聲明一下,計(jì)算 mid 時(shí)需要技巧防止溢出,即 mid=left+(right-left)/2。本文暫時(shí)忽略這個(gè)問題。

一、尋找一個(gè)數(shù)(基本的二分搜索)

這個(gè)場景是最簡單的,肯能也是大家最熟悉的,即搜索一個(gè)數(shù),如果存在,返回其索引,否則返回 -1。

int binarySearch(int[] nums, int target) {

int left = 0;

int right = nums.length - 1; // 注意

while(left 《= right) {

int mid = (right + left) / 2;

if(nums[mid] == target)

return mid;

else if (nums[mid] 《 target)

left = mid + 1; // 注意

else if (nums[mid] 》 target)

right = mid - 1; // 注意

}

return -1;

}

1. 為什么 while 循環(huán)的條件中是 《=,而不是 《 ?

答:因?yàn)槌跏蓟?right 的賦值是 nums.length-1,即最后一個(gè)元素的索引,而不是 nums.length。

這二者可能出現(xiàn)在不同功能的二分查找中,區(qū)別是:前者相當(dāng)于兩端都閉區(qū)間 [left, right],后者相當(dāng)于左閉右開區(qū)間 [left, right),因?yàn)樗饕笮?nums.length 是越界的。

我們這個(gè)算法中使用的是前者 [left, right] 兩端都閉的區(qū)間。這個(gè)區(qū)間其實(shí)就是每次進(jìn)行搜索的區(qū)間,我們不妨稱為「搜索區(qū)間」。

什么時(shí)候應(yīng)該停止搜索呢?當(dāng)然,找到了目標(biāo)值的時(shí)候可以終止:

if(nums[mid] == target)

return mid;

但如果沒找到,就需要 while 循環(huán)終止,然后返回 -1。那 while 循環(huán)什么時(shí)候應(yīng)該終止?搜索區(qū)間為空的時(shí)候應(yīng)該終止,意味著你沒得找了,就等于沒找到嘛。

while(left 《= right) 的終止條件是 left == right + 1,寫成區(qū)間的形式就是 [right + 1, right],或者帶個(gè)具體的數(shù)字進(jìn)去 [3, 2],可見這時(shí)候搜索區(qū)間為空,因?yàn)闆]有數(shù)字既大于等于 333 又小于等于 222 的吧。所以這時(shí)候 while 循環(huán)終止是正確的,直接返回 -1 即可。

while(left 《 right) 的終止條件是 left == right,寫成區(qū)間的形式就是 [left, right],或者帶個(gè)具體的數(shù)字進(jìn)去 [2, 2],這時(shí)候搜索區(qū)間非空,還有一個(gè)數(shù) 2,但此時(shí) while 循環(huán)終止了。也就是說這區(qū)間 [2, 2] 被漏掉了,索引 2 沒有被搜索,如果這時(shí)候直接返回 -1 就是錯(cuò)誤的。

當(dāng)然,如果你非要用 while(left 《 right) 也可以,我們已經(jīng)知道了出錯(cuò)的原因,就打個(gè)補(bǔ)丁好了:

//。..

while(left 《 right) {

// 。..

}

return nums[left] == target ? left : -1;

2. 為什么 left = mid + 1,right = mid - 1?我看有的代碼是 right = mid 或者 left = mid,沒有這些加加減減,到底怎么回事,怎么判斷?

答:這也是二分查找的一個(gè)難點(diǎn),不過只要你能理解前面的內(nèi)容,就能夠很容易判斷。

剛才明確了「搜索區(qū)間」這個(gè)概念,而且本算法的搜索區(qū)間是兩端都閉的,即 [left, right]。那么當(dāng)我們發(fā)現(xiàn)索引 mid 不是要找的 target 時(shí),如何確定下一步的搜索區(qū)間呢?

當(dāng)然是 [left, mid - 1] 或者 [mid + 1, right] 對不對?因?yàn)?mid 已經(jīng)搜索過,應(yīng)該從搜索區(qū)間中去除。

3. 此算法有什么缺陷?

答:至此,你應(yīng)該已經(jīng)掌握了該算法的所有細(xì)節(jié),以及這樣處理的原因。但是,這個(gè)算法存在局限性。

比如說給你有序數(shù)組 nums = [1,2,2,2,3],target = 2,此算法返回的索引是 2,沒錯(cuò)。但是如果我想得到 target 的左側(cè)邊界,即索引 1,或者我想得到 target 的右側(cè)邊界,即索引 3,這樣的話此算法是無法處理的。

這樣的需求很常見。你也許會(huì)說,找到一個(gè) target,然后向左或向右線性搜索不行嗎?可以,但是不好,因?yàn)檫@樣難以保證二分查找對數(shù)級的復(fù)雜度了。

我們后續(xù)的算法就來討論這兩種二分查找的算法。

二、尋找左側(cè)邊界的二分搜索

直接看代碼,其中的標(biāo)記是需要注意的細(xì)節(jié):

int left_bound(int[] nums, int target) {

if (nums.length == 0) return -1;

int left = 0;

int right = nums.length; // 注意

while (left 《 right) { // 注意

int mid = (left + right) / 2;

if (nums[mid] == target) {

right = mid;

} else if (nums[mid] 《 target) {

left = mid + 1;

} else if (nums[mid] 》 target) {

right = mid; // 注意

}

}

return left;

}

1. 為什么 while(left 《 right) 而不是 《= ?

答:用相同的方法分析,因?yàn)?right = nums.length 而不是 nums.length - 1 。因此每次循環(huán)的「搜索區(qū)間」是 [left, right) 左閉右開。

while(left 《 right) 終止的條件是 left == right,此時(shí)搜索區(qū)間 [left, left) 為空,所以可以正確終止。

2. 為什么沒有返回 -1 的操作?如果 nums 中不存在 target 這個(gè)值,怎么辦?

答:因?yàn)橐徊揭徊絹?,先理解一下這個(gè)「左側(cè)邊界」有什么特殊含義:

詳解C語言二分查找算法細(xì)節(jié)

對于這個(gè)數(shù)組,算法會(huì)返回 1。這個(gè) 1 的含義可以這樣解讀:nums 中小于 2 的元素有 1 個(gè)。

比如對于有序數(shù)組 nums = [2,3,5,7], target = 1,算法會(huì)返回 0,含義是:nums 中小于 1 的元素有 0 個(gè)。

再比如說 nums 不變,target = 8,算法會(huì)返回 4,含義是:nums 中小于 8 的元素有 4 個(gè)。

綜上可以看出,函數(shù)的返回值(即 left 變量的值)取值區(qū)間是閉區(qū)間 [0, nums.length],所以我們簡單添加兩行代碼就能在正確的時(shí)候 return -1:

while (left 《 right) {

//。..

}

// target 比所有數(shù)都大

if (left == nums.length) return -1;

// 類似之前算法的處理方式

return nums[left] == target ? left : -1;

3. 為什么 left = mid + 1,right = mid ?和之前的算法不一樣?

答:這個(gè)很好解釋,因?yàn)槲覀兊摹杆阉鲄^(qū)間」是 [left, right) 左閉右開,所以當(dāng) nums[mid] 被檢測之后,下一步的搜索區(qū)間應(yīng)該去掉 mid 分割成兩個(gè)區(qū)間,即 [left, mid) 或 [mid + 1, right)。

4. 為什么該算法能夠搜索左側(cè)邊界?

答:關(guān)鍵在于對于 nums[mid] == target 這種情況的處理:

if (nums[mid] == target)

right = mid;

可見,找到 target 時(shí)不要立即返回,而是縮小「搜索區(qū)間」的上界 right,在區(qū)間 [left, mid) 中繼續(xù)搜索,即不斷向左收縮,達(dá)到鎖定左側(cè)邊界的目的。

5. 為什么返回 left 而不是 right?

答:都是一樣的,因?yàn)?while 終止的條件是 left == right。

三、尋找右側(cè)邊界的二分查找

尋找右側(cè)邊界和尋找左側(cè)邊界的代碼差不多,只有兩處不同,已標(biāo)注:

int right_bound(int[] nums, int target) {

if (nums.length == 0) return -1;

int left = 0, right = nums.length;

while (left 《 right) {

int mid = (left + right) / 2;

if (nums[mid] == target) {

left = mid + 1; // 注意

} else if (nums[mid] 《 target) {

left = mid + 1;

} else if (nums[mid] 》 target) {

right = mid;

}

}

return left - 1; // 注意

}

1. 為什么這個(gè)算法能夠找到右側(cè)邊界?

答:類似地,關(guān)鍵點(diǎn)還是這里:

if (nums[mid] == target) {

left = mid + 1;

當(dāng) nums[mid] == target 時(shí),不要立即返回,而是增大「搜索區(qū)間」的下界 left,使得區(qū)間不斷向右收縮,達(dá)到鎖定右側(cè)邊界的目的。

2. 為什么最后返回 left - 1 而不像左側(cè)邊界的函數(shù),返回 left?而且我覺得這里既然是搜索右側(cè)邊界,應(yīng)該返回 right 才對。

答:首先,while 循環(huán)的終止條件是 left == right,所以 left 和 right 是一樣的,你非要體現(xiàn)右側(cè)的特點(diǎn),返回 right - 1 好了。

至于為什么要減一,這是搜索右側(cè)邊界的一個(gè)特殊點(diǎn),關(guān)鍵在這個(gè)條件判斷:

if (nums[mid] == target) {

left = mid + 1;

// 這樣想: mid = left - 1

詳解C語言二分查找算法細(xì)節(jié)

因?yàn)槲覀儗?left 的更新必須是 left = mid + 1,就是說 while 循環(huán)結(jié)束時(shí),nums[left] 一定不等于 target 了,而 nums[left-1] 可能是 target。更多精彩文章歡迎關(guān)注我的眾公號(hào) labuladong。

至于為什么 left 的更新必須是 left = mid + 1,同左側(cè)邊界搜索,就不再贅述。

3. 為什么沒有返回 ?1-1?1 的操作?如果 nums 中不存在 target 這個(gè)值,怎么辦?

答:類似之前的左側(cè)邊界搜索,因?yàn)?while 的終止條件是 left == right,就是說 left 的取值范圍是 [0, nums.length],所以可以添加兩行代碼,正確地返回 ?1-1?1:

while (left 《 right) {

// 。..

}

if (left == 0) return -1;

return nums[left-1] == target ? (left-1) : -1;

四、最后總結(jié)

來梳理一下這些細(xì)節(jié)差異的因果邏輯:

第一個(gè),最基本的二分查找算法:

因?yàn)槲覀兂跏蓟?right = nums.length - 1

所以決定了我們的「搜索區(qū)間」是 [left, right]

所以決定了 while (left 《= right)

同時(shí)也決定了 left = mid+1 和 right = mid-1

因?yàn)槲覀冎恍枵业揭粋€(gè) target 的索引即可

所以當(dāng) nums[mid] == target 時(shí)可以立即返回

第二個(gè),尋找左側(cè)邊界的二分查找:

因?yàn)槲覀兂跏蓟?right = nums.length

所以決定了我們的「搜索區(qū)間」是 [left, right)

所以決定了 while (left 《 right)

同時(shí)也決定了 left = mid + 1 和 right = mid

因?yàn)槲覀冃枵业?target 的最左側(cè)索引

所以當(dāng) nums[mid] == target 時(shí)不要立即返回

而要收緊右側(cè)邊界以鎖定左側(cè)邊界

第三個(gè),尋找右側(cè)邊界的二分查找:

因?yàn)槲覀兂跏蓟?right = nums.length

所以決定了我們的「搜索區(qū)間」是 [left, right)

所以決定了 while (left 《 right)

同時(shí)也決定了 left = mid + 1 和 right = mid

因?yàn)槲覀冃枵业?target 的最右側(cè)索引

所以當(dāng) nums[mid] == target 時(shí)不要立即返回

而要收緊左側(cè)邊界以鎖定右側(cè)邊界

又因?yàn)槭站o左側(cè)邊界時(shí)必須 left = mid + 1

所以最后無論返回 left 還是 right,必須減一

如果以上內(nèi)容你都能理解,那么恭喜你,二分查找算法的細(xì)節(jié)不過如此。

通過本文,你學(xué)會(huì)了:

分析二分查找代碼時(shí),不要出現(xiàn) else,全部展開成 else if 方便理解。

注意「搜索區(qū)間」和 while 的終止條件,如果存在漏掉的元素,記得在最后檢查。

如需要搜索左右邊界,只要在 nums[mid] == target 時(shí)做修改即可。搜索右側(cè)時(shí)需要減一。

以后就算遇到其他的二分查找變形,運(yùn)用這幾點(diǎn)技巧,也能保證你寫出正確的代碼。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • C語言
    +關(guān)注

    關(guān)注

    180

    文章

    7575

    瀏覽量

    134086
  • 二分法
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    7545
收藏 人收藏

    評論

    相關(guān)推薦

    如何用C語言實(shí)現(xiàn)高效查找二分法)

    今天給分享一下使用C語言實(shí)現(xiàn)二分算法,主要包含以下幾部分內(nèi)容:二分查找
    的頭像 發(fā)表于 06-04 08:04 ?765次閱讀
    如何用<b class='flag-5'>C</b><b class='flag-5'>語言</b>實(shí)現(xiàn)高效<b class='flag-5'>查找</b>(<b class='flag-5'>二分</b>法)

    Java常用排序算法&程序員必須掌握的8大排序算法+二分查找

    Java常用排序算法&程序員必須掌握的8大排序算法+二分查找
    發(fā)表于 10-19 19:33

    簡單的查找算法

    ; } return 0;} 3. 有序數(shù)組表的查找:一般使用二分查找。通過判斷查找元素與中間元素(mid)的大小來決定下一次的查找在低
    發(fā)表于 12-27 22:33

    淺析漸近表示法和二分

    算法圖解》NOTE 1 算法的漸近表示法以及二分
    發(fā)表于 10-10 10:58

    C語言教程之二分查找

    C語言教程之二分查找,很好的C語言資料,快來學(xué)習(xí)吧。
    發(fā)表于 04-22 11:06 ?0次下載

    基于聚類算法二分網(wǎng)絡(luò)社區(qū)挖掘算法

    針對二分網(wǎng)絡(luò)中社區(qū)挖掘的準(zhǔn)確性不高、對額外參數(shù)的依賴較大的問題,基于譜聚類算法的思想,從二分網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)展開,提出了一種改進(jìn)的社區(qū)挖掘算法。該算法
    發(fā)表于 12-27 10:06 ?0次下載
    基于聚類<b class='flag-5'>算法</b>的<b class='flag-5'>二分</b>網(wǎng)絡(luò)社區(qū)挖掘<b class='flag-5'>算法</b>

    基于C語言二分查找排序源代碼

    本文檔內(nèi)容介紹了C語言歸并、選擇、直接插入、希爾、冒泡、快速、堆排序與順序、二分查找排序源代碼,分享給大家供大家參考。
    發(fā)表于 01-04 11:24 ?1次下載

    圖像處理算法二分查找

    二分查找又稱折半查找,優(yōu)點(diǎn)是比較次數(shù)少,查找速度快,平均性能好;其缺點(diǎn)是要求待查表為有序表,且插入刪除困難。
    的頭像 發(fā)表于 03-17 11:29 ?4788次閱讀

    學(xué)習(xí)C語言的目標(biāo)和方法有哪些及C語言的關(guān)鍵字說明

    、結(jié)構(gòu)體和指針、硬件和指針等的聯(lián)系與應(yīng)用;4. 掌握基本的查找和排序算法,比如二分查找和冒泡等;5. 掌握系統(tǒng)庫的應(yīng)用及靜態(tài)庫和動(dòng)態(tài)庫的打包與構(gòu)建方法;
    發(fā)表于 08-02 17:34 ?1次下載
    學(xué)習(xí)<b class='flag-5'>C</b><b class='flag-5'>語言</b>的目標(biāo)和方法有哪些及<b class='flag-5'>C</b><b class='flag-5'>語言</b>的關(guān)鍵字說明

    二分查找及其變種的總結(jié)

    今天給大家?guī)淼氖?b class='flag-5'>二分查找及其變種的總結(jié),大家一定要看到最后呀,非常非常用心的一篇文章,廢話不多說,讓導(dǎo)演幫我們把鏡頭切到袁記菜館吧! 袁記菜館內(nèi)。。。。 店小:掌柜的,您進(jìn)貨回來了呀,喲!今天您
    的頭像 發(fā)表于 01-04 14:28 ?2073次閱讀
    <b class='flag-5'>二分</b><b class='flag-5'>查找</b>及其變種的總結(jié)

    一種融合語義模型的二分網(wǎng)絡(luò)推薦算法

    當(dāng)前基于二分網(wǎng)絡(luò)的推薦算法未考慮推薦對象之間的語義關(guān)系,因此文中提出一種融合語義模型的二分網(wǎng)絡(luò)推薦算法。該算法利用作者主題模型將推薦對象的語
    發(fā)表于 04-28 13:53 ?4次下載
    一種融合語義模型的<b class='flag-5'>二分</b>網(wǎng)絡(luò)推薦<b class='flag-5'>算法</b>

    二分搜索算法運(yùn)用的框架套路

    我們前文 我作了首詩,保你閉著眼睛也能寫對二分查找 詳細(xì)介紹了二分搜索的細(xì)節(jié)問題,探討了「搜索一個(gè)元素」,「搜索左側(cè)邊界」,「搜索右側(cè)邊界」這三個(gè)情況,教你如何寫出正確無 bug 的
    的頭像 發(fā)表于 08-25 16:06 ?1746次閱讀

    筑基_C_5_對數(shù)組的二分查找

    C語言泛型編程,實(shí)現(xiàn)對數(shù)組中某元素的二分查找
    發(fā)表于 12-06 10:21 ?9次下載
    筑基_<b class='flag-5'>C</b>_5_對數(shù)組的<b class='flag-5'>二分</b><b class='flag-5'>查找</b>

    如何理解二分查找算法

    本文就來探究幾個(gè)最常用的二分查找場景:尋找一個(gè)數(shù)、尋找左側(cè)邊界、尋找右側(cè)邊界。 而且,我們就是要深入細(xì)節(jié),比如不等號(hào)是否應(yīng)該帶等號(hào),mid 是否應(yīng)該加一等等。分析這些細(xì)節(jié)的差異以
    的頭像 發(fā)表于 04-19 11:10 ?542次閱讀
    如何理解<b class='flag-5'>二分</b><b class='flag-5'>查找</b><b class='flag-5'>算法</b>

    FPGA設(shè)計(jì)中二分法查表算法的實(shí)現(xiàn)

    二分查找算法是在軟件中廣泛應(yīng)用的一種算法,那么在FPGA的設(shè)計(jì)中是否可以用這種算法呢?什么場景下會(huì)可能用到這種
    的頭像 發(fā)表于 09-06 18:26 ?847次閱讀
    FPGA設(shè)計(jì)中<b class='flag-5'>二分</b>法查表<b class='flag-5'>算法</b>的實(shí)現(xiàn)