0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于C語言指針的本質(zhì)和原理與技巧用法,用圖文和代碼給你詳細(xì)分析

GReq_mcu168 ? 來源:CSDN技術(shù)社區(qū) ? 作者:道哥分享 ? 2021-04-03 12:05 ? 次閱讀

一、前言

如果問C語言中最重要、威力最大的概念是什么,答案必將是指針!威力大,意味著使用方便、高效,同時(shí)也意味著語法復(fù)雜、容易出錯(cuò)。指針用的好,可以極大的提高代碼執(zhí)行效率、節(jié)約系統(tǒng)資源;如果用的不好,程序中將會充滿陷阱、漏洞。

這篇文章,我們就來聊聊指針。從最底層的內(nèi)存存儲空間開始,一直到應(yīng)用層的各種指針使用技巧,循序漸進(jìn)、抽絲剝繭,以最直白的語言進(jìn)行講解,讓你一次看過癮。

說明:為了方便講解和理解,文中配圖的內(nèi)存空間的地址是隨便寫的,在實(shí)際計(jì)算機(jī)中是要遵循地址對齊方式的。

二、變量與指針的本質(zhì)

1. 內(nèi)存地址

我們編寫一個(gè)程序源文件之后,編譯得到的二進(jìn)制可執(zhí)行文件存放在電腦的硬盤上,此時(shí)它是一個(gè)靜態(tài)的文件,一般稱之為程序。

當(dāng)這個(gè)程序被啟動的時(shí)候,操作系統(tǒng)將會做下面幾件事情:

把程序的內(nèi)容(代碼段、數(shù)據(jù)段)從硬盤復(fù)制到內(nèi)存中;

創(chuàng)建一個(gè)數(shù)據(jù)結(jié)構(gòu)PCB(進(jìn)程控制塊),來描述這個(gè)程序的各種信息(例如:使用的資源,打開的文件描述符。..);

在代碼段中定位到入口函數(shù)的地址,讓CPU從這個(gè)地址開始執(zhí)行。

958a9c80-90f9-11eb-8b86-12bb97331649.png

當(dāng)程序開始被執(zhí)行時(shí),就變成一個(gè)動態(tài)的狀態(tài),一般稱之為進(jìn)程。

內(nèi)存分為:物理內(nèi)存和虛擬內(nèi)存。操作系統(tǒng)對物理內(nèi)存進(jìn)行管理、包裝,我們開發(fā)者面對的是操作系統(tǒng)提供的虛擬內(nèi)存。

這2個(gè)概念不妨礙文章的理解,因此就統(tǒng)一稱之為內(nèi)存。

在我們的程序中,通過一個(gè)變量名來定義變量、使用變量。變量本身是一個(gè)確確實(shí)實(shí)存在的東西,變量名是一個(gè)抽象的概念,用來代表這個(gè)變量。就比如:我是一個(gè)實(shí)實(shí)在在的人,是客觀存在與這個(gè)地球上的,道哥是我給自己起的一個(gè)名字,這個(gè)名字是任意取得,只要自己覺得好聽就行,如果我愿意還可以起名叫:鳥哥、龍哥等等。

那么,我們定義一個(gè)變量之后,這個(gè)變量放在哪里呢?那就是內(nèi)存的數(shù)據(jù)區(qū)。內(nèi)存是一個(gè)很大的存儲區(qū)域,被操作系統(tǒng)劃分為一個(gè)一個(gè)的小空間,操作系統(tǒng)通過地址來管理內(nèi)存。

95c93698-90f9-11eb-8b86-12bb97331649.png

內(nèi)存中的最小存儲單位是字節(jié)(8個(gè)bit),一個(gè)內(nèi)存的完整空間就是由這一個(gè)一個(gè)的字節(jié)連續(xù)組成的。在上圖中,每一個(gè)小格子代表一個(gè)字節(jié),但是好像大家在書籍中沒有這么來畫內(nèi)存模型的,更常見的是下面這樣的畫法:

96325c18-90f9-11eb-8b86-12bb97331649.png

也就是把連續(xù)的4個(gè)字節(jié)的空間畫在一起,這樣就便于表述和理解,特別是深入到代碼對齊相關(guān)知識時(shí)更容易理解。(我認(rèn)為根本原因應(yīng)該是:大家都這么畫,已經(jīng)看順眼了~~)

2. 32位與64位系統(tǒng)

我們平時(shí)所說的計(jì)算機(jī)是32位、64位,指的是計(jì)算機(jī)的CPU中寄存器的最大存儲長度,如果寄存器中最大存儲32bit的數(shù)據(jù),就稱之為32位系統(tǒng)。

在計(jì)算機(jī)中,數(shù)據(jù)一般都是在硬盤、內(nèi)存和寄存器之間進(jìn)行來回存取。CPU通過3種總線把各組成部分聯(lián)系在一起:地址總線、數(shù)據(jù)總線和控制總線。地址總線的寬度決定了CPU的尋址能力,也就是CPU能達(dá)到的最大地址范圍。

96a799e2-90f9-11eb-8b86-12bb97331649.png

剛才說了,內(nèi)存是通過地址來管理的,那么CPU想從內(nèi)存中的某個(gè)地址空間上存取一個(gè)數(shù)據(jù),那么CPU就需要在地址總線上輸出這個(gè)存儲單元的地址。假如地址總線的寬度是8位,能表示的最大地址空間就是256個(gè)字節(jié),能找到內(nèi)存中最大的存儲單元是255這個(gè)格子(從0開始)。即使內(nèi)存條的實(shí)際空間是2G字節(jié),CPU也沒法使用后面的內(nèi)存地址空間。如果地址總線的寬度是32位,那么能表示的最大地址就是2的32次方,也就是4G字節(jié)的空間。

【注意】:這里只是描述地址總線的概念,實(shí)際的計(jì)算機(jī)中地址計(jì)算方式要復(fù)雜的多,比如:虛擬內(nèi)存中采用分段、分頁、偏移量來定位實(shí)際的物理內(nèi)存,在分頁中還有大頁、小頁之分,感興趣的同學(xué)可以自己查一下相關(guān)資料。

3. 變量

我們在C程序中使用變量來“代表”一個(gè)數(shù)據(jù),使用函數(shù)名來“代表”一個(gè)函數(shù),變量名和函數(shù)名是程序員使用的助記符。變量和函數(shù)最終是要放到內(nèi)存中才能被CPU使用的,而內(nèi)存中所有的信息(代碼和數(shù)據(jù))都是以二進(jìn)制的形式來存儲的,計(jì)算機(jī)根據(jù)就不會從格式上來區(qū)分哪些是代碼、哪些是數(shù)據(jù)。CPU在訪問內(nèi)存的時(shí)候需要的是地址,而不是變量名、函數(shù)名。

問題來了:在程序代碼中使用變量名來指代變量,而變量在內(nèi)存中是根據(jù)地址來存放的,這二者之間如何映射(關(guān)聯(lián))起來的?

答案是:編譯器!編譯器在編譯文本格式的C程序文件時(shí),會根據(jù)目標(biāo)運(yùn)行平臺(就是編譯出的二進(jìn)制程序運(yùn)行在哪里?是x86平臺的電腦?還是ARM平臺的開發(fā)板?)來安排程序中的各種地址,例如:加載到內(nèi)存中的地址、代碼段的入口地址等等,同時(shí)編譯器也會把程序中的所有變量名,轉(zhuǎn)成該變量在內(nèi)存中的存儲地址。

變量有2個(gè)重要屬性:變量的類型和變量的值。

示例:代碼中定義了一個(gè)變量

int a = 20;

類型是int型,值是20。這個(gè)變量在內(nèi)存中的存儲模型為:

96f0ac86-90f9-11eb-8b86-12bb97331649.png

我們在代碼中使用變量名a,在程序執(zhí)行的時(shí)候就表示使用0x11223344地址所對應(yīng)的那個(gè)存儲單元中的數(shù)據(jù)。因此,可以理解為變量名a就等價(jià)于這個(gè)地址0x11223344。換句話說,如果我們可以提前知道編譯器把變量a安排在地址0x11223344這個(gè)單元格中,我們就可以在程序中直接用這個(gè)地址值來操作這個(gè)變量。

在上圖中,變量a的值為20,在內(nèi)存中占據(jù)了4個(gè)格子的空間,也就是4個(gè)字節(jié)。為什么是4個(gè)字節(jié)呢?在C標(biāo)準(zhǔn)中并沒有規(guī)定每種數(shù)據(jù)類型的變量一定要占用幾個(gè)字節(jié),這是與具體的機(jī)器、編譯器有關(guān)。

比如:32位的編譯器中:

char: 1個(gè)字節(jié);

short int: 2個(gè)字節(jié);

int: 4個(gè)字節(jié);

long: 4個(gè)字節(jié)。

比如:64位的編譯器中:

char: 1個(gè)字節(jié);

short int: 2個(gè)字節(jié);

int: 4個(gè)字節(jié);

long: 8個(gè)字節(jié)。

為了方便描述,下面都以32位為例,也就是int型變量在內(nèi)存中占據(jù)4個(gè)字節(jié)。

另外,0x11223344,0x11223345,0x11223346,0x11223347這連續(xù)的、從低地址到高地址的4個(gè)字節(jié)用來存儲變量a的數(shù)值20。在圖示中,使用十六進(jìn)制來表示,十進(jìn)制數(shù)值20轉(zhuǎn)成16進(jìn)制就是:0x00000014,所以從開始地址依次存放0x00、0x00、0x00、0x14這4個(gè)字節(jié)(存儲順序涉及到大小端的問題,不影響文本理解)。

根據(jù)這個(gè)圖示,如果在程序中想知道變量a存儲在內(nèi)存中的什么位置,可以使用取地址操作符&,如下:

printf(“&a = 0x%x

”, &a);

這句話將會打印出:&a = 0x11223344。

考慮一下,在32位系統(tǒng)中:指針變量占用幾個(gè)字節(jié)?

4. 指針變量

指針變量可以分2個(gè)層次來理解:

指針變量首先是一個(gè)變量,所以它擁有變量的所有屬性:類型和值。它的類型就是指針,它的值是其他變量的地址。 既然是一個(gè)變量,那么在內(nèi)存中就需要為這個(gè)變量分配一個(gè)存儲空間。在這個(gè)存儲空間中,存放著其他變量的地址。

指針變量所指向的數(shù)據(jù)類型,這是在定義指針變量的時(shí)候就確定的。例如:int *p; 意味著指針指向的是一個(gè)int型的數(shù)據(jù)。

首先回答一下剛才那個(gè)問題,在32位系統(tǒng)中,一個(gè)指針變量在內(nèi)存中占據(jù)4個(gè)字節(jié)的空間。因?yàn)镃PU對內(nèi)存空間尋址時(shí),使用的是32位地址空間(4個(gè)字節(jié)),也就是用4個(gè)字節(jié)就能存儲一個(gè)內(nèi)存單元的地址。而指針變量中的值存儲的就是地址,所以需要4個(gè)字節(jié)的空間來存儲一個(gè)指針變量的值。

示例:

int a = 20;

int *pa;

pa = &a;

printf(“value = %d

”, *pa);

在內(nèi)存中的存儲模型如下:

9723195a-90f9-11eb-8b86-12bb97331649.png

對于指針變量pa來說,首先它是一個(gè)變量,因此在內(nèi)存中需要有一個(gè)空間來存儲這個(gè)變量,這個(gè)空間的地址就是0x11223348;

其次,這個(gè)內(nèi)存空間中存儲的內(nèi)容是變量a的地址,而a的地址為0x11223344,所以指針變量pa的地址空間中,就存儲了0x11223344這個(gè)值。

這里對兩個(gè)操作符&和*進(jìn)行說明:

&:取地址操作符,用來獲取一個(gè)變量的地址。上面代碼中&a就是用來獲取變量a在內(nèi)存中的存儲地址,也就是0x11223344。

*:這個(gè)操作符用在2個(gè)場景中:定義一個(gè)指針的時(shí)候,獲取一個(gè)指針?biāo)赶虻淖兞恐档臅r(shí)候。

int pa; 這個(gè)語句中的表示定義的變量pa是一個(gè)指針,前面的int表示pa這個(gè)指針指向的是一個(gè)int類型的變量。不過此時(shí)我們沒有給pa進(jìn)行賦值,也就是說此刻pa對應(yīng)的存儲單元中的4個(gè)字節(jié)里的值是沒有初始化的,可能是0x00000000,也可能是其他任意的數(shù)字,不確定;

printf語句中的*表示獲取pa指向的那個(gè)int類型變量的值,學(xué)名叫解引用,我們只要記住是獲取指向的變量的值就可以了。

5. 操作指針變量

對指針變量的操作包括3個(gè)方面:

操作指針變量自身的值;

獲取指針變量所指向的數(shù)據(jù);

以什么樣數(shù)據(jù)類型來使用/解釋指針變量所指向的內(nèi)容。

5.1 指針變量自身的值

int a = 20;這個(gè)語句是定義變量a,在隨后的代碼中,只要寫下a就表示要操作變量a中存儲的值,操作有兩種:讀和寫。

printf(“a = %d ”, a); 這個(gè)語句就是要讀取變量a中的值,當(dāng)然是20;

a = 100;這個(gè)語句就是要把一個(gè)數(shù)值100寫入到變量a中。

同樣的道理,int *pa;語句是用來定義指針變量pa,在隨后的代碼中,只要寫下pa就表示要操作變量pa中的值:

printf(“pa = %d ”, pa); 這個(gè)語句就是要讀取指針變量pa中的值,當(dāng)然是0x11223344;

pa = &a;這個(gè)語句就是要把新的值寫入到指針變量pa中。再次強(qiáng)調(diào)一下,指針變量中存儲的是地址,如果我們可以提前知道變量a的地址是 0x11223344,那么我們也可以這樣來賦值:pa = 0x11223344;

思考一下,如果執(zhí)行這個(gè)語句printf(“&pa =0x%x ”, &pa);,打印結(jié)果會是什么?

上面已經(jīng)說過,操作符&是用來取地址的,那么&pa就表示獲取指針變量pa的地址,上面的內(nèi)存模型中顯示指針變量pa是存儲在0x11223348這個(gè)地址中的,因此打印結(jié)果就是:&pa = 0x11223348。

5.2 獲取指針變量所指向的數(shù)據(jù)

指針變量所指向的數(shù)據(jù)類型是在定義的時(shí)候就明確的,也就是說指針pa指向的數(shù)據(jù)類型就是int型,因此在執(zhí)行printf(“value = %d ”, *pa);語句時(shí),首先知道pa是一個(gè)指針,其中存儲了一個(gè)地址(0x11223344),然后通過操作符*來獲取這個(gè)地址(0x11223344)對應(yīng)的那個(gè)存儲空間中的值;又因?yàn)樵诙xpa時(shí),已經(jīng)指定了它指向的值是一個(gè)int型,所以我們就知道了地址0x11223344中存儲的就是一個(gè)int類型的數(shù)據(jù)。

5.3 以什么樣的數(shù)據(jù)類型來使用/解釋指針變量所指向的內(nèi)容

如下代碼:

int a = 30000;

int *pa = &a;

printf(“value = %d

”, *pa);

根據(jù)以上的描述,我們知道printf的打印結(jié)果會是value = 30000,十進(jìn)制的30000轉(zhuǎn)成十六進(jìn)制是0x00007530,內(nèi)存模型如下:

974d5378-90f9-11eb-8b86-12bb97331649.png

現(xiàn)在我們做這樣一個(gè)測試:

char *pc = 0x11223344;

printf(“value = %d

”, *pc);

指針變量pc在定義的時(shí)候指明:它指向的數(shù)據(jù)類型是char型,pc變量中存儲的地址是0x11223344。當(dāng)使用*pc獲取指向的數(shù)據(jù)時(shí),將會按照char型格式來讀取0x11223344地址處的數(shù)據(jù),因此將會打印value = 0(在計(jì)算機(jī)中,ASCII碼是用等價(jià)的數(shù)字來存儲的)。

這個(gè)例子中說明了一個(gè)重要的概念:在內(nèi)存中一切都是數(shù)字,如何來操作(解釋)一個(gè)內(nèi)存地址中的數(shù)據(jù),完全是由我們的代碼來告訴編譯器的。剛才這個(gè)例子中,雖然0x11223344這個(gè)地址開始的4個(gè)字節(jié)的空間中,存儲的是整型變量a的值,但是我們讓pc指針按照char型數(shù)據(jù)來使用/解釋這個(gè)地址處的內(nèi)容,這是完全合法的。

以上內(nèi)容,就是指針最根本的心法了。把這個(gè)心法整明白了,剩下的就是多見識、多練習(xí)的問題了。

三、指針的幾個(gè)相關(guān)概念1. const屬性

const標(biāo)識符用來表示一個(gè)對象的不可變的性質(zhì),例如定義:

const int b = 20;

在后面的代碼中就不能改變變量b的值了,b中的值永遠(yuǎn)是20。同樣的,如果用const來修飾一個(gè)指針變量:

int a = 20;

int b = 20;

int * const p = &a;

內(nèi)存模型如下:

976015a8-90f9-11eb-8b86-12bb97331649.png

這里的const用來修飾指針變量p,根據(jù)const的性質(zhì)可以得出結(jié)論:p在定義為變量a的地址之后,就固定了,不能再被改變了,也就是說指針變量pa中就只能存儲變量a的地址0x11223344。如果在后面的代碼中寫p = &b;,編譯時(shí)就會報(bào)錯(cuò),因?yàn)閜是不可改變的,不能再被設(shè)置為變量b的地址。

但是,指針變量p所指向的那個(gè)變量a的值是可以改變的,即:*p = 21;這個(gè)語句是合法的,因?yàn)橹羔榩的值沒有改變(仍然是變量c的地址0x11223344),改變的是變量c中存儲的值。

與下面的代碼區(qū)分一下:

int a = 20;

int b = 20;

const int *p = &a;

p = &b;

這里的const沒有放在p的旁邊,而是放在了類型int的旁邊,這就說明const符號不是用來修飾p的,而是用來修飾p所指向的那個(gè)變量的。所以,如果我們寫p = &b;把變量b的地址賦值給指針p,就是合法的,因?yàn)閜的值可以被改變。

但是這個(gè)語句*p = 21就是非法了,因?yàn)槎x語句中的const就限制了通過指針p獲取的數(shù)據(jù),不能被改變,只能被用來讀取。這個(gè)性質(zhì)常常被用在函數(shù)參數(shù)上,例如下面的代碼,用來計(jì)算一塊數(shù)據(jù)的CRC校驗(yàn),這個(gè)函數(shù)只需要讀取原始數(shù)據(jù),不需要(也不可以)改變原始數(shù)據(jù),因此就需要在形參指針上使用const修飾符:

short int getDataCRC(const char *pData, int len)

{

short int crc = 0x0000;

// 計(jì)算CRC

return crc;

}

2. void型指針

關(guān)鍵字void并不是一個(gè)真正的數(shù)據(jù)類型,它體現(xiàn)的是一種抽象,指明不是任何一種類型,一般有2種使用場景:

函數(shù)的返回值和形參;

定義指針時(shí)不明確規(guī)定所指數(shù)據(jù)的類型,也就意味著可以指向任意類型。

指針變量也是一種變量,變量之間可以相互賦值,那么指針變量之間也可以相互賦值,例如:

int a = 20;

int b = a;

int *p1 = &a;

int *p2 = p1;

變量a賦值給變量b,指針p1賦值給指針p2,注意到它們的類型必須是相同的:a和b都是int型,p1和p2都是指向int型,所以可以相互賦值。那么如果數(shù)據(jù)類型不同呢?必須進(jìn)行強(qiáng)制類型轉(zhuǎn)換。例如:

int a = 20;

int *p1 = &a;

char *p2 = (char *)p1;

內(nèi)存模型如下:

97e9a39a-90f9-11eb-8b86-12bb97331649.png

p1指針指向的是int型數(shù)據(jù),現(xiàn)在想把它的值(0x11223344)賦值給p2,但是由于在定義p2指針時(shí)規(guī)定它指向的數(shù)據(jù)類型是char型,因此需要把指針p1進(jìn)行強(qiáng)制類型轉(zhuǎn)換,也就是把地址0x11223344處的數(shù)據(jù)按照char型數(shù)據(jù)來看待,然后才可以賦值給p2指針。

如果我們使用void *p2來定義p2指針,那么在賦值時(shí)就不需要進(jìn)行強(qiáng)制類型轉(zhuǎn)換了,例如:

int a = 20;

int *p1 = &a;

void *p2 = p1;

指針p2是void*型,意味著可以把任意類型的指針賦值給p2,但是不能反過來操作,也就是不能把void*型指針直接賦值給其他確定類型的指針,而必須要強(qiáng)制轉(zhuǎn)換成被賦值指針?biāo)赶虻臄?shù)據(jù)類型,如下代碼,必須把p2指針強(qiáng)制轉(zhuǎn)換成int*型之后,再賦值給p3指針:

int a = 20;

int *p1 = &a;

void *p2 = p1;

int *p3 = (int *)p2;

我們來看一個(gè)系統(tǒng)函數(shù):

void* memcpy(void* dest, const void* src, size_t len);

第一個(gè)參數(shù)類型是void*,這正體現(xiàn)了系統(tǒng)對內(nèi)存操作的真正意義:它并不關(guān)心用戶傳來的指針具體指向什么數(shù)據(jù)類型,只是把數(shù)據(jù)挨個(gè)存儲到這個(gè)地址對應(yīng)的空間中。

第二個(gè)參數(shù)同樣如此,此外還添加了const修飾符,這樣就說明了memcpy函數(shù)只會從src指針處讀取數(shù)據(jù),而不會修改數(shù)據(jù)。

3. 空指針和野指針

一個(gè)指針必須指向一個(gè)有意義的地址之后,才可以對指針進(jìn)行操作。如果指針中存儲的地址值是一個(gè)隨機(jī)值,或者是一個(gè)已經(jīng)失效的值,此時(shí)操作指針就非常危險(xiǎn)了,一般把這樣的指針稱作野指針,C代碼中很多指針相關(guān)的bug就來源于此。

3.1 空指針:不指向任何東西的指針

在定義一個(gè)指針變量之后,如果沒有賦值,那么這個(gè)指針變量中存儲的就是一個(gè)隨機(jī)值,有可能指向內(nèi)存中的任何一個(gè)地址空間,此時(shí)萬萬不可以對這個(gè)指針進(jìn)行寫操作,因?yàn)樗锌赡苤赶騼?nèi)存中的代碼段區(qū)域、也可能指向內(nèi)存中操作系統(tǒng)所在的區(qū)域。

一般會將一個(gè)指針變量賦值為NULL來表示一個(gè)空指針,而C語言中,NULL實(shí)質(zhì)是 ((void*)0) , 在C++中,NULL實(shí)質(zhì)是0。在標(biāo)準(zhǔn)庫頭文件stdlib.h中,有如下定義:

#ifdef __cplusplus

#define NULL 0

#else

#define NULL ((void *)0)

#endif

3.2 野指針:地址已經(jīng)失效的指針

我們都知道,函數(shù)中的局部變量存儲在棧區(qū),通過malloc申請的內(nèi)存空間位于堆區(qū),如下代碼:

int *p = (int *)malloc(4);

*p = 20;

內(nèi)存模型為:

97ffe52e-90f9-11eb-8b86-12bb97331649.png

在堆區(qū)申請了4個(gè)字節(jié)的空間,然后強(qiáng)制類型轉(zhuǎn)換為int*型之后,賦值給指針變量p,然后通過*p設(shè)置這個(gè)地址中的值為14,這是合法的。如果在釋放了p指針指向的空間之后,再使用*p來操作這段地址,那就是非常危險(xiǎn)了,因?yàn)檫@個(gè)地址空間可能已經(jīng)被操作系統(tǒng)分配給其他代碼使用,如果對這個(gè)地址里的數(shù)據(jù)強(qiáng)行操作,程序立刻崩潰的話,將會是我們最大的幸運(yùn)!

int *p = (int *)malloc(4);

*p = 20;

free(p);

// 在free之后就不可以再操作p指針中的數(shù)據(jù)了。

p = NULL; // 最好加上這一句。

四、指向不同數(shù)據(jù)類型的指針1. 數(shù)值型指針

通過上面的介紹,指向數(shù)值型變量的指針已經(jīng)很明白了,需要注意的就是指針?biāo)赶虻臄?shù)據(jù)類型。

2. 字符串指針

字符串在內(nèi)存中的表示有2種:

用一個(gè)數(shù)組來表示,例如:char name1[8] = “zhangsan”;

用一個(gè)char *指針來表示,例如:char *name2 = “zhangsan”;

name1在內(nèi)存中占據(jù)8個(gè)字節(jié),其中存儲了8個(gè)字符的ASCII碼值;name2在內(nèi)存中占據(jù)9個(gè)字節(jié),因?yàn)槌舜鎯?個(gè)字符的ASCII碼值,在最后一個(gè)字符‘n’的后面還額外存儲了一個(gè)‘’,用來標(biāo)識字符串結(jié)束。

對于字符串來說,使用指針來操作是非常方便的,例如:變量字符串name2:

char *name2 = “zhangsan”;

char *p = name2;

while (*p != ‘’)

{

printf(“%c ”, *p);

p = p + 1;

}

在while的判斷條件中,檢查p指針指向的字符是否為結(jié)束符‘’。在循環(huán)體重,打印出當(dāng)前指向的字符之后,對指針比那里進(jìn)行自增操作,因?yàn)橹羔榩所指向的數(shù)據(jù)類型是char,每個(gè)char在內(nèi)存中占據(jù)一個(gè)字節(jié),因此指針p在自增1之后,就指向下一個(gè)存儲空間。

98840732-90f9-11eb-8b86-12bb97331649.png

也可以把循環(huán)體中的2條語句寫成1條語句:

printf(“%c ”, *p++);

假如一個(gè)指針指向的數(shù)據(jù)類型為int型,那么執(zhí)行p = p + 1;之后,指針p中存儲的地址值將會增加4,因?yàn)橐粋€(gè)int型數(shù)據(jù)在內(nèi)存中占據(jù)4個(gè)字節(jié)的空間,如下所示:

98b9604e-90f9-11eb-8b86-12bb97331649.png

思考一個(gè)問題:void*型指針能夠遞增嗎?如下測試代碼:

int a[3] = {1, 2, 3};

void *p = a;

printf(“1: p = 0x%x

”, p);

p = p + 1;

printf(“2: p = 0x%x

”, p);

打印結(jié)果如下:

1: p = 0x733748c0

2: p = 0x733748c1

說明void*型指針在自增時(shí),是按照一個(gè)字節(jié)的跨度來計(jì)算的。

3. 指針數(shù)組與數(shù)組指針

這2個(gè)說法經(jīng)常會混淆,至少我是如此,先看下這2條語句:

int *p1[3]; // 指針數(shù)組

int (*p2)[3]; // 數(shù)組指針

3.1 指針數(shù)組

第1條語句中:中括號[]的優(yōu)先級高,因此與p1先結(jié)合,表示一個(gè)數(shù)組,這個(gè)數(shù)組中有3個(gè)元素,這3個(gè)元素都是指針,它們指向的是int型數(shù)據(jù)??梢赃@樣來理解:如果有這個(gè)定義char p[3],很容易理解這是一個(gè)有3個(gè)char型元素的數(shù)組,那么把char換成int*,意味著數(shù)組里的元素類型是int*型(指向int型數(shù)據(jù)的指針)。內(nèi)存模型如下(注意:三個(gè)指針指向的地址并不一定是連續(xù)的):

994bc9b6-90f9-11eb-8b86-12bb97331649.png

如果向指針數(shù)組中的元素賦值,需要逐個(gè)把變量的地址賦值給指針元素:

int a = 1, b = 2, c = 3;

char *p1[3];

p1[0] = &a;

p1[1] = &b;

p1[2] = &c;

3.2 數(shù)組指針

第2條語句中:小括號讓p2與*結(jié)合,表示p2是一個(gè)指針,這個(gè)指針指向了一個(gè)數(shù)組,數(shù)組中有3個(gè)元素,每一個(gè)元素的類型是int型??梢赃@樣來理解:如果有這個(gè)定義int p[3],很容易理解這是一個(gè)有3個(gè)char型元素的數(shù)組,那么把數(shù)組名p換成是*p2,也就是p2是一個(gè)指針,指向了這個(gè)數(shù)組。內(nèi)存模型如下(注意:指針指向的地址是一個(gè)數(shù)組,其中的3個(gè)元素是連續(xù)放在內(nèi)存中的):

999475b2-90f9-11eb-8b86-12bb97331649.png

在前面我們說到取地址操作符&,用來獲得一個(gè)變量的地址。凡事都有特殊情況,對于獲取地址來說,下面幾種情況不需要使用&操作符:

字符串字面量作為右值時(shí),就代表這個(gè)字符串在內(nèi)存中的首地址;

數(shù)組名就代表這個(gè)數(shù)組的地址,也等于這個(gè)數(shù)組的第一個(gè)元素的地址;

函數(shù)名就代表這個(gè)函數(shù)的地址。

因此,對于一下代碼,三個(gè)printf語句的打印結(jié)果是相同的:

int a[3] = {1, 2, 3};

int (*p2)[3] = a;

printf(“0x%x

”, a);

printf(“0x%x

”, &a);

printf(“0x%x

”, p2);

思考一下,如果對這里的p2指針執(zhí)行p2 = p2 + 1;操作,p2中的值將會增加多少?

答案是12個(gè)字節(jié)。因?yàn)閜2指向的是一個(gè)數(shù)組,這個(gè)數(shù)組中包含3個(gè)元素,每個(gè)元素占據(jù)4個(gè)字節(jié),那么這個(gè)數(shù)組在內(nèi)存中一共占據(jù)12個(gè)字節(jié),因此p2在加1之后,就跳過12個(gè)字節(jié)。

99ddb15a-90f9-11eb-8b86-12bb97331649.png

4. 二維數(shù)組和指針

一維數(shù)組在內(nèi)存中是連續(xù)分布的多個(gè)內(nèi)存單元組成的,而二維數(shù)組在內(nèi)存中也是連續(xù)分布的多個(gè)內(nèi)存單元組成的,從內(nèi)存角度來看,一維數(shù)組和二維數(shù)組沒有本質(zhì)差別。

和一維數(shù)組類似,二維數(shù)組的數(shù)組名表示二維數(shù)組的第一維數(shù)組中首元素的首地址,用代碼來說明:

int a[3][3] = {{1,2,3}, {4,5,6}, {7,8,9}}; // 二維數(shù)組

int (*p0)[3] = NULL; // p0是一個(gè)指針,指向一個(gè)數(shù)組

int (*p1)[3] = NULL; // p1是一個(gè)指針,指向一個(gè)數(shù)組

int (*p2)[3] = NULL; // p2是一個(gè)指針,指向一個(gè)數(shù)組

p0 = a[0];

p1 = a[1];

p2 = a[2];

printf(“0: %d %d %d

”, *(*p0 + 0), *(*p0 + 1), *(*p0 + 2));

printf(“1: %d %d %d

”, *(*p1 + 0), *(*p1 + 1), *(*p1 + 2));

printf(“2: %d %d %d

”, *(*p2 + 0), *(*p2 + 1), *(*p2 + 2));

打印結(jié)果是:

0: 1 2 3

1: 4 5 6

2: 7 8 9

我們拿第一個(gè)printf語句來分析:p0是一個(gè)指針,指向一個(gè)數(shù)組,數(shù)組中包含3個(gè)元素,每個(gè)元素在內(nèi)存中占據(jù)4個(gè)字節(jié)。現(xiàn)在我們想獲取這個(gè)數(shù)組中的數(shù)據(jù),如果直接對p0執(zhí)行加1操作,那么p0將會跨過12個(gè)字節(jié)(就等于p1中的值了),因此需要使用解引用操作符*,把p0轉(zhuǎn)為指向int型的指針,然后再執(zhí)行加1操作,就可以得到數(shù)組中的int型數(shù)據(jù)了。

5. 結(jié)構(gòu)體指針

C語言中的基本數(shù)據(jù)類型是預(yù)定義的,結(jié)構(gòu)體是用戶定義的,在指針的使用上可以進(jìn)行類比,唯一有區(qū)別的就是在結(jié)構(gòu)體指針中,需要使用-》箭頭操作符來獲取結(jié)構(gòu)體中的成員變量,例如:

typedef struct

{

int age;

char name[8];

} Student;

Student s;

s.age = 20;

strcpy(s.name, “l(fā)isi”);

Student *p = &s;

printf(“age = %d, name = %s

”, p-》age, p-》name);

看起來似乎沒有什么技術(shù)含量,如果是結(jié)構(gòu)體數(shù)組呢?例如:

Student s[3];

Student *p = &s;

printf(“size of Student = %d

”, sizeof(Student));

printf(“1: 0x%x, 0x%x

”, s, p);

p++;

printf(“2: 0x%x

”, p);

打印結(jié)果是:

size of Student = 12

1: 0x4c02ac00, 0x4c02ac00

2: 0x4c02ac0c

在執(zhí)行p++操作后,p需要跨過的空間是一個(gè)結(jié)構(gòu)體變量在內(nèi)存中占據(jù)的大?。?2個(gè)字節(jié)),所以此時(shí)p就指向了數(shù)組中第2個(gè)元素的首地址,內(nèi)存模型如下:

9a9a03b4-90f9-11eb-8b86-12bb97331649.png

6. 函數(shù)指針

每一個(gè)函數(shù)在經(jīng)過編譯之后,都變成一個(gè)包含多條指令的集合,在程序被加載到內(nèi)存之后,這個(gè)指令集合被放在代碼區(qū),我們在程序中使用函數(shù)名就代表了這個(gè)指令集合的開始地址。

9ad4fad2-90f9-11eb-8b86-12bb97331649.png

函數(shù)指針,本質(zhì)上仍然是一個(gè)指針,只不過這個(gè)指針變量中存儲的是一個(gè)函數(shù)的地址。函數(shù)最重要特性是什么?可以被調(diào)用!因此,當(dāng)定義了一個(gè)函數(shù)指針并把一個(gè)函數(shù)地址賦值給這個(gè)指針時(shí),就可以通過這個(gè)函數(shù)指針來調(diào)用函數(shù)。

如下示例代碼:

int add(int x,int y)

{

return x+y;

}

int main()

{

int a = 1, b = 2;

int (*p)(int, int);

p = add;

printf(“%d + %d = %d

”, a, b, p(a, b));

}

前文已經(jīng)說過,函數(shù)的名字就代表函數(shù)的地址,所以函數(shù)名add就代表了這個(gè)加法函數(shù)在內(nèi)存中的地址。int (*p)(int, int);這條語句就是用來定義一個(gè)函數(shù)指針,它指向一個(gè)函數(shù),這個(gè)函數(shù)必須符合下面這2點(diǎn)(學(xué)名叫:函數(shù)簽名):

有2個(gè)int型的參數(shù);

有一個(gè)int型的返回值。

代碼中的add函數(shù)正好滿足這個(gè)要求,因此,可以把a(bǔ)dd賦值給函數(shù)指針p,此時(shí)p就指向了內(nèi)存中這個(gè)函數(shù)存儲的地址,后面就可以用函數(shù)指針p來調(diào)用這個(gè)函數(shù)了。

在示例代碼中,函數(shù)指針p是直接定義的,那如果想定義2個(gè)函數(shù)指針,難道需要像下面這樣定義嗎?

int (*p)(int, int);

int (*p2)(int, int);

這里的參數(shù)比較簡單,如果函數(shù)很復(fù)雜,這樣的定義方式豈不是要煩死?可以用typedef關(guān)鍵字來定義一個(gè)函數(shù)指針類型:

typedef int (*pFunc)(int, int);

然后用這樣的方式pFunc p1, p2;來定義多個(gè)函數(shù)指針就方便多了。注意:只能把與函數(shù)指針類型具有相同簽名的函數(shù)賦值給p1和p2,也就是參數(shù)的個(gè)數(shù)、類型要相同,返回值也要相同。

注意:這里有幾個(gè)小細(xì)節(jié)稍微了解一下:

在賦值函數(shù)指針時(shí),使用p = &a;也是可以的;

使用函數(shù)指針調(diào)用時(shí),使用(*p)(a, b);也是可以的。

這里沒有什么特殊的原理需要講解,最終都是編譯器幫我們處理了這里的細(xì)節(jié),直接記住即可。

函數(shù)指針整明白之后,再和數(shù)組結(jié)合在一起:函數(shù)指針數(shù)組。示例代碼如下:

int add(int a, int b) { return a + b; }

int sub(int a, int b) { return a - b; }

int mul(int a, int b) { return a * b; }

int divide(int a, int b) { return a / b; }

int main()

{

int a = 4, b = 2;

int (*p[4])(int, int);

p[0] = add;

p[1] = sub;

p[2] = mul;

p[3] = divide;

printf(“%d + %d = %d

”, a, b, p[0](a, b));

printf(“%d - %d = %d

”, a, b, p[1](a, b));

printf(“%d * %d = %d

”, a, b, p[2](a, b));

printf(“%d / %d = %d

”, a, b, p[3](a, b));

}

這條語句不太好理解:int (*p[4])(int, int);,先分析中間部分,標(biāo)識符p與中括號[]結(jié)合(優(yōu)先級高),所以p是一個(gè)數(shù)組,數(shù)組中有4個(gè)元素;然后剩下的內(nèi)容表示一個(gè)函數(shù)指針,那么就說明數(shù)組中的元素類型是函數(shù)指針,也就是其他函數(shù)的地址,內(nèi)存模型如下:

9afce06a-90f9-11eb-8b86-12bb97331649.png

如果還是難以理解,那就回到指針的本質(zhì)概念上:指針就是一個(gè)地址!這個(gè)地址中存儲的內(nèi)容是什么根本不重要,重要的是你告訴計(jì)算機(jī)這個(gè)內(nèi)容是什么。如果你告訴它:這個(gè)地址里存放的內(nèi)容是一個(gè)函數(shù),那么計(jì)算機(jī)就去調(diào)用這個(gè)函數(shù)。那么你是如何告訴計(jì)算機(jī)的呢,就是在定義指針變量的時(shí)候,僅此而已!

五、總結(jié)

我已經(jīng)把自己知道的所有指針相關(guān)的概念、語法、使用場景都作了講解,就像一個(gè)小酒館的掌柜,把自己的美酒佳肴都呈現(xiàn)給你,但愿你已經(jīng)酒足飯飽!

如果以上的內(nèi)容太多,一時(shí)無法消化,那么下面的這兩句話就作為飯后甜點(diǎn)為您奉上,在以后的編程中,如果遇到指針相關(guān)的困惑,就想一想這兩句話,也許能讓你茅塞頓開。

指針就是地址,地址就是指針。

指針就是指向內(nèi)存中的一塊空間,至于如何來解釋/操作這塊空間,由這個(gè)指針的類型來決定。

另外還有一點(diǎn)囑咐,那就是學(xué)習(xí)任何一門編程語言,一定要弄清楚內(nèi)存模型,內(nèi)存模型,內(nèi)存模型!
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • C語言
    +關(guān)注

    關(guān)注

    180

    文章

    7596

    瀏覽量

    135945
  • 指針
    +關(guān)注

    關(guān)注

    1

    文章

    478

    瀏覽量

    70493
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4730

    瀏覽量

    68259

原文標(biāo)題:C語言指針-從底層原理到花式技巧,用圖文和代碼幫你講解透徹

文章出處:【微信號:mcu168,微信公眾號:硬件攻城獅】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    C語言指針學(xué)習(xí)筆記

    本文從底層內(nèi)存分析,徹底讓讀者明白C語言指針本質(zhì)。
    的頭像 發(fā)表于 11-05 17:40 ?130次閱讀
    <b class='flag-5'>C</b><b class='flag-5'>語言</b><b class='flag-5'>指針</b>學(xué)習(xí)筆記

    C語言指針運(yùn)算符詳解

    C語言中,當(dāng)你有一個(gè)指向數(shù)組中某個(gè)元素的指針時(shí),你可以對該指針執(zhí)行某些算術(shù)運(yùn)算,例如加法或減法。這些運(yùn)算可以用來遍歷數(shù)組中的元素,如ptr[i]等價(jià)于*(ptr + i)。然而,如果
    的頭像 發(fā)表于 10-30 11:16 ?133次閱讀

    C語言指針詳細(xì)解析

    可以對數(shù)據(jù)本身,也可以對存儲數(shù)據(jù)的變量地址進(jìn)行操作。 指針是一個(gè)占據(jù)存儲空間的實(shí)體在這一段空間起始位置的相對距離值。在C/C++語言中,指針
    發(fā)表于 09-14 10:03

    hex文件如何查看原c語言代碼

    是處理器可以直接執(zhí)行的指令,而 C 語言代碼則是人類可讀的高級編程語言代碼。 然而,如果你想要從 .hex 文件中獲取一些有用的信息或者對程
    的頭像 發(fā)表于 09-02 10:37 ?1275次閱讀

    面試中的高頻問題:指針函數(shù)與函數(shù)指針,你能完美應(yīng)對嗎?

    的內(nèi)存分析,徹底讓大家明白指針本質(zhì)。建議大家靜下心來再復(fù)習(xí)一遍。一、指針變量首先要明白指針是一個(gè)變量,為此寫了如下
    的頭像 發(fā)表于 06-22 08:11 ?1489次閱讀
    面試中的高頻問題:<b class='flag-5'>指針</b>函數(shù)與函數(shù)<b class='flag-5'>指針</b>,你能完美應(yīng)對嗎?

    提高C代碼可讀性的編寫技巧與策略

    指針C 語言的靈魂,是 C 比其他語言更靈活,更強(qiáng)大的地方。所以學(xué)習(xí) C
    發(fā)表于 04-23 18:25 ?433次閱讀

    C語言指針用法

    C語言編程中善用指針可以簡化一些任務(wù)的處理,而對于一些任務(wù)(比如動態(tài)內(nèi)存分配),必須要有指針才行的。也就是說精通C
    發(fā)表于 03-05 14:22 ?306次閱讀
    <b class='flag-5'>C</b><b class='flag-5'>語言</b>的<b class='flag-5'>指針</b><b class='flag-5'>用法</b>

    如何解決C語言中的“訪問權(quán)限沖突”異常?C語言引發(fā)異常原因分析

    一些措施來解決和防止其發(fā)生。本文將詳細(xì)介紹C語言中訪問權(quán)限沖突異常的原因以及解決方法。 一、訪問權(quán)限沖突異常的原因分析 訪問權(quán)限沖突異常可分為兩類:訪問私有成員和訪問未定義成員。下面分
    的頭像 發(fā)表于 01-12 16:03 ?4829次閱讀

    C語言-#和##的具體用法

    C語言中,在宏里面使用’#’和’##’有它非常神奇的作用。在宏定義的替換的過程中,#號可以作為一個(gè)預(yù)處理運(yùn)算符,把宏參數(shù)轉(zhuǎn)換為字符串。##運(yùn)算符則可以把兩個(gè)宏參數(shù)組合在一起。下面就來說說具體的用法。
    的頭像 發(fā)表于 12-19 12:54 ?4772次閱讀
    <b class='flag-5'>C</b><b class='flag-5'>語言</b>-#和##的具體<b class='flag-5'>用法</b>

    c語言程序設(shè)計(jì)基礎(chǔ)知識點(diǎn)

    程序設(shè)計(jì)的基礎(chǔ)知識點(diǎn)。 首先,我們將從C語言的數(shù)據(jù)類型和變量開始。C語言提供了多種數(shù)據(jù)類型,包括整數(shù)、浮點(diǎn)數(shù)、字符和指針等。整數(shù)類型包括in
    的頭像 發(fā)表于 11-27 15:25 ?1578次閱讀

    c語言源程序main函數(shù)的位置

    理解C語言程序的執(zhí)行過程。 C語言程序的執(zhí)行過程可以簡單概括為以下幾個(gè)步驟: 掃描源代碼:在程序執(zhí)行前,編譯器會將
    的頭像 發(fā)表于 11-24 10:23 ?2271次閱讀

    c語言代碼錯(cuò)誤怎么找

    當(dāng)我們編寫C語言代碼時(shí),常常會遇到一些錯(cuò)誤。這些錯(cuò)誤可能是語法錯(cuò)誤,邏輯錯(cuò)誤或者是運(yùn)行時(shí)錯(cuò)誤。無論是什么類型的錯(cuò)誤,我們都需要學(xué)會如何找到并解決這些問題。 一、語法錯(cuò)誤: 語法錯(cuò)誤是最常見的錯(cuò)誤類型
    的頭像 發(fā)表于 11-24 10:05 ?3500次閱讀

    while和if一起的例子c語言

    在一起使用時(shí),可以實(shí)現(xiàn)更加復(fù)雜和靈活的程序邏輯。本篇文章將詳細(xì)介紹while和if在C語言中的使用,并通過具體的代碼示例詳實(shí)、細(xì)致地闡述。 二、while語句的基本使用 在
    的頭像 發(fā)表于 11-22 10:09 ?4066次閱讀

    c語言在while中嵌套if循環(huán)

    中嵌套if語句的用法和好處。 一、C語言中的while循環(huán)和if語句 在開始我們深入探討while循環(huán)中嵌套if語句的細(xì)節(jié)之前,讓我們首先回顧一下while循環(huán)和if語句的基本用法。
    的頭像 發(fā)表于 11-22 10:09 ?5527次閱讀

    C語言for循環(huán)的用法和注意事項(xiàng)

    C 語言是一種廣泛使用的編程語言,它具有簡潔、高效、靈活的特點(diǎn)。C 語言中有很多控制流程的語句,其中 for 循環(huán)是一種常見的循環(huán)結(jié)構(gòu),可以
    的頭像 發(fā)表于 11-20 18:27 ?2223次閱讀
    <b class='flag-5'>C</b><b class='flag-5'>語言</b>for循環(huán)的<b class='flag-5'>用法</b>和注意事項(xiàng)