一、前言
如果問C語言中最重要、威力最大的概念是什么,答案必將是指針!威力大,意味著使用方便、高效,同時也意味著語法復(fù)雜、容易出錯。指針用的好,可以極大的提高代碼執(zhí)行效率、節(jié)約系統(tǒng)資源;如果用的不好,程序中將會充滿陷阱、漏洞。
這篇文章,我們就來聊聊指針。從最底層的內(nèi)存存儲空間開始,一直到應(yīng)用層的各種指針使用技巧,循序漸進(jìn)、抽絲剝繭,以最直白的語言進(jìn)行講解,讓你一次看過癮。
說明:為了方便講解和理解,文中配圖的內(nèi)存空間的地址是隨便寫的,在實(shí)際計算機(jī)中是要遵循地址對齊方式的。
二、變量與指針的本質(zhì)
1. 內(nèi)存地址
我們編寫一個程序源文件之后,編譯得到的二進(jìn)制可執(zhí)行文件存放在電腦的硬盤上,此時它是一個靜態(tài)的文件,一般稱之為程序。
當(dāng)這個程序被啟動的時候,操作系統(tǒng)將會做下面幾件事情:
把程序的內(nèi)容(代碼段、數(shù)據(jù)段)從硬盤復(fù)制到內(nèi)存中;
創(chuàng)建一個數(shù)據(jù)結(jié)構(gòu)PCB(進(jìn)程控制塊),來描述這個程序的各種信息(例如:使用的資源,打開的文件描述符...);
在代碼段中定位到入口函數(shù)的地址,讓CPU從這個地址開始執(zhí)行。
當(dāng)程序開始被執(zhí)行時,就變成一個動態(tài)的狀態(tài),一般稱之為進(jìn)程。
內(nèi)存分為:物理內(nèi)存和虛擬內(nèi)存。操作系統(tǒng)對物理內(nèi)存進(jìn)行管理、包裝,我們開發(fā)者面對的是操作系統(tǒng)提供的虛擬內(nèi)存。
這2個概念不妨礙文章的理解,因此就統(tǒng)一稱之為內(nèi)存。
在我們的程序中,通過一個變量名來定義變量、使用變量。變量本身是一個確確實(shí)實(shí)存在的東西,變量名是一個抽象的概念,用來代表這個變量。就比如:我是一個實(shí)實(shí)在在的人,是客觀存在與這個地球上的,道哥是我給自己起的一個名字,這個名字是任意取得,只要自己覺得好聽就行,如果我愿意還可以起名叫:鳥哥、龍哥等等。
那么,我們定義一個變量之后,這個變量放在哪里呢?那就是內(nèi)存的數(shù)據(jù)區(qū)。內(nèi)存是一個很大的存儲區(qū)域,被操作系統(tǒng)劃分為一個一個的小空間,操作系統(tǒng)通過地址來管理內(nèi)存。
內(nèi)存中的最小存儲單位是字節(jié)(8個bit),一個內(nèi)存的完整空間就是由這一個一個的字節(jié)連續(xù)組成的。在上圖中,每一個小格子代表一個字節(jié),但是好像大家在書籍中沒有這么來畫內(nèi)存模型的,更常見的是下面這樣的畫法:
也就是把連續(xù)的4個字節(jié)的空間畫在一起,這樣就便于表述和理解,特別是深入到代碼對齊相關(guān)知識時更容易理解。(我認(rèn)為根本原因應(yīng)該是:大家都這么畫,已經(jīng)看順眼了~~)
2. 32位與64位系統(tǒng)
我們平時所說的計算機(jī)是32位、64位,指的是計算機(jī)的CPU中寄存器的最大存儲長度,如果寄存器中最大存儲32bit的數(shù)據(jù),就稱之為32位系統(tǒng)。
在計算機(jī)中,數(shù)據(jù)一般都是在硬盤、內(nèi)存和寄存器之間進(jìn)行來回存取。CPU通過3種總線把各組成部分聯(lián)系在一起:地址總線、數(shù)據(jù)總線和控制總線。地址總線的寬度決定了CPU的尋址能力,也就是CPU能達(dá)到的最大地址范圍。
剛才說了,內(nèi)存是通過地址來管理的,那么CPU想從內(nèi)存中的某個地址空間上存取一個數(shù)據(jù),那么CPU就需要在地址總線上輸出這個存儲單元的地址。假如地址總線的寬度是8位,能表示的最大地址空間就是256個字節(jié),能找到內(nèi)存中最大的存儲單元是255這個格子(從0開始)。即使內(nèi)存條的實(shí)際空間是2G字節(jié),CPU也沒法使用后面的內(nèi)存地址空間。如果地址總線的寬度是32位,那么能表示的最大地址就是2的32次方,也就是4G字節(jié)的空間。
【注意】:這里只是描述地址總線的概念,實(shí)際的計算機(jī)中地址計算方式要復(fù)雜的多,比如:虛擬內(nèi)存中采用分段、分頁、偏移量來定位實(shí)際的物理內(nèi)存,在分頁中還有大頁、小頁之分,感興趣的同學(xué)可以自己查一下相關(guān)資料。
3. 變量
我們在C程序中使用變量來“代表”一個數(shù)據(jù),使用函數(shù)名來“代表”一個函數(shù),變量名和函數(shù)名是程序員使用的助記符。變量和函數(shù)最終是要放到內(nèi)存中才能被CPU使用的,而內(nèi)存中所有的信息(代碼和數(shù)據(jù))都是以二進(jìn)制的形式來存儲的,計算機(jī)根據(jù)就不會從格式上來區(qū)分哪些是代碼、哪些是數(shù)據(jù)。CPU在訪問內(nèi)存的時候需要的是地址,而不是變量名、函數(shù)名。
問題來了:在程序代碼中使用變量名來指代變量,而變量在內(nèi)存中是根據(jù)地址來存放的,這二者之間如何映射(關(guān)聯(lián))起來的?
答案是:編譯器!編譯器在編譯文本格式的C程序文件時,會根據(jù)目標(biāo)運(yùn)行平臺(就是編譯出的二進(jìn)制程序運(yùn)行在哪里?是x86平臺的電腦?還是ARM平臺的開發(fā)板?)來安排程序中的各種地址,例如:加載到內(nèi)存中的地址、代碼段的入口地址等等,同時編譯器也會把程序中的所有變量名,轉(zhuǎn)成該變量在內(nèi)存中的存儲地址。
變量有2個重要屬性:變量的類型和變量的值。
示例:代碼中定義了一個變量
?
int a = 20;
?
類型是int型,值是20。這個變量在內(nèi)存中的存儲模型為:
我們在代碼中使用變量名a,在程序執(zhí)行的時候就表示使用0x11223344地址所對應(yīng)的那個存儲單元中的數(shù)據(jù)。因此,可以理解為變量名a就等價于這個地址0x11223344。換句話說,如果我們可以提前知道編譯器把變量a安排在地址0x11223344這個單元格中,我們就可以在程序中直接用這個地址值來操作這個變量。
在上圖中,變量a的值為20,在內(nèi)存中占據(jù)了4個格子的空間,也就是4個字節(jié)。為什么是4個字節(jié)呢?在C標(biāo)準(zhǔn)中并沒有規(guī)定每種數(shù)據(jù)類型的變量一定要占用幾個字節(jié),這是與具體的機(jī)器、編譯器有關(guān)。
比如:32位的編譯器中:
char: 1個字節(jié);
short int: 2個字節(jié);
int: 4個字節(jié);
long: 4個字節(jié)。
比如:64位的編譯器中:
char: 1個字節(jié);
short int: 2個字節(jié);
int: 4個字節(jié);
long: 8個字節(jié)。
為了方便描述,下面都以32位為例,也就是int型變量在內(nèi)存中占據(jù)4個字節(jié)。
另外,0x11223344,0x11223345,0x11223346,0x11223347這連續(xù)的、從低地址到高地址的4個字節(jié)用來存儲變量a的數(shù)值20。在圖示中,使用十六進(jìn)制來表示,十進(jìn)制數(shù)值20轉(zhuǎn)成16進(jìn)制就是:0x00000014,所以從開始地址依次存放0x00、0x00、0x00、0x14這4個字節(jié)(存儲順序涉及到大小端的問題,不影響文本理解)。
根據(jù)這個圖示,如果在程序中想知道變量a存儲在內(nèi)存中的什么位置,可以使用取地址操作符&,如下:
?
printf("&a = 0x%x ", &a);
?
這句話將會打印出:&a = 0x11223344。
考慮一下,在32位系統(tǒng)中:指針變量占用幾個字節(jié)?
4. 指針變量
指針變量可以分2個層次來理解:
指針變量首先是一個變量,所以它擁有變量的所有屬性:類型和值。它的類型就是指針,它的值是其他變量的地址。?既然是一個變量,那么在內(nèi)存中就需要為這個變量分配一個存儲空間。在這個存儲空間中,存放著其他變量的地址。
指針變量所指向的數(shù)據(jù)類型,這是在定義指針變量的時候就確定的。例如:int *p; 意味著指針指向的是一個int型的數(shù)據(jù)。
首先回答一下剛才那個問題,在32位系統(tǒng)中,一個指針變量在內(nèi)存中占據(jù)4個字節(jié)的空間。因為CPU對內(nèi)存空間尋址時,使用的是32位地址空間(4個字節(jié)),也就是用4個字節(jié)就能存儲一個內(nèi)存單元的地址。而指針變量中的值存儲的就是地址,所以需要4個字節(jié)的空間來存儲一個指針變量的值。
示例:
?
int a = 20; int *pa; pa = &a; printf("value = %d ", *pa);
?
在內(nèi)存中的存儲模型如下:
對于指針變量pa來說,首先它是一個變量,因此在內(nèi)存中需要有一個空間來存儲這個變量,這個空間的地址就是0x11223348;
其次,這個內(nèi)存空間中存儲的內(nèi)容是變量a的地址,而a的地址為0x11223344,所以指針變量pa的地址空間中,就存儲了0x11223344這個值。
這里對兩個操作符&和*進(jìn)行說明:
&:取地址操作符,用來獲取一個變量的地址。上面代碼中&a就是用來獲取變量a在內(nèi)存中的存儲地址,也就是0x11223344。
*:這個操作符用在2個場景中:定義一個指針的時候,獲取一個指針?biāo)赶虻淖兞恐档臅r候。
int?*pa; 這個語句中的表示定義的變量pa是一個指針,前面的int表示pa這個指針指向的是一個int類型的變量。不過此時我們沒有給pa進(jìn)行賦值,也就是說此刻pa對應(yīng)的存儲單元中的4個字節(jié)里的值是沒有初始化的,可能是0x00000000,也可能是其他任意的數(shù)字,不確定;
printf語句中的*表示獲取pa指向的那個int類型變量的值,學(xué)名叫解引用,我們只要記住是獲取指向的變量的值就可以了。
5. 操作指針變量
對指針變量的操作包括3個方面:
操作指針變量自身的值;
獲取指針變量所指向的數(shù)據(jù);
以什么樣數(shù)據(jù)類型來使用/解釋指針變量所指向的內(nèi)容。
5.1 指針變量自身的值
int a = 20;這個語句是定義變量a,在隨后的代碼中,只要寫下a就表示要操作變量a中存儲的值,操作有兩種:讀和寫。
printf("a = %d ", a);?這個語句就是要讀取變量a中的值,當(dāng)然是20;
a = 100;這個語句就是要把一個數(shù)值100寫入到變量a中。
同樣的道理,int *pa;語句是用來定義指針變量pa,在隨后的代碼中,只要寫下pa就表示要操作變量pa中的值:
printf("pa = %d ", pa);?這個語句就是要讀取指針變量pa中的值,當(dāng)然是0x11223344;
pa = &a;這個語句就是要把新的值寫入到指針變量pa中。再次強(qiáng)調(diào)一下,指針變量中存儲的是地址,如果我們可以提前知道變量a的地址是 0x11223344,那么我們也可以這樣來賦值:pa = 0x11223344;
思考一下,如果執(zhí)行這個語句printf("&pa =0x%x ", &pa);,打印結(jié)果會是什么?
上面已經(jīng)說過,操作符&是用來取地址的,那么&pa就表示獲取指針變量pa的地址,上面的內(nèi)存模型中顯示指針變量pa是存儲在0x11223348這個地址中的,因此打印結(jié)果就是:&pa = 0x11223348。
5.2 獲取指針變量所指向的數(shù)據(jù)
指針變量所指向的數(shù)據(jù)類型是在定義的時候就明確的,也就是說指針pa指向的數(shù)據(jù)類型就是int型,因此在執(zhí)行printf("value = %d ", *pa);語句時,首先知道pa是一個指針,其中存儲了一個地址(0x11223344),然后通過操作符*來獲取這個地址(0x11223344)對應(yīng)的那個存儲空間中的值;又因為在定義pa時,已經(jīng)指定了它指向的值是一個int型,所以我們就知道了地址0x11223344中存儲的就是一個int類型的數(shù)據(jù)。
5.3 以什么樣的數(shù)據(jù)類型來使用/解釋指針變量所指向的內(nèi)容
如下代碼:
?
int a = 30000; int *pa = &a; printf("value = %d ", *pa);
?
根據(jù)以上的描述,我們知道printf的打印結(jié)果會是value = 30000,十進(jìn)制的30000轉(zhuǎn)成十六進(jìn)制是0x00007530,內(nèi)存模型如下:
現(xiàn)在我們做這樣一個測試:
?
char *pc = 0x11223344; printf("value = %d ", *pc);
?
指針變量pc在定義的時候指明:它指向的數(shù)據(jù)類型是char型,pc變量中存儲的地址是0x11223344。當(dāng)使用*pc獲取指向的數(shù)據(jù)時,將會按照char型格式來讀取0x11223344地址處的數(shù)據(jù),因此將會打印value = 0(在計算機(jī)中,ASCII碼是用等價的數(shù)字來存儲的)。
這個例子中說明了一個重要的概念:在內(nèi)存中一切都是數(shù)字,如何來操作(解釋)一個內(nèi)存地址中的數(shù)據(jù),完全是由我們的代碼來告訴編譯器的。剛才這個例子中,雖然0x11223344這個地址開始的4個字節(jié)的空間中,存儲的是整型變量a的值,但是我們讓pc指針按照char型數(shù)據(jù)來使用/解釋這個地址處的內(nèi)容,這是完全合法的。
以上內(nèi)容,就是指針最根本的心法了。把這個心法整明白了,剩下的就是多見識、多練習(xí)的問題了。
三、指針的幾個相關(guān)概念
1. const屬性
const標(biāo)識符用來表示一個對象的不可變的性質(zhì),例如定義:
?
const int b = 20;
?
在后面的代碼中就不能改變變量b的值了,b中的值永遠(yuǎn)是20。同樣的,如果用const來修飾一個指針變量:
?
int a = 20; int b = 20; int * const p = &a;
?
內(nèi)存模型如下:
這里的const用來修飾指針變量p,根據(jù)const的性質(zhì)可以得出結(jié)論:p在定義為變量a的地址之后,就固定了,不能再被改變了,也就是說指針變量pa中就只能存儲變量a的地址0x11223344。如果在后面的代碼中寫p = &b;,編譯時就會報錯,因為p是不可改變的,不能再被設(shè)置為變量b的地址。
但是,指針變量p所指向的那個變量a的值是可以改變的,即:*p = 21;這個語句是合法的,因為指針p的值沒有改變(仍然是變量c的地址0x11223344),改變的是變量c中存儲的值。
與下面的代碼區(qū)分一下:
?
int a = 20; int b = 20; const int *p = &a; p = &b;
?
這里的const沒有放在p的旁邊,而是放在了類型int的旁邊,這就說明const符號不是用來修飾p的,而是用來修飾p所指向的那個變量的。所以,如果我們寫p = &b;把變量b的地址賦值給指針p,就是合法的,因為p的值可以被改變。
但是這個語句*p = 21就是非法了,因為定義語句中的const就限制了通過指針p獲取的數(shù)據(jù),不能被改變,只能被用來讀取。這個性質(zhì)常常被用在函數(shù)參數(shù)上,例如下面的代碼,用來計算一塊數(shù)據(jù)的CRC校驗,這個函數(shù)只需要讀取原始數(shù)據(jù),不需要(也不可以)改變原始數(shù)據(jù),因此就需要在形參指針上使用const修飾符:
?
short int getDataCRC(const char *pData, int len) { short int crc = 0x0000; // 計算CRC return crc; }
?
2. void型指針
關(guān)鍵字void并不是一個真正的數(shù)據(jù)類型,它體現(xiàn)的是一種抽象,指明不是任何一種類型,一般有2種使用場景:
函數(shù)的返回值和形參;
定義指針時不明確規(guī)定所指數(shù)據(jù)的類型,也就意味著可以指向任意類型。
指針變量也是一種變量,變量之間可以相互賦值,那么指針變量之間也可以相互賦值,例如:
?
int a = 20; int b = a; int *p1 = &a; int *p2 = p1;
?
變量a賦值給變量b,指針p1賦值給指針p2,注意到它們的類型必須是相同的:a和b都是int型,p1和p2都是指向int型,所以可以相互賦值。那么如果數(shù)據(jù)類型不同呢?必須進(jìn)行強(qiáng)制類型轉(zhuǎn)換。例如:
?
int a = 20; int *p1 = &a; char *p2 = (char *)p1;
?
內(nèi)存模型如下:
p1指針指向的是int型數(shù)據(jù),現(xiàn)在想把它的值(0x11223344)賦值給p2,但是由于在定義p2指針時規(guī)定它指向的數(shù)據(jù)類型是char型,因此需要把指針p1進(jìn)行強(qiáng)制類型轉(zhuǎn)換,也就是把地址0x11223344處的數(shù)據(jù)按照char型數(shù)據(jù)來看待,然后才可以賦值給p2指針。
如果我們使用void *p2來定義p2指針,那么在賦值時就不需要進(jìn)行強(qiáng)制類型轉(zhuǎn)換了,例如:
?
int a = 20; int *p1 = &a; void *p2 = p1;
?
指針p2是void*型,意味著可以把任意類型的指針賦值給p2,但是不能反過來操作,也就是不能把void*型指針直接賦值給其他確定類型的指針,而必須要強(qiáng)制轉(zhuǎn)換成被賦值指針?biāo)赶虻臄?shù)據(jù)類型,如下代碼,必須把p2指針強(qiáng)制轉(zhuǎn)換成int*型之后,再賦值給p3指針:
?
int a = 20; int *p1 = &a; void *p2 = p1; int *p3 = (int *)p2;
?
我們來看一個系統(tǒng)函數(shù):
?
void* memcpy(void* dest, const void* src, size_t len);
?
第一個參數(shù)類型是void*,這正體現(xiàn)了系統(tǒng)對內(nèi)存操作的真正意義:它并不關(guān)心用戶傳來的指針具體指向什么數(shù)據(jù)類型,只是把數(shù)據(jù)挨個存儲到這個地址對應(yīng)的空間中。
第二個參數(shù)同樣如此,此外還添加了const修飾符,這樣就說明了memcpy函數(shù)只會從src指針處讀取數(shù)據(jù),而不會修改數(shù)據(jù)。
3. 空指針和野指針
一個指針必須指向一個有意義的地址之后,才可以對指針進(jìn)行操作。如果指針中存儲的地址值是一個隨機(jī)值,或者是一個已經(jīng)失效的值,此時操作指針就非常危險了,一般把這樣的指針稱作野指針,C代碼中很多指針相關(guān)的bug就來源于此。
3.1 空指針:不指向任何東西的指針
在定義一個指針變量之后,如果沒有賦值,那么這個指針變量中存儲的就是一個隨機(jī)值,有可能指向內(nèi)存中的任何一個地址空間,此時萬萬不可以對這個指針進(jìn)行寫操作,因為它有可能指向內(nèi)存中的代碼段區(qū)域、也可能指向內(nèi)存中操作系統(tǒng)所在的區(qū)域。
一般會將一個指針變量賦值為NULL來表示一個空指針,而C語言中,NULL實(shí)質(zhì)是 ((void*)0) , 在C++中,NULL實(shí)質(zhì)是0。在標(biāo)準(zhǔn)庫頭文件stdlib.h中,有如下定義:
?
#ifdef __cplusplus #define NULL 0 #else #define NULL ((void *)0) #endif
?
3.2 野指針:地址已經(jīng)失效的指針
我們都知道,函數(shù)中的局部變量存儲在棧區(qū),通過malloc申請的內(nèi)存空間位于堆區(qū),如下代碼:
?
int *p = (int *)malloc(4); *p = 20;
?
內(nèi)存模型為:
在堆區(qū)申請了4個字節(jié)的空間,然后強(qiáng)制類型轉(zhuǎn)換為int*型之后,賦值給指針變量p,然后通過*p設(shè)置這個地址中的值為14,這是合法的。如果在釋放了p指針指向的空間之后,再使用*p來操作這段地址,那就是非常危險了,因為這個地址空間可能已經(jīng)被操作系統(tǒng)分配給其他代碼使用,如果對這個地址里的數(shù)據(jù)強(qiáng)行操作,程序立刻崩潰的話,將會是我們最大的幸運(yùn)!
?
int *p = (int *)malloc(4); *p = 20; free(p); // 在free之后就不可以再操作p指針中的數(shù)據(jù)了。 p = NULL; // 最好加上這一句。
?
四、指向不同數(shù)據(jù)類型的指針
1. 數(shù)值型指針
通過上面的介紹,指向數(shù)值型變量的指針已經(jīng)很明白了,需要注意的就是指針?biāo)赶虻臄?shù)據(jù)類型。
2. 字符串指針
字符串在內(nèi)存中的表示有2種:
用一個數(shù)組來表示,例如:char name1[8] = "zhangsan";
用一個char *指針來表示,例如:char *name2 = "zhangsan";
name1在內(nèi)存中占據(jù)8個字節(jié),其中存儲了8個字符的ASCII碼值;name2在內(nèi)存中占據(jù)9個字節(jié),因為除了存儲8個字符的ASCII碼值,在最后一個字符'n'的后面還額外存儲了一個'?',用來標(biāo)識字符串結(jié)束。
對于字符串來說,使用指針來操作是非常方便的,例如:變量字符串name2:
?
char *name2 = "zhangsan"; char *p = name2; while (*p != '?') { printf("%c ", *p); p = p + 1; }
?
在while的判斷條件中,檢查p指針指向的字符是否為結(jié)束符'?'。在循環(huán)體重,打印出當(dāng)前指向的字符之后,對指針比那里進(jìn)行自增操作,因為指針p所指向的數(shù)據(jù)類型是char,每個char在內(nèi)存中占據(jù)一個字節(jié),因此指針p在自增1之后,就指向下一個存儲空間。
也可以把循環(huán)體中的2條語句寫成1條語句:
?
printf("%c ", *p++);
?
假如一個指針指向的數(shù)據(jù)類型為int型,那么執(zhí)行p = p + 1;之后,指針p中存儲的地址值將會增加4,因為一個int型數(shù)據(jù)在內(nèi)存中占據(jù)4個字節(jié)的空間,如下所示:
思考一個問題:void*型指針能夠遞增嗎?如下測試代碼:
?
int a[3] = {1, 2, 3}; void *p = a; printf("1: p = 0x%x ", p); p = p + 1; printf("2: p = 0x%x ", p);
?
打印結(jié)果如下:
?
1: p = 0x733748c0 2: p = 0x733748c1
?
說明void*型指針在自增時,是按照一個字節(jié)的跨度來計算的。
3. 指針數(shù)組與數(shù)組指針
這2個說法經(jīng)常會混淆,至少我是如此,先看下這2條語句:
?
int *p1[3]; // 指針數(shù)組 int (*p2)[3]; // 數(shù)組指針
?
3.1 指針數(shù)組
第1條語句中:中括號[]的優(yōu)先級高,因此與p1先結(jié)合,表示一個數(shù)組,這個數(shù)組中有3個元素,這3個元素都是指針,它們指向的是int型數(shù)據(jù)??梢赃@樣來理解:如果有這個定義char p[3],很容易理解這是一個有3個char型元素的數(shù)組,那么把char換成int*,意味著數(shù)組里的元素類型是int*型(指向int型數(shù)據(jù)的指針)。內(nèi)存模型如下(注意:三個指針指向的地址并不一定是連續(xù)的):
如果向指針數(shù)組中的元素賦值,需要逐個把變量的地址賦值給指針元素:
?
int a = 1, b = 2, c = 3; char *p1[3]; p1[0] = &a; p1[1] = &b; p1[2] = &c;
?
3.2 數(shù)組指針
第2條語句中:小括號讓p2與*結(jié)合,表示p2是一個指針,這個指針指向了一個數(shù)組,數(shù)組中有3個元素,每一個元素的類型是int型??梢赃@樣來理解:如果有這個定義int p[3],很容易理解這是一個有3個char型元素的數(shù)組,那么把數(shù)組名p換成是*p2,也就是p2是一個指針,指向了這個數(shù)組。內(nèi)存模型如下(注意:指針指向的地址是一個數(shù)組,其中的3個元素是連續(xù)放在內(nèi)存中的):
在前面我們說到取地址操作符&,用來獲得一個變量的地址。凡事都有特殊情況,對于獲取地址來說,下面幾種情況不需要使用&操作符:
字符串字面量作為右值時,就代表這個字符串在內(nèi)存中的首地址;
數(shù)組名就代表這個數(shù)組的地址,也等于這個數(shù)組的第一個元素的地址;
函數(shù)名就代表這個函數(shù)的地址。
因此,對于一下代碼,三個printf語句的打印結(jié)果是相同的:
?
int a[3] = {1, 2, 3}; int (*p2)[3] = a; printf("0x%x ", a); printf("0x%x ", &a); printf("0x%x ", p2);
?
思考一下,如果對這里的p2指針執(zhí)行p2 = p2 + 1;操作,p2中的值將會增加多少?
答案是12個字節(jié)。因為p2指向的是一個數(shù)組,這個數(shù)組中包含3個元素,每個元素占據(jù)4個字節(jié),那么這個數(shù)組在內(nèi)存中一共占據(jù)12個字節(jié),因此p2在加1之后,就跳過12個字節(jié)。
4. 二維數(shù)組和指針
一維數(shù)組在內(nèi)存中是連續(xù)分布的多個內(nèi)存單元組成的,而二維數(shù)組在內(nèi)存中也是連續(xù)分布的多個內(nèi)存單元組成的,從內(nèi)存角度來看,一維數(shù)組和二維數(shù)組沒有本質(zhì)差別。
和一維數(shù)組類似,二維數(shù)組的數(shù)組名表示二維數(shù)組的第一維數(shù)組中首元素的首地址,用代碼來說明:
?
int a[3][3] = {{1,2,3}, {4,5,6}, {7,8,9}}; // 二維數(shù)組 int (*p0)[3] = NULL; // p0是一個指針,指向一個數(shù)組 int (*p1)[3] = NULL; // p1是一個指針,指向一個數(shù)組 int (*p2)[3] = NULL; // p2是一個指針,指向一個數(shù)組 p0 = a[0]; p1 = a[1]; p2 = a[2]; printf("0: %d %d %d ", *(*p0 + 0), *(*p0 + 1), *(*p0 + 2)); printf("1: %d %d %d ", *(*p1 + 0), *(*p1 + 1), *(*p1 + 2)); printf("2: %d %d %d ", *(*p2 + 0), *(*p2 + 1), *(*p2 + 2));
?
打印結(jié)果是:
?
0: 1 2 3 1: 4 5 6 2: 7 8 9
?
我們拿第一個printf語句來分析:p0是一個指針,指向一個數(shù)組,數(shù)組中包含3個元素,每個元素在內(nèi)存中占據(jù)4個字節(jié)。現(xiàn)在我們想獲取這個數(shù)組中的數(shù)據(jù),如果直接對p0執(zhí)行加1操作,那么p0將會跨過12個字節(jié)(就等于p1中的值了),因此需要使用解引用操作符*,把p0轉(zhuǎn)為指向int型的指針,然后再執(zhí)行加1操作,就可以得到數(shù)組中的int型數(shù)據(jù)了。
5. 結(jié)構(gòu)體指針
C語言中的基本數(shù)據(jù)類型是預(yù)定義的,結(jié)構(gòu)體是用戶定義的,在指針的使用上可以進(jìn)行類比,唯一有區(qū)別的就是在結(jié)構(gòu)體指針中,需要使用->箭頭操作符來獲取結(jié)構(gòu)體中的成員變量,例如:
?
typedef struct { int age; char name[8]; } Student; Student s; s.age = 20; strcpy(s.name, "lisi"); Student *p = &s; printf("age = %d, name = %s ", p->age, p->name);
?
看起來似乎沒有什么技術(shù)含量,如果是結(jié)構(gòu)體數(shù)組呢?例如:
?
Student s[3]; Student *p = &s; printf("size of Student = %d ", sizeof(Student)); printf("1: 0x%x, 0x%x ", s, p); p++; printf("2: 0x%x ", p);
?
打印結(jié)果是:
?
size of Student = 12 1: 0x4c02ac00, 0x4c02ac00 2: 0x4c02ac0c
?
在執(zhí)行p++操作后,p需要跨過的空間是一個結(jié)構(gòu)體變量在內(nèi)存中占據(jù)的大小(12個字節(jié)),所以此時p就指向了數(shù)組中第2個元素的首地址,內(nèi)存模型如下:
6. 函數(shù)指針
每一個函數(shù)在經(jīng)過編譯之后,都變成一個包含多條指令的集合,在程序被加載到內(nèi)存之后,這個指令集合被放在代碼區(qū),我們在程序中使用函數(shù)名就代表了這個指令集合的開始地址。
函數(shù)指針,本質(zhì)上仍然是一個指針,只不過這個指針變量中存儲的是一個函數(shù)的地址。函數(shù)最重要特性是什么?可以被調(diào)用!因此,當(dāng)定義了一個函數(shù)指針并把一個函數(shù)地址賦值給這個指針時,就可以通過這個函數(shù)指針來調(diào)用函數(shù)。
如下示例代碼:
?
int add(int x,int y) { return x+y; } int main() { int a = 1, b = 2; int (*p)(int, int); p = add; printf("%d + %d = %d ", a, b, p(a, b)); }
?
前文已經(jīng)說過,函數(shù)的名字就代表函數(shù)的地址,所以函數(shù)名add就代表了這個加法函數(shù)在內(nèi)存中的地址。int (*p)(int, int);這條語句就是用來定義一個函數(shù)指針,它指向一個函數(shù),這個函數(shù)必須符合下面這2點(diǎn)(學(xué)名叫:函數(shù)簽名):
有2個int型的參數(shù);
有一個int型的返回值。
代碼中的add函數(shù)正好滿足這個要求,因此,可以把a(bǔ)dd賦值給函數(shù)指針p,此時p就指向了內(nèi)存中這個函數(shù)存儲的地址,后面就可以用函數(shù)指針p來調(diào)用這個函數(shù)了。
在示例代碼中,函數(shù)指針p是直接定義的,那如果想定義2個函數(shù)指針,難道需要像下面這樣定義嗎?
?
int (*p)(int, int); int (*p2)(int, int);
?
這里的參數(shù)比較簡單,如果函數(shù)很復(fù)雜,這樣的定義方式豈不是要煩死?可以用typedef關(guān)鍵字來定義一個函數(shù)指針類型:
?
typedef int (*pFunc)(int, int);
?
然后用這樣的方式pFunc p1, p2;來定義多個函數(shù)指針就方便多了。注意:只能把與函數(shù)指針類型具有相同簽名的函數(shù)賦值給p1和p2,也就是參數(shù)的個數(shù)、類型要相同,返回值也要相同。
注意:這里有幾個小細(xì)節(jié)稍微了解一下:
在賦值函數(shù)指針時,使用p = &a;也是可以的;
使用函數(shù)指針調(diào)用時,使用(*p)(a, b);也是可以的。
這里沒有什么特殊的原理需要講解,最終都是編譯器幫我們處理了這里的細(xì)節(jié),直接記住即可。
函數(shù)指針整明白之后,再和數(shù)組結(jié)合在一起:函數(shù)指針數(shù)組。示例代碼如下:
?
int add(int a, int b) { return a + b; } int sub(int a, int b) { return a - b; } int mul(int a, int b) { return a * b; } int divide(int a, int b) { return a / b; } int main() { int a = 4, b = 2; int (*p[4])(int, int); p[0] = add; p[1] = sub; p[2] = mul; p[3] = divide; printf("%d + %d = %d ", a, b, p[0](a, b)); printf("%d - %d = %d ", a, b, p[1](a, b)); printf("%d * %d = %d ", a, b, p[2](a, b)); printf("%d / %d = %d ", a, b, p[3](a, b)); }
?
這條語句不太好理解:int (*p[4])(int, int);,先分析中間部分,標(biāo)識符p與中括號[]結(jié)合(優(yōu)先級高),所以p是一個數(shù)組,數(shù)組中有4個元素;然后剩下的內(nèi)容表示一個函數(shù)指針,那么就說明數(shù)組中的元素類型是函數(shù)指針,也就是其他函數(shù)的地址,內(nèi)存模型如下:
如果還是難以理解,那就回到指針的本質(zhì)概念上:指針就是一個地址!這個地址中存儲的內(nèi)容是什么根本不重要,重要的是你告訴計算機(jī)這個內(nèi)容是什么。如果你告訴它:這個地址里存放的內(nèi)容是一個函數(shù),那么計算機(jī)就去調(diào)用這個函數(shù)。那么你是如何告訴計算機(jī)的呢,就是在定義指針變量的時候,僅此而已!
五、總結(jié)
我已經(jīng)把自己知道的所有指針相關(guān)的概念、語法、使用場景都作了講解,就像一個小酒館的掌柜,把自己的美酒佳肴都呈現(xiàn)給你,但愿你已經(jīng)酒足飯飽!
如果以上的內(nèi)容太多,一時無法消化,那么下面的這兩句話就作為飯后甜點(diǎn)為您奉上,在以后的編程中,如果遇到指針相關(guān)的困惑,就想一想這兩句話,也許能讓你茅塞頓開。
指針就是地址,地址就是指針。
指針就是指向內(nèi)存中的一塊空間,至于如何來解釋/操作這塊空間,由這個指針的類型來決定。
另外還有一點(diǎn)囑咐,那就是學(xué)習(xí)任何一門編程語言,一定要弄清楚內(nèi)存模型,內(nèi)存模型,內(nèi)存模型!
評論
查看更多