前言
Http 緩存機(jī)制作為 web 性能優(yōu)化的重要手段,對(duì)于從事 Web 開發(fā)的同學(xué)們來說,應(yīng)該是知識(shí)體系庫中的一個(gè)基礎(chǔ)環(huán)節(jié),同時(shí)對(duì)于有志成為前端架構(gòu)師的同學(xué)來說是必備的知識(shí)技能。
但是對(duì)于很多前端同學(xué)來說,僅僅只是知道瀏覽器會(huì)對(duì)請(qǐng)求的靜態(tài)文件進(jìn)行緩存,但是為什么被緩存,緩存是怎樣生效的,卻并不是很清楚。
在此,我會(huì)嘗試用簡(jiǎn)單明了的文字,向大家系統(tǒng)的介紹HTTP緩存機(jī)制,期望對(duì)各位正確的理解前端緩存有所幫助。
在介紹HTTP緩存之前,作為知識(shí)鋪墊,先簡(jiǎn)單介紹一下HTTP報(bào)文
HTTP報(bào)文就是瀏覽器和服務(wù)器間通信時(shí)發(fā)送及響應(yīng)的數(shù)據(jù)塊。
瀏覽器向服務(wù)器請(qǐng)求數(shù)據(jù),發(fā)送請(qǐng)求(request)報(bào)文;服務(wù)器向?yàn)g覽器返回?cái)?shù)據(jù),返回響應(yīng)(response)報(bào)文。
報(bào)文信息主要分為兩部分
1.包含屬性的首部(header)--------------------------附加信息(cookie,緩存信息等)與緩存相關(guān)的規(guī)則信息,均包含在header中
2.包含數(shù)據(jù)的主體部分(body)-----------------------HTTP請(qǐng)求真正想要傳輸?shù)牟糠?/p>
緩存規(guī)則解析
為方便大家理解,我們認(rèn)為瀏覽器存在一個(gè)緩存數(shù)據(jù)庫,用于存儲(chǔ)緩存信息。
在客戶端第一次請(qǐng)求數(shù)據(jù)時(shí),此時(shí)緩存數(shù)據(jù)庫中沒有對(duì)應(yīng)的緩存數(shù)據(jù),需要請(qǐng)求服務(wù)器,服務(wù)器返回后,將數(shù)據(jù)存儲(chǔ)至緩存數(shù)據(jù)庫中。
HTTP緩存有多種規(guī)則,根據(jù)是否需要重新向服務(wù)器發(fā)起請(qǐng)求來分類,我將其分為兩大類(強(qiáng)制緩存,對(duì)比緩存)
在詳細(xì)介紹這兩種規(guī)則之前,先通過時(shí)序圖的方式,讓大家對(duì)這兩種規(guī)則有個(gè)簡(jiǎn)單了解。
已存在緩存數(shù)據(jù)時(shí),僅基于強(qiáng)制緩存,請(qǐng)求數(shù)據(jù)的流程如下
已存在緩存數(shù)據(jù)時(shí),僅基于對(duì)比緩存,請(qǐng)求數(shù)據(jù)的流程如下
對(duì)緩存機(jī)制不太了解的同學(xué)可能會(huì)問,基于對(duì)比緩存的流程下,不管是否使用緩存,都需要向服務(wù)器發(fā)送請(qǐng)求,那么還用緩存干什么?
這個(gè)問題,我們暫且放下,后文在詳細(xì)介紹每種緩存規(guī)則的時(shí)候,會(huì)帶給大家答案。
我們可以看到兩類緩存規(guī)則的不同,強(qiáng)制緩存如果生效,不需要再和服務(wù)器發(fā)生交互,而對(duì)比緩存不管是否生效,都需要與服務(wù)端發(fā)生交互。
兩類緩存規(guī)則可以同時(shí)存在,強(qiáng)制緩存優(yōu)先級(jí)高于對(duì)比緩存,也就是說,當(dāng)執(zhí)行強(qiáng)制緩存的規(guī)則時(shí),如果緩存生效,直接使用緩存,不再執(zhí)行對(duì)比緩存規(guī)則。
強(qiáng)制緩存
從上文我們得知,強(qiáng)制緩存,在緩存數(shù)據(jù)未失效的情況下,可以直接使用緩存數(shù)據(jù),那么瀏覽器是如何判斷緩存數(shù)據(jù)是否失效呢?
我們知道,在沒有緩存數(shù)據(jù)的時(shí)候,瀏覽器向服務(wù)器請(qǐng)求數(shù)據(jù)時(shí),服務(wù)器會(huì)將數(shù)據(jù)和緩存規(guī)則一并返回,緩存規(guī)則信息包含在響應(yīng)header中。
對(duì)于強(qiáng)制緩存來說,響應(yīng)header中會(huì)有兩個(gè)字段來標(biāo)明失效規(guī)則(Expires/Cache-Control)
使用chrome的開發(fā)者工具,可以很明顯地看到對(duì)于強(qiáng)制緩存生效時(shí),網(wǎng)絡(luò)請(qǐng)求的情況
Expires
Expires的值為服務(wù)端返回的到期時(shí)間,即下一次請(qǐng)求時(shí),請(qǐng)求時(shí)間小于服務(wù)端返回的到期時(shí)間,直接使用緩存數(shù)據(jù)。
不過Expires 是HTTP 1.0的東西,現(xiàn)在默認(rèn)瀏覽器均默認(rèn)使用HTTP 1.1,所以它的作用基本忽略。
另一個(gè)問題是,到期時(shí)間是由服務(wù)端生成的,但是客戶端時(shí)間可能跟服務(wù)端時(shí)間有誤差,這就會(huì)導(dǎo)致緩存命中的誤差。
所以HTTP 1.1 的版本,使用Cache-Control替代。
Cache-Control
Cache-Control 是最重要的規(guī)則。常見的取值有private、public、no-cache、max-age,no-store,默認(rèn)為private。
private:客戶端可以緩存
public:客戶端和代理服務(wù)器都可緩存(前端的同學(xué),可以認(rèn)為public和private是一樣的)
max-age=xxx:緩存的內(nèi)容將在xxx秒后失效
no-cache:需要使用對(duì)比緩存來驗(yàn)證緩存數(shù)據(jù)(后面介紹)
no-store:所有內(nèi)容都不會(huì)緩存,強(qiáng)制緩存,對(duì)比緩存都不會(huì)觸發(fā)(對(duì)于前端開發(fā)來說,緩存越多越好,so...基本上和它說886)
圖中Cache-Control僅指定了max-age,所以默認(rèn)為private,緩存時(shí)間為31536000秒(365天)
也就是說,在365天內(nèi)再次請(qǐng)求這條數(shù)據(jù),都會(huì)直接獲取緩存數(shù)據(jù)庫中的數(shù)據(jù),直接使用。
對(duì)比緩存
對(duì)比緩存,顧名思義,需要進(jìn)行比較判斷是否可以使用緩存。
瀏覽器第一次請(qǐng)求數(shù)據(jù)時(shí),服務(wù)器會(huì)將緩存標(biāo)識(shí)與數(shù)據(jù)一起返回給客戶端,客戶端將二者備份至緩存數(shù)據(jù)庫中。
再次請(qǐng)求數(shù)據(jù)時(shí),客戶端將備份的緩存標(biāo)識(shí)發(fā)送給服務(wù)器,服務(wù)器根據(jù)緩存標(biāo)識(shí)進(jìn)行判斷,判斷成功后,返回304狀態(tài)碼,通知客戶端比較成功,可以使用緩存數(shù)據(jù)。
第一次訪問:
再次訪問:
通過兩圖的對(duì)比,我們可以很清楚的發(fā)現(xiàn),在對(duì)比緩存生效時(shí),狀態(tài)碼為304,并且報(bào)文大小和請(qǐng)求時(shí)間大大減少。
原因是,服務(wù)端在進(jìn)行標(biāo)識(shí)比較后,只返回header部分,通過狀態(tài)碼通知客戶端使用緩存,不再需要將報(bào)文主體部分返回給客戶端。
對(duì)于對(duì)比緩存來說,緩存標(biāo)識(shí)的傳遞是我們著重需要理解的,它在請(qǐng)求header和響應(yīng)header間進(jìn)行傳遞,
一共分為兩種標(biāo)識(shí)傳遞,接下來,我們分開介紹。
Last-Modified / If-Modified-Since
Last-Modified:
服務(wù)器在響應(yīng)請(qǐng)求時(shí),告訴瀏覽器資源的最后修改時(shí)間。
If-Modified-Since:
再次請(qǐng)求服務(wù)器時(shí),通過此字段通知服務(wù)器上次請(qǐng)求時(shí),服務(wù)器返回的資源最后修改時(shí)間。
服務(wù)器收到請(qǐng)求后發(fā)現(xiàn)有頭If-Modified-Since 則與被請(qǐng)求資源的最后修改時(shí)間進(jìn)行比對(duì)。
若資源的最后修改時(shí)間大于If-Modified-Since,說明資源又被改動(dòng)過,則響應(yīng)整片資源內(nèi)容,返回狀態(tài)碼200;
若資源的最后修改時(shí)間小于或等于If-Modified-Since,說明資源無新修改,則響應(yīng)HTTP 304,告知瀏覽器繼續(xù)使用所保存的cache。
Etag / If-None-Match(優(yōu)先級(jí)高于Last-Modified / If-Modified-Since)
Etag:
服務(wù)器響應(yīng)請(qǐng)求時(shí),告訴瀏覽器當(dāng)前資源在服務(wù)器的唯一標(biāo)識(shí)(生成規(guī)則由服務(wù)器決定)。
If-None-Match:
再次請(qǐng)求服務(wù)器時(shí),通過此字段通知服務(wù)器客戶段緩存數(shù)據(jù)的唯一標(biāo)識(shí)。
服務(wù)器收到請(qǐng)求后發(fā)現(xiàn)有頭If-None-Match 則與被請(qǐng)求資源的唯一標(biāo)識(shí)進(jìn)行比對(duì),
不同,說明資源又被改動(dòng)過,則響應(yīng)整片資源內(nèi)容,返回狀態(tài)碼200;
相同,說明資源無新修改,則響應(yīng)HTTP 304,告知瀏覽器繼續(xù)使用所保存的cache。
總結(jié)
對(duì)于強(qiáng)制緩存,服務(wù)器通知瀏覽器一個(gè)緩存時(shí)間,在緩存時(shí)間內(nèi),下次請(qǐng)求,直接用緩存,不在時(shí)間內(nèi),執(zhí)行比較緩存策略。
對(duì)于比較緩存,將緩存信息中的Etag和Last-Modified通過請(qǐng)求發(fā)送給服務(wù)器,由服務(wù)器校驗(yàn),返回304狀態(tài)碼時(shí),瀏覽器直接使用緩存。
瀏覽器第一次請(qǐng)求:
瀏覽器再次請(qǐng)求時(shí):
哪些請(qǐng)求不能被緩存?
-
HTTP信息頭中包含Cache-Control:no-cache,pragma:no-cache,或Cache-Control:max-age=0等告訴瀏覽器不用緩存的請(qǐng)求
-
需要根據(jù)Cookie,認(rèn)證信息等決定輸入內(nèi)容的動(dòng)態(tài)請(qǐng)求是不能被緩存的
-
經(jīng)過HTTPS安全加密的請(qǐng)求(有人也經(jīng)過測(cè)試發(fā)現(xiàn),ie其實(shí)在頭部加入Cache-Control:max-age信息,firefox在頭部加入Cache-Control:Public之后,能夠?qū)TTPS的資源進(jìn)行緩存。
-
POST請(qǐng)求無法被緩存
-
HTTP響應(yīng)頭中不包含Last-Modified/Etag,也不包含Cache-Control/Expires的請(qǐng)求無法被緩存
說了這么多,有哪些應(yīng)用呢
-
同一個(gè)資源保證URL的穩(wěn)定性。URL 是瀏覽器緩存機(jī)制的基礎(chǔ),所以如果一個(gè)資源需要在多個(gè)地方被引用,盡量保證 URL 是固定的。同時(shí),比較推薦使用公共類庫,比如 Google Ajax Library 等,有利于最大限度使用緩存
-
給css、js、圖片等資源增加HTTP緩存頭,并強(qiáng)制入口html不被緩存。對(duì)于不經(jīng)常修改的靜態(tài)資源,比如 Css,js,圖片等,可以設(shè)置一個(gè)較長(zhǎng)的過期的時(shí)間,或者至少加上 Last-Modified/Etag,而對(duì)于 html 頁面這種入口文件,不建議設(shè)置緩存。這樣既能保證在靜態(tài)資源不變了情況下,可以不重發(fā)請(qǐng)求或直接通過 304 避免重復(fù)下載,又能保證在資源有更新的,只要通過給資源增加時(shí)間戳或者更換路徑,就能讓用戶訪問最新的資源
-
減少對(duì)Cookie的依賴。過多的使用 Cookie 會(huì)大大增加 HTTP 請(qǐng)求的負(fù)擔(dān),每次 GET 或 POST 請(qǐng)求,都會(huì)把 Cookie 都帶上,增加網(wǎng)絡(luò)傳輸流量,導(dǎo)致增長(zhǎng)交互時(shí)間;同時(shí) Cache 是很難被緩存的,應(yīng)該盡量少使用,或者這在動(dòng)態(tài)頁面上使用。
-
減少對(duì)HTTPS加密協(xié)議的使用。通過 HTTPS 請(qǐng)求的資源,默認(rèn)是不會(huì)被緩存的,必須通過特殊的配置,才能讓資源得到緩存。建議只對(duì)涉及敏感信息的請(qǐng)求使用 HTTPS 傳輸,其他類似 Css,Js,圖片這些靜態(tài)資源,盡量避免使用。
-
多用Get方式請(qǐng)求動(dòng)態(tài)Cgi。雖然 POST 的請(qǐng)求方式比 Get 更安全,可以避免類似密碼這種敏感信息在網(wǎng)絡(luò)傳輸,被代理或其他人截獲,但是 Get 請(qǐng)求方式更快,效率更高,而且能被緩存,建議對(duì)于那些不涉及敏感信息提交的請(qǐng)求盡量使用 Get 方式請(qǐng)求
-
動(dòng)態(tài)CGI也是可以被緩存。如果動(dòng)態(tài)腳本或 CGI 輸入的內(nèi)容在一定的時(shí)間范圍內(nèi)是固定的,或者根據(jù) GET 參數(shù)相同,輸入的內(nèi)容相同,我們也認(rèn)為請(qǐng)求是可以被緩存的,有以下幾種方式,可以達(dá)到這個(gè)效果:
讓動(dòng)態(tài)腳本定期將內(nèi)容改變時(shí)導(dǎo)出成靜態(tài)文件,Web 直接訪問帶有 Last-Modified/Etag 的靜態(tài)文件。
開發(fā)者可以通過代碼給動(dòng)態(tài)腳本的響應(yīng)頭中添加 Cache-Control: max-age,告訴瀏覽器在過期前可以直接使用副本。
通過代碼給動(dòng)態(tài)腳本的響應(yīng)頭添加 Last-Modified/Etag 信息,瀏覽器再次請(qǐng)求的時(shí)候,可以通過解析 If-Modified-Since/If-None-Match 得知瀏覽器是否存在緩存,由代碼邏輯控制是否返回 304。
說了這么多,如何給站點(diǎn)增加緩存機(jī)制
HTTP 請(qǐng)求/響應(yīng)頭中緩存報(bào)頭對(duì)有效利用站點(diǎn)緩存,作為一個(gè) Web 前端開發(fā)者,我要做什么呢?答案是:啥都不用做。不過要去推動(dòng) Web 運(yùn)營(yíng)人員、Web 后端開發(fā)人員分別給服務(wù)器和動(dòng)態(tài)腳本 CGI 增加合適的緩存報(bào)頭。
審核編輯 :李倩
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
8700瀏覽量
84528 -
HTTP
+關(guān)注
關(guān)注
0文章
478瀏覽量
30756 -
CGI
+關(guān)注
關(guān)注
0文章
20瀏覽量
10333
原文標(biāo)題:徹底弄懂HTTP緩存機(jī)制及原理
文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論