0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

輸入一個URL

冬至子 ? 來源:西加加語言 ? 作者:吳YH堅 ? 2023-06-05 14:46 ? 次閱讀

前幾天看到一個題目,問在瀏覽器中輸入一個URL會發(fā)生神馬,這好像是網(wǎng)上比較流行的面試題,而且也被回答爛了,仔細(xì)想下來,要是自己遇到這個題目能不能答上來,后來一想, 這個題目要完全答出來可以把大學(xué)開始的幾乎所有知識都用上。 呵呵,為了模擬面試,所以都憑印象說的,沒有查網(wǎng)絡(luò)資料,所以估計很多地方都不對,歡迎來拍。[]()后續(xù)可以總結(jié)一個非常非常詳細(xì)的版本,個人感覺真的可以把大學(xué)開始的所有的東西都用上,包括連數(shù)電模電(全部流程都跑不掉),信息論(gzip壓縮),密碼學(xué)(HTTPS),通訊原理(網(wǎng)絡(luò)基帶傳輸)這種都可以,本文還是以軟件處理過程為主。[]()

硬件層---鍵盤到CPU

[]()輸入網(wǎng)址嘛,那就是鍵盤輸入了,鍵盤一般用usb或者PS/2口連接電腦,現(xiàn)在見過PS/2口的人不多了吧,我們就看看usb吧,usb分為主從模式,一般的鍵盤本身的usb是一個從設(shè)備,相應(yīng)的還有u盤啊,鼠標(biāo)啊都是從設(shè)備,對應(yīng)的主機(jī)端的USBcontroller是一個主設(shè)備,這個主設(shè)備掛在CPU上,在X86結(jié)構(gòu)的機(jī)器上是掛在主板的南橋(好像是的,反正是低速的那個)芯片上,如果是ARM這類嵌入式設(shè)備的話,那么就是掛在APB總線上,對這個我熟悉一些,就按ARM這種SoC來說吧,當(dāng)是在手機(jī)上輸入URL吧,呵呵。[]()

鍵盤輸入字符以后,通過USB協(xié)議(USB協(xié)議簡單的來說就是一個串行協(xié)議,靠一個時鐘電信號和一個數(shù)據(jù)電信號傳輸數(shù)據(jù))將數(shù)據(jù)傳輸?shù)紸PB總線上的USB控制器上。然后這個控制器開始搶總線,總線的APB橋接收到信號以后也開始通過APB總線上的時鐘和數(shù)據(jù)線發(fā)送一個中斷信號APB橋中,APB橋同時連接在AHP高速總線上,接收完數(shù)據(jù)以后,它開始搶高速總線,高速總線上有個Arbiter(總線仲裁器),因為高速總線上接的都是內(nèi)存啊這種家伙,你一個小小的USB不見得搶得過他們,等仲裁器給你時間以后,APB橋開始把中斷信號發(fā)給CPU。[]()

CPU接收到這個中斷以后,要是沒有其他更高級的中斷需要處理的話就會調(diào)用內(nèi)核中的中斷處理函數(shù)開始處理中斷,中斷處理函數(shù)又分為底半部和頂半部,首先會是底半部處理,把中斷放到處理隊列中就返回了,然后頂半部從隊列根據(jù)注冊的的中斷號拿到自己對應(yīng)的中斷號進(jìn)行處理,這時候中斷處理函數(shù)就算收到這個信號了,相當(dāng)于硬件的電信號已經(jīng)傳遞到軟件層了,中斷處理函數(shù)會調(diào)用USB的驅(qū)動程序去USB控制器上讀取這個輸入的字符,這個字符還是通過兩條總線(APB和AHB)以獨占的方式傳遞到軟件層上,其實呢,是軟件控制這個信號寫到了內(nèi)存的某個空間上。[]()

整個流程是這樣的[]()

發(fā)出中斷 :鍵盤--->usb控制器 ---> APB橋 ---> CPU硬件中斷 ---> 中斷處理底部 ---> 中斷處理函數(shù)頂部 ---> 驅(qū)動程序 ---> 讀取數(shù)據(jù) ---> CPU尋址 ---> 寫入內(nèi)存[]()

內(nèi)核層到應(yīng)用層

[]()假設(shè)我們輸入的url以C語言scanf函數(shù)為例,scanf函數(shù)會一直在內(nèi)核態(tài)阻塞著,直到中斷處理函數(shù)接收到了所有的字符并且接受到了一個回車符,這時scanf語句會通過操作系統(tǒng)的read調(diào)用把緩沖區(qū)的所有字符從內(nèi)核態(tài)拷貝到用戶態(tài),這時這些個字符就從電信號傳遞到了應(yīng)用程序(瀏覽器)的軟件層了。[]()

整個流程是[]()

scanf ---> 系統(tǒng)調(diào)用read ---> 內(nèi)核態(tài)阻塞等待 ---> 讀取拷貝數(shù)據(jù) ---> 用戶態(tài)接收數(shù)據(jù)[]()

因為軟件層也不是一個實體層次,其實所有的操作最后都變成了硬件的電信號,所有沒辦法把流程寫得很明白,大概就是這么個意思吧。[]()

網(wǎng)絡(luò)請求

[]()應(yīng)用程序(瀏覽器)接收到這個URL以后,就開始走網(wǎng)絡(luò)層來獲取數(shù)據(jù)了,這里我們就不深入到底層的電信號了,就按網(wǎng)絡(luò)這一套來說吧。[]()

DNS解析

[]()首先就要解析域名了,瀏覽器會先看一下本地的host文件,看有沒有url域名對應(yīng)的ip地址,如果沒有的話,會通過DNS協(xié)議發(fā)送數(shù)據(jù)包給DNS服務(wù)器詢問域名的ip地址,DNS服務(wù)自己沒有對應(yīng)的ip的話會繼續(xù)往上尋找,然后把ip地址發(fā)回給瀏覽器。DNS協(xié)議是UDP的,但好像有特殊情況是TCP連接,好像是各個DNS服務(wù)器之間傳輸用的TCP吧,不管了,反正通過UDP這個傳輸層協(xié)議之上的DNS應(yīng)用層協(xié)議把url對應(yīng)的ip地址得到了。[]()

傳輸數(shù)據(jù)準(zhǔn)備

[]()拿到ip地址以后,假設(shè)我們輸入的網(wǎng)址是https://www.baidu.com/,百度的服務(wù)器在北京,而我們在上海,瀏覽器就通過connect開始連接這個這個北京的ip地址了,連接跑到tcp/ip協(xié)議棧以后,協(xié)議棧一看這個IP和本地IP根本就不在一個段上啊,那ARP也不發(fā)了,直接把數(shù)據(jù)包轉(zhuǎn)發(fā)到網(wǎng)關(guān)上,也就是家里的路由器上了,路由器拿到地址,查一下本地的路由表,呀,我這小路由表上沒這個網(wǎng)段的啊,那我不管了,給我的上級路由吧(也許是小區(qū)的大路由器了),小區(qū)路由一看,我這也沒有啊,這樣一級一級傳遞到了上海的城際路由上,然后到了北京的城際路由,這么一層一層下來終于傳到了百度的服務(wù)器上。[]()

在這里看上去簡單,但是路由的算法是很復(fù)雜的,這一塊我也不太懂沒弄過,但是Dijkstra選路算法還是明白的,別問我為什么記得這個單詞,大學(xué)計算機(jī)網(wǎng)絡(luò)課的課程作業(yè)啊,就是實現(xiàn)這個Dijkstra啊,通過路由算法,終于把第一個數(shù)據(jù)包發(fā)送給百度的服務(wù)器了。[]()

建立連接

[]()這個數(shù)據(jù)包是神馬呢,就是我們熟悉的TCP三次握手的第一握了,SYN=1的那個數(shù)據(jù)包,關(guān)于三次握手就不多說了,大家都知道,關(guān)鍵是我不記得細(xì)節(jié)了,反正就是大家都懂的,握手完了連接就建立完了。為什么建立連接需要三次握手,關(guān)閉連接需要四次握手,呵呵,寫不動了。[]()

同時,在百度服務(wù)器這邊,有個web服務(wù)器的應(yīng)用程序(比如Nginx),一直在監(jiān)聽著80端口,收到這個數(shù)據(jù)包以后也同時和客戶端建立起了連接了。[]()

傳輸數(shù)據(jù)

[]()連接建立好以后,是TCP連接建立了,這時通過更上層的HTTP協(xié)議開始傳輸數(shù)據(jù),HTTP協(xié)議本身很復(fù)雜,這里我們簡單的來說,就是瀏覽器發(fā)送了一個GET / HTTP/1.1 \\n\\r字符串給了服務(wù)器,服務(wù)器接受到這個字符串以后,通過協(xié)議棧傳遞給了上層的Nginx應(yīng)用程序。[]()

應(yīng)用程序一看這個地址是/,然后對照一下自己的配置文件nginx.conf,有個配置告訴他碰到這種請求,直接把本地的index.html吐出去,于是Nginx讀取index.html并把數(shù)據(jù)通過這條TCP連接回復(fù)給了客戶端。[]()

由于http協(xié)議是無狀態(tài)的,所以本次傳輸完數(shù)據(jù)以后,這個鏈接就關(guān)閉了。[]()

完成顯示

[]()好了,后面的就是接受到數(shù)據(jù)的顯示了,關(guān)于webkit內(nèi)核的細(xì)節(jié)就真不清楚了,就是解DOM樹,執(zhí)行JS代碼,重新請求CSS和圖片,然后把頁面畫出來吧。[]()

哦了,題目做完了,其實還有很多細(xì)節(jié)沒有說的,比如網(wǎng)絡(luò)尋址的時候的ARP協(xié)議啊,路由器尋路的其他很多算法啊,Nginx處理請求的時候的幾個階段解讀啊,是否需要反向代理到后端的服務(wù)器上啊,最后顯示的時候還需要操作顯卡進(jìn)行顯存的操作,如果頁面中有復(fù)雜的圖形效果還需要GPU參與運算之類的,要寫就寫不完了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • USB接口
    +關(guān)注

    關(guān)注

    9

    文章

    691

    瀏覽量

    55373
  • USB控制器
    +關(guān)注

    關(guān)注

    1

    文章

    35

    瀏覽量

    11837
  • SoC設(shè)計
    +關(guān)注

    關(guān)注

    1

    文章

    147

    瀏覽量

    18720
  • C語言
    +關(guān)注

    關(guān)注

    180

    文章

    7575

    瀏覽量

    134160
  • URL
    URL
    +關(guān)注

    關(guān)注

    0

    文章

    138

    瀏覽量

    15220
收藏 人收藏

    評論

    相關(guān)推薦

    C語言實現(xiàn)url解析小實例

    編寫簡單的用于解析url的小例子,最終目標(biāo)是解析出URL中所有的數(shù)據(jù)信息。二、庫函數(shù)用到的幾個庫函數(shù)如下:1. strncasecmp頭文件#include<
    發(fā)表于 04-12 09:10

    為什么有些URL包含“www”,有些卻不包括?“www”是什

    為什么有些URL包含“www”,有些卻不包括?“www”是什么意思? 眾所周知,“普通”網(wǎng)站的URL如下所示:http://www.howstuffworks.com。然而您可能也已注意到,很多網(wǎng)站并不需
    發(fā)表于 08-06 08:16 ?3934次閱讀

    URL,URL是什么意思

    URL,URL是什么意思 URL(Uniform Resoure Locator:統(tǒng)資源定位器)是WWW頁的地址,它從左到右由下述部分組成: &
    發(fā)表于 03-22 10:53 ?8221次閱讀

    C#教程之打開Url

    C#教程之打開Url,很好的C#資料,快來學(xué)習(xí)吧。
    發(fā)表于 04-20 10:50 ?5次下載

    ·從輸入url到頁面展示到底發(fā)生了什么

    步·輸入地址 當(dāng)我們開始在瀏覽器中輸入網(wǎng)址的時候,瀏覽器其實就已經(jīng)在智能的匹配可能得url了,他會從歷史記錄,書簽等地方,找到已經(jīng)輸入
    發(fā)表于 01-11 15:35 ?433次閱讀
    <b class='flag-5'>一</b>·從<b class='flag-5'>輸入</b><b class='flag-5'>url</b>到頁面展示到底發(fā)生了什么

    檢測惡意URL的方法

    提出種高效的基于段模式的檢測惡意URL的方法,該方法首先解析已標(biāo)注的惡意URL中的域名、路徑名和文件名3語義段,然后通過建立以三元組為詞項的倒排索引快速計算惡意
    發(fā)表于 02-27 11:18 ?1次下載
    檢測惡意<b class='flag-5'>URL</b>的方法

    Chrome 86新特性:改進(jìn)地址欄隱藏/顯示完整 URL 功能

    釣魚、社交工程和網(wǎng)絡(luò)詐騙。項研究顯示,當(dāng) URL 中出現(xiàn)誤導(dǎo)性品牌名稱時,超過 60% 的用戶會被欺騙。
    的頭像 發(fā)表于 08-17 11:23 ?2331次閱讀
    Chrome 86新特性:改進(jìn)地址欄隱藏/顯示完整 <b class='flag-5'>URL</b> 功能

    基于畸形URL前綴的網(wǎng)絡(luò)攻擊激增6000%

    來自GreatHorn的研究人員報告說,他們已經(jīng)觀察到了犯罪分子通過構(gòu)造 “畸形的URL前綴 ”來逃避安全軟件的防護(hù),發(fā)送釣魚郵件進(jìn)行攻擊的次數(shù)增加了近6000%。除非你仔細(xì)觀察URL前綴中使用的符號,要不然,它們看起來是非常合法的。
    的頭像 發(fā)表于 02-26 15:40 ?1666次閱讀

    EN55022 B類認(rèn)證產(chǎn)品文檔URL鏈接

    EN55022 B類認(rèn)證產(chǎn)品文檔URL鏈接
    發(fā)表于 05-10 18:27 ?16次下載
    EN55022 B類認(rèn)證產(chǎn)品文檔<b class='flag-5'>URL</b>鏈接

    簡述go語言標(biāo)準(zhǔn)庫 net/url 庫的過程。

    本文是篇學(xué)習(xí)筆記,記錄了作者學(xué)習(xí) go 語言標(biāo)準(zhǔn)庫 net/url 庫的過程。 參考:https://studygolang.com/pkgdoc 導(dǎo)入方式: import “net/url
    的頭像 發(fā)表于 08-14 10:35 ?1507次閱讀

    IP知識百科之URL過濾

    URL過濾 URL過濾是種針對用戶的URL請求進(jìn)行上網(wǎng)控制的技術(shù),通過允許或禁止用戶訪問某些網(wǎng)頁資源,達(dá)到規(guī)范上網(wǎng)行為和降低安全風(fēng)險的目的。URL
    的頭像 發(fā)表于 09-23 11:08 ?5339次閱讀

    編寫用于解析url的小例子

    前面口君寫了篇關(guān)于url的文章:《文帶你理解URI 和 URL 有什么區(qū)別?》
    的頭像 發(fā)表于 04-14 12:55 ?1571次閱讀

    什么是URL?為什么要做URL靜態(tài)化?

    進(jìn)行URL靜態(tài)化的目的是對于搜索引擎和用戶來說更為友好,雖然Google之前在官方博客發(fā)表了博文Google能夠很好的抓取動態(tài)網(wǎng)頁,并且也非常鼓勵網(wǎng)站采取動態(tài)網(wǎng)頁的形式來建站,但是我們所要做的網(wǎng)站
    的頭像 發(fā)表于 06-28 15:34 ?3911次閱讀

    Spring MVC的工作原理是怎樣的

    的處理、視圖的渲染和響應(yīng)的發(fā)送。 首先,當(dāng)用戶在瀏覽器中輸入URL并發(fā)送請求時,請求被發(fā)送到服務(wù)器。服務(wù)器會根據(jù)請求的URL和其他相關(guān)信
    的頭像 發(fā)表于 11-22 16:53 ?571次閱讀

    MySQL數(shù)據(jù)庫的url地址

    MySQL數(shù)據(jù)庫的URL地址是用于連接到MySQL服務(wù)器的地址。URL種統(tǒng)資源定位符,用于指定特定資源的位置和訪問方式。MySQL數(shù)據(jù)庫的UR
    的頭像 發(fā)表于 12-06 10:58 ?2130次閱讀