国产亚洲欧美日韩三区电影,中文字幕有码无码人妻av,国产欧美精品一区AⅤ影院

尋找并分析百度云的轉(zhuǎn)存api

首先你得有一個(gè)百度云盤的賬號，然后登錄，用瀏覽器（這里用火狐瀏覽器做示范）打開一個(gè)分享鏈接。F12打開控制臺進(jìn)行抓包。手動(dòng)進(jìn)行轉(zhuǎn)存操作：全選文件->保存到網(wǎng)盤->選擇路徑->確定。點(diǎn)擊【確定】前建議先清空一下抓包記錄，這樣可以精確定位到轉(zhuǎn)存的api，這就是我們中學(xué)時(shí)學(xué)到的【控制變量法】2333。

可以看到上圖中抓到了一個(gè)帶有 “transfer” 單詞的 post 請求，這就是我們要找的轉(zhuǎn)存（transfer）api 。接下來很關(guān)鍵，就是分析它的請求頭和請求參數(shù)，以便用代碼模擬。

點(diǎn)擊它，再點(diǎn)擊右邊的【Cookies】就可以看到請求頭里的 cookie 情況。

cookie分析

因?yàn)檗D(zhuǎn)存是登錄后的操作，所以需要模擬登錄狀態(tài)，將與登錄有關(guān)的 cookie 設(shè)置在請求頭里。我們繼續(xù)使用【控制變量法】，先將瀏覽器里關(guān)于百度的 cookie 全部刪除（在右上角的設(shè)置里面，點(diǎn)擊【隱私】，移除cookies。具體做法自己百度吧。）

然后登錄，右上角進(jìn)入瀏覽器設(shè)置->隱私->移除cookie，搜索 "bai" 觀察 cookie 。這是所有跟百度相關(guān)的 cookie ，一個(gè)個(gè)刪除，刪一個(gè)刷新一次百度的頁面，直到刪除了 BDUSS ，刷新后登錄退出了，所以得出結(jié)論，它就是與登錄狀態(tài)有關(guān)的 cookie 。

同理，刪除掉 STOKEN 后，進(jìn)行轉(zhuǎn)存操作會(huì)提示重新登錄。所以，這兩個(gè)就是轉(zhuǎn)存操作所必須帶上的 cookie 。

弄清楚了 cookie 的情況，可以像下面這樣構(gòu)造請求頭。

除了上面說到的兩個(gè) cookie ，其他的請求頭參數(shù)可以參照手動(dòng)轉(zhuǎn)存時(shí)抓包的請求頭。這兩個(gè) cookie 預(yù)留出來做參數(shù)的原因是 cookie 都是有生存周期的，過期了需要更新，不同的賬號登錄也有不同的 cookie 。

參數(shù)分析

接下來分析參數(shù)，點(diǎn)擊【Cookies】右邊的【Params】查看參數(shù)情況。如下：

上面的query string（也就是？后跟的參數(shù)）里，除了框起來的shareid、from、bdstoken需要我們填寫以外，其他的都可以不變，模擬請求的時(shí)候直接抄下來。

前兩個(gè)與分享的資源有關(guān)，bdstoken與登錄的賬號有關(guān)。下面的form data里的兩個(gè)參數(shù)分別是資源在分享用戶的網(wǎng)盤的所在目錄和剛剛我們點(diǎn)擊保存指定的目錄。

所以，需要我們另外填寫的參數(shù)為：shareid、from、bdstoken、filelist 和 path，bdstoken 可以手動(dòng)轉(zhuǎn)存抓包找到，path 根據(jù)你的需要自己定義，前提是你的網(wǎng)盤里有這個(gè)路徑。其他三個(gè)需要從分享鏈接里爬取，這個(gè)將在后面的【爬取shareid、from、filelist，發(fā)送請求轉(zhuǎn)存到網(wǎng)盤】部分中進(jìn)行講解。

搞清楚了參數(shù)的問題，可以像下面這樣構(gòu)造轉(zhuǎn)存請求的 url 。

爬取shareid、from、filelist，發(fā)送請求轉(zhuǎn)存到網(wǎng)盤

以上面這個(gè)資源鏈接為例（隨時(shí)可能被河蟹，但是沒關(guān)系，其他鏈接的結(jié)構(gòu)也是一樣的），我們先用瀏覽器手動(dòng)訪問，F(xiàn)12 打開控制臺先分析一下源碼，看看我們要的資源信息在什么地方?？刂婆_有搜索功能，直接搜 “shareid”。

定位到4個(gè)shareid，前三個(gè)與該資源無關(guān)，是其他分享資源，最后一個(gè)定位到該 html 文件的最后一個(gè)標(biāo)簽塊里。雙擊后可以看到格式化后的 js 代碼，可以發(fā)現(xiàn)我們要的信息全都在里邊。如下節(jié)選：

可以看到這兩行

yunData.PATH 只指向了一個(gè)路徑信息，完整的 filelist 可以從 yunData.FILEINFO 里提取，它是一個(gè) json ，list 里的信息是Unicode編碼的，所以在控制臺看不到中文，用Python代碼訪問并獲取輸出一下就可以了。

直接用request請求會(huì)收獲 404 錯(cuò)誤，可能是需要構(gòu)造請求頭參數(shù)，不能直接請求，這里博主為了節(jié)省時(shí)間，直接用selenium的webdriver來get了兩次，就收到了返回信息。第一次get沒有任何 cookie ，但是baidu 會(huì)給你返回一個(gè)BAIDUID ，在第二次 get 就可以正常訪問了。

yunData.FILEINFO 結(jié)構(gòu)如下，你可以將它復(fù)制粘貼到j(luò)son.cn里，可以看得更清晰。

清楚了這三個(gè)參數(shù)的位置，我們就可以用正則表達(dá)式進(jìn)行提取了。代碼如下：

爬取到了這三個(gè)參數(shù)，就可以調(diào)用之前的 transfer 方法進(jìn)行轉(zhuǎn)存了。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴