0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Kubernetes存儲體系解析 淺談Volume概念的由來

454398 ? 來源:云原生技術(shù)愛好者社區(qū) ? 作者:strict_nerd ? 2020-10-15 16:45 ? 次閱讀

Volume、PV、PVC、StorageClass由來

先思考一個問題,為什么會引入Volume這樣一個概念?

答案很簡單,為了實現(xiàn)數(shù)據(jù)持久化,數(shù)據(jù)的生命周期不隨著容器的消亡而消亡。

”在沒有介紹Kubernetes Volume之前,先來回顧下Docker Volume,Docker Volume常用使用方式有兩種,

volumes通過這種方式, Docker管理宿主機文件系統(tǒng)的一部分,默認位于 /var/lib/docker/volumes目錄中,由于在創(chuàng)建時沒有創(chuàng)建指定數(shù)據(jù)卷, docker自身會創(chuàng)建默認數(shù)據(jù)卷;

bind mounts通過這種方式,可以把容器內(nèi)文件掛載到宿主機任意目錄。

既然有了Docker Volume,為啥Kubernetes又搞出了自己的Volume?谷歌的標新立異?

答案是否定的,Kubernetes Volume和Docker Volume概念相似,但是又有不同的地方,Kubernetes Volume與Pod的生命周期相同,但與容器的生命周期不相關(guān)。當容器終止或重啟時,Volume中的數(shù)據(jù)也不會丟失。當Pod被刪除時,Volume才會被清理。并且數(shù)據(jù)是否丟失取決于Volume的具體類型,比如emptyDir類型的Volume數(shù)據(jù)會丟失,而持久化類型的數(shù)據(jù)則不會丟失。另外Kubernetes提供了將近20種Volume類型。

”現(xiàn)在有了Kubernetes的Volume,我們就可以完全可以在Yaml編排文件中填寫上Volume是字段,如下nfs所示:

。。..volumes: - name: static-nfs nfs: server: 12.18.17.240 path: /nfs/data/static

如果你使用ceph作為存儲插件,你可以在編排文件中這樣定義:

volumes: - name: ceph-vol cephfs: monitors: - 12.18.17.241:6789 - 12.18.17.242:6789 user: admin secretRef: name: ceph-secret readOnly: true

當然只要是Kubernetes已經(jīng)實現(xiàn)的數(shù)據(jù)卷類型,你都可以按照如上方式進行直接在Yaml編排文件中定義使用。

看到這里其實已經(jīng)完成了80%的工作,那么為什么還要設(shè)計多此一舉的PV呢?這個問題先擱置下,后面會有說明。

在沒有說明為什么要設(shè)計多此一舉的PV PVC之前,先來看看什么是PV PVC?

PV是對持久化存儲數(shù)據(jù)卷的一種描述。

”PV通常是由運維人員提前在集群里面創(chuàng)建等待使用的一種數(shù)據(jù)卷。如下所示:

apiVersion: v1kind: PersistentVolumemetadata: name: nfsspec: capacity: storage: 10Gi accessModes: - ReadWriteMany nfs: server: 10.244.1.4 path: “/nfs”

PVC描述的是持久化存儲的屬性,比如大小、讀寫權(quán)限等。

”PVC通常由開發(fā)人員創(chuàng)建,如下所示:

apiVersion: v1kind: PersistentVolumeClaimmetadata: name: nfsspec: accessModes: - ReadWriteMany resources: requests: storage: 10Gi

而用戶創(chuàng)建的PV PVC必須綁定完成之后才能被利用起來。而PV PVC綁定起來的前提是PV中spec中聲明字段大小、權(quán)限等必須滿足PVC的要求。

成功綁定之后,就可以在Pod Yaml編排文件中定義和使用。如下所示:

apiVersion: v1kind: Podmetadata: labels: role: webspec: containers: - name: web image: nginx ports: - name: web containerPort: 80 volumeMounts: - name: nfs mountPath: “/usr/share/nginx/html” volumes: - name: nfs persistentVolumeClaim: claimName: nfs

看到這里,我們還會認為僅僅是PV對Volume多了一層抽象,并不見得比直接在Yaml中聲明Volume高明多少。仔細思考下,我們?yōu)槭裁茨軌蛑苯釉赮aml中直接定義Volume?因為Kubernetes已經(jīng)幫助我們實現(xiàn)了這種Volume類型,如果我們有自己的存儲類型,而Kubernetes中并沒有實現(xiàn),這種是沒有辦法直接在Yaml編排文件中直接定義Volume的。這個時候PV PVC面向?qū)ο蟮脑O(shè)計就體現(xiàn)出其價值了。這也是在軟件開發(fā)領(lǐng)域經(jīng)常碰到的問題,開源軟件無法滿足要求,但也沒有提供出可擴展的接口,沒辦法,只能重新造輪子。

我們在開發(fā)過程中經(jīng)常碰到這樣一個問題,在Pod中聲明一個PVC之后,發(fā)現(xiàn)Pod不能被調(diào)度成功,原因是因為PVC沒有綁定到合適的PV,這個時候要求運維人員創(chuàng)建一個PV,緊接著Pod調(diào)度成功。剛才上在介紹PV PVC,它們的創(chuàng)建過程都是手動,如果集群中需要成千上萬的PV,那么運維人員豈不累死?在實際操作中,這種方式根本行不通。所以Kubernetes給我們提供了一套自動創(chuàng)建PV的機制Dynamic Provisioning.在沒有介紹這套自動創(chuàng)建機制之前,先看看Static Provisioning,什么是Static Provisioning?剛才人工創(chuàng)建PV PVC的方式就是Static Provisioning。你可以在PV PVC編排文件中聲明StorageClass,如果沒有聲明,那么默認為“”。具體交互流程如下所示:

靜態(tài)分配流程

首先由集群管理員事先去規(guī)劃這個集群中的用戶會怎樣使用存儲,它會先預(yù)分配一些存儲,也就是預(yù)先創(chuàng)建一些 PV;然后用戶在提交自己的存儲需求(PVC)的時候,Kubernetes內(nèi)部相關(guān)組件會幫助它把PVC PV 做綁定;最后pod使用存儲的時候,就可以通過PVC找到相應(yīng)的PV,它就可以使用了。不足之處也非常清楚,首先繁瑣,然后運維人員無法預(yù)知開發(fā)人員的真實存儲需求,比如運維人員創(chuàng)建了多個100Gi的PV存儲,但是在實際開發(fā)過程中,開發(fā)人員只能使用10Gi,這就造成了資源的浪費。當然Kubernetes也為我們提供更好的使用方式,即Dynamic Provisioning它是什么呢?

Dynamic Provisioning包含了創(chuàng)建某種PV所需要的參數(shù)信息,類似于一個創(chuàng)建PV的模板。具體交互流程如下所示:

Kubernetes集群中的控制器,會結(jié)合PVC和StorageClass的信息動態(tài)生成用戶所需要的PV,將PVC PV進行綁定后,pod就可以使用PV了。通過 StorageClass配置生成存儲所需要的存儲模板,再結(jié)合用戶的需求動態(tài)創(chuàng)建PV對象,做到按需分配,在沒有增加用戶使用難度的同時也解放了集群管理員的運維工作。

動態(tài)PV使用Dynamic Provisioning上面提到過,運維人員不再預(yù)分配PV,而只是創(chuàng)建一個模板文件,這個模板文件正是StorageClass。下面以NFS為例進行說明,動態(tài)PV的整個使用過程。

安裝NFS服務(wù)

#安裝nfsyum -y install nfs-utils rpcbind#開機自啟動systemctl enable rpcbind nfs-server#配置nfs 文件echo “/nfs/data *(rw,no_root_squash,sync)” 》/etc/exports

部署置備程序

apiVersion: v1

kind: ServiceAccount

metadata:

name: nfs-provisioner

---

kind: ClusterRole

apiVersion: rbac.authorization.k8s.io/v1

metadata:

name: nfs-provisioner-runner

rules:

- apiGroups: [“”]

resources: [“persistentvolumes”]

verbs: [“get”, “l(fā)ist”, “watch”, “create”, “delete”]

- apiGroups: [“”]

resources: [“persistentvolumeclaims”]

verbs: [“get”, “l(fā)ist”, “watch”, “update”]

- apiGroups: [“storage.k8s.io”]

resources: [“storageclasses”]

verbs: [“get”, “l(fā)ist”, “watch”]

- apiGroups: [“”]

resources: [“events”]

verbs: [“watch”, “create”, “update”, “patch”]

- apiGroups: [“”]

resources: [“services”, “endpoints”]

verbs: [“get”,“create”,“l(fā)ist”, “watch”,“update”]

- apiGroups: [“extensions”]

resources: [“podsecuritypolicies”]

resourceNames: [“nfs-provisioner”]

verbs: [“use”]

---

kind: ClusterRoleBinding

apiVersion: rbac.authorization.k8s.io/v1

metadata:

name: run-nfs-provisioner

subjects:

- kind: ServiceAccount

name: nfs-provisioner

namespace: logging

roleRef:

kind: ClusterRole

name: nfs-provisioner-runner

apiGroup: rbac.authorization.k8s.io

---

kind: Deployment

apiVersion: apps/v1

metadata:

name: nfs-client-provisioner

spec:

selector:

matchLabels:

app: nfs-client-provisioner

replicas: 1

strategy:

type: Recreate

template:

metadata:

labels:

app: nfs-client-provisioner

spec:

serviceAccount: nfs-provisioner

containers:

- name: nfs-client-provisioner

image: quay.io/external_storage/nfs-client-provisioner:latest

imagePullPolicy: IfNotPresent

volumeMounts:

- name: nfs-client

mountPath: /persistentvolumes

env:

- name: PROVISIONER_NAME

value: fuseim.pri/ifs

- name: NFS_SERVER

value: 12.18.7.20

- name: NFS_PATH

value: /nfs/data

volumes:

- name: nfs-client

nfs:

server: 12.18.7.20

path: /nfs/data

創(chuàng)建StorageClass模板

apiVersion: storage.k8s.io/v1kind: StorageClassmetadata: name: nfs-storageprovisioner: fuseim.pri/ifsreclaimPolicy: Retain

這些參數(shù)是通過Kubernetes創(chuàng)建存儲的時候,需要指定的一些細節(jié)參數(shù)。對于這些參數(shù),用戶是不需要關(guān)心的,像這里provisioner指的是使用nfs的置備程序。ReclaimPolicy就是說動態(tài)創(chuàng)建出來的PV,當使用方使用結(jié)束、Pod 及 PVC被刪除后,這塊PV應(yīng)該怎么處理,我們這個地方寫的是Retain,意思就是說當使用方pod PVC被刪除之后,這個PV會保留。

提交完成模板文件之后,用戶只需要在 Pod yaml文件定義 PVC,即可自動創(chuàng)建 PV和 PVC。

apiVersion: apps/v1kind: StatefulSetmetadata: name: esspec: 。。.。。.。。 template: metadata: labels: app: elasticsearch spec: 。。.。。.。。. initContainers: 。。.。。.。。 containers: - name: elasticsearch image: docker.elastic.co/elasticsearch/elasticsearch:7.6.2 。。.。。.。 volumeClaimTemplates: - metadata: name: data labels: app: elasticsearch spec: accessModes: [ “ReadWriteOnce” ] storageClassName: nfs-storage resources: requests: storage: 50Gi`

Capacity:存儲對象的大小;

AccessModes:也是用戶需要關(guān)心的,就是說使用這個PV的方式。它有三種使用方式:ReadWriteOnce是單node讀寫訪問;ReadOnlyMany是多個node只讀訪問,常見的一種數(shù)據(jù)共享方式;ReadWriteMany是多個node上讀寫訪問;

StorageClassName:StorageClassName這個我們剛才說了,動態(tài)Provisioning時必須指定的一個字段,就是說我們要指定到底用哪一個模板文件來生成PV。

Kubernetes存儲架構(gòu)

存儲架構(gòu)圖

PV Controller: 負責 PV PVC的綁定、生命周期管理,并根據(jù)需求進行數(shù)據(jù)卷的 Provision Delete操作

AD Controller:負責存儲設(shè)備的 Attach Detach操作,將設(shè)備掛載到目標節(jié)點

Volume Manager:管理卷的 Mount Unmount操作、卷設(shè)備的格式化以及掛載到一些公用目錄上的操作

Volume Plugins:它主要是對上面所有掛載功能的實現(xiàn)。 PV Controller、AD Controller、Volume Manager 主要是進行操作的調(diào)用,而具體操作則是由 Volume Plugins實現(xiàn)的。根據(jù)源碼的位置可將 Volume Plugins分為 In-Tree和 Out-of-Tree兩類: In-Tree表示源碼是放在 Kubernetes內(nèi)部的(常見的 NFS、cephfs等),和 Kubernetes一起發(fā)布、管理與迭代,缺點是迭代速度慢、靈活性差; Out-of-Tree的 Volume Plugins的代碼獨立于 Kubernetes,它是由存儲 提供商實現(xiàn)的,目前主要有 Flexvolume CSI兩種實現(xiàn)機制,可以根據(jù)存儲類型實現(xiàn)不同的存儲插件

Scheduler:實現(xiàn)對 Pod的調(diào)度能力,會根據(jù)一些存儲相關(guān)的的定義去做存儲相關(guān)的調(diào)度

動態(tài)PV交互流程

Kubernetes掛載Volume過程

用戶創(chuàng)建一個包含 PVC的 Pod

PV Controller會觀察 ApiServer,如果它發(fā)現(xiàn)一個 PVC已經(jīng)創(chuàng)建完畢但仍然是未綁定的狀態(tài),它就會試圖把一個 PV和 PVC綁定

Provision就是從遠端上一個具體的存儲介質(zhì)創(chuàng)建一個 Volume,并且在集群中創(chuàng)建一個 PV對象,然后將此 PV和 PVC進行綁定

Scheduler進行多個維度考量完成后,把 Pod調(diào)度到一個合適的 Node

Kubelet不斷 watch APIServer是否有 Pod要調(diào)度到當前所在節(jié)點

Pod調(diào)度到某個節(jié)點之后,它所定義的 PV還沒有被掛載( Attach),此時 AD Controller就會調(diào)用 VolumePlugin,把遠端的 Volume掛載到目標節(jié)點中的設(shè)備上( /dev/vdb);當 Volum Manager 發(fā)現(xiàn)一個 Pod調(diào)度到自己的節(jié)點上并且 Volume已經(jīng)完成了掛載,它就會執(zhí)行 mount操作,將本地設(shè)備(也就是剛才得到的 /dev/vdb)掛載到 Pod在節(jié)點上的一個子目錄中

啟動容器,并將已經(jīng)掛載到本地的 Volume映射到容器中

總結(jié)本文主要扯了如下內(nèi)容,首先介紹Kubernetes中Volume、PV、PVC、StorageClass由來,然后介紹了StorageClass使用,最后簡單介紹了Kubernetes存儲架構(gòu)以及動態(tài)存儲交互流程。
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲技術(shù)
    +關(guān)注

    關(guān)注

    5

    文章

    723

    瀏覽量

    45733
  • 容器
    +關(guān)注

    關(guān)注

    0

    文章

    490

    瀏覽量

    21986
  • kubernetes
    +關(guān)注

    關(guān)注

    0

    文章

    222

    瀏覽量

    8657
收藏 人收藏

    評論

    相關(guān)推薦

    亮亮視野AR賦能標識解析體系,開啟智能制造新篇章

    近日,亮亮視野承建的工業(yè)互聯(lián)網(wǎng)標識解析二級節(jié)點AR應(yīng)用繼續(xù)深化,二期項目升級簽約落地。AR(增強現(xiàn)實)技術(shù)與工業(yè)互聯(lián)網(wǎng)標識解析體系的結(jié)合如同兩把鑰匙共同解鎖了智能制造新世界的大門。
    的頭像 發(fā)表于 09-13 11:47 ?303次閱讀

    閃測儀的精度概念解析

    上期,小優(yōu)博士講述了和白光干涉儀相關(guān)的精度概念:上期回顧BREAKAWAY與白光干涉儀相關(guān)的精度概念都有哪些|科普篇優(yōu)可測今天,小優(yōu)博士為大家繼續(xù)帶來《和一鍵影像測量儀相關(guān)的精度概念》一、在單視野
    的頭像 發(fā)表于 08-30 13:01 ?414次閱讀
    閃測儀的精度<b class='flag-5'>概念</b><b class='flag-5'>解析</b>

    使用Velero備份Kubernetes集群

    Velero 是 heptio 團隊(被 VMWare 收購)開源的 Kubernetes 集群備份、遷移工具。
    的頭像 發(fā)表于 08-05 15:43 ?226次閱讀
    使用Velero備份<b class='flag-5'>Kubernetes</b>集群

    如何使用Kubeadm命令在PetaExpress Ubuntu系統(tǒng)上安裝Kubernetes集群

    Kubernetes,通??s寫為K8s,是一個開源的容器編排平臺,旨在自動化容器化應(yīng)用的部署、擴展和管理。有了Kubernetes,您可以輕松地部署、更新和擴展應(yīng)用,而無需擔心底層基礎(chǔ)設(shè)施。
    的頭像 發(fā)表于 07-15 13:31 ?694次閱讀
    如何使用Kubeadm命令在PetaExpress Ubuntu系統(tǒng)上安裝<b class='flag-5'>Kubernetes</b>集群

    虛擬存儲器的概念和特征

    用戶提供一個比物理貯存容量大得多、可尋址的“主存儲器”,從而極大地提高了計算機系統(tǒng)的存儲能力。本文將詳細介紹虛擬存儲器的概念、原理、特征及其在計算機系統(tǒng)中的應(yīng)用。
    的頭像 發(fā)表于 05-24 17:23 ?1046次閱讀

    工業(yè)互聯(lián)網(wǎng)標識解析體系&quot;貫通&quot;計劃公布

    據(jù)了解,這份文件是首個關(guān)于工業(yè)互聯(lián)網(wǎng)標識解析體系的明確指導(dǎo)方針。工業(yè)互聯(lián)網(wǎng)作為第四次工業(yè)革命的支柱,也是連接數(shù)字經(jīng)濟與實體經(jīng)濟的橋梁,被視為新型工業(yè)化的重大基礎(chǔ)設(shè)施。
    的頭像 發(fā)表于 02-02 10:05 ?447次閱讀

    Kubernetes Gateway API攻略教程

    Kubernetes Gateway API 剛剛 GA,旨在改進將集群服務(wù)暴露給外部的過程。這其中包括一套更標準、更強大的 API資源,用于管理已暴露的服務(wù)。在這篇文章中,我將介紹 Gateway
    的頭像 發(fā)表于 01-12 11:32 ?704次閱讀
    <b class='flag-5'>Kubernetes</b> Gateway API攻略教程

    使用Jenkins和單個模板部署多個Kubernetes組件

    在持續(xù)集成和部署中,我們通常需要部署多個實例或組件到Kubernetes集群中。通過Jenkins的管道腳本,我們可以自動化這個過程。在本文中,我將演示如何使用Jenkins Pipeline及單個
    的頭像 發(fā)表于 01-02 11:40 ?554次閱讀
    使用Jenkins和單個模板部署多個<b class='flag-5'>Kubernetes</b>組件

    Kubernetes RBAC:掌握權(quán)限管理的精髓

    Kubernetes RBAC(Role-Based Access Control)是 Kubernetes 中一項關(guān)鍵的安全功能,它通過細粒度的權(quán)限控制機制,確保集群資源僅被授權(quán)的用戶或服務(wù)賬號訪問。
    的頭像 發(fā)表于 12-25 09:43 ?364次閱讀

    Kubernetes開發(fā)指南之深入理解CRD

    CRD本身是Kubernetes內(nèi)置的資源類型,全稱是CustomResourceDefinition,可以通過命令查看,kubectl get查看集群內(nèi)定義的CRD資源。
    的頭像 發(fā)表于 12-13 18:19 ?674次閱讀
    <b class='flag-5'>Kubernetes</b>開發(fā)指南之深入理解CRD

    智能物聯(lián)網(wǎng)時代里信息存儲、處理和傳輸方式的變化淺談

    智能物聯(lián)網(wǎng)時代里信息存儲、處理和傳輸方式的變化淺談
    的頭像 發(fā)表于 11-10 17:51 ?446次閱讀

    什么是Kubernetes CoreDNS?如何監(jiān)控 CoreDNS?

    如果您在 Kubernetes 中運行您的工作負載,并且您不知道如何監(jiān)控 CoreDNS,請繼續(xù)閱讀本文:如何使用 Prometheus 來抓取 CoreDNS 指標,您應(yīng)該檢查哪些指標,以及它們的含義。
    發(fā)表于 10-30 09:55 ?1951次閱讀
    什么是<b class='flag-5'>Kubernetes</b> CoreDNS?如何監(jiān)控 CoreDNS?

    戴爾科技再次榮獲Kubernetes數(shù)據(jù)存儲領(lǐng)導(dǎo)者

    近日,國際權(quán)威研究機構(gòu)GigaOm公布了《2023企業(yè)級Kubernetes存儲雷達報告》戴爾科技集團連續(xù)兩年被評為Kubernetes數(shù)據(jù)存儲領(lǐng)導(dǎo)者。
    的頭像 發(fā)表于 10-26 10:16 ?598次閱讀
    戴爾科技再次榮獲<b class='flag-5'>Kubernetes</b>數(shù)據(jù)<b class='flag-5'>存儲</b>領(lǐng)導(dǎo)者

    Jenkins pipeline是如何連接Kubernetes的呢?

    Kubernetes 是一個開源的容器編排平臺,可以幫助開發(fā)團隊管理和部署容器化的應(yīng)用程序。
    的頭像 發(fā)表于 10-23 11:13 ?1710次閱讀
    Jenkins pipeline是如何連接<b class='flag-5'>Kubernetes</b>的呢?

    MAX9768: 10W Mono Class D Speaker Amplifier with Volume Control Data Sheet MAX9768: 10W Mono Class D Speaker Amplifier with Volume Control D

    電子發(fā)燒友網(wǎng)為你提供ADI(ADI)MAX9768: 10W Mono Class D Speaker Amplifier with Volume Control Data Sheet相關(guān)產(chǎn)品參數(shù)
    發(fā)表于 10-17 18:54
    MAX9768: 10W Mono Class D Speaker Amplifier with <b class='flag-5'>Volume</b> Control Data Sheet MAX9768: 10W Mono Class D Speaker Amplifier with <b class='flag-5'>Volume</b> Control D