下一步,永遠(yuǎn)比這一步更難。
數(shù)據(jù)庫與操作系統(tǒng)、中間件是計算機(jī)基礎(chǔ)的三大軟件。
“缺芯少魂”之痛常讓人為國產(chǎn)操作系統(tǒng)的不足捏一把汗,而數(shù)據(jù)庫卻更像藏在水面之下的冰山,甚少有人關(guān)注?,F(xiàn)在,市場上顯現(xiàn)出了一些新的變化,國產(chǎn)數(shù)據(jù)庫已經(jīng)邁出了通往快速路的第一步。
數(shù)據(jù)庫,即數(shù)據(jù)管理系統(tǒng),誕生于20世紀(jì)60年代中期的美國,可以被看作是電子化的文件柜。與國外廠商的誕生時間和發(fā)展速度相比,我國數(shù)據(jù)庫處于相對落后狀態(tài)。20世紀(jì)80年代,數(shù)據(jù)庫老大哥甲骨文最早進(jìn)入內(nèi)地市場時,國外數(shù)據(jù)庫已經(jīng)迭代了超過7個版本。
那時,操作系統(tǒng)、中間件、數(shù)據(jù)庫都在嘗試國外廠商已有的數(shù)字化實踐之路。從今天來看,雖然國外廠商仍占據(jù)我國數(shù)據(jù)庫市場80%以上,國內(nèi)廠商仍不是主流產(chǎn)品,但一些新的趨勢正在行業(yè)內(nèi)部悄然發(fā)生。
比如,關(guān)系型數(shù)據(jù)庫市場中,國產(chǎn)數(shù)據(jù)庫市占率已經(jīng)從2009年的4.2%提升至2019年的18.9%以上;2020 年 11 月Gartner 發(fā)布的2020年度數(shù)據(jù)庫廠商評估報告中,中國數(shù)據(jù)庫廠商已經(jīng)占據(jù)三席。
本文,「甲子光年」深度采訪了藏在第七次全國人口普查、騰訊會議、健康碼背后的數(shù)據(jù)庫團(tuán)隊TDSQL。不為人知的是,這支在騰訊內(nèi)部慢慢生長的小分隊見證了騰訊近十年來的技術(shù)成長,在騰訊關(guān)于視頻、游戲、社交、金融等一場場戰(zhàn)役中,都有它的身影。
今天,這支小分隊已經(jīng)不止于服務(wù)騰訊內(nèi)部,而且走出家門。它開墾金融、政務(wù)、電商、社交、互聯(lián)網(wǎng)等領(lǐng)域的荒地,為微眾銀行、張家港農(nóng)商行、平安銀行、PICC、三一重工、bilibili、微盟、富途證券、云南公安等提供數(shù)據(jù)庫技術(shù)支持,成長為企業(yè)級的分布式數(shù)據(jù)庫,更被認(rèn)為是代表了整個銀行界IT分布式架構(gòu)的標(biāo)準(zhǔn)。
國產(chǎn)數(shù)據(jù)庫真的迎來轉(zhuǎn)折點(diǎn)了嗎?國產(chǎn)數(shù)據(jù)庫的機(jī)會在哪里?在云時代,我們又將需要怎樣的數(shù)據(jù)庫?
回答這些問題,TDSQL有獨(dú)到的理解和不容置疑的發(fā)言權(quán)。
曙光初現(xiàn)背后的“臨危受命”
Oracle ACE總監(jiān),恩墨科技創(chuàng)始人蓋國強(qiáng)曾在“2019中國數(shù)據(jù)庫元年”的論述中講過:“一個技術(shù)生態(tài)的繁榮發(fā)展,必須擁有廣泛的投入、廣泛的參與、廣泛的關(guān)注,這三者缺一不可。”
時間軸來到2020,從投入、參與和關(guān)注上,我們可以看到國產(chǎn)數(shù)據(jù)庫的豐收之色。
據(jù)「甲子光年」不完全統(tǒng)計,僅2020年新成立的初創(chuàng)型國產(chǎn)數(shù)據(jù)庫公司就已完成13個融資項目。此外,一家僅成立5年的創(chuàng)業(yè)數(shù)據(jù)庫公司在2020年就已拿到2.7億美元的融資。
不止資本方面,學(xué)界也在發(fā)揮力量。從2020年論文發(fā)表數(shù)量來看,中國名列前茅。根據(jù)中信證券的分析報告,2020年 VLDB(大規(guī)模數(shù)據(jù)庫國際會議)刊登的 63 篇論文中,來自中國學(xué)者和研究人員的文章有23篇,在所有國家中排行第一,占比 36.5%。
2020年按國家分類VLDB論文發(fā)表數(shù)(單位:篇)
從參與度上來說,數(shù)據(jù)庫的賽道更是從壟斷狀態(tài)進(jìn)入了百舸爭流的狀況。
據(jù)「甲子光年」不完全統(tǒng)計,僅2020年新成立的數(shù)據(jù)庫公司就有110家。國產(chǎn)數(shù)據(jù)庫賽道中的玩家更可以被分為4大流派,分別是以南大通用、武漢達(dá)夢、人大金倉為代表的學(xué)院派,騰訊云TDSQL、阿里OceanBase為代表的互聯(lián)網(wǎng)派,TiDB、巨杉數(shù)據(jù)庫、優(yōu)炫、萬里開源、易鯨捷、熱璞 HotDB、極數(shù)云舟 ArkDB、星環(huán) KunDB、青云 RadonDB為代表的創(chuàng)業(yè)派和中興GoldenDB、亞信AntDB為代表的企業(yè)派。
國產(chǎn)數(shù)據(jù)庫的新動作更是緊鑼密鼓,以騰訊云為例:
2020年4月,其以3.86 億元中標(biāo)《2020年銀聯(lián)云建設(shè)采購項目》,成為當(dāng)時國內(nèi)金融云第一大單。其中,騰訊云數(shù)據(jù)庫為中國銀聯(lián)數(shù)字化轉(zhuǎn)型提供支持;
6月,騰訊云以10.66 億元中標(biāo)中國人民保險集團(tuán)股份有限公司(PICC)人保云建設(shè)項目,其中,騰訊云分布式數(shù)據(jù)庫TDSQL PG(原TBase)為中國人保集團(tuán)在數(shù)字化方面提供支持;騰訊云以5.47億中標(biāo)“央視頻”5G新媒體平臺項目,騰訊云TDSQL和Redis數(shù)據(jù)庫提供技術(shù)支持;
8月,昆山農(nóng)商銀行和騰訊云計算(北京)有限責(zé)任公司正式簽署戰(zhàn)略合作協(xié)議,騰訊分布式數(shù)據(jù)庫TDSQL提供支持。
新動作一直持續(xù)到去年(2020年)年底。12月24日,騰訊云宣布其數(shù)據(jù)庫品牌TDSQL品牌整合升級計劃,集中發(fā)力數(shù)據(jù)庫技術(shù)創(chuàng)新突破。騰訊云原有的TDSQL、TBase、CynosDB三大產(chǎn)品線統(tǒng)一升級為“騰訊云企業(yè)級分布式數(shù)據(jù)庫TDSQL”。
這一年,國產(chǎn)數(shù)據(jù)庫無疑迎來了火熱發(fā)展的黃金時期。
這種火熱程度對騰訊云TDSQL來說不是跟風(fēng)上,更是等風(fēng)來。騰訊云數(shù)據(jù)庫技術(shù)負(fù)責(zé)人潘安群以一種身經(jīng)百戰(zhàn)的自信告訴「甲子光年」,“包括金融、政務(wù)、互聯(lián)網(wǎng)、智慧零售、社交、電商等各行各業(yè)的場景,TDSQL是真正經(jīng)歷過海量實際場景驗證的產(chǎn)品?!?/p>
的確,自誕生起,騰訊云數(shù)據(jù)庫的身上就有一種“臨危受命”的使命感。
2007年之前,騰訊還在完全使用以MySQL數(shù)據(jù)庫為主的開源數(shù)據(jù)庫,一些海量的數(shù)據(jù)分析和財務(wù)部分也還跑在Oracle數(shù)據(jù)庫上,據(jù)騰訊云數(shù)據(jù)庫專家工程師雷海林回憶,“那個時候沒有更多產(chǎn)品化,主要是培養(yǎng)技術(shù)團(tuán)隊的階段?!?/p>
然而,騰訊壯大的速度遠(yuǎn)遠(yuǎn)超過了開源數(shù)據(jù)庫的承受能力。
2006年,QQ用戶量增長速度創(chuàng)造了歷史記錄,QQ同時在線人數(shù)逼近2000萬,開源的數(shù)據(jù)庫沒見過這么大的陣仗,市面上的開源數(shù)據(jù)庫和傳統(tǒng)商業(yè)數(shù)據(jù)庫沒有一家能夠支撐騰訊龐大的流量需求。
“增長太快了,”騰訊云副總裁李綱告訴「甲子光年」,“當(dāng)時每天早上我們看報表,發(fā)現(xiàn)報表時間到了,數(shù)據(jù)卻沒有跑出來,那就是已經(jīng)挑戰(zhàn)了集中式數(shù)據(jù)庫的系統(tǒng)極限?!?/p>
既然別人家沒有,那就自己造出來。
2007年,社交2.0爆發(fā),騰訊后臺的請求量和訪問量都呈現(xiàn)爆發(fā)式增長,騰訊技術(shù)團(tuán)隊拍板決定自研數(shù)據(jù)庫。既然要做,就做最穩(wěn)定、最準(zhǔn)確的數(shù)據(jù)庫,“7*24小時高可用、數(shù)據(jù)一筆不差、金額一分不差”成為了騰訊云數(shù)據(jù)庫TDSQL最初立下的要求。
此后,“臨危受命”成了騰訊云數(shù)據(jù)庫需要面對的家常便飯,這支小分隊也成為騰訊發(fā)展中每一場戰(zhàn)役背后的中堅力量。
2009年,“QQ空間”大火,“QQ農(nóng)場”、“好友買賣”、“搶車位”等一票社交游戲上線,而每偷一棵菜,數(shù)據(jù)庫團(tuán)隊就需要改寫、擴(kuò)容,被人垂涎的是騰訊的流量,而更辛苦卻難以變現(xiàn)的部分,是騰訊的技術(shù)支撐;2010年,騰訊推出“開放戰(zhàn)略”,能夠和流量大廠一起吃肉,一時間各大小廠商蜂擁而至,今天的騰訊云真正有記錄意義的誕生就出在“開放平臺”上。
那是騰訊云數(shù)據(jù)庫第一次面對外部客戶,而對外,需要面對兩個挑戰(zhàn)。
一是從服務(wù)騰訊這個“大胖子業(yè)務(wù)”變成服務(wù)很多小業(yè)務(wù)疊加的中長尾,而小業(yè)務(wù)的場景則更容易出問題。
比如在數(shù)據(jù)庫的一致性方面,在數(shù)據(jù)不能丟、不能錯的情況下,TDSQL需要提供一個更加完整的數(shù)據(jù)庫解決方案,讓對數(shù)據(jù)庫使用毫無經(jīng)驗的使用者們實現(xiàn)“懶人模式”,同時不會出現(xiàn)數(shù)據(jù)錯誤。
二是服務(wù)外部會涉及到錢,比如由于有些游戲會涉及到賬戶的數(shù)據(jù),開啟了自動到賬的功能,怎么樣把關(guān)于錢的問題做到零差錯,也是TDSQL需要面對的新挑戰(zhàn)。
這兩個難題雖然是挑戰(zhàn),但也成為騰訊云第一次面向外部客戶的必經(jīng)之路。此后,騰訊云數(shù)據(jù)庫跨過了解決數(shù)據(jù)高可用、快速彈性拓展問題的階段、解決業(yè)務(wù)海量擴(kuò)展能力的階段,以及產(chǎn)品化輸出的階段。
時間軸來到2014年,騰訊走進(jìn)了擁抱云的時代。
2014年,微信推出了“紅包”功能,而在紅包上拿下的第一城,當(dāng)屬2015年春晚的“搖紅包”活動。與“電商雙十一”可以提前預(yù)測流量、能夠做好準(zhǔn)備不同,“春晚搖紅包”更具有突發(fā)性,一時間會增長特別快,而且沒有非常準(zhǔn)確的預(yù)期,不像傳統(tǒng)IT能夠知道增量是什么樣子的。
據(jù)春晚結(jié)束后公開資料的統(tǒng)計數(shù)據(jù),當(dāng)時的峰值甚至超過了每秒20萬筆,而這個數(shù)據(jù),是前期無論如何也預(yù)料不到的。
談起給微信紅包做數(shù)據(jù)庫后端支持的契機(jī),騰訊云數(shù)據(jù)庫技術(shù)總監(jiān)李躍森告訴「甲子光年」,“有一天,微信支付的總經(jīng)理去開會的時候問我們,現(xiàn)在線上數(shù)據(jù)庫MySQL一定是扛不住這樣的流量了,能不能幫他們把這個事情搞定呢?”但那個時候,距離春節(jié)只有半年的準(zhǔn)備時間,李躍森和團(tuán)隊一共6個人,需要完成的是保守預(yù)測10倍的增長。
結(jié)果很明顯,微信紅包一炮而紅。
征戰(zhàn)金融高地
自1970年IBM研究員E.F.Codd在論文中提出關(guān)系模型概念以來,數(shù)據(jù)庫的發(fā)展可以被分為三個階段:
第一個階段,數(shù)據(jù)庫龍頭 Oracle、Informix、Sybase和SQL Server等公司相繼誕生,并在2000年形成了Oracle、Microsoft和IBM三巨頭的競爭格局。
第二個階段,互聯(lián)網(wǎng)泡沫破滅之后,一批新的互聯(lián)網(wǎng)巨頭誕生。網(wǎng)絡(luò)需求推動了數(shù)據(jù)量的爆發(fā)式增長,傳統(tǒng)集中式的數(shù)據(jù)庫明顯跟不上互聯(lián)網(wǎng)的巨大爆發(fā)量,分布式數(shù)據(jù)庫、互聯(lián)網(wǎng)巨頭開始?xì)⑷胄袠I(yè)競爭。
第三個階段,隨著云計算的蓬勃發(fā)展,云數(shù)據(jù)庫成為新趨勢。2014年,Amazon推出Aurora,憑借低性能、高成本、高可用的優(yōu)勢吸引了大批客戶和尾隨者,并在之后的6年里走到了全球前三的陣營中。2016年,此前對云計算持消極態(tài)度的甲骨文也開始向云計算進(jìn)軍。
在上述每一個階段的過渡之中,我們都可以看到一些行業(yè)格局的重構(gòu),發(fā)生列隊位次變化的痛點(diǎn)也可以歸從兩方面找到。
一是云化的趨勢。李躍森告訴「甲子光年」,云化和數(shù)據(jù)庫領(lǐng)域的云化不是未來的事情,而是已經(jīng)在路上了。2018年,全球云數(shù)據(jù)庫就已貢獻(xiàn)了104億美元,實現(xiàn)了68%的行業(yè)增長貢獻(xiàn)。
二是分布式數(shù)據(jù)庫逐漸取代集中式數(shù)據(jù)庫的趨勢。潘安群向「甲子光年」解釋了集中式數(shù)據(jù)庫和分布式數(shù)據(jù)庫的不同:集中式數(shù)據(jù)庫可以被看作是一個非常高可用的小柜子,可以運(yùn)作十幾年不停機(jī),而且非常穩(wěn)定。但同樣,為了能讓它保持這種良好的運(yùn)作狀態(tài),其對應(yīng)的成本也就非常高,比如需要好幾層的電源,可以保證他不斷電。
但問題是,柜子的容量是有限的,到了系統(tǒng)的極限就會出現(xiàn)問題。而在銀行的場景中,業(yè)務(wù)量并沒有邊界感,還對成本控制提出了要求,那么集中式的理念就是行不通的。
相反,在分布式的理念中,硬件(小柜子)被默認(rèn)為是不可靠的,但總有一個plan B存在,那么,即使出現(xiàn)故障,也可以快速實現(xiàn)切換,可以把風(fēng)險分?jǐn)偟綐O小,比如在TDSQL給微眾銀行搭建數(shù)據(jù)庫的案例中,也正是在這種分散的方式,解決了微眾銀行穩(wěn)定性和成本的博弈。
無疑,在今天的國產(chǎn)數(shù)據(jù)庫探索中,TDSQL正好踩住了云化、分布式的趨勢,而更具有突破性意義的是,TDSQL真正從需求導(dǎo)向走向目標(biāo)導(dǎo)向的節(jié)點(diǎn),剛好對準(zhǔn)了金融場景這個“最難啃的硬骨頭”。
對于數(shù)據(jù)庫來說,金融是難攻下來的高地,卻也是好盤踞的堡壘。在春晚紅包的同一年,騰訊云TDSQL接到了一個大任務(wù)——給微眾銀行提供數(shù)據(jù)庫支持。
用潘安群的話來說,做金融領(lǐng)域是機(jī)緣巧合,對于TDSQL來說是有價值的挑戰(zhàn),但同時也讓人膽戰(zhàn)心驚。要知道,金融產(chǎn)品是所有產(chǎn)品中要求最苛刻的,而銀行又是金融產(chǎn)品中要求最高的。
在互聯(lián)網(wǎng)場景中,卡頓會影響使用體驗,但不會造成巨大損失。而在金融場景中則風(fēng)險更大,舉個例子,當(dāng)用戶購買理財產(chǎn)品時,某個時間點(diǎn)前后的收益會出現(xiàn)很大的差異,所以一旦出現(xiàn)卡頓的情況,將會造成嚴(yán)重的損失。
除了滿足自身的業(yè)務(wù)需求之外,由于銀行的行業(yè)特殊性,并不存在試錯的可能性。在微眾銀行之前,并沒有銀行有過這樣的嘗試,這第一次也是唯一一次的機(jī)會。潘安群告訴「甲子光年」,“他們(微眾銀行)前期就告訴我們,故障半小時已經(jīng)是非常嚴(yán)重的級別?!?/p>
那時,微眾銀行剛成立不久,在國產(chǎn)化的浪潮中,作為國內(nèi)首家互聯(lián)網(wǎng)銀行,微眾期待把普惠金融的IT架構(gòu)做好,希望能夠改變傳統(tǒng)銀行的單業(yè)務(wù)成本高的問題,提出了既能夠服務(wù)海量用戶,又可以把每個用戶的成本控制到很低的范圍內(nèi)的要求。
在今天看來,微眾的案例已經(jīng)取得了勝利,可以被認(rèn)為是代表了整個銀行界IT分布式架構(gòu)的標(biāo)準(zhǔn)。
微眾銀行對于機(jī)房的部署是,同城有5個機(jī)房、異地有2個機(jī)房,如果按照傳統(tǒng)的架構(gòu),同城的5個機(jī)房做成1主4備,其余的4個機(jī)房就會造成資源浪費(fèi),而在TDSQL分布式架構(gòu)中,多個數(shù)據(jù)庫實例的主備節(jié)點(diǎn)交叉部署在五個機(jī)房,這樣任何一個機(jī)房故障都只會影響1/5的流量,且任何一個機(jī)房故障不會造成全局系統(tǒng)性宕機(jī)的風(fēng)險。
簡言之,既保證了資源有效利用,又解決了穩(wěn)定性的問題。
它的IT架構(gòu)可以把成本控制得非常低,「甲子光年」也從TDSQL團(tuán)隊獲悉,現(xiàn)在大部分銀行在做分布式的時候,基本上都是在用這種架構(gòu),比如華通銀行在構(gòu)建底層架構(gòu)時,就直接聯(lián)系了TDSQL,希望可以用這個架構(gòu)構(gòu)建自己的核心系統(tǒng)。
但在當(dāng)時,這樣的任務(wù)對于TDSQL團(tuán)隊來說,更是一場讓人眉頭緊鎖的拉鋸賽。
這是TDSQL團(tuán)隊第一次真正意義上走到需求了前面。走出騰訊內(nèi)部的溫床,對剛剛成熟的TDSQL來說是探索未知,但也讓TDSQL變成了更好的自己。
首先,走進(jìn)無人區(qū)的難點(diǎn)在于未知。
對于新籌備的互聯(lián)網(wǎng)銀行來說,交易量、未來業(yè)務(wù)的發(fā)展程度都未可知,對于TDSQL來說,分布式能達(dá)成成本控制的程度、銀行監(jiān)管的要求和新業(yè)務(wù)面對拓展性、一致性和監(jiān)管要求的挑戰(zhàn)也未可知。而分布式數(shù)據(jù)庫是現(xiàn)階段金融場景能夠給出的最好回答。
其次,外部的歷練讓TDSQL變成了更好的自己。
在騰訊內(nèi)部使用時,一旦出現(xiàn)問題,TDSQL可以給自己家做做維修,但進(jìn)入銀行場景,由于內(nèi)外網(wǎng)隔離,別人家的屋子沒法干涉,也就需要銀行自己解決,這就對TDSQL團(tuán)隊提出了更高的要求,去打磨出更好的產(chǎn)品。
另外,走出家門,就不再被家長“寵著”了。潘安群告訴「甲子光年」,“給客戶做數(shù)據(jù)庫的時候,很多也是未知的領(lǐng)域,做的不好的話,不是在自己家改一改就好了,人家真的會罵你?!?/p>
在和微眾銀行合作的初期,由于雙方都是第一次嘗試金融場景里的分布式架構(gòu),也還經(jīng)歷過“TDSQL覺得微眾不懂互聯(lián)網(wǎng),而微眾覺得TDSQL不懂銀行”的磨合期。
但磨合過后的成效也在今天得以顯現(xiàn)。目前,微眾銀行基于TDSQL搭建的分布式銀行核心系統(tǒng)可以做到7*24小時全天候不間斷服務(wù)。已成功服務(wù)超過2.5億客戶,實現(xiàn)年均日交易3.6億筆,單日交易峰值近6億筆,最高TPS(每秒傳輸?shù)氖挛锾幚韨€數(shù))達(dá)到10 萬+,也為微粒貸、微業(yè)貸等業(yè)務(wù)的數(shù)百個核心系統(tǒng)提供了堅實支撐。
如果過去,TDSQL只是站在金融場景下的一只小白鼠,那么今天,對于微眾銀行和TDSQL來說,更是互相都懂了。
實際上,TDSQL在今天仍可以成為前排選手,不變的是面對無人區(qū)時,仍敢于向前的勇氣。
“換心”傳統(tǒng)深水區(qū)
2013年,曾發(fā)生過一件讓使用國外信息軟硬件的中國公司感到警鈴大作的事。
當(dāng)年6月,前中情局(CIA)職員愛德華·斯諾登將兩份絕密資料交給英國《衛(wèi)報》和美國《華盛頓郵報》,資料內(nèi)容曝光了美國于2007啟動的一項秘密項目,它要求電信巨頭威瑞森公司必須每天提交數(shù)百萬用戶的通話記錄。
根據(jù)美國時代周刊當(dāng)時的報道,美國政府對公眾隱私的監(jiān)控可能比媒體報道的更深入。FBI和NSA監(jiān)視范圍廣泛,其挖掘了包括微軟、雅虎、谷歌、Facebook、PalTalk、YouTube、Skype、AOL、蘋果等等各大技術(shù)公司的數(shù)據(jù)。
這就是轟動一時的“棱鏡門”事件。
該事件一出,使用數(shù)據(jù)庫的中國機(jī)構(gòu)就開始轉(zhuǎn)向?qū)ふ覈a(chǎn)數(shù)據(jù)庫產(chǎn)品,而令人痛心疾首的是,就當(dāng)時的產(chǎn)品競爭力而言,國產(chǎn)數(shù)據(jù)庫與 Oracle 相差巨大。
然而,7年后的今天,國產(chǎn)數(shù)據(jù)庫的門前正在點(diǎn)燃兩門禮炮。
第一炮,信息爆發(fā)式增長刺激數(shù)據(jù)庫需求。
根據(jù)2018年11月IDC白皮書《Data Age 2025》,全球數(shù)據(jù)量總和將從2018年的33ZB增至2025年的 175ZB。與此同時,IDC數(shù)據(jù)同樣指出,到2025年,全球49%的已存儲數(shù)據(jù)將會存在公共云中。這意味著,分布式數(shù)據(jù)庫和云數(shù)據(jù)中心正在成為數(shù)據(jù)新的存儲方式。
高增長必然會帶動強(qiáng)需求,需求導(dǎo)向的市場狀態(tài)將會刺激資本、學(xué)界、國家等多層面的關(guān)注,也就是我們前文提到的火熱狀態(tài)發(fā)生的根源所在。所以,數(shù)據(jù)庫的布道者們更加會為之傾注心力。
2010-2025年全球數(shù)據(jù)規(guī)模量 資料來源:IDC,數(shù)據(jù)時代2025,興業(yè)證券經(jīng)濟(jì)與金融研究院
第二炮,我國正在步入加快推進(jìn)基礎(chǔ)科技創(chuàng)新與安全可控時代,這將推動數(shù)據(jù)庫國產(chǎn)化率的快速提升。
根據(jù)IDC預(yù)測,到2024年中國關(guān)系型數(shù)據(jù)庫軟件市場規(guī)模將達(dá)到38.2億美元,未來5年整體市場年復(fù)合增長率為23.3%,與這樣的預(yù)期增長數(shù)字相伴的,是與時代攜手的共同前行,大的機(jī)遇和發(fā)展空間。
而此刻正是TDSQL突破蠶繭、完成蝶變的重要時間節(jié)點(diǎn)。
微眾銀行的戰(zhàn)役告一段落之后,TDSQL并沒有離開金融云數(shù)據(jù)庫的賽場,而是在向深水區(qū)更近了一步。他們把戰(zhàn)役的矛頭對準(zhǔn)傳統(tǒng)銀行,其中兩個典型的案例分別是張家港農(nóng)商行(以下簡稱張家港行)和平安銀行。
相比微眾銀行需要研發(fā)新的系統(tǒng),傳統(tǒng)銀行的數(shù)據(jù)改造難度更大。如果微眾銀行只是一片尚未開荒的新土壤,傳統(tǒng)銀行可以被看作是難度更大的深水區(qū)。
兩者的不同點(diǎn)在于,傳統(tǒng)銀行有歷史包袱,改造并不只是在原有的系統(tǒng)上搭建新東西,而更是拆除、歸零,需要將老系統(tǒng)的數(shù)據(jù)平穩(wěn)過渡到新系統(tǒng)中,還需要在銀保監(jiān)會要求的時間內(nèi)完成變更。
同樣,在此之前,國內(nèi)沒有一個傳統(tǒng)銀行或金融機(jī)構(gòu)把核心系統(tǒng)放在國內(nèi)的分布式數(shù)據(jù)庫上,也就沒有前車之鑒可以作為參考。擺在騰訊云面前的挑戰(zhàn)是,能夠突破原有老式框架、銀行系統(tǒng)的監(jiān)管以及和銀行方面的磨合問題。
第一,突破原有集中式數(shù)據(jù)庫使用上的問題。
在與騰訊云TDSQL合作之前,張家港農(nóng)商行的老核心系統(tǒng)使用的是國外商業(yè)數(shù)據(jù)庫Sybase。隨著業(yè)務(wù)量的增長,集中式數(shù)據(jù)庫常常跟不上請求的速度,出現(xiàn)卡頓、運(yùn)行緩慢的問題,張家港行便把目光投向了分布式數(shù)據(jù)庫,TDSQL剛巧是選項之一。
也許是傳統(tǒng)銀行嚴(yán)謹(jǐn)性的把控,在張家港行的數(shù)據(jù)庫正式上線之前,其實開發(fā)了兩套系統(tǒng),一套是基于TDSQL,一套是傳統(tǒng)集中式數(shù)據(jù)庫。經(jīng)過對兩套系統(tǒng)的性能、可用性和成本的對比,張家港行選擇了以TDSQL的分布式架構(gòu)作為試用,而集中式的作為備胎,以防不時之需。
這個過程中,也出現(xiàn)了由于集中式和分布式數(shù)據(jù)庫在使用上的不同,導(dǎo)致分布式呈現(xiàn)出數(shù)據(jù)過低、效果也比較差的情況。在這樣的數(shù)據(jù)下,張家港行也向分布式提出質(zhì)疑,“分布式到底靠譜嗎?”
得知這個消息,作為TDSQL數(shù)據(jù)庫專家的張文就跑到張家港待了足足一個多月,讓張家港行掌握了分布式數(shù)據(jù)庫的正確使用方法,并贏得了行方的信任,促使數(shù)據(jù)庫更平穩(wěn)的運(yùn)行。
直至2019年8月,項目行將結(jié)束之時,張文在朋友圈里記錄了這樣一段文字:
“記得年初第一次來張家港銀行,那時開發(fā)人員對分布式數(shù)據(jù)庫根本無從下手,核心系統(tǒng)改造當(dāng)時看來還是天方夜譚。再看今天,全行核心業(yè)務(wù)跑在分布式架構(gòu)下穩(wěn)如磐石,性能輕松碾壓國內(nèi)同等規(guī)模銀行,軟硬件綜合成本降低75%。
張家港行的分布式改造實際上是銀行的一場換‘心’行動,而除了張家港行,在此之前國內(nèi)尚未有一家銀行冒這個險?!?/p>
而那個集中式數(shù)據(jù)庫的備胎,放在后備箱待了一年也沒派上用場。
第二,銀行的業(yè)務(wù)特殊性問題。
做金融級數(shù)據(jù)庫的最大挑戰(zhàn)就在于行業(yè)特殊性,一旦數(shù)據(jù)庫出現(xiàn)癱瘓,可能就會引發(fā)銀行整個系統(tǒng)都無法正常運(yùn)作的連鎖反應(yīng),這對銀行和用戶來說帶來的損失不可估量。
如果經(jīng)驗不足,真誠和實力就是最打動人的武器。
在張家港行的案例中,TDSQL通過銀行科技部門以及騰訊、長亮科技開發(fā)團(tuán)隊三方一起合作,經(jīng)歷了半年的模擬測試演練,把可以想到的或可以檢索到的業(yè)內(nèi)故障的場景盡可能模擬一遍,以及多輪性能測試的數(shù)據(jù),并形成了比較完整的資料和文檔。
最終,三方合作的默契度和決心獲得了各方的認(rèn)可。
當(dāng)談及做張家港項目的初心,張文說,“我們并不覺得TDSQL是為張家港銀行或者哪個銀行定制的功能,在做銀行和to B上,我們沒有國外的集中式廠商做的時間久,我們是抱著虛心的態(tài)度進(jìn)行場景適配,達(dá)成有效的溝通,讓三方都覺得是很默契的合作?!?/p>
沒有明確的發(fā)心,單純想把事情做好,也許才是能夠做好的起點(diǎn)和終點(diǎn)。
第三,在每一份溝通與合作中,最重要的就是信任和磨合的問題。
于對外經(jīng)驗相對缺乏的TDSQL團(tuán)隊來說,如何讓帶著產(chǎn)品經(jīng)理思維的鵝與銀行打好配合,是前路是否好走的關(guān)鍵。
與張家港行相似,平安銀行一直以來在技術(shù)上的重視,其對人力、交付和SOA的響應(yīng)度都有更高的要求。更重要的是,平安銀行要做的,是業(yè)務(wù)首次將銀行核心系統(tǒng)從傳統(tǒng)集中式大型機(jī)下移。這無疑又是一次前無古人的突破嘗試。
平安銀行對TDSQL的放心,更來自騰訊云團(tuán)隊對項目的全程保駕護(hù)航。比如,給平安銀行定制一整套的交付流程、每周都會進(jìn)行保障、在項目上線的頭兩周和上線之后的后兩周是24小時進(jìn)行相應(yīng)的、投產(chǎn)的三天,24小時里會有6個工作人員一直在現(xiàn)場。
讓騰訊云數(shù)據(jù)庫專家工程師王輝印象深刻的是一次機(jī)型采購的事件。當(dāng)時,平安銀行采購了兩套機(jī)型,在測試的過程中,戴爾機(jī)型的延時偏大,聯(lián)想機(jī)型偏小,而未經(jīng)過分析的平安銀行同事直接沖到TDSQL的會議室說“你們的產(chǎn)品存在問題”。
“當(dāng)時他們很著急,我們希望對方把情況講清楚,但是他們不愿意花時間讓我們了解情況。”這也讓看起來溫文爾雅的王輝有點(diǎn)生氣,“我想我是做乙方的,怎么樣都要忍住,就到外面院子里轉(zhuǎn)了一下,買了瓶飲料壓了壓火,然后和這個同事搞清楚了,問題在于戴爾和聯(lián)想的機(jī)器不一樣。”
問題解決了之后,兩人一起吃了飯,并約定好這個項目成功之后一定要喝酒。
后來呢?就真的喝了酒。
從微眾銀行到平安銀行,對于金融場景這個最難啃的“硬骨頭”,今天的TDSQL已經(jīng)摸了個遍。
誰的大機(jī)會?
與國產(chǎn)化浪潮對應(yīng)的,是巨大的市場空間。
過去十年來,國產(chǎn)數(shù)據(jù)庫的市占率從2009年4.0%增長至2017年的14.26%,增長超過3倍。然而,數(shù)據(jù)庫的國產(chǎn)化率仍處于較低水平,根據(jù)興業(yè)證券的預(yù)測,在保守、中性與樂觀假設(shè)下,數(shù)據(jù)庫國產(chǎn)化的潛在市場空間分別為108億、268億和428億元。
機(jī)會之下,這無疑是國產(chǎn)數(shù)據(jù)庫的逆襲時刻。能夠抓住機(jī)會的人,更應(yīng)該懂得機(jī)遇與競爭同在,常有犬牙相搏,競者廝殺。面向未來,騰訊云數(shù)據(jù)庫將云原生數(shù)據(jù)庫【1】和高速網(wǎng)絡(luò)設(shè)備的超融合【2】兩大特點(diǎn)有機(jī)結(jié)合,在騰訊云副總裁李綱看來,能夠與賽道中的伙伴們同行是一件幸事。
在今天,我們或許應(yīng)該對“勝利者”有新的定義,此時此刻的階段性號角,為騰訊吹響,但也不只為騰訊吹響。但清晰可見的是,在這條關(guān)于國產(chǎn)自主、關(guān)于云、關(guān)于數(shù)據(jù)庫的探索道路上,騰訊擁有的是伙伴、團(tuán)隊和沃土。
從伙伴上來看,從B到C,騰訊未變的是產(chǎn)品經(jīng)理的服務(wù)意識和生態(tài)聯(lián)動。
首先,在騰訊的沃土上,有眾多子行業(yè):政務(wù)、教育、文旅、工業(yè)、醫(yī)療、交通、金融、智慧建筑等等,在這個過程中會積累非常多的客戶,這些客戶在公有云上的發(fā)展也會讓TDSQL有充分的積累。
其次,TDSQL和一些頭部關(guān)系非常好的客戶建立聯(lián)動機(jī)制,這些客戶的訴求不僅僅是享受提供的服務(wù),更多是可以和騰訊一起探索更多的未知。
再次,在騰訊的生態(tài)上下游中,包括集成商、硬件、硬件的服務(wù)商和線下的各種支付和運(yùn)營都能夠和騰訊一起,以生態(tài)的數(shù)據(jù)庫形象做好客戶的服務(wù)。
李綱也向「甲子光年」表示了他們對客戶的態(tài)度,“即使未來你不用了,合同不簽約了,你不用我們的維保服務(wù)了,你自己的運(yùn)營人員加上生態(tài)的支持,你還是可以讓你的數(shù)據(jù)庫很穩(wěn)定,問題不是很大?!?/p>
從團(tuán)隊上來看,騰訊同樣穩(wěn)定和專業(yè)。
潘安群聊起加入騰訊云的出發(fā)點(diǎn)時說,“我們的發(fā)心很單純,就是把事情做好,整個團(tuán)隊不會有太多的外部壓力和太多想法?!币苍S正是出于這份純粹,從2003年到今天,和李綱一起奮戰(zhàn)在一線的主創(chuàng)團(tuán)隊成員們幾乎都還在。
此外,騰訊云數(shù)據(jù)庫也注重人才的培養(yǎng),TDSQL向「甲子光年」表示,TDSQL自2003年開始,就在內(nèi)部培養(yǎng)了很多人才,自己培養(yǎng)的專家在騰訊的專家團(tuán)隊里占比非常高。而且,騰訊還會從高?;蛘吆M鈹?shù)據(jù)庫的企業(yè)引進(jìn)一些高端的人才,比如TDSQL有分散在美國、北京、杭州、上海、深圳的專家委員會,定期會有數(shù)據(jù)庫技術(shù)探索群來對前沿技術(shù)問題進(jìn)行交流。
前文提到的專家工程師王輝就來自O(shè)racle數(shù)據(jù)庫,選擇騰訊,正是出于此前在和騰訊的合作中,對TDSQL團(tuán)隊的認(rèn)可。
而更多的,生長于騰訊自有的這塊沃土上,從不缺鍛煉的機(jī)會、勇敢的能力和大廠的底氣。
在騰訊內(nèi)部有一個不成文的規(guī)定,即新鮮出爐的數(shù)據(jù)庫產(chǎn)品先是部門自己用,然后放到公司內(nèi)部用,最后完全沒有問題才會推到外面,騰訊內(nèi)部多樣的產(chǎn)品線和大量復(fù)雜的業(yè)務(wù)場景給TDSQL提供了不斷打磨更好產(chǎn)品的沃土。
其次,關(guān)于騰訊的開放、包容以及持續(xù)支持的態(tài)度,是被TDSQL團(tuán)隊多次提到的工作體驗。而這,也被公認(rèn)為是團(tuán)隊自發(fā)產(chǎn)生主動性的原因。正是騰訊這個大家庭耐心的投入、歷練的機(jī)會和上層的支持與肯定,讓發(fā)展初期宛如嬰孩的騰訊云數(shù)據(jù)庫擁有了完美的童年。
在今天,TDSQL長大了,也是時候可以獨(dú)當(dāng)一面了。
那么,未來的困難還有多少呢?
如果說初期還有一些經(jīng)驗可循,今天的騰訊云數(shù)據(jù)庫向無人區(qū)深處更進(jìn)了一步。如何撥開迷霧,認(rèn)清前路,保證不會偏航,是成熟的TDSQL需要面對的新問題。
而從未改變過的是,每天早上,在騰訊云數(shù)據(jù)庫的辦公樓下,依舊格子衫攢動。
原文標(biāo)題:誰在國產(chǎn)數(shù)據(jù)庫的無人區(qū)開荒? | 甲子光年
文章出處:【微信公眾號:甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責(zé)任編輯:haq
-
操作系統(tǒng)
+關(guān)注
關(guān)注
37文章
6696瀏覽量
123147 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3752瀏覽量
64236
原文標(biāo)題:誰在國產(chǎn)數(shù)據(jù)庫的無人區(qū)開荒? | 甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論