關(guān)系型數(shù)據(jù)庫最難的地方,就是建模(model)。
錯(cuò)綜復(fù)雜的數(shù)據(jù),需要建立模型,才能儲存在數(shù)據(jù)庫。所謂"模型"就是兩樣?xùn)|西:實(shí)體(entity)+ 關(guān)系(relationship)。
實(shí)體指的是那些實(shí)際的對象,帶有自己的屬性,可以理解成一組相關(guān)屬性的容器。關(guān)系就是實(shí)體之間的聯(lián)系,通??梢苑殖?一對一"、"一對多"和"多對多"等類型。
在關(guān)系型數(shù)據(jù)庫里面,每個(gè)實(shí)體有自己的一張表(table),所有屬性都是這張表的字段(field),表與表之間根據(jù)關(guān)聯(lián)字段"連接"(join)在一起。所以,表的連接是關(guān)系型數(shù)據(jù)庫的核心問題。
表的連接分成好幾種類型。
內(nèi)連接(inner join)
外連接(outer join)
左連接(left join)
右連接(right join)
全連接(full join)
以前,很多文章采用維恩圖(兩個(gè)圓的集合運(yùn)算),解釋不同連接的差異。
上周,我讀到一篇文章,認(rèn)為還有比維恩圖更好的解釋方式。我發(fā)現(xiàn)確實(shí)如此,換一個(gè)角度解釋,更容易懂。
所謂"連接",就是兩張表根據(jù)關(guān)聯(lián)字段,組合成一個(gè)數(shù)據(jù)集。問題是,兩張表的關(guān)聯(lián)字段的值往往是不一致的,如果關(guān)聯(lián)字段不匹配,怎么處理?比如,表 A 包含張三和李四,表 B 包含李四和王五,匹配的只有李四這一條記錄。
很容易看出,一共有四種處理方法。
只返回兩張表匹配的記錄,這叫內(nèi)連接(inner join)。
返回匹配的記錄,以及表 A 多余的記錄,這叫左連接(left join)。
返回匹配的記錄,以及表 B 多余的記錄,這叫右連接(right join)。
返回匹配的記錄,以及表 A 和表 B 各自的多余記錄,這叫全連接(full join)。
下圖就是四種連接的圖示。我覺得,這張圖比維恩圖更易懂,也更準(zhǔn)確。
上圖中,表 A 的記錄是 123,表 B 的記錄是 ABC,顏色表示匹配關(guān)系。返回結(jié)果中,如果另一張表沒有匹配的記錄,則用 null 填充。
這四種連接,又可以分成兩大類:內(nèi)連接(inner join)表示只包含匹配的記錄,外連接(outer join)表示還包含不匹配的記錄。所以,左連接、右連接、全連接都屬于外連接。
這四種連接的 SQL 語句如下。
SELECT*FROMAINNERJOINBONA.book_id=B.book_id;SELECT*FROMALEFTJOINBONA.book_id=B.book_id;SELECT*FROMARIGHTJOINBONA.book_id=B.book_id;SELECT*FROMAFULLJOINBONA.book_id=B.book_id;
上面的 SQL 語句還可以加上where條件從句,對記錄進(jìn)行篩選,比如只返回表 A 里面不匹配表 B 的記錄。
SELECT*FROMALEFTJOINBONA.book_id=B.book_idWHEREB.idISnull;
另一個(gè)例子,返回表 A 或表 B 所有不匹配的記錄。
SELECT*FROMAFULLJOINBONA.book_id=B.book_idWHEREA.idISnullORB.idISnull;
此外,還存在一種特殊的連接,叫做"交叉連接"(cross join),指的是表 A 和表 B 不存在關(guān)聯(lián)字段,這時(shí)表 A(共有 n 條記錄)與表 B (共有 m 條記錄)連接后,會產(chǎn)生一張包含 n x m 條記錄的新表(見下圖)。
-
SQL
+關(guān)注
關(guān)注
1文章
750瀏覽量
43900 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3712瀏覽量
64025 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1197瀏覽量
24538
原文標(biāo)題:數(shù)據(jù)庫表連接的簡單解釋
文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論