sparksql : 數據庫表連接的簡單解釋

表的連接分成好幾種類型。

  • 內連接(inner join)
  • 外連接(outer join)
  • 左連接(left join)
  • 右連接(right join)
  • 全連接(full join)
  • 只返回兩張表匹配的記錄,這叫內連接(inner join)。
  • 返回匹配的記錄,以及表 A 多餘的記錄,這叫左連接(left join)。
  • 返回匹配的記錄,以及表 B 多餘的記錄,這叫右連接(right join)。
  • 返回匹配的記錄,以及表 A 和表 B 各自的多餘記錄,這叫全連接(full join)

 

上圖中,表 A 的記錄是 123,表 B 的記錄是 ABC,顏色表示匹配關係。返回結果中,如果另一張表沒有匹配的記錄,則用 null 填充。

這四種連接,又可以分成兩大類:內連接(inner join)表示只包含匹配的記錄,外連接(outer join)表示還包含不匹配的記錄。所以,左連接、右連接、全連接都屬於外連接。

這四種連接的 SQL 語句如下。


SELECT * FROM A  
INNER JOIN B ON A.book_id=B.book_id;

SELECT * FROM A  
LEFT JOIN B ON A.book_id=B.book_id;

SELECT * FROM A  
RIGHT JOIN B ON A.book_id=B.book_id;

SELECT * FROM A  
FULL JOIN B ON A.book_id=B.book_id;

上面的 SQL 語句還可以加上where條件從句,對記錄進行篩選,比如只返回表 A 裏面不匹配表 B 的記錄。


SELECT * FROM A
LEFT JOIN B
ON A.book_id=B.book_id
WHERE B.id IS null;

另一個例子,返回表 A 或表 B 所有不匹配的記錄。


SELECT * FROM A
FULL JOIN B
ON A.book_id=B.book_id
WHERE A.id IS null OR B.id IS null;

此外,還存在一種特殊的連接,叫做"交叉連接"(cross join),指的是表 A 和表 B 不存在關聯字段,這時表 A(共有 n 條記錄)與表 B (共有 m 條記錄)連接後,會產生一張包含 n x m 條記錄的新表(見下圖)

發佈了75 篇原創文章 · 獲贊 100 · 訪問量 128萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章