分庫後的計算不能直接使用SQL;異構庫 SQL 函數不盡相同;JAVA 硬編碼實施難度大;即使藉助透明網關訪問遠程數據庫,分庫性能優化也是頭疼問題。
一般常規辦法:
方法1:java硬編碼
簡單的跨庫count運算,Java部分代碼大概要寫成這樣:
… public Connection getConnection(String drivername,String url, String username, String password) { try { Class.forName(drivername); conn = DriverManager.getConnection(url, username, password); } catch (Exception e) { System.out.println("DBUtils.getConnection_FAILED!"); e.printStackTrace(); } return conn; } … … Connection conn1 = DBUtils.getConnection(URL1, USER1, PASSWORD1); Connection conn2 = DBUtils.getConnection(URL2, USER2, PASSWORD2); … String sql = "select count(*) c from sales";
PreparedStatement ptmt1 = conn1.prepareStatement(sql); PreparedStatement ptmt2 = conn1.prepareStatement(sql); … ResultSet rs1 = ptmt1.executeQuery(); ResultSet rs2 = ptmt2.executeQuery(); … return rs1.getInt("c") + rs2.getInt("c"); … |
方法2:透明網關
例如oracle的dblink
帶有DBLINK的SQL,優化起來很複雜。可以通過分析執行計劃,利用collocated inline view,driving_site hint 等手段,來優化這些帶有DBLINK的SQL。但這即使對於一名經驗豐富的DBA來說,也是件很頭疼、很費勁的事。
這種情況下,如果有集算器就簡單很多,看下面這個例子:
n個庫的count運算。該運算需要在各分庫中分別進行 count,對各分庫的結果,在彙總階段要用sum求和,集算器(SPL)僅4行就可以搞定了。
A | B | |
1 | =n.(connect("mysql"+string(~))) | //獲取n個分庫的連接 |
2 | =SQL="select count(*) c from sales" | //需要在分庫中執行的SQL |
3 | =A1.(~.cursor(SQL)) | //在n個分庫中執行 SQL |
4 | =A3.conjx().total(sum(c)) | //將各分庫算出的count值進行彙總 |
即使分庫數據庫爲異構的情況,集算器也可以通過SQL翻譯功能方便地進行SQL轉化,爲不同數據庫提供可執行的SQL。
利用集算器還可根據數據特徵,輕鬆寫出具有針對性的高性能代碼,無需大量硬編碼,即可實現高效的算法 。諸如排序、top、分組、去重、連接等各類分庫運算,都可以輕鬆實現,感興趣可以參考:分庫後的查詢統計
集算器還很容易嵌入到Java應用程序中,Java如何調用SPL腳本有使用和獲得它的方法。
關於集算器安裝使用、獲得免費授權和相關技術資料,可以參見如何使用集算器。