solr-phoenix

原創

天然呆的技术博客

2020-02-25 10:17

1 , phoenix配置文檔+demo-crud程序

2 , solr索引原理（一次性建立還是每次都建立，對值）

將HBase表中涉及條件過濾的字段和rowkey在Solr中建立索引，通過Solr的多條件查詢快速獲得符合過濾條件的rowkey值，拿到這些rowkey之後在HBASE中通過指定rowkey進行查詢

phoenix VS solr

第一種方案是通過HBase的普通API獲取數據建立索引：

phoenix是HBASE的sql層，本質還是調用HBASE API，數據存放在HBASE

solr是一種獨立的服務，存在自己的服務器，建立索引的數據存放在solr服務器，用戶訪問時，根據solr提供的接口訪問到

優點：HBase與Solr彼此沒有任何耦合，通過外部java程序來控制索引的創建修改，整個系統的高可用性和容錯性有保證。

缺點：效率較低。每秒處理125條數據（加大線程可以提高效率）

第二種方案是用到HBase的Mapreduce框架

優點：分佈式並行執行效率特別高，處理1000萬條數據僅需5分鐘

缺點：但是這種高併發需要對Solr服務器進行配置調優，不然會拋出服務器無法響應的異常。適合批量處理，數據量較小時不適合。

第三種方案是在往HBase寫數據的過程中，觸發HBase的coprocessor的observer功能調用solr服務，建立solr索引。是在Base的中實現。

優點：外部調用端不需要考慮solr索引的建立問題，只需要調用HBase操作數據，索引的建立交給HBase調用Solr實現。

缺點：協處理器運行在和RegionServer相同的進程空間裏，出錯的協處理器有潛在可能使進程崩潰，導致HBase的數據出錯。

綜上所述，考慮到HBase集羣的高可用性、容錯性、擴展性等，建議主要使用第一種方案建立索引，第二種方案爲輔助。

ElasticSearch

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

windows下memcached安裝步驟

1、下載windows下memcached的穩定版本，地址http://download.csdn.net/detail/u013445663/6991525 2、解壓到某個盤符下，例如D:\memcached 3、然後進入cmd命令界面

2020-07-06 23:27:14

數據分析平臺解析

隨着互聯網、移動互聯網和物聯網的發展，誰也無法否認，我們已經切實地迎來了一個海量數據的時代，數據調查公司IDC預計2011年的數據總量將達到1.8萬億GB，對這些海量數據的分析已經成爲一個非常重要且緊迫的需求。作爲一家互聯網數據分析公司

2020-06-26 07:37:26

Redis詳細學習

目錄1、單體Mysql的年代2、Memcached(緩存)+Mysql+垂直拆分（讀寫分離）3、分庫分表+水平拆分+集羣4、如今最近的年代5、什麼是NoSQL6、NoSQL特點：7、阿里巴巴演進分析NoSQL的四大分類Redis入

夏天的风€&^_^

2020-06-25 17:45:15

Redis(一) Java之SpringBoot集成Redis

1.創建一個maven項目導入jar包 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xs

2020-06-23 17:46:33

NoSql是什麼？

一、nosql的簡介 Nosql的全稱是Not Only Sql，這個概念早起就有人提出，而我們常用的都是關係型數據庫。就像我們常用的mysql，sqlserver一樣，這些數據庫一般用來存儲重要信息，應對普通的業務

2020-06-23 10:49:22

MongoDB的聚合鏈接地址集合

https://docs.mongodb.com 1.https://miss-me.github.io/2018/03/03/mongoDB-%E6%95%B0%E6%8D%AE%E8%81%9A%E5%90%88%E7%9A%84%E

2020-06-18 22:49:04

memcache深入解析

1.爲什麼要使用memcache由於網站的高併發讀寫需求，傳統的關係型數據庫開始出現瓶頸，例如：1）對數據庫的高併發讀寫：關係型數據庫本身就是個龐然大物，處理過程非常耗時（如解析SQL語句，事務處理等）。如果對關係型數據庫進行高併發讀寫

2020-06-16 02:48:14

Nosql學習之Redis資料（一）

一、簡介：在過去的幾年中，NoSQL數據庫一度成爲高併發、海量數據存儲解決方案的代名詞，與之相應的產品也呈現出雨後春筍般的生機。然而在衆多產品中能夠脫穎而出的卻屈指可數，如Redis、MongoDB、BerkeleyDB和Co

2020-06-14 22:01:24

JAVA服務端開發基礎知識

J2EE:J2EE核心是一組技術規範與指南，其中所包含的各類組件、服務架構及技術層次，均有共同的標準及規格，讓各種依循J2EE架構的不同平臺之間，存在良好的兼容性，解決過去企業後端使用的信息產品彼此之間無法兼容，企業內部或外部難以互通的窘

2020-06-14 17:52:57

主從 + sentinel 實現redis的高可用

redis提供主從模式(也就是複製replication), 如果不太清楚主從搭建過程的請參考之前博客, 一主多從這種模式只是將讀寫進行了分類，如果主發生了故障，整個redis系統都將變的不可用. 然而redis 引進了哨兵, 哨

2020-06-13 12:15:26

MongoDB的客戶端工具MongoVue

一個很不錯的MongoDB的客戶端工具MongoVue，地址是[url]http://www.mongovue.com/[/url]。做的不錯，1.0

2020-06-12 22:02:07

【知識積累】BigDate介紹

Big Data技術綜述　　Big Data是近來的一個技術熱點，但從名字就能判斷它並不是什麼新詞。畢竟，大是一個相對概念。歷史上，數據庫、數據倉庫、數據集市等信息管理領域的技術，很大程度上也是爲了解決大規模數據的問題。被譽爲數據倉庫之

2020-06-10 16:49:51

Mongodb中Security介紹

2020-06-04 01:13:24

Nosql數據庫技術之mongodb

2020-06-02 05:12:04

Redis學習(八)————深入瞭解Redis主從複製，Redis哨兵機制

2020-05-31 00:55:39

24小時熱門文章

python gdal 安裝使用（Windows， python 3.6.8）

最新文章

最新評論文章