延雲行業搜索數據庫 在大數據生態中位置和重要性

延雲行業搜索數據庫

在大數據生態中位置和重要性

大數據的挑戰

隨着大數據在各行業的應用,互聯網及物聯網技術的迅猛發展,數據正在大量產生、被存儲並被快速的利用,很多行業的每天的數據增量就達到了千億級,總量則超過了數萬億。比如,在公共安全行業,海量的上網行爲被記錄,電子圍欄系統時刻採集海量移動設備信息;在交通行業,一箇中等城市的卡口系統,每天採集的過車記錄到達數百萬條到千萬條不等;在電信行業,每天時刻記錄着數億人的通話及信息記錄;在金融行業,每天產生數以億計的交易記錄和支付信息等等。而各行業所面臨的一個關鍵問題就是,如此大規模的數據如何被快速地有效地利用,讓數據產生足夠大的價值。

大數據技術的現狀

目前在大數據生態中,有三種方式來解決以上問題,分別是:批處理(Batch),即席查詢與分析(Ad-hoc),流計算(Stream)。(1)批處理是大數據生態中成熟的技術,其優勢是又穩又準,但時效性極差,無法滿足交互式應用的要求。(2)流計算技術也比較成熟,在數據流入的時候即把相應的計算操作完成,有極高的時效性,但只能計算設定好的模型,靈活度方面有極大限制。(3)而目前大數據業內呼聲最高應用前景最爲廣泛的即是即席查詢與分析,既具有良好的時效性,又兼顧了很好靈活性。簡單來說,就是在海量數據在產生後的1~2分鐘內,就可以對海量數據集進行任意維度的查詢和分析,真正地實現大數據的交互式查詢與分析,想查什麼就查什麼,想算什麼就算什麼,從而實現高效地挖掘大數據背後的潛在價值。

公安、軍隊、交通交警等監管機構需要在海量數據中做大量的搜索與數據碰撞工作。(1)傳統ORACLE數據庫在搜索上已經滿足不了性能要求,而開源的搜索引擎在功能上較弱,只能進行一些簡單的像百度那樣的全文搜索,無法支撐複雜的查詢邏輯.(2)目前的監管需求邏輯均比較複雜,爲了構建一個這樣的系統,往往需要4~5種不同系統共同完成一個產品,除了整體部署硬件成本很高外,每個系統的接口類型與風格也完不同, 非SQL統一接口,開發人員需要學習每個系統的使用,安裝,配置與調優,而這些往往需要在行業積累多年的技術專家才能做到.

 延雲行業搜索數據庫

延雲行業搜索數據庫簡稱延雲YDB是由延雲獨立研發,自主可控的實時、多維、大數據即席查詢與分析引擎.(1)延雲獨特的搜索與分詞技術,在搜索性能與搜索準確定上比傳統的開源搜索引擎更高。(2)延雲YDB能同時滿足高性能的搜索與數據碰撞,又能進行復雜的業務邏輯計算,只需要一個產品即可滿足現有的監管產品大部分需求.(3)對外統一的SQL接口,對開發人員來說學習成本很低,懂大數據的開發人員很少,但是可以說幾乎每個開發人員都懂SQL。

延雲是大數據即席查詢與分析領域的先行者,也是領導者,從2016年7月,延雲搜索數據庫產品YDB穩定版本發佈以來,受到了大數據業界的廣泛關注,並在公安,交通,軍隊,運營商,互聯網等行業的數十個生產系統中上線運行,並取得良好的應用效果。目前有數十個項目正在進行深度體驗和測試,延雲的發展正在進入快車道。

延雲在大數據領域有深厚的積澱和技術儲備,延雲創始人母延年曾就職於阿里巴巴,騰訊及新浪等互聯網公司,曾任多個大數據項目的技術負責人, 在千億級大數據搜索與即系分析方面積累的豐富的實戰經驗,是開源項目Mdrill(千億數據即席分析),JStorm(分佈式實時計算引擎)的Committer,也是騰訊Hermes(即席查詢多維分析平臺)的原作者。延雲在大數據即席分析與查詢領域保持着業內絕對領先。業內同領域其他產品,比如華爲的CarbonData,Hermes等產品,目前均處於項目的孵化期或者僅限於公司內部使用,距離產品的真正商用還有相當大的距離,而延雲的產品已經得到數個關鍵行業的認可,已經進入了商業拓張期,在此階段延雲需要資本力量的助推,在大數據生態中佔據重要位置,並在大數據時代成就輝煌。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章