原创 將博客搬至CSDN

大家好!爲便於文章發放和整理、我將iteye博客文章搬家到CSDN上面!

原创 ubuntu neo4j單機安裝和集羣環境安裝

1. Neo4j簡介     Neo4j是一個用Java實現的、高性能的、NoSQL圖形數據庫。Neo4j 使用圖(graph)相關的概念來描述數據模型,通過圖中的節點和節點的關係來建模。Neo4j完全兼容ACID的事務性。Neo4j以“

原创 spark map flatMap flatMapToPair mapPartitions 的區別和用途

import akka.japi.Function2; import org.apache.spark.HashPartitioner; import org.apache.spark.SparkConf; import org.apac

原创 org.apache.hadoop.hdfs.DFSClient: Error Recovery for null bad datanode[0] nodes == null問題可能出現的原因

2014年-1-22日遇到了這個問題: 2014-01-22 14:36:18,346 WARN org.apache.hadoop.hdfs.DFSClient: Error Recovery for null bad datanode

原创 交互設計專業必備知識,看到了好的課程,給自己一點儲備

交互設計師出發點和考慮的因素以及跟其他業務人員的交互 交互設計流程和工作內容 交互設計素質 本次發表的內容都來自於學習的課程             ——人人都懂交互設計,未必人人都是交互師 連接: http://www.du

原创 mongodb-river-elasticsearch源碼解析

MongoDBRiverPlugin MongoDBRiverPlugin類是插件註冊類,它繼承自AbstractPlugin,其功能是 1.      在RiverModule中註冊一個MongoDBRiver 2.      在Re

原创 mongodb-elasticsearch-rive源碼解析

MongoDBRiverPlugin MongoDBRiverPlugin類是插件註冊類,它繼承自AbstractPlugin,其功能是 1.      在RiverModule中註冊一個MongoDBRiver 2.      在Res

原创 solr 基礎架構

本節通過建一個基礎應用來說明solr的主要核心模塊,當然這個過程中我們也能夠看出solr的特別之處和solr存在的意義。首先在說明solr是什麼之前,我們先撇清一些概念---------solr既不是搜索引擎也不是搜索引擎優化。 上面的圖

原创 HADOOP 分佈式集羣環境下第一個mapReduce程序—WordCount

       關於hadoop 分佈式集羣環境搭建,本人已經在博客中的 ubuntu hadoop 全分佈式集羣搭建中介紹清楚了。具體詳見(http://blog.csdn.net/luoluowushengmimi/article/de

原创 將博客搬至CSDN

大家好!爲便於文章發放和整理、我將iteye博客文章搬家到CSDN上面!

原创 mongo服務器啓動錯誤 1067

mongodb啓動服務時報錯,錯誤:1067,進程意外終止 解決辦法:我之前也遇到過類似的問題,個人分析是數據的問題,在網上查信息說要刪掉mongod.lock文件就重啓就可以了,但是在我的機子上依然出現上

原创 elasticsearch與mongodb分佈式集羣環境下數據同步以及遇到的相應問題解答

1. ElasticSearch是什麼      ElasticSearch 是一個基於Lucene構建的開源、分佈式,RESTful搜索引擎。它的服務是爲具有數據庫和Web前端的應用程序提供附加的組件(即可搜索的存儲庫)。Elasti

原创 neo4j 三元組數據存儲問題的解決方案

    圖數據庫的擴展性,靈活性非常好,適合用於複雜關係管理和關係查詢推理,社交關係應用就是一個可選的應用場景。語義網和Ontology的數據結構(三元組)就是圖結構數據,而基於RDF構建的語義網,過於複雜,效率很低,實際上不如基於圖數

原创 ubuntu hadoop 全分佈式集羣搭

                                   ubuntu hadoop 全分佈式集羣搭建 1 集羣介紹 1.1 Hadoop簡介     Hadoop是Apache軟件基金會旗下的一個開源分佈式計算平臺。以Had

原创 solrcloud安裝手冊

關於如何安裝solrcloud看了網上很多資料也嘗試了很多次,發現有許多不太對的地方,正好單位 需要用,所以仔細實踐了一下,把相關實踐的情況總結一下: 1. 在同一臺機器上建立兩個Shard集羣 這個例