原创 數據和服務 – 通向企業服務總線(ESB)之路

在前面的章節中,我們已經學習了XML的基礎知識以及基於XML的Web服務。現在,我們就可以從企業級的視角,看看這些是如何組裝起來。對企業用戶來說,信息及信息的基本構成元素—數據是他們所感興趣的。數據可以駐留在任何數據存儲中心,並以各種形式

原创 利用WSO2發佈數據服務

WSO2數據服務是WSO2公司2008年10月份新發布的一款產品。WSO2數據服務的主要用途是快速發佈數據,而且幾乎不用編程;它不但能發佈關係數據庫中的數據,而且還能發佈非關係數據庫比如Excel、Txt等扁平文件中的數據;它不但能把數

原创 使用Apache Axis實現Web服務

Apache Axis是提交給W3C的一種SOAP(Simple Object Access Protocol)實現,Axis在實現Java Web服務方面穩定可靠。許多公司在它們的產品中使用了Axis來支持Web服務,而且Axis還有一

原创 DFS分佈式文件搜索引擎

[size=medium]最近由於找不到一款適合的海量文件的公司內部搜索引擎,只好自己動手寫了一個,並註冊了個域名將其放在美國的一個VPS上。詳情請見[url]http://www.enpknowledge

原创 行業垂直搜索引擎網頁抓取項目

公司有一個搜索引擎項目,希望各路高人有空來幫忙指導,謝謝!這是詳細需求:(1) 通過提供的網站地址(大概100-200個網站),網頁抓取程序能不斷抓取網頁和其它類型的文件(如Excel、PDF、Word、p

原创 在Tensorflow環境下利用梯度下降法進行線性迴歸

最近在Coursera學習《Machine Learning 》這門機器學習的入門課。在Matlab中完成作業感覺不是很爽。因此突發奇想,想把第二課的作業在Tensorflow上跑一遍,以加深印象。有關假設模型(Hypothesis)、代

原创 Elasticsearch多語言搜索入門(一)

Elasticsearch自帶一套語言分析器(Analyzer),爲世界上大多數語言提供良好的支持。Elasticsearch主要支持的語言有:阿拉伯語語、 亞美尼亞語、 巴斯克語、 巴西語、 保加利亞語、 加泰羅尼亞語、 中文、 捷克語

原创 Tensorflow-gpu的錯誤

今天在Nvidia顯卡上安裝tensorflow-gpu,安裝教程http://blog.csdn.net/weixin_36368407/article/details/54177380。以前在cpu上跑tensorflow1.3沒有問

原创 用Python的statsmodels包做前向逐步迴歸

Python的statsmodels包含了一些R風格的統計模型和工具。在內部實現上,statsmodels使用patsy包將數據轉化爲矩陣並建立線性模型,具體信息參見pasty主頁http://patsy.readthedocs.io/e

原创 在Windows下使用Curl工具完美操作ElasticSearch

首先可以從 http://curl.haxx.se/download.html上下載並安裝Windows環境下的Curl。安裝完成後,將Curl的I386目錄的完整路徑添加到Windows的Path環境變

原创 利用梯度下降法實現簡單的線性迴歸

最近做了好多個數據挖掘的小項目,使用並比較了N多算法,瞭解了很多機器學習的工具,如R語言、Spark機器學習庫、Python、Tensorflow和RapidMiner等等。但是我感覺到自己沒能深入下去,充其量也只是把別人的工具拿來玩玩而

原创 RapidMiner缺失數據處理——去掉數據大量缺失的變量

最近做數據挖掘,發現RapidMiner是一款數據清洗、處理和轉換的好工具,尤其在數據量不大的情況下。和R語言相比,RapidMiner在數據處理方面要簡單直觀得多。雖然RapidMiner的功能可能不如R強大。另外,我們也可以在Rapi

原创 機器學習中的相似性度量

轉自http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html 在做分類時常常需要估算不同樣本之間的相似性度量(Similarity Measurement),這時通常採用

原创 使用原汁原味的Java 語言

本文摘自: http://www.ibm.com/developerworks/cn/java/j-noaccent.html     學習一種新的編程語言比學習新的口頭語言要容易得多。然而,在這兩種學習過程中,都要付出額外的努力去學習不

原创 機器學習和數據科學從業者必讀的10本免費英文書

本文編譯自https://www.kdnuggets.com/2018/05/10-more-free-must-read-books-for-machine-learning-and-data-science.html。夏天本該是放鬆的