原创 Running Celery as root

問題解決參考自:http://stackoverflow.com/questions/20346851/running-celery-as-root Q: I need to run my Django along with Ce

原创 Python 中的 str 與 unicode 編碼處理

問題 用 Python 處理中文時會經常發現亂碼(字符串處理,讀寫文件,print),多數的做法是調用encode/decode進行調試,並沒有明確思考爲何出現亂碼,所以調試時常出現錯誤。 理論 若要完全掌握字符編碼的處理,必須理

原创 SQLite vs MySQL vs PostgreSQL: A Comparison Of Relational Database Management Systems

https://www.digitalocean.com/community/tutorials/sqlite-vs-mysql-vs-postgresql-a-comparison-of-relational-database-m

原创 PyInstaller 打包 Python 源碼爲 exe 可執行文件

最近用 Python 寫的一個爬蟲運行在 Windows 系統中,爲了方便啓動程序,考慮將 Python 源文件打包成 exe 可執行文件。 目前發現的工具主要有兩種,一是 PyInstaller ,另一個是 py2exe 。當然如果不怕

原创 CentOS 下 VNC Server 的配置與使用

VNC 是一款優秀的遠程控制工具軟件,由著名的 AT&T 的歐洲研究實驗室開發的。VNC 是在基於 UNIX 和 Linux 操作系統的免費的開源軟件,遠程控制能力強大,高效實用,其性能可以和 Windows 和 MAC 中的任何遠程控制

原创 Apache Hadoop over OpenStack Swift(在swfit框架上運行Hadoop)

Apache Hadoop over OpenStack Swift 原文地址:http://bigdatacraft.com/archives/349 By Camuel Gilyadov, on March 1st, 2012

原创 HDInsight 簡介

Windows Azure HDInsight Service HDInsight 是在 Windows Azure 上快速擴展 Apache Hadoop 技術堆棧(作爲大數據分析的首選解決方案)的雲實現。它包括 Storm、H

原创 爲 Hadoop 的存儲層增加對 OpenStack Swift 的支持

在 Hadoop 中有一個抽象文件系統的概念,它有多個不同的子類實現,由 DistributedFileSystem 類代表的 HDFS 便是其中之一。本文將探討通過編寫 Swift 適配器,將 OpenStack Swift

原创 python 網絡編程(TCP & UDP)

1 TCP方式      1.1 server: import socket import datetime def tcpServer():     address = ('127.0.0.1',22310)     s = sock

原创 Java Runtime 執行系統命令行程序

以前寫過一篇文章,介紹通過 Java 的 Runtime 類執行操作系統命令行程序:Java調用linux系統shell執行命令。最近項目中又有需要用這個方法,在使用過程中遇到了一些新的問題,感覺以前沒有弄清楚,故在此做補充學習記錄。 先

原创 Python 的包管理工具 distribute, setuptools, easy_install 與 pip

        剛開始學習 Python 時,看資料和別人介紹中提到過,安裝 Python 的包有的用 easy_install, setuptools, 有的使用 pip,distribute。現在把這些相關的資料整理一下,能更清晰的瞭

原创 Django 使用 MySQL 存儲時間中遇到的問題(在數據庫中記錄插入時間、更新時間、刪除時間)

一、MySQL 的時間存儲格式 首先,把 MySQL 的時間類型做一下解釋。在 MySQL 中,表示時間值的DATE和時間類型爲 DATETIME、DATE、TIMESTAMP、TIME和YEAR。每個時間類型有一個有效值範圍和一個“零”

原创 The Differences Between Data, Information and Knowledge

The Differences Between Data, Information and Knowledge 原文地址: http://www.infogineering.net/data-information-knowle

原创 sklearn 中 make_blobs模塊使用

Abstract ref: http://scikit-learn.org/0.17/modules/generated/sklearn.datasets.make_blobs.html Generate isotropic G

原创 個性化推薦的十大挑戰

  個性化推薦很多人都知道,但其中不乏認識上的誤區。有的人覺得個性化推薦就是細分市場和精準營銷,實際上細分市場和精準營銷往往是把潛在的用戶分成很多羣體,這固然相比基於全體的統計有了長足的進步,但是距離“給每一個用戶量身定做的信息服