原创 Running Celery as root
問題解決參考自:http://stackoverflow.com/questions/20346851/running-celery-as-root Q: I need to run my Django along with Ce
原创 Python 中的 str 與 unicode 編碼處理
問題 用 Python 處理中文時會經常發現亂碼(字符串處理,讀寫文件,print),多數的做法是調用encode/decode進行調試,並沒有明確思考爲何出現亂碼,所以調試時常出現錯誤。 理論 若要完全掌握字符編碼的處理,必須理
原创 SQLite vs MySQL vs PostgreSQL: A Comparison Of Relational Database Management Systems
https://www.digitalocean.com/community/tutorials/sqlite-vs-mysql-vs-postgresql-a-comparison-of-relational-database-m
原创 PyInstaller 打包 Python 源碼爲 exe 可執行文件
最近用 Python 寫的一個爬蟲運行在 Windows 系統中,爲了方便啓動程序,考慮將 Python 源文件打包成 exe 可執行文件。 目前發現的工具主要有兩種,一是 PyInstaller ,另一個是 py2exe 。當然如果不怕
原创 CentOS 下 VNC Server 的配置與使用
VNC 是一款優秀的遠程控制工具軟件,由著名的 AT&T 的歐洲研究實驗室開發的。VNC 是在基於 UNIX 和 Linux 操作系統的免費的開源軟件,遠程控制能力強大,高效實用,其性能可以和 Windows 和 MAC 中的任何遠程控制
原创 Apache Hadoop over OpenStack Swift(在swfit框架上運行Hadoop)
Apache Hadoop over OpenStack Swift 原文地址:http://bigdatacraft.com/archives/349 By Camuel Gilyadov, on March 1st, 2012
原创 HDInsight 簡介
Windows Azure HDInsight Service HDInsight 是在 Windows Azure 上快速擴展 Apache Hadoop 技術堆棧(作爲大數據分析的首選解決方案)的雲實現。它包括 Storm、H
原创 爲 Hadoop 的存儲層增加對 OpenStack Swift 的支持
在 Hadoop 中有一個抽象文件系統的概念,它有多個不同的子類實現,由 DistributedFileSystem 類代表的 HDFS 便是其中之一。本文將探討通過編寫 Swift 適配器,將 OpenStack Swift
原创 python 網絡編程(TCP & UDP)
1 TCP方式 1.1 server: import socket import datetime def tcpServer(): address = ('127.0.0.1',22310) s = sock
原创 Java Runtime 執行系統命令行程序
以前寫過一篇文章,介紹通過 Java 的 Runtime 類執行操作系統命令行程序:Java調用linux系統shell執行命令。最近項目中又有需要用這個方法,在使用過程中遇到了一些新的問題,感覺以前沒有弄清楚,故在此做補充學習記錄。 先
原创 Python 的包管理工具 distribute, setuptools, easy_install 與 pip
剛開始學習 Python 時,看資料和別人介紹中提到過,安裝 Python 的包有的用 easy_install, setuptools, 有的使用 pip,distribute。現在把這些相關的資料整理一下,能更清晰的瞭
原创 Django 使用 MySQL 存儲時間中遇到的問題(在數據庫中記錄插入時間、更新時間、刪除時間)
一、MySQL 的時間存儲格式 首先,把 MySQL 的時間類型做一下解釋。在 MySQL 中,表示時間值的DATE和時間類型爲 DATETIME、DATE、TIMESTAMP、TIME和YEAR。每個時間類型有一個有效值範圍和一個“零”
原创 The Differences Between Data, Information and Knowledge
The Differences Between Data, Information and Knowledge 原文地址: http://www.infogineering.net/data-information-knowle
原创 sklearn 中 make_blobs模塊使用
Abstract ref: http://scikit-learn.org/0.17/modules/generated/sklearn.datasets.make_blobs.html Generate isotropic G
原创 個性化推薦的十大挑戰
個性化推薦很多人都知道,但其中不乏認識上的誤區。有的人覺得個性化推薦就是細分市場和精準營銷,實際上細分市場和精準營銷往往是把潛在的用戶分成很多羣體,這固然相比基於全體的統計有了長足的進步,但是距離“給每一個用戶量身定做的信息服