原创 iostat命令使用指南

Linux系統中的 iostat是I/O statistics(輸入/輸出統計)的縮寫,iostat工具將對系統的磁盤操作活動進行監視。它的特點是彙報磁盤活動統計情況,同時也會彙報出CPU使用情況。同vmstat一樣,iostat也有一

原创 查詢域名與對應ip的關係

今天找到一個網站,可以查詢ip對應的域名,感覺還是很有用的,記錄一下。 http://tool.chinaz.com/ windows的指令nslookup nslookup命令用於查詢DNS的記錄,查看域名解析是否正常,在網絡故障

原创 shell刪除創建時間大於10天的所有文件

清理文件腳本(已經測試通過):find /tmp/hadoop-flume/s3 -mtime +10 -exec rm -rf {} \;crontab腳本:#clear 0 17 * * 5 cd /home/data/ sh cl

原创 Linux 守護進程的實現

守護進程 Daemon 守護進程,也即通常所說的 Daemon 進程,是 Linux 下一種特殊的後臺服務進程,它獨立於控制終端並且週期性的執行某種任務或者等待處理某些發生的事件。守護進程通常在系統引導裝入時啓動,在系統關閉時終止。L

原创 哈佛幸福課-幸福筆記

幸福筆記 “我是真的什麼都有,我就是想有什麼我都可以買什麼,但是我居然這麼痛苦,所以我就知道了這個幸福跟這個錢多少真的是沒關係,而且錢多的話或者名氣大,如果成功,如果你沒有管理好你自己往往更容易讓你陷入精神的痛苦。” -張朝陽接受楊瀾採訪

原创 Hive 優化-限制大作業的提交

最近有些同事些sql進行查詢時,sql語句裏不指定partition字段,這樣直接造成hive生成Hadoop的MapReduce任務時查詢的數據量巨大,從而影響整個集羣的性能。經研究可以通過配置Hive參數來預防此類錯誤,從而達到優化

原创 告訴你什麼叫做"機器學習"-------(樓主力薦)

作者:計算機的潛意識 在本篇文章中,我將對機器學習做個概要的介紹。本文的目的是能讓即便完全不瞭解機器學習的人也能瞭解機器學習,並且上手相關的實踐。這篇文檔也算是EasyPR開發的番外篇,從這裏開始,必須對機器學習瞭解才能進一步介紹Ea

原创 Python--pytesseract驗證碼識別處理實例

(linux-ubuntu系統) 安裝過程 pytesser 調用了 tesseract,因此需要安裝 tesseract,安裝 tesseract 需要安裝 leptonica,否則編譯tesseract 的時候出現 "configur

原创 先驗概率與後驗概率是什麼?

一、先驗概率與後驗概率 事情還沒有發生,要求這件事情發生的可能性的大小,是先驗概率. 事情已經發生,要求這件事情發生的原因是由某個因素引起的可能性的大小,是後驗概率. 先驗概率是指根據以往經驗和分析得到的概率,如全概率公式,它往往作爲“

原创 瀏覽器野史 UserAgent列傳(下)

前篇《瀏覽器野史 UserAgent列傳(上)》 六、師夷長技 前面說到,微軟靠Windows系統捆綁IE銷售。而Windows自然也有它的對手,Linux。一個技術快速發展的時代,系統的世界裏也是戰火紛飛。Linux系統自從

原创 互聯網之子 – Aaron Swartz

1986年11月8日,有個叫Aaron Swartz的人在美國芝加哥伊利諾伊州出生。因爲他父母創辦了一個軟件公司,所以,Aaron在3歲的時候就接觸到了電腦,然後就着迷了。 我們先通過Aaron Swartz 的青少年時期來看一下他是

原创 防盜鏈和反盜鏈的原理

防盜鏈原理 http標準協議中有專門的字段記錄referer 一來可以追溯上一個入站地址是什麼 二來對於資源文件,可以跟蹤到包含顯示他的網頁地址是什麼 因此所有防盜鏈方法都是基於這個Referer字段 防盜鏈的作用 在很多地方,如淘寶、

原创 瀏覽器野史 UserAgent列傳(上)

某天,我做一個小項目,需要判斷一下瀏覽器類型。簡單的呀。 控制檯敲下:navigator.userAgent 瀏覽器迴應:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36

原创 Linux中init.d目錄詳解

/etc/init.d 是 /etc/rc.d/init.d 的軟鏈接(soft link)。可以通過 ll 命令查看,如下: init.d指的是/etc/rc.d/init.d目錄。 本文包括3部分內容1、 Linux的引導過程 2、

原创 2016年數據科學家將扮演什麼角色?

數據科學家已被譽爲2016年美國最好的工作,但是這一崗位的定義和所要求的技能卻一直在變化。技術進步與商業需求不斷驅動數據科學崗位的演化,其所處的行業也是日新月異。在本文中,我們將更加仔細地審視2016年數據科學家將扮演的角色。 Dave