原创 《Using OpenRefine》翻譯~14

上一篇:《Using OpenRefine》翻譯~13 第四章:數據集關聯 數據集之間並不是互相獨立的。總在某些時候,可能在你預想不到的地方,數據之間互相關聯,比如,如果你的數據集有一列是關於國家的數據,那麼這列就和國家地理數據庫有關聯。

原创 FaceBook高效工作十個原則圖

雖然道理都懂,但不知有多少人會遵從。現在大到企業工作文山會海,文件朝令夕改,恰恰業績上也體現出了默默無聞;小到個人活在萬千瑣事中迷失自我,失去方向,轉眼韶華已逝,青春不在,回頭方知簡簡單單堅持一件事情做好的重要性。既如此,不如大家都活得簡

原创 《Using OpenRefine》翻譯~8

上一篇:《Using OpenRefine》翻譯~7 定製透視 我們現在已經學習了兩種主要的透視方法-文本透視和數字透視。但其實還有很多透視方法存在,你甚至可以按照你的想法自如的透視數據。定製透視就可以讓你做到這點,無論是文本類型(比如透

原创 《Using OpenRefine》翻譯~1

總覽: 無論是現今的大數據還是企業內部的小數據,都存在一些普遍的問題,如數據格式不對需要轉換,一個單元格內包含多個含義的內容,包含重複項等等,雖然我們也可以使用excel解決,但是excel天生有諸多限制,比如其爲直接對數據進行操作,容易

原创 《Using OpenRefine》翻譯~10

上一篇:《Using OpenRefine》翻譯~9 第三章:高級數據操作 上一章中,我們介紹了OpenRefine的一些基本的操作。然而這些僅僅提供了你初級的數據分析處理技能。只有OpenRefine高級特性才能讓你領略其真正的強大之處

原创 《Using OpenRefine》翻譯~3

上一篇:《Using OpenRefine》翻譯~2 要點4:操縱列 本點中,你將學習列在OpenRefine如何隱藏和展開、按需要轉換、以及重命名和刪除。 列是OpenRefine中的基本元素:其是具有同一屬性的成千上萬的值的集合,可以

原创 《Using OpenRefine》翻譯~12

上一篇:《Using OpenRefine》翻譯~11 點4:單元格值轉換 在第二章:分析和修改數據中,我們學習到OpenRefine可以自動修改一列的單元格內容,比如去除多餘空格。上一點中,我們學習到聚類是另一種修改列單元格內容的方法。

原创 《Using OpenRefine》翻譯~9

上一篇:《Using OpenRefine》翻譯~8 點4-應用一個文本過濾 本點中,我們將學習如何使用文本過濾來尋找符合某個條件的值。 當你想尋找那些匹配某個特定字符串的行時,最簡單的方法是使用文本過濾功能。讓我們以一個簡單的例子開始

原创 《Using OpenRefine》翻譯~2

上一篇:《Using OpenRefine》翻譯~1 OpenRefine支持的文件類型 以下是部分OpenRefine支持的文件格式: ●csv、tsv及其他*sv ●xls/xlsx、cdf、ods ●JSON ●XML ●行文本格

原创 《Using OpenRefine》翻譯~7

上一篇:《Using OpenRefine》翻譯~6 點2-數據透視 OpenRefine最常用的功能可能就是數據透視了。數據透視並不改變數據,但是可以讓你獲得數據集的有用信息。你可以把數據透視看作是多方面查看數據的方法,就像從不同的角度

原创 《Using OpenRefine》翻譯~5

上一篇:《Using OpenRefine》翻譯~4 要點7:獲取更多的運行內存 最後一點,我們將學習如何如何分配更多的運行內存以操作更大的數據集。 對於大數據集,你會發覺OpenRefine會運行緩慢或者提示內存不夠。這表明你需要分配更

原创 首開博客,記錄學習歷程

凡是能夠堅持做下來的事情一般都能夠成功,沒能成功的往往是半途而廢。 個人感覺:首先要找到方向,要和自己的興趣契合-昨夜西風凋碧樹,獨上高樓,望斷天涯路。然後就是枯燥的努力,中間的小成功就是克服枯燥感的良藥-衣帶漸寬終不悔,爲伊消得人憔悴。

原创 《Using OpenRefine》翻譯~6

上一篇:《Using OpenRefine》翻譯~5 第二章:分析和修改數據 本章中,我們將更加深入的學習OpenRefine的數據分析和修改功能,主要的內容包括下面六點: *點1-數據排序 *點2-數據透視 *點3-重複檢測 *點4-應

原创 《Using OpenRefine》翻譯~11

上一篇:《Using OpenRefine》翻譯~10 點3:相似單元格聚類 多虧了OpenRefine,我們並不需要擔心數據創建過程中產生的一些問題。如果你在分割多值單元格後對分類進行了分析,你會發現同樣的分類並不一定有相同的拼寫。比如

原创 《Using OpenRefine》翻譯~4

上一篇:《Using OpenRefine》翻譯~3 要點5:使用項目操作歷史 本點中,你將學習到如何返回到任一個項目歷史操作點,並且學習如何在項目重新打開後查看歷史操作信息。 OpenRefine一個特別有用的功能是可以在項目創建後保存