Open Refine能学到什么

  • 清理不一致的术语拼写(即“美国”,“美国”,“美国”等)。
  • 将数值(即1.23亿美元)的文本描述值转换为可用于分析的实际数值(即123000000)。
  • 识别特定列的哪些行包含搜索项
  • 提取和清除日期的值
  • 删除重复的行
  • 使用散点图来显示不同列中的值之间的关系
  • 查找地名列表的地理座标(即大学名称等)
  • 将清理的数据导出到Excel



Open Refine是一个开源的数据整理根据。功能还是很强大的,虽然没玩过几天,不过觉得使用起来非常方便。
感兴趣的博友可以看看以下网址,对这个工具的进一步认识。
1.Open Refine教程:   http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial
2.用户文档: https://github.com/OpenRefine/OpenRefine/wiki/Documentation-For-Users
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章