- http://hortonworks.com/blog/moving-hadoop-beyond-batch-with-apache-yarn/ 分析Hadoop YARN出現的原因,主要的角度是SQL in Hadoop;
- http://blog.cloudera.com/blog/2013/05/cloudera-development-kit-cdk/ 此前Cloudera推出Cloudera Manager,主要提供給Admin和Operation使用;現在終於面前開發者而推出Cloudera Development Kit
- http://blog.cloudera.com/blog/2013/05/extending-the-data-warehouse-with-hadoop/ 提出了Cloudera的觀點,認爲Hadoop不會替換現有的數據基礎設施,比如數據倉庫,相反,Hadoop是一種補充,比如其可以作爲Transactional
system和warehouse之間的staging area
- http://www.cs.umd.edu/users/pugh/java/memoryModel/ 《Effective Java》的Item 66,說的是"When multiple threads share mutable data, each
thread that reads or writes the data must perform synchronization.",哪怕這個mutable data是int, long這類原子類型,也需要同步。這跟Java Memory Model有關,因爲"it does not guarantee that a value written by one thread will be visible to another"。這篇文章比較詳細地解釋了Memory Model,因爲有processor local
cache,code reordering的存在,如果沒有同步,那麼多線程可能拿到不一致的數據。
- http://developer.yahoo.com/blogs/hadoop/next-generation-apache-hadoop-mapreduce-3061.html Arun
C. Murthy寫的一個關於YARN的post,淺顯易懂
- http://www.eecs.harvard.edu/~mdw/papers/events.pdf 這是一篇2000年左右的論文,討論了構造高併發系統的兩種基本策略——thread-based and event-driven——闡述各自的優缺點,並提出一種混合策略。
- http://act2.me/full-stack-web-development/ 短小精悍的文章,討論了Web開發演進的歷史
- http://www.infoq.com/news/2009/08/google-chose-jetty
- http://blog.cloudera.com/blog/2009/12/7-tips-for-improving-mapreduce-performance/ 提高MapReduce程序性能的幾種思路
- http://drankye.wordpress.com/2012/11/20/understanding-hadoop-kerberos-authentication/ 描述Hadoop
Kerberos Authentication機制的原理和應用的幾個框架和API
- http://blog.cloudera.com/blog/2009/02/the-small-files-problem/ 解釋了爲什麼Hadoop不適合處理很多小文件
- http://www.programcreek.com/2013/09/top-10-methods-for-java-arrays/ 超級實用的Java數組使用技巧
【Reading】2013-05, 06, 07, 08
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.