大数据之路 Hadoop 的学习流程
首先
首先记录,在这篇文章书写前,自己并不是刚刚上手 Hadoop, 其实学了有一段时间了
在这段时间内,由最开始的对 Hadoop 的懵懂无知到渐渐的熟悉 Hadoop 大致的开发流程
整个过程越来越清晰
于是就想着,把自己接下来在 Hadoop 上的学习计划记录下来
流程
- 了解 Hadoop 背景,开发作用
- 然后搭建Hadoop集群,先让它在自己电脑上运行。
- 学习分布式文件系统HDFS。
- 学习分布式计算框架MapReduce
- 学习流式计算Storm
- 学习分布式协作服务Zookeeper
- 学习Hive—数据仓库工具
- 学习Hbase—分布式存储系统
- 学习Spark
- 学习Scala
- 学习Spark开发技术
最后
这些技术在工作中是远远不够的,但也不是工作中每项都有用到了
就自己现在公司的大数据环境来说,还有像 impala,zookeeper,spark,kafka…等等
等有新的学习计划再补充吧