当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。
这一切,都起源自Web数据爆炸时代的来临
数据抓取系统 – Nutch
海量数据怎么存,当然是用分布式文件系统 – HDFS
数据怎么用呢,分析,处理
MapReduce框架,让你编写代码来实现对大数据的分析工作
非结构化数据(日志)收集处理 – fuse,webdav, chukwa, flume, Scribe
数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 – Hiho, sqoop
MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据 – Pig, Hive, Jaql
让你的数据可见 – drilldown, Intellicus
用高级语言管理你的任务流 – oozie, Cascading
Hadoop当然也有自己的监控管理工具 – Hue, karmasphere, eclipse plugin, cacti, ganglia
数据序列化处理与任务调度 – Avro, Zookeeper
更多构建在Hadoop上层的服务 – Mahout, Elastic map Reduce
OLTP存储系统 – Hbase

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
作者
相关推荐
-
Azure数据湖分析从U-SQL中获得提升
大数据的发展已经让许多精通SQL的数据专业人员不知所措。微软的U-SQL编程语言试图让这些人回归数据查询游戏。
-
如何使用SAP HANA Vora规划HANA大数据战略?
SAP努力将HANA定位为一个大数据平台。要制定可行的大数据战略,您需要了解诸如SAP HANA Vora之类的工具。
-
数据库和数据仓库的区别在哪儿?
目前,大部分数据仓库还是用数据库进行管理。数据库是整个数据仓库环境的核心,是数据存放的地方和提供对数据检索的支持。
-
进入机器学习时代,数据库何去何从?
Vertica之前就已经能够对Hadoop数据进行访问,但Vertica8.0分析引擎则能够与Hadoop数据适当协作,如此一来就能减少数据迁移。