博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
欢迎来到Hadoop
阅读量:6943 次
发布时间:2019-06-27

本文共 448 字,大约阅读时间需要 1 分钟。

What Is Apache Hadoop?

Hadoop是一个可靠的、可扩展的、分布式计算的开源软件。

Hadoop是一个分布式处理大数据的框架。它被设计成从一台到上千台不等的服务器,每个服务器都提供本地计算和存储的能力。它并非依赖于硬件来提供高可用服务。

Hadoop这个工程包含如下模块:

  • Hadoop Common:公共模块
  • Hadoop Distributed File System (HDFS™):分布式文件系统
  • Hadoop YARN:一个任务调度和集群资源管理的框架
  • Hadoop MapReduce:一个机遇YARN的系统,用于并行处理大数据

其它相关的工程还包括:

  • HBase:一个弹性的、分布式的数据库,支持结构化的数据存储
  • Hive:一个数据仓库的基础设施,提供数据汇总和查询
  • Spark:一个快速、通用的计算引擎。Spark提供简单并且有表现力的程序模块以支持大范围的应用,包括ETL、机器学习、流处理和图计算
  • Zookeeper:为分布式应用提供一个高性能的协调服务

 

转载地址:http://ctinl.baihongyu.com/

你可能感兴趣的文章
c# 获取当前程序的路径
查看>>
Dijkstra基本思路(感觉和Prim非常类似)
查看>>
Jq-滚动条插件写法(二)
查看>>
Android 中AlterDialog使用
查看>>
移动互联网周刊第二期,不错,推荐给大家
查看>>
网页背景图固定不动,不跟随滚动条滚动
查看>>
网站推广百步曲
查看>>
F# 20分钟快速上手(二)
查看>>
[Android UI] listview 自定义style
查看>>
VS 2015 Enterprise第二大坑
查看>>
Java静态字段(属性、方法、类别)
查看>>
白话学习MVC(六)模型绑定
查看>>
Java魔法堂:自定义和解析注解
查看>>
在字符串中删除特定的字符
查看>>
在Python中怎么表达True
查看>>
C# 多线程控制控件实例
查看>>
Asp.net页面生命周期
查看>>
【初窥javascript奥秘之面向对象】封装与继承
查看>>
Silverlight 解谜游戏 之十四 音效
查看>>
git集锦
查看>>