讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 数据库 > mysql教程 > 正文

Hadoop简单介绍

php中文网

发布： 2016-06-07 14:58:29

原创

2154人浏览过

hadoop简单介绍一、Hadoop要解决的两个问题：首先我们撇开Hadoop的历史、概念，我们先了解Hadoop是用来干啥的。 Hadoop解决两个问题： 1.海量数据存储 HDFS 2.海量的数据分析 MapReduce 二、Hadoop历史： 2002年的apache项目Nutch 2003年Google发表了关于G

hadoop简单介绍

一、Hadoop要解决的两个问题：

首先我们撇开Hadoop的历史、概念，我们先了解Hadoop是用来干啥的。

Hadoop解决两个问题：

1.海量数据存储 HDFS

2.海量的数据分析 MapReduce

二、Hadoop历史：

2002年的apache项目Nutch

2003年Google发表了关于GFS的论文

2004年Nutch的开发者开发了NDFS

2004年Google发表了关于MapReduce的论文

2005年MapR被引入了NDFS

2006年改名为Hadoop，NDFS创始人加入了yahoo，yahoo成立了一个专门的小组发展Hadoop

三、学习Hadoop的目的：

Hadoop是IT行业一个新的热点，是云计算的一个具体实现

Hadoop本身具有很高的技术含量，是IT工程师学习的首选

四、HDFS设计目标：

1.Very large files

2.Streaming data access

write-once read-many-times

新秀B2C商城系统

新秀B2C商城系统

新秀B2C商城系统是一款简洁易用PHP商城系统。可免费下载使用，可用于商业用途，没有时效限制，除版权标识外，所有代码都允许修改。后台功能简介：1、商城设置：基本信息，配送方式，配送范围，支付方式，财务管理；2、商品管理：商品列表，添加商品，商品分类，商品品牌，商品属性；3、订单管理：订单列表，缺货登记；4、用户互动：用户管理，留言管理，评论管理，网站公告，在线客服，用户协议；5、文章管理：文章列表

新秀B2C商城系统

0

新秀B2C商城系统

3.Commodity hardware

五、Hadoop不适合的场景：

1.low-latency data access

2.Lots of small files

3.Multiple writers,arbitrary file modifications

六、HDFS架构：

（1）假设有一个 600G的文件a.txt，由于我们的Hadoop默认一个块的大小是64M，故将这600G文件以64M为一块分别存储到所有的集群的主机上，这样我们的读取速度将会大大提高。

（2）同一个文件块在不同的节点中有多个副本，这样当集群里某一文件块损坏或者数据丢失时，会在另外一个节点得到补充。另外这些副本和原本都是在一个配置文件里配置的，Hadoop会根据配置信息自动寻找备份的内容块。

（3）刚刚我们提到的配置文件，我们需要一个集中的地方保存文件的分块信息：

/home/asdf/a.txt.part1,3,(dm1,dm2,dm3)

/home/asdf/a.txt.part2,3,(dm2,dm3,dm4)

/home/asdf/a.txt.part3,3,(dm6,dm11,dm28)

这里边的3是指加上备份有三份。

（4）Block:一个文件分块，默认64M

NameNode：保存整个文件系统的目录信息，文件信息以及文件相应的分块信息。

DataNode：用于存储Blocks

HDFS的HA策略：NameNode一旦宕机，整个文件系统将无法工作。如果NameNode中的数据丢失，整个文件系统也就丢失了。 2.x开始，HDFS支持NameNode的active-standy模式。

大家都在看：

hadoop跟mysql的区别是什么？ mysql镜像配置如何导出数据库_mysql镜像配置数据库导出操作指南 mysql通配符与like怎么结合_mysql通配符与like结合使用的完整指南 mysql通配符在like中怎么用_mysql通配符配合like语句的详细用法 mysql触发器怎么实现数据过滤_mysql触发器进行数据过滤的具体实现

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：Postgresql命令行常用操作下一篇：Mongo服务器集群配置学习一主从复制

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

如何在虚拟机中搭建mysql_mysql虚拟机环境搭建方法在虚拟机中搭建MySQL需先安装兼容操作系统（如Ubuntu22.04或RockyLinux），再安装MySQL服务并运行mysql_secure_installation加固；接着修改bind-address为0.0.0.0、创建远程用户、开放3306端口，最后从宿主机通过IP连接验证。

2025-12-21 12:58:58

638

如何在mysql中删除数据库_mysql数据库删除操作说明直接使用DROPDATABASE语句可删除MySQL数据库，需确保拥有DROP权限且操作不可逆；执行前应确认数据库名、检查权限、备份数据，禁用伪删除方式。

2025-12-21 12:49:02

317

mysql默认用户安全吗_mysql默认安全风险分析 MySQL默认配置极不安全，须人工加固：立即设置root强密码、删除匿名用户；绑定bind-address=127.0.0.1限制本地访问；禁用FILE/SHUTDOWN等高危权限；启用SSL加密通信并开启日志审计。

2025-12-21 12:43:02

103

如何在新服务器首次部署mysql_mysql首次部署流程新服务器首次部署MySQL需完成安装、初始化、安全加固和基础配置四步：Ubuntu/Debian用apt安装，CentOS/RHEL用dnf或yum；启动服务并获取临时密码；登录后修改root密码并刷新权限；最后必须运行mysql_secure_installation加固。

2025-12-21 12:07:02

667

如何在mysql中实现数据软删除_mysql逻辑删除实战方案 MySQL不支持原生软删除，需通过is_deleted或deleted_at字段实现；建表/加字段、统一查询过滤、改DELETE为UPDATE、配套归档与恢复机制是关键。

2025-12-21 10:57:08

640

如何配置mysql环境变量_mysql环境变量设置方法配置MySQL环境变量需将bin目录路径添加到系统PATH中，Windows通过“系统属性→环境变量”添加，macOS/Linux编辑~/.zshrc或~/.bashrc并执行source生效，最后用mysql--version验证。

2025-12-21 10:22:02

439

mysql如何处理索引碎片_mysql索引碎片整理方法判断MySQL索引碎片主要看information_schema.TABLES中DATA_FREE字段，结合data_length+index_length计算碎片率；碎片率＞20%或DATA_FREE＞100MB建议整理，常用OPTIMIZETABLE或ALTERTABLE...ENGINE=InnoDB重建表，大表宜用pt-online-schema-change在线处理。

2025-12-21 10:15:33

311

mysql用户和权限是什么_mysql权限管理基础概念 MySQL用户由用户名和主机名共同定义，权限分全局、数据库、表、列四级，支持角色批量授权，连接需经合法性与权限两阶段验证，修改权限后需刷新缓存。

2025-12-21 10:09:34

341

mysql中数据一致性是什么意思_mysql一致性概念说明 MySQL的一致性指事务执行前后数据库始终满足完整性约束且业务逻辑正确，由主库事务+约束机制（主键、外键、CHECK等）保障，与主从同步延迟无关。

2025-12-21 10:05:02

128

如何配置mysql启动参数_mysql启动参数设置方法 MySQL启动参数主要通过配置文件（my.cnf或my.ini）设置，生产环境推荐此方式以确保持久性和可维护性；命令行临时指定仅适用于调试，优先级高于配置文件但不持久。

2025-12-21 09:57:36

912

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

尚学堂Mahout视频教程

31262次学习
收藏
Bootstrap 5教程

24850次学习
收藏
jQuery 教程

31586次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部