千锋教育-做有情怀、有良心、有品质的职业教育机构

手机站
千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频
千锋教育

关注千锋学习站小程序
随时随地免费学习课程

当前位置:首页  >  行业资讯  > 千锋大数据培训课程:Hadoop的作业提交流程

千锋大数据培训课程:Hadoop的作业提交流程

来源:千锋教育
发布人:千锋老师
时间: 2018-08-17 17:03:00 1534496580

  大数据时代,无论你深处哪个行业,做着哪份工作,多多少少都会接触到一些数据信息,数据决策已经成为很多公司的发展战略。掌握大数据技术,变得越来越重要。今天千锋大数据培训老师给大家分享的技术知识是:Hadoop的作业提交流程。

  hadoop任务的提交常用的两种,一种是测试常用的IDE远程提交,另一种就是生产上用的客户端命令行提交。

图片1

  通用的任务程序提交步骤为:

  1.客户端向resourceManager发送job请求

  2.resourceManager返回存储路径,jobId给客户端

  3.客户端创建路径把jobId,分片信息,配置文件信息,jar文件拷贝到返回的存储路径上

  4.客户端向resourceManager报告提交完成

  5.resourceManager在nodeManager上启动一个容器(container),在container中执行mrappmaster进程(主管mr任务执行)

  6.mrappmaster取得分片信息,任务的相关配置,计算job所需资源

  7.mrappmaster向resourceManager申请资源

  8.resourceManager准备资源,mrappmaster启动container运行mapTask

  9.maptask进程启动之后,根据给定的数据切片范围进行数据处理,处理流程:

  1)利用客户指定的inputformat来获取recordReader读取数据,形成kv键值对。

  2)将kv传递给客户定义的mapper类的map方法,做逻辑运算,并将map方法的输出kv收集到缓存。

  10.mrappmaster监控所有的maptask进程完成之后,会根据用户指定的参数来启动相应的reduceTask进程,并告知reduceTask需要处理的数据范围

  11.reducetask启动之后,根据appmaster告知的待处理的数据位置,从若干的maptask所在的机器上获取若干的maptask输出结果,并在本地进行一个归并排序,然后,再按照相同的key的kv为一组,调用客户自定义的reduce方法,并收集输出结果kv,然后按照用户指定的outputFormat将结果存储到外部设备。

  12.所有任务定期向mrappmaster报告任务进度,所有任务完成后,mrappmaster报告resourceManager释放资源

  如果你想要成为高端实用的技术精英,如果你想要成为就业实力派,那就不要错过千锋。学习大数据开发,可以参考千锋提供的大数据学习路线,提供完整的大数据开发知识体系,内容包含Linux&&Hadoop生态体系、大数据计算框架体系、云计算体系、机器学习&&深度学习。根据千锋提供的大数据学习路线图可以让你对学习大数据需要掌握的知识有个清晰的了解,并快速入门大数据开发。

tags:
声明:本站稿件版权均属千锋教育所有,未经许可不得擅自转载。
10年以上业内强师集结,手把手带你蜕变精英
请您保持通讯畅通,专属学习老师24小时内将与您1V1沟通
免费领取
今日已有369人领取成功
刘同学 138****2860 刚刚成功领取
王同学 131****2015 刚刚成功领取
张同学 133****4652 刚刚成功领取
李同学 135****8607 刚刚成功领取
杨同学 132****5667 刚刚成功领取
岳同学 134****6652 刚刚成功领取
梁同学 157****2950 刚刚成功领取
刘同学 189****1015 刚刚成功领取
张同学 155****4678 刚刚成功领取
邹同学 139****2907 刚刚成功领取
董同学 138****2867 刚刚成功领取
周同学 136****3602 刚刚成功领取
相关推荐HOT
开班信息
北京校区
  • 北京校区
  • 大连校区
  • 广州校区
  • 成都校区
  • 杭州校区
  • 长沙校区
  • 合肥校区
  • 南京校区
  • 上海校区
  • 深圳校区
  • 武汉校区
  • 郑州校区
  • 西安校区
  • 青岛校区
  • 重庆校区
  • 太原校区
  • 沈阳校区
  • 南昌校区
  • 哈尔滨校区