婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 剖析阿里巴巴的云梯YARN集群技術使用

剖析阿里巴巴的云梯YARN集群技術使用

熱門標簽:百度地圖標注不能編輯 勝威電話外呼系統密碼 徐州穩定外呼系統代理商 廣安電銷外呼系統 威海語音外呼系統廠家 搜地圖標注怎么找店鋪 百度高德騰訊地圖標注公司 個人家庭地圖標注教程 七臺河商家地圖標注注冊

阿里巴巴作為國內使用Hadoop最早的公司之一,已開啟了Apache Hadoop 2.0時代。阿里巴巴的Hadoop集群,即云梯集群,分為存儲與計算兩個模塊,計算模塊既有MRv1,也有YARN集群,它們共享一個存儲HDFS集 群。云梯YARN集群上既支持MapReduce,也支持Spark、MPI、RHive、RHadoop等計算模型。本文將詳細介紹云梯YARN集群的 技術實現與發展狀況。

MRv1與YARN集群共享HDFS存儲的技術實現

以服務化為起點,云梯集群已將Hadoop分為存儲(HDFS)服務與計算(MRv1和YARN)服務。兩個計算集群共享著這個HDFS存儲集群,這是怎么做到的呢?

在引入YARN之前,云梯的Hadoop是一個基于Apache Hadoop 0.19.1-dc版本,并增加許多新功能的版本。另外還兼容了Apache Hadoop 0.19、0.20、CDH3版本的客戶端。為了保持對客戶端友好,云梯服務端升級總會保持對原有客戶端的兼容性。另外,為了訪問數據的便捷性,阿里的存 儲集群是一個單一的大集群,引入YARN不應迫使HDFS集群拆分,但YARN是基于社區0.23系列版本,它無法直接訪問云梯HDFS集群。因此實現 YARN集群訪問云梯的HDFS集群是引入YARN后第一個需要解決的技術問題。

Hadoop代碼主要分為Common、HDFS、Mapred三個包。

Common部分包括公共類,如I/O、通信等類。
HDFS部分包括HDFS相關類,依賴Common包。
Mapred部分包括MapReduce相關代碼,依賴Common包和HDFS包。
為了盡量減少對云梯HDFS的修改,開發人員主要做了以下工作。

使用云梯的HDFS客戶端代碼替換0.23中HDFS,形成新的HDFS包。
對0.23新的HDFS包做了少量的修改使其可以運行在0.23的Common包上。
對0.23新的HDFS包做了少量修改使0.23的Mapred包能運行在新的HDFS包。
對云梯的Common包的通信部分做了hack,使其兼容0.23的Common。

圖1 云梯Hadoop代碼架構

新的云梯代碼結構如圖1所示,相應闡述如下。

服務端

存儲部分使用原有的HDFS。
MRv1計算集群中提供原MRv1服務。
YARN集群提供更豐富的應用服務。
客戶端

云梯現有的客戶端不做任何修改,繼續使用原有的服務。
使用YARN的服務需要使用新客戶端。
云梯MR服務切換為YARN要經過三個階段

服務端只有MRv1, 客戶端只有老版本客戶端。
服務端MRv1和YARN共存(MRv1資源逐漸轉移到YARN上), 客戶端若需使用MRv1服務則保持客戶端不變;若需使用YARN服務則需使用新版客戶端。
服務端只剩下YARN,客戶端只有新版本客戶端。
通過上述修改,云梯開發人員以較小的修改實現了YARN對云梯HDFS的訪問。

Spark on YARN的實現

云梯版YARN集群已實現對MRv2、Hive、Spark、MPI、RHive、RHadoop等應用的支持。云梯集群當前結構如圖2所示。

圖2 云梯架構圖

其中,Spark已成為YARN集群上除MapReduce應用外另一個重要的應用。

Spark是一個分布式數據快速分析項目。它的核心技術是彈性分布式數據集(Resilient Distributed Datasets),提供了比MapReduce豐富的模型,可以快速在內存中對數據集進行多次迭代,來支持復雜的數據挖掘算法和圖形計算算法。

Spark 的計算調度方式,從Mesos到Standalone,即自建Spark計算集群。雖然Standalone方式性能與穩定性都得到了提升,但自建集群畢 竟資源較少,并需要從云梯集群復制數據,不能滿足數據挖掘與計算團隊業務需求。而Spark on YARN能讓Spark計算模型在云梯YARN集群上運行,直接讀取云梯上的數據,并充分享受云梯YARN集群豐富的計算資源。

Spark on YARN功能理論上從Spark 0.6.0版本開始支持,但實際上還遠未成熟,經過數據挖掘與計算團隊長時間的壓力測試,修復了一些相對關鍵的Bug,保證Spark on YARN的穩定性和正確性。

圖3展示了Spark on YARN的作業執行機制。

圖3 Spark on YARN框架

基于YARN的Spark作業首先由客戶端生成作業信息,提交給ResourceManager,ResourceManager在某一 NodeManager匯報時把AppMaster分配給NodeManager,NodeManager啟動 SparkAppMaster,SparkAppMaster啟動后初始化作業,然后向ResourceManager申請資源,申請到相應資源后 SparkAppMaster通過RPC讓NodeManager啟動相應的SparkExecutor,SparkExecutor向 SparkAppMaster匯報并完成相應的任務。此外,SparkClient會通過AppMaster獲取作業運行狀態。

目前,數據挖掘與計算團隊通過Spark on YARN已實現MLR、PageRank和JMeans算法,其中MLR已作為生產作業運行。

云梯YARN集群維護經驗分享

云梯YARN的維護過程中遇到許多問題,這些問題在維護YARN集群中很有可能會遇到,這里分享兩個較典型的問題與其解決方法。

問題1
問題描述:社區的CPU隔離與調度功能,需要在每個NodeManager所在的機器創建用戶賬戶對應的Linux賬戶。但阿里云梯集群有5000多個賬 戶,是否需要在每個NodeManager機器創建這么多Linux賬戶;另外每次創建或刪除一個Hadoop用戶,也應該在每臺NodeManager 機器上創建或刪除相應的Linux賬戶,這將大大增加運維的負擔。

問題分析:我們發現,CPU的隔離是不依賴于Linux賬戶的,意味著即 使同一個賬戶創建兩個進程,也可通過Cgroup進行CPU隔離,但為什么社區要在每臺NodeManager機器上創建賬戶呢?原來這是為了讓每個 Container都以提交Application的賬戶執行,防止Container所屬的Linux賬戶權限過大,保證安全。但云梯集群很早前就已分 賬戶,啟動Container的Linux賬戶統一為一個普通賬戶,此賬戶權限較小,并且用戶都為公司內部員工,安全性已能滿足需求。

解決方案:通過修改container-executor.c文件,防止其修改Container的啟動賬戶,并使用一個統一的普通Linux賬戶(無sudo權限)運行Container。這既能保證安全,又能減少運維的工作量。

問題2
問題描述:MRApplicationMaster初始化慢,某些作業的MRApplicationMaster啟動耗時超過一分鐘。

問 題分析:通過檢查MRApplication-Master的日志,發現一分鐘的初始化時間都消耗在解析Rack上。從代碼上分 析,MRApplicationMaster啟動時需要初始化TaskAttempt,這時需要解析split信息中的Host,生成對應的Rack信 息。云梯當前解析Host的方法是通過調用外部一個Python腳本解析,每次調用需要20ms左右,而由于云梯HDFS集群非常大,有4500多臺機 器,假如輸入數據分布在每個Datanode上,則解析Host需要花費4500×20ms=90s;如果一個作業的輸入數據較大,且文件的備份數為3, 那么輸入數據將很有可能分布在集群的大多Datanode上。

解決方案:開發人員通過在Node-Manager上增加一個配置文件,包含所有Datanode的Rack信息,MRApp-licationMaster啟動后加載此文件,防止頻繁調用外部腳本解析。這大大加快了MRApplicationMaster的初始化速度。

此外,云梯開發人員還解決了一些會使ResourceManager不工作的Bug,并貢獻給Apache Hadoop社區。

在搭建與維護云梯YARN集群期間,云梯開發人員遇到并解決了許多問題,分析和解決這些問題首先需要熟悉代碼,但代碼量巨大,我們如何能快速熟悉它們呢?這 需要團隊的配合,團隊中每個人負責不同模塊,閱讀后輪流分享,這能加快代碼熟悉速度。另外,Hadoop的優勢在于可以利用社區的力量,當遇到一個問題 時,首先可以到社區尋找答案,因為很多問題在社區已得到了解決,充分利用社區,可以大大提高工作效率。

云梯YARN集群的優勢與未來之路

當前云梯YARN集群已經試運行,并有MRv2、Hive、Spark、RHive和RHadoop等應用。云梯YARN集群的優勢在于:

支持更豐富的計算模型;
共享云梯最大的存儲集群,訪問便捷、快速;
AppHistory信息存儲在HDFS上,各種應用的作業歷史都能方便查看;
相對于MRv1集群,云梯YARN能支持更大規模的集群;
 相對于MRv1集群,云梯YARN集群支持內存和CPU調度,資源利用將更加合理。
未來,云梯將會把大多業務遷移到云梯YARN集群。針對YARN版本,云梯將增加資源隔離與調度,增加對Storm、Tez等計算模型的支持,并優化YARN的性能。

標簽:三明 滁州 威海 吳忠 臨沂 婁底 昭通 云浮

巨人網絡通訊聲明:本文標題《剖析阿里巴巴的云梯YARN集群技術使用》,本文關鍵詞  剖析,阿里巴巴,的,云梯,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《剖析阿里巴巴的云梯YARN集群技術使用》相關的同類信息!
  • 本頁收集關于剖析阿里巴巴的云梯YARN集群技術使用的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    美女视频黄a大片欧美| 亚洲va天堂va国产va久| 亚洲欧美一区二区在线观看| 开心九九激情九九欧美日韩精美视频电影| 欧美色倩网站大全免费| 一级日本不卡的影视| 欧美性猛交xxxx乱大交退制版| 亚洲免费av在线| 一本色道久久综合精品竹菊| 亚洲人成亚洲人成在线观看图片| 在线看国产一区二区| 日韩中文字幕一区二区三区| 欧美本精品男人aⅴ天堂| 国产成人综合在线观看| 亚洲欧洲日产国码二区| 色94色欧美sute亚洲13| 日韩精品免费专区| 精品电影一区二区三区| 懂色av中文字幕一区二区三区| 欧美国产乱子伦| 欧美视频一区二区三区四区| 久久精品国产色蜜蜜麻豆| 国产精品久久看| 欧美日韩国产免费| 国产宾馆实践打屁股91| 亚洲国产精品影院| 26uuu国产一区二区三区| 一本色道久久综合精品竹菊| 激情偷乱视频一区二区三区| 一区二区三区四区激情| 国产色产综合产在线视频| 欧美美女bb生活片| 成人va在线观看| 理论片日本一区| 亚洲精品视频自拍| 久久色中文字幕| 7777精品伊人久久久大香线蕉的| 精品视频全国免费看| 国产一区二区精品在线观看| 香蕉乱码成人久久天堂爱免费| 国产日韩欧美一区二区三区综合| 欧美日韩国产高清一区二区三区| 成人综合激情网| 久久成人久久爱| 日韩二区三区四区| 一级女性全黄久久生活片免费| 国产清纯白嫩初高生在线观看91 | 国产精一区二区三区| 国产精品网站一区| 日韩欧美成人午夜| 欧美日韩激情在线| 91在线一区二区| 床上的激情91.| 国产精品一区在线观看你懂的| 日韩精品一二区| 五月天婷婷综合| 亚洲国产一区二区三区| 国产精品福利一区| 国产精品丝袜久久久久久app| 日韩视频免费直播| 欧美电影在线免费观看| 欧美色图片你懂的| 色94色欧美sute亚洲13| 91片黄在线观看| 欧美主播一区二区三区美女| 在线观看区一区二| 欧美日韩成人综合天天影院| 欧美人成免费网站| 欧美一区二区三区视频| 日韩欧美区一区二| 欧美精品一区二区在线播放| 青青草国产精品亚洲专区无| 欧美激情一区三区| 亚洲激情图片小说视频| 欧美另类高清zo欧美| 在线亚洲一区观看| 欧美中文字幕亚洲一区二区va在线| 日本精品一级二级| 色综合一个色综合亚洲| 色综合久久久久综合体桃花网| av电影在线不卡| 欧美系列一区二区| 欧美一区二区在线免费播放| 日韩欧美综合一区| 国产欧美日产一区| 亚洲人亚洲人成电影网站色| 午夜精品久久久久久久| 精品一区二区三区在线观看| 成人午夜视频福利| 日韩一级二级三级精品视频| 奇米精品一区二区三区在线观看| 亚洲午夜精品在线| 久久国产尿小便嘘嘘尿| 国产一区二区三区在线观看免费视频| 成人免费视频免费观看| 欧美日韩在线三级| 欧美国产视频在线| 五月天中文字幕一区二区| 成人午夜激情片| 91精品国产91久久久久久一区二区| 久久久精品tv| 亚洲一区二区av在线| 国产一区二区三区高清播放| 在线日韩国产精品| 国产亚洲精品久| 亚洲一区精品在线| 成人免费福利片| 欧美日韩国产区一| 日韩美女视频19| 久久精品亚洲精品国产欧美kt∨| 一区二区三区视频在线看| 欧美第一区第二区| 国产高清成人在线| 色欧美日韩亚洲| 久久免费国产精品| 午夜精品免费在线观看| 国产sm精品调教视频网站| 精品视频一区 二区 三区| 亚洲欧洲另类国产综合| 久久99久久精品| 欧美日韩电影在线| 亚洲在线中文字幕| 99r国产精品| 中文字幕不卡在线| 国产精品羞羞答答xxdd| 欧美一级二级三级蜜桃| 亚洲国产日韩精品| 在线视频中文字幕一区二区| 国产欧美精品一区二区三区四区 | 日韩一区二区在线观看视频| 精品久久久久久久久久久久久久久久久| 日韩一区欧美小说| 成人精品在线视频观看| 久久久久久97三级| 国产一区二区精品久久91| 日韩亚洲欧美在线观看| 日韩成人av影视| 日韩一区二区免费在线观看| 亚洲成人免费电影| 7777精品伊人久久久大香线蕉的| 亚洲一区国产视频| 欧美日韩三级视频| 亚洲激情图片一区| 欧美日韩高清一区二区不卡| 高清在线不卡av| 久久综合九色欧美综合狠狠| 看电视剧不卡顿的网站| 亚洲精品一区二区三区影院 | 一区二区三区中文在线| eeuss鲁片一区二区三区在线看| 久久久久久亚洲综合| 国产成人av影院| 中文字幕佐山爱一区二区免费| 91美女精品福利| 丝袜脚交一区二区| 久久蜜桃一区二区| 成+人+亚洲+综合天堂| 成人免费在线观看入口| 色系网站成人免费| 日韩高清国产一区在线| www国产精品av| 99精品欧美一区二区三区综合在线| 怡红院av一区二区三区| 精品日本一线二线三线不卡| 成人免费视频caoporn| 亚洲福利视频一区| 久久女同性恋中文字幕| 91论坛在线播放| 激情另类小说区图片区视频区| 亚洲天堂免费在线观看视频| 欧美欧美午夜aⅴ在线观看| 国产一区二区主播在线| 亚洲久草在线视频| 欧美一区二区三区免费观看视频| 国产99久久久国产精品| 亚洲一区二区美女| 国产亚洲欧美色| 正在播放一区二区| 99久久国产综合精品麻豆| 久久福利资源站| 亚洲夂夂婷婷色拍ww47| 国产精品欧美极品| 欧美一区二区三区性视频| 97se狠狠狠综合亚洲狠狠| 精品一区二区三区在线观看| 亚洲成av人片在线| 亚洲欧美日韩精品久久久久| 久久精品亚洲精品国产欧美 | 国产视频一区在线播放| 在线观看91av| 色婷婷亚洲综合| 国产精品456| 麻豆国产欧美一区二区三区| 亚洲高清一区二区三区| 亚洲人xxxx| 国产精品视频免费| 国产三级欧美三级日产三级99| 51精品国自产在线| 91久久精品日日躁夜夜躁欧美| 99久久久免费精品国产一区二区|