婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁(yè) > 知識(shí)庫(kù) > hadoop map-reduce中的文件并發(fā)操作

hadoop map-reduce中的文件并發(fā)操作

熱門標(biāo)簽:合肥crm外呼系統(tǒng)加盟 電話機(jī)器人怎么看余額 城市地圖標(biāo)志怎么標(biāo)注 西安電話自動(dòng)外呼系統(tǒng) 怎么修改高德地圖標(biāo)注 漯河電銷回?fù)芡夂粝到y(tǒng) 硅基電話機(jī)器人官網(wǎng) 長(zhǎng)沙外呼系統(tǒng)平臺(tái) 美國(guó)地圖標(biāo)注軟件下載

這樣的操作在map端或者reduce端均可。下面以一個(gè)實(shí)際業(yè)務(wù)場(chǎng)景中的例子來簡(jiǎn)要說明。

問題簡(jiǎn)要描述:

假如reduce輸入的key是Text(String),value是BytesWritable(byte[]),不同key的種類為100萬個(gè),value的大小平均為30k左右,每個(gè)key大概對(duì)應(yīng) 100個(gè)value,要求對(duì)每一個(gè)key建立兩個(gè)文件,一個(gè)用來不斷添加value中的二進(jìn)制數(shù)據(jù),一個(gè)用來記錄各個(gè)value在文件中的位置索引。(大量的小文件會(huì)影響HDFS的性能,所以最好對(duì)這些小文件進(jìn)行拼接)

當(dāng)文件數(shù)量較小時(shí),可以考慮使用MultipleOutput來進(jìn)行key-value的分流,可以按照key的不同,將其輸出到不同的文件或者目錄中。但是reduce的數(shù)量只能為1,不然每個(gè)reduce都會(huì)生成相同的目錄或者文件,不能達(dá)到最終的目的。此外最重要的是,操作系統(tǒng)對(duì)每個(gè)進(jìn)程打開的文件數(shù)量的限制,默認(rèn)為1024,集群的各個(gè)datanode可能會(huì)配置更高的值,但最多在幾萬左右,仍然是一個(gè)限制因素。不能滿足百萬文件的需求。

reduce的主要目的是用來歸并key-value并輸出到HDFS上,我們當(dāng)然也可以在reduce中進(jìn)行其他的操作,比如文件讀寫。因?yàn)槟J(rèn)的partitioner保證同一個(gè)key的數(shù)據(jù)肯定會(huì)在同一個(gè)reduce中,所以在每個(gè)reduce中只用打開兩個(gè)文件進(jìn)行讀寫即可(一個(gè)索引文件,一個(gè)數(shù)據(jù)文件)。并發(fā)度由reduce數(shù)量決定,將reduce數(shù)量設(shè)為256,那我們就可以同時(shí)處理256個(gè)key的數(shù)據(jù)(partioner保證了不同reduce處理的key不同,不會(huì)引起文件讀寫沖突)。這樣的并發(fā)度的效率是很客觀的,可以在較短的時(shí)間內(nèi)完成需求。

思路是這樣,但同時(shí)由于hdfs的特性以及hadoop的任務(wù)調(diào)度,在文件讀寫過程中,仍有可能會(huì)出現(xiàn)很多問題,下面簡(jiǎn)要說些一些常見的會(huì)碰到的問題。

1.org.apache.hadoop.hdfs.protocol.AlreadyBeingCreatedException異常

這可能是最經(jīng)常碰到的一個(gè)問題。可能的原因如下:

(1)文件流沖突。

一般創(chuàng)建文件時(shí)都會(huì)打開一個(gè)供寫入的文件流。而我們希望是追加,所以如果使用了錯(cuò)誤的API ,就有可能引起上述問題。以FileSystem類為例,如果使用create()方法之后再調(diào)用append()方法,就會(huì)拋出上述異常。所以最好使用createNewFile方法,只創(chuàng)建文件,不打開流。

(2)mapreduce推測(cè)執(zhí)行機(jī)制

mapreduce 為了提高效率,會(huì)在一個(gè)任務(wù)啟動(dòng)之后,同時(shí)啟動(dòng)一些相同的任務(wù)(attempt),其中有一個(gè)attempt成功完成之后,視為整個(gè)task完成,其結(jié)果 作為最終結(jié)果,并且殺掉那些較慢的attempt。集群一般會(huì)開啟此選項(xiàng)以優(yōu)化性能(以空間換時(shí)間)。但在本問題環(huán)境下推測(cè)執(zhí)行卻不太合適。因?yàn)槲覀円话阆M粋€(gè)task 用來處理一個(gè)文件,但如果啟動(dòng)推測(cè)執(zhí)行,會(huì)有幾個(gè)attempt同時(shí)試圖操作同一個(gè)文件,就會(huì)引發(fā)異常。所以最好關(guān)掉此選項(xiàng),將 mapred.reduce.max.attempts 設(shè)為1,或者將mapred.reduce.tasks.speculative.execution設(shè)為false.

但此時(shí)仍有可能會(huì)出現(xiàn)問題。因?yàn)槿绻粋€(gè)task的唯一attempt出現(xiàn)問題,在被kill掉之后,task仍會(huì)另起一個(gè)attempt,此時(shí)因?yàn)榍耙粋€(gè)attempt異常終止,仍有可能會(huì)影響到新起的attempt的文件操作,引發(fā)異常。所以最安全的方法是,借鑒推測(cè)執(zhí)行的機(jī)制(每個(gè)attempt各自生成自己的結(jié)果,最終選擇一個(gè)作為最終結(jié)果),以每個(gè)attempt的id號(hào)為后綴附加到所操作的文件上,同時(shí)捕獲所有文件操作的異常并處理,這樣可避免文件的讀寫沖突。Context可以用來獲取運(yùn)行時(shí)的一些上下文信息,可以很容易得到attempt的id號(hào)。注意,此時(shí)如果開啟推測(cè)執(zhí)行也可以,但是會(huì)生成很多相同的文件(每個(gè)attempt一份),仍然不是最好的解決方法。

同時(shí),我們可以利用reduce的輸出來記錄運(yùn)行“不正常的” key.這些task大多數(shù)是attempt_0被殺掉而重啟了一個(gè)attempt_1,所以下面的文件一般為兩份。可以對(duì)這些情況的key輸出(文件異常或者attemptID > 0),并進(jìn)行一些后續(xù)處理,比如文件重命名,或者緊對(duì)這些key重新寫入。因?yàn)榇朔N情況的key一般只占極少數(shù),所以并不影響總體的效率。

2.文件異常處理

最好能將mapreduce中的所有文件操作都設(shè)置好異常處理。不然一個(gè)文件異常就有可能會(huì)使整個(gè)job失敗。所以從效率來講,最好是在文件發(fā)生異常時(shí)將其key作為reduce的輸出以進(jìn)行記錄。因?yàn)橥瑫r(shí)mapreduce會(huì)重啟一個(gè)task attempts重新進(jìn)行文件讀寫,可保證我們得到最終的數(shù)據(jù),最后所需的只是對(duì)那些異常的key進(jìn)行一些簡(jiǎn)單的文件重命名操作即可。

3.多目錄以及文件拼接

如果我們將key的種類設(shè)為1000萬,上述方法會(huì)生成太多的小文件從而影響hdfs的性能,另外,因?yàn)樗形募荚谕粋€(gè)目錄下,會(huì)導(dǎo)致同一個(gè)目錄下文件數(shù)目過多而影響訪問效率。

在創(chuàng)建文件的同時(shí)建立多個(gè)子目錄,一個(gè)有用的方法是以reduce的taskid來建立子目錄。這樣有多少個(gè)reduce就可以建立多少個(gè)子目錄,不會(huì)有文件沖突。同一個(gè)reduce處理的key都會(huì)在同一個(gè)目錄下。

文件拼接要考慮的一個(gè)索引的問題。為了將文件索引建立的盡量簡(jiǎn)單,應(yīng)該盡量保證同一個(gè)key的所有數(shù)據(jù)都在同一個(gè)大文件中。這可以利用key的hashCode來實(shí)現(xiàn)。如果我們想在每個(gè)目錄下建立1000個(gè)文件,只需將hashCode對(duì)1000取余即可。

您可能感興趣的文章:
  • Hadoop2.X/YARN環(huán)境搭建--CentOS7.0系統(tǒng)配置
  • 用python + hadoop streaming 分布式編程(一) -- 原理介紹,樣例程序與本地調(diào)試
  • Hadoop1.2中配置偽分布式的實(shí)例
  • 用PHP和Shell寫Hadoop的MapReduce程序
  • hadoop實(shí)現(xiàn)grep示例分享
  • hadoop的hdfs文件操作實(shí)現(xiàn)上傳文件到hdfs
  • Hadoop單機(jī)版和全分布式(集群)安裝
  • hadoop中一些常用的命令介紹
  • hadoop是什么語(yǔ)言

標(biāo)簽:撫順 吉林 瀘州 商洛 廣西 玉溪 濟(jì)源 文山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《hadoop map-reduce中的文件并發(fā)操作》,本文關(guān)鍵詞  hadoop,map-reduce,中的,文件,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《hadoop map-reduce中的文件并發(fā)操作》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于hadoop map-reduce中的文件并發(fā)操作的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    欧美亚洲精品一区| 国产视频一区在线观看| 偷拍亚洲欧洲综合| 欧美精品三级在线观看| 欧美一区二区三区性视频| 日韩三级伦理片妻子的秘密按摩| 欧美日韩三级视频| 99国产精品国产精品毛片| 99国产麻豆精品| 高清视频一区二区| 色综合色狠狠天天综合色| 欧美影片第一页| 7777精品伊人久久久大香线蕉| 精品国产乱码久久久久久图片| 国产欧美一区二区三区在线老狼| 粉嫩欧美一区二区三区高清影视 | 色综合网色综合| 欧美一区二区在线播放| 国产精品美女一区二区三区| 香蕉加勒比综合久久| www.欧美日韩| 亚洲国产精品av| 韩国欧美国产1区| 日韩欧美亚洲另类制服综合在线| 久久99最新地址| 色婷婷综合中文久久一本| 国产精品免费av| 日韩av中文字幕一区二区三区| 欧美日韩五月天| 91精品国产美女浴室洗澡无遮挡| 国产不卡在线一区| 欧美日韩和欧美的一区二区| 亚洲欧洲精品一区二区三区| 成人在线视频一区二区| 日韩欧美一区二区在线视频| 亚洲bdsm女犯bdsm网站| 色综合久久天天| 亚洲欧洲色图综合| 91麻豆高清视频| 一区二区中文视频| 91丨porny丨户外露出| 久久久久久久久久久久久久久99| 亚洲一级二级在线| 婷婷开心激情综合| 欧美体内she精视频| 日韩毛片高清在线播放| 国产精品网友自拍| 青青国产91久久久久久 | 欧美日韩视频第一区| 欧美日韩电影在线| 国产精品伦一区二区三级视频| 欧美精选午夜久久久乱码6080| 美腿丝袜亚洲色图| 欧美欧美午夜aⅴ在线观看| 久久国产剧场电影| 国产女人18水真多18精品一级做 | 欧美国产综合一区二区| 国产精品国产自产拍高清av王其| 日韩一级视频免费观看在线| 另类欧美日韩国产在线| 日本精品裸体写真集在线观看| 欧美日韩电影一区| 麻豆传媒一区二区三区| 国产亚洲精品7777| 成人午夜激情在线| 夜夜操天天操亚洲| 欧美美女激情18p| 日本美女视频一区二区| 精品国产污污免费网站入口| 丁香啪啪综合成人亚洲小说| 久久97超碰国产精品超碰| 欧美极品美女视频| 欧洲精品视频在线观看| 日日夜夜免费精品视频| 国产精品久久久久久久久果冻传媒| 一区二区三区丝袜| 91精品国产综合久久久蜜臀粉嫩 | 午夜精品久久久久久久久久| 欧美大片一区二区| 色综合久久久久久久久久久| 婷婷丁香激情综合| 国产精品国产精品国产专区不片 | 国产成人aaaa| 2020国产成人综合网| 国产精品一区二区黑丝| 亚洲视频综合在线| 精品国产不卡一区二区三区| 欧美网站一区二区| 99久久久精品免费观看国产蜜| xf在线a精品一区二区视频网站| 美日韩一级片在线观看| 亚洲国产一区二区a毛片| 国产精品久久一卡二卡| 国产精品免费网站在线观看| 国产视频一区在线观看| 日韩精品一区二区三区四区| 91超碰这里只有精品国产| 久久一日本道色综合| 欧美日韩国产另类不卡| 91网站在线播放| 亚洲靠逼com| 国产日韩欧美精品综合| 欧美亚洲高清一区二区三区不卡| 久久久亚洲精华液精华液精华液| 精品一区二区国语对白| 亚洲成精国产精品女| 亚洲五月六月丁香激情| 91精品国产综合久久蜜臀| 欧美亚洲综合一区| 国产成人在线视频网站| 亚洲一区二区三区国产| 成人国产视频在线观看 | 午夜精品久久久久久久99樱桃| 精品一区二区综合| 亚洲欧美日本韩国| 欧美国产一区在线| 一区二区三区久久| 亚洲成人www| 狠狠色综合色综合网络| 91丨九色porny丨蝌蚪| 69堂亚洲精品首页| 久久综合久色欧美综合狠狠| ...中文天堂在线一区| 日本少妇一区二区| 国产美女精品一区二区三区| 色综合色综合色综合色综合色综合 | 91亚洲精华国产精华精华液| 日韩欧美国产1| 91精品国产黑色紧身裤美女| 久久久国际精品| 国产精品国产成人国产三级| 午夜伦理一区二区| a4yy欧美一区二区三区| 日韩一级完整毛片| 亚洲一二三区在线观看| 国产91精品在线观看| 91麻豆精品国产91久久久资源速度| 亚洲一区二区三区中文字幕| 成人精品小蝌蚪| 国产成人免费在线| 精品在线免费视频| 97精品久久久午夜一区二区三区 | 91精品在线免费| 亚洲欧美另类图片小说| 青青国产91久久久久久| 欧美丰满高潮xxxx喷水动漫| 成人免费一区二区三区在线观看| 国产精品一区在线观看乱码| 欧美日韩久久久| 国产精品女主播av| 亚洲欧美日韩国产另类专区| 国产91精品露脸国语对白| 99视频有精品| 欧美日韩精品是欧美日韩精品| 亚洲aⅴ怡春院| 欧美美女激情18p| 日欧美一区二区| 欧美久久久一区| 视频一区二区欧美| 4hu四虎永久在线影院成人| 亚洲最大成人综合| 欧美视频一区在线| 肉肉av福利一精品导航| 欧美成人vps| 成人高清免费观看| 中文字幕免费观看一区| 成人avav影音| 一区二区三国产精华液| 三级成人在线视频| 欧美日韩国产bt| 日韩精品福利网| 91精品国产综合久久久久久漫画 | 一区二区久久久久久| 欧美人与禽zozo性伦| 国产资源精品在线观看| 久久精品一区四区| 在线中文字幕一区二区| 久久国产乱子精品免费女| 国产日韩欧美精品综合| 精品视频一区二区不卡| 国产乱子伦一区二区三区国色天香| 欧美极品少妇xxxxⅹ高跟鞋| 欧美日韩一区二区在线观看| 日日夜夜免费精品视频| 久久女同性恋中文字幕| 色播五月激情综合网| 久久99久国产精品黄毛片色诱| 日韩精品一区二| aaa国产一区| 韩国女主播成人在线| 亚洲欧美视频在线观看视频| 日韩美女视频在线| 一本在线高清不卡dvd| 美国毛片一区二区| 成人欧美一区二区三区视频网页| 欧美一区二区三区在线观看| av一本久道久久综合久久鬼色| 日本va欧美va精品发布| 洋洋成人永久网站入口| 中文字幕一区三区|