婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Hadoop介紹與安裝配置方法

Hadoop介紹與安裝配置方法

熱門標簽:去哪里辦卡 鄭州中國移動400電話申請 福建ai電銷機器人加盟公司 熱血傳奇沃瑪森林地圖標注 無錫電銷機器人銷售 招聘信息 南召400電話辦理資費 地圖標注審核工作怎么樣注冊 揭陽外呼系統公司 地圖標注植物名稱

 1. HADOOP背景介紹

1.1 什么是HADOOP

1.HADOOP是apache旗下的一套開源軟件平臺
2.HADOOP提供的功能:利用服務器集群,根據用戶的自定義業務邏輯,對海量數據進行分布式處理
3.HADOOP的核心組件有 1.HDFS(分布式文件系統)
2.YARN(運算資源調度系統)
3.MAPREDUCE(分布式運算編程框架)

4.廣義上來說,HADOOP通常是指一個更廣泛的概念——HADOOP生態圈

Hadoop hive hbase flume kafka sqoop spark flink …….

1.2 HADOOP產生背景

1.HADOOP最早起源于Nutch。Nutch的設計目標是構建一個大型的全網搜索引擎,包括網頁抓取、索引、查詢等功能,但隨著抓取網頁數量的增加,遇到了嚴重的可擴展性問題——如何解決數十億網頁的存儲和索引問題。
2.2003年、2004年谷歌發表的兩篇論文為該問題提供了可行的解決方案。

——分布式文件系統(GFS),可用于處理海量網頁的存儲

——分布式計算框架MAPREDUCE,可用于處理海量網頁的索引計算問題。

   3.Nutch的開發人員完成了相應的開源實現HDFS和MAPREDUCE,并從Nutch中剝離成為獨立項目HADOOP,到2008年1月,HADOOP成為Apache頂級項目,迎來了它的快速發展期。

1.3 HADOOP在大數據、云計算中的位置和關系

1.云計算是分布式計算、并行計算、網格計算、多核計算、網絡存儲、虛擬化、負載均衡等傳統計算機技術和互聯網技術融合發展的產物。借助IaaS(基礎設施即服務)、PaaS(平臺即服務)、SaaS(軟件即服務)等業務模式,把強大的計算能力提供給終端用戶。

    2.現階段,云計算的兩大底層支撐技術為“虛擬化”和“大數據技術”

    3.而HADOOP則是云計算的PaaS層的解決方案之一,并不等同于PaaS,更不等同于云計算本身。 

前言

最近想學習下大數據,有點急于求成,于是去網上找了各種培訓機構的視頻,發現大都質量不佳,理論基本不說或者簡單講下,然后教你照貓畫虎的敲代碼,出了問題都沒法分析。最后還是找了廈門大學的公開課從理論開始穩扎穩打的學習了。

一 Hadoop起源

Hadoop的理論起源主要來自谷歌公司的三大論文,并迅速應用于全球各大互聯網公司。因此,學習大數據Hadoop是繞不開的一個知識點。今年來,大數據的興起其實來自于計算機技術的發展,物聯網技術產生了大量的數據,云技術使得計算機存儲與運算資源更加普及,因此大數據技術應運而出,用以解決大量數據的存儲與計算的問題。

二 Hadoop生態圈

學習Hadoop,需要知道Hadoop生態圈中各個項目的功能與作用,為何要用開發這種新項目,而不使用已有項目實現這種功能。

2.1 HDFS

Hadoop的底層文件系統,與傳統文件系統不同在于它是分布式的。同時與已有的分布式文件系統相比,它又有著舊分布式文件系統沒有的優點。如:高可用性,高可靠性,吞吐量大,能使用廉價服務器構建,可通過不斷增加機器數來進行拓展。具體實現在HDFS文章中記錄。

2.2 HBase

構建在HDFS之上的分布式數據庫系統。是一種基于列的NoSQL數據庫,從另一個角度看也能看成鍵值對的NoSQL數據庫。與傳統關系型數據庫相比,最大的優勢在于可通過增加機器進行橫向擴展,并且能使用廉價服務器。

2.3 Hive

一種分布式數據倉庫,可以導入外部數據后用類SQL語言進行操作。一般用于歷史數據的查詢與分析。與HBase不同,HBase常用于實時的交互式查詢。

2.4 MapRuduce

一種分布式計算框架,MapRuce本來就是一種計算模型的名稱。核心思想是“分而治之”,能將計算分解成多個小計算,由多個機器同時計算。適合離線批處理。

2.5 Storm

一種流式計算框架,MapRuce適合批處理,無法完成流式數據的處理,因此開發出流式處理框架。

2.6 常見大數據處理需求

•離線批處理,特點:使用歷史數據,大批量的處理,要求吞吐率。
•實時交互式處理,特點:用戶交互使用,要求反映速度在秒級到數分鐘之間。
•流式數據處理,特點:數據以流的形式輸入,要求毫秒級的處理速度,且處理后的數據大部分都不用儲存。

2.7 Hadoop組件關系

基本的關系就是,底層用HDFS存儲,之上是核心計算框架MapRuduce。而Hive,Hbase,Pig等等組件一般都是將自身的操作轉化成Mapreduce代碼然后通過Mapreduce進行計算實現功能。同時與MapRuduce框架同一層次的Storm解決了流式數據的處理。Hbase雖然是使用Mapreduce框架進行處理,但是基本也能實現實時交互式處理的要求。(也正是Mapreduce存在種種問題,Spark漸漸興起,雖然Mapreduce也做了各種優化,但是在某些領域相比Spark還是有些差距)。

三 Hadoop安裝

1.準備。同一局域網的Linux服務器數臺,我是用我的游戲本同時開了3個虛擬機代替的。

2.Linux里創建hadoop用戶,專門負責Hadoop項目,便于管理與權限劃分。

3.安裝JDK,下載Hadoop時官方會指明JDK版本需求,設置JDK環境變量

4.安裝SSH并設置免密登錄。因為HDFS的NameNode與其他DateNode等節點的通訊與管理就是基于SSH協議的。并且將要使用的機器域名寫入hosts文件,方便命名。

5.去官網下載并解壓Hadoop。修改hadoop配置文件,位于hadoop/etc/hadoop /下面,分別有:

•slaves。寫入DateNode的機器,因為之前修改了域名解析文件,可以直接寫域名,不用寫IP了。
•core-site.xml。Hadoop的核心配置文件

fs.defaultFS,默認文件系統的主機和端口,這里的文件系統就是hdfs。

hadoop.tmp.dir hadoop的臨時文件路徑,不設置則會使用系統臨時文件路徑,系統重啟后就丟失了。

configuration>
    property>
        name>fs.defaultFS/name>
        value>hdfs://Master:9000/value>
    /property>
    property>
        name>hadoop.tmp.dir/name>
        value>file:/usr/local/hadoop/tmp/value>
        description>Abase for other temporary directories./description>
    /property>
/configuration>

•hdfs-site.xml。HDFS的配置文件

dfs.namenode.secondary.http-address。SecondNameNode的機器和端口

dfs.replication。HDFS系統保存的文件副本數。

dfs.namenode.name.dir,dfs.datanode.data.dir。NameNode和DataNode數據在原本文件系統中的存放位置。

configuration>
    property>
        name>dfs.namenode.secondary.http-address/name>
        value>Master:50090/value>
    /property>
    property>
        name>dfs.replication/name>
        value>1/value>
    /property>
    property>
        name>dfs.namenode.name.dir/name>
        value>file:/usr/local/hadoop/tmp/dfs/name/value>
    /property>
    property>
        name>dfs.datanode.data.dir/name>
        value>file:/usr/local/hadoop/tmp/dfs/data/value>
    /property>
/configuration>

•mapred-site.xml。MapReuce的配置文件

mapreduce.framework.name。MapReuce的資源管理系統。這個選yarn,原本是MapReuce自己進行分布式計算時的資源管理,后來發現效率不足便分割開來重新開發了一套框架。

mapreduce.jobhistory.address。MapReuce的任務日志系統,指定機器和端口。

mapreduce.jobhistory.webapp.address。任務日志系統web頁面所使用的機器和端口,通過這個可以在web頁面中查看任務日志系統。

configuration>
    property>
        name>mapreduce.framework.name/name>
        value>yarn/value>
    /property>
    property>
        name>mapreduce.jobhistory.address/name>
        value>Master:10020/value>
    /property>
    property>
        name>mapreduce.jobhistory.webapp.address/name>
        value>Master:19888/value>
    /property>
/configuration>

•yarn-site.xml。YARN的配置文件

yarn.resourcemanager.hostname。YARN的ResourceManager所使用的機器。這個負責進行全局的資源分配,管理。
yarn.nodemanager.aux-services。可以自定義一些服務,比如MapReuce的shuffle就是用這個配置的。目前我們使用填shuffle就行了。

configuration>
    property>
        name>mapreduce.framework.name/name>
        value>yarn/value>
    /property>
    property>
        name>mapreduce.jobhistory.address/name>
        value>Master:10020/value>
    /property>
    property>
        name>mapreduce.jobhistory.webapp.address/name>
        value>Master:19888/value>
    /property>
/configuration>

1.配置好以后將Hadoop文件從主節點復制到各個從節點,Hadoop的HADFS與MapReduce就安裝完成了。(CentOs系統需要關閉相應防火墻)

四 Hadoop生態圈其他組件安裝

看看網友博客和官方文檔差不多就會了,基本一個形式。下載解壓-配置環境變量-配置組件的配置文件,基本都是xxxx-env.sh,xxx-site.sh,xxx-core.sh,slave,work這種,在里面按照需求配置參數就好了,具體參數意思和必須要配置的參數看看官方文檔也就懂了(滑稽)。

總結

以上所述是小編給大家介紹的Hadoop介紹與安裝配置方法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!

您可能感興趣的文章:
  • 詳解Hadoop 運行環境搭建過程
  • hadoop分布式環境搭建過程
  • hadoop基于Linux7的安裝配置圖文詳解
  • Hadoop源碼分析二安裝配置過程詳解

標簽:鹽城 黔南 宣城 文山 景德鎮 東莞 南昌 桂林

巨人網絡通訊聲明:本文標題《Hadoop介紹與安裝配置方法》,本文關鍵詞  Hadoop,介紹,與,安裝,配置,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Hadoop介紹與安裝配置方法》相關的同類信息!
  • 本頁收集關于Hadoop介紹與安裝配置方法的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    91啦中文在线观看| 国产成人综合网| 久久66热re国产| 宅男在线国产精品| 樱花影视一区二区| 色偷偷一区二区三区| 亚洲欧美另类综合偷拍| 91色综合久久久久婷婷| 综合在线观看色| 成人免费视频网站在线观看| 国产色一区二区| 成人av片在线观看| 亚洲精品午夜久久久| 欧美在线短视频| 五月激情综合网| 日韩久久精品一区| 国产高清不卡一区二区| 国产精品免费观看视频| 色综合亚洲欧洲| 午夜久久久久久电影| 欧美一级黄色片| 韩国毛片一区二区三区| 国产精品久久久久一区二区三区共| 91一区二区在线| 肉肉av福利一精品导航| 久久亚洲捆绑美女| 色欧美88888久久久久久影院| 亚洲mv在线观看| 精品人在线二区三区| 高清shemale亚洲人妖| 日韩国产欧美在线视频| 欧美精品777| 国产69精品久久99不卡| 一区二区三区日韩精品| 精品国产污网站| 97精品久久久午夜一区二区三区| 一区二区三国产精华液| 精品久久久久久久人人人人传媒| 99国产精品久久| 麻豆成人在线观看| 亚洲国产激情av| 日韩一区二区电影在线| 91一区二区在线| 国产成人自拍网| 五月天网站亚洲| 国产精品久久久久一区| 日韩欧美激情在线| 欧美在线观看视频一区二区| 国产jizzjizz一区二区| 老司机精品视频在线| 一卡二卡三卡日韩欧美| 国产亚洲欧洲一区高清在线观看| 在线一区二区视频| 毛片基地黄久久久久久天堂| 国产精品你懂的在线欣赏| 日韩精品专区在线| 69久久夜色精品国产69蝌蚪网| 成人免费视频视频| 激情综合五月天| 日韩理论在线观看| 久久精品一区二区三区不卡| 欧美日韩在线播| 99久久久久免费精品国产| 麻豆精品一区二区| 亚洲三级免费电影| 欧美日韩日本视频| 国产欧美日韩中文久久| 国产欧美日韩在线看| 制服.丝袜.亚洲.另类.中文| 精品sm捆绑视频| www.在线成人| 欧美视频三区在线播放| 欧美亚洲综合色| 国产精品视频yy9299一区| 亚洲视频综合在线| 国产成人在线视频网址| 青青草一区二区三区| 亚洲黄一区二区三区| 一区二区三区免费观看| 久久精品国产亚洲高清剧情介绍| 色综合一个色综合亚洲| 91成人免费在线视频| 奇米影视一区二区三区| 成人av资源下载| 国产麻豆一精品一av一免费 | 美腿丝袜一区二区三区| 99九九99九九九视频精品| 这里只有精品视频在线观看| 麻豆精品一区二区三区| 国产日产欧美一区二区视频| 免费一级片91| 自拍偷拍国产亚洲| 日韩国产精品91| 欧美日韩免费一区二区三区视频 | 亚洲色图另类专区| 亚洲国产岛国毛片在线| 欧美日韩亚洲综合在线 | 欧美一区二区三区小说| 亚洲一区二区精品久久av| 91精品国产综合久久久久久漫画| www.欧美日韩国产在线| 国产在线精品免费| 中文字幕精品一区| 欧美精品vⅰdeose4hd| 91偷拍与自偷拍精品| 91麻豆免费在线观看| 99精品视频在线观看| 捆绑变态av一区二区三区| 国产精品白丝av| 精品在线播放免费| 首页亚洲欧美制服丝腿| 日韩电影在线观看网站| 天堂影院一区二区| 亚洲国产日韩在线一区模特| 欧美精品一级二级| 波波电影院一区二区三区| 91美女视频网站| 久久久久久久网| 欧美极品xxx| 国产日韩欧美一区二区三区乱码 | 欧美一级午夜免费电影| av午夜一区麻豆| 韩国精品主播一区二区在线观看 | 91精品国产入口在线| 2022国产精品视频| 欧美乱妇15p| 91网站最新网址| 色婷婷亚洲精品| 91视频.com| 欧美人与z0zoxxxx视频| 日韩美女一区二区三区四区| 日韩欧美一区二区久久婷婷| 日韩精品一区二区三区三区免费| 国产女主播在线一区二区| 国产精品免费人成网站| 久久成人久久爱| 成人免费黄色大片| 欧美精品久久99久久在免费线 | 国产精品免费免费| 国产精品主播直播| 成人性生交大片免费看在线播放 | 91精品国产综合久久久久久漫画| 成人性色生活片免费看爆迷你毛片| 久久99精品久久久久久久久久久久| 日韩精品高清不卡| 午夜精品福利一区二区三区av | 日韩免费看网站| 日本一区二区三区在线观看| 久久久久久**毛片大全| 日韩激情视频在线观看| gogogo免费视频观看亚洲一| 久久久久久久久一| 秋霞成人午夜伦在线观看| 一本一道久久a久久精品| 中文字幕欧美日韩一区| 成人黄色网址在线观看| 中文字幕在线不卡视频| www.日韩大片| 一区二区三区四区在线| 欧美日韩性生活| 免费观看一级特黄欧美大片| 欧美变态口味重另类| 国产成人免费视| **性色生活片久久毛片| 在线视频国内自拍亚洲视频| 夜夜夜精品看看| 7777精品久久久大香线蕉| 久久久久久97三级| 国产成人aaa| 91在线视频网址| 日韩一区和二区| 亚洲gay无套男同| 欧美一级欧美三级| 亚洲欧美一区二区久久| 高清国产一区二区三区| 亚洲午夜羞羞片| 日韩欧美久久一区| 成人免费观看av| 亚洲h动漫在线| 国产日韩精品一区二区三区| 一本一道久久a久久精品| 久久99热狠狠色一区二区| 国产精品福利在线播放| 4438成人网| 成人午夜电影小说| 亚洲一区二区三区激情| 久久久午夜精品| 91久久人澡人人添人人爽欧美| 久久精品免费观看| 精品国产伦理网| 欧美日韩dvd在线观看| 国产一区二区在线影院| 日韩精品一二三| 中文字幕在线观看一区| 欧美精品一区二区三区久久久| 欧美三区在线视频| 成人激情图片网| 国产精品自拍av| 五月激情综合婷婷| 中文字幕亚洲电影|