99国产精品99久久久久久,国产婷婷色一区二区三区在线,√在线天堂中文最新版网,噜噜色综合天天综合网mp3,国产精品亚洲综合一区二区三区

域名綜合信息查詢...
  • 綜合
  • Whois
×
歷史記錄
首頁 > 常見問題 > 正文

什么是hadoop?

發(fā)布時間:2023-06-08 14:43:49 來源:互聯(lián)網(wǎng) 作者:h 點擊量:1890

  所謂Hadoop其實就是Apache開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu),主要解決海量數(shù)據(jù)存儲與計算的問題,是大數(shù)據(jù)技術(shù)中的基石。Hadoop以一種可靠、高效、可伸縮的方式進(jìn)行數(shù)據(jù)處理,主要特點如下:

  1、海量數(shù)據(jù)存儲

  HDFS有高容錯性的特點,并且設(shè)計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(High throughput)來訪問數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應(yīng)用程序,它由n臺運行著DataNode的機器組成和1臺(另外一個standby)運行NameNode進(jìn)程一起構(gòu)成。每個DataNode 管理一部分?jǐn)?shù)據(jù),然后NameNode負(fù)責(zé)管理整個HDFS 集群的信息(存儲元數(shù)據(jù))。

  2、資源管理,調(diào)度和分配

  Apache Hadoop YARN(Yet Another Resource Negotiator,另一種資源協(xié)調(diào)者)是一種新的 Hadoop 資源管理器,它是一個通用資源管理系統(tǒng)和調(diào)度平臺,可為上層應(yīng)用提供統(tǒng) 一的資源管理和調(diào)度,它的引入為集群在利用率、資源統(tǒng)一管理和數(shù)據(jù)共享等方面帶來了巨大好處。

  3、并行數(shù)據(jù)處理

  MapReduce算法要求你可以并行化你的數(shù)據(jù)處理。MapReduce在變量逐個處理的情況下工作得很好(例如,計數(shù)或聚合);但是,當(dāng)您需要共同處理變量(例如,變量之間有許多相關(guān)性)時,此模型不起作用。

  任何基于圖形的數(shù)據(jù)處理(意味著依賴于其他數(shù)據(jù)的復(fù)雜數(shù)據(jù)網(wǎng)絡(luò))都不適合Hadoop的標(biāo)準(zhǔn)方法。話雖如此,相關(guān)的Apache Tez框架確實允許使用基于圖形的方法來處理數(shù)據(jù),而不是更線性的MapReduce工作流程。

  以上就是什么是hadoop?的內(nèi)容。

域名注冊價格:http://www.lenghan.cn/regym.htm?t=seo_adzcw
域名一口價交易:http://www.lenghan.cn/ykj/?t=seo_admm
過期域名查詢:http://www.lenghan.cn/gq/?t=seo_adqz
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享網(wǎng)絡(luò)內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:400-997-2996;郵箱:service@Juming.com。本站原創(chuàng)內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明出處:聚名網(wǎng) 什么是hadoop?
關(guān)鍵詞: hadoop
熱門競價 更多>
推薦一口價 更多>
常見問題相關(guān)文章

登錄聚名,您可以享受以下權(quán)益:

立即登錄/注冊