Hadoop與Spark大數(shù)據(jù)架構(gòu)

  •  
    •  課程目標(biāo)

      首先介紹了大數(shù)據(jù)架構(gòu)的總體內(nèi)容,并分別詳細(xì)講解了Hadhoop與Spark兩套架構(gòu),深入講解了主流的三大類(lèi)大數(shù)據(jù)計(jì)算框架,分別是批處理、交互式計(jì)算和流式計(jì)算框架,并選取當(dāng)下主流的開(kāi)源實(shí)現(xiàn)進(jìn)行介紹。課程最后對(duì)Mahout與MLlib這兩個(gè)主流的分布式數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)庫(kù)進(jìn)行了實(shí)現(xiàn)以及應(yīng)用案例講解。

    •  師資團(tuán)隊(duì)

    • 華清創(chuàng)客企業(yè)內(nèi)訓(xùn)講師,均是來(lái)自各個(gè)領(lǐng)域的資深專(zhuān)家,均擁有6年以上大型項(xiàng)目經(jīng)驗(yàn)。

    •  培養(yǎng)對(duì)象

      1、學(xué)員學(xué)習(xí)本課程應(yīng)具備基礎(chǔ)知識(shí):了解Java語(yǔ)言、Linux系統(tǒng);
      2、適用于各類(lèi)IT/軟件企業(yè)和研發(fā)機(jī)構(gòu)的軟件架構(gòu)師、軟件設(shè)計(jì)師、程序員。對(duì)于懷有設(shè)計(jì)疑問(wèn)和問(wèn)題,需要梳理解答的團(tuán)隊(duì)和個(gè)人,效果最佳。

    •  培訓(xùn)方式

    第一種:華清創(chuàng)客講師面授
    課時(shí):共2天,每天6學(xué)時(shí),總計(jì)12學(xué)時(shí)
    ◆費(fèi)用(含教材費(fèi)):2400元
    ◆外地學(xué)員:代理安排食宿(需提前預(yù)定)

    第二種:線上直播授課
    直播課時(shí):共4天,每天3學(xué)時(shí),總計(jì)12學(xué)時(shí);
    輔導(dǎo):授課期間,輔導(dǎo)老師每天有1小時(shí)的輔導(dǎo)直播
    ◆費(fèi)用(含教材費(fèi)):2400元

    第三種:企業(yè)訂制培訓(xùn)
    課時(shí):根據(jù)定制的大綱確定課時(shí)
    費(fèi)用:根據(jù)課程難度,每課時(shí)1500~3000元

      •  質(zhì)量保證

        1、培訓(xùn)過(guò)程中,如有部分內(nèi)容理解不透或消化不好,可免費(fèi)在下期培訓(xùn)班中重聽(tīng);

        2、培訓(xùn)結(jié)束后免費(fèi)提供一個(gè)月的技術(shù)支持,充分保證培訓(xùn)后出效果;

        3、培訓(xùn)合格學(xué)員可享受免費(fèi)推薦就業(yè)機(jī)會(huì)。

      •  課程大綱

        主題 內(nèi)容

        大數(shù)據(jù)架構(gòu)概述 "1.1大數(shù)據(jù)層級(jí)架構(gòu)及各層軟件設(shè)計(jì)要求,包括數(shù)據(jù)收集、存儲(chǔ)、計(jì)算框、應(yīng)用

        1.2 Hadoop生態(tài)系統(tǒng)概述以及版本演化,并給出版本選擇建議。

        1.3 Spark生態(tài)系統(tǒng)概述及其特點(diǎn),并與Hadoop對(duì)比"

        數(shù)據(jù)收集系統(tǒng)FlumeSqoop


        2.1使用flumesqoop兩個(gè)系統(tǒng)將外部流式數(shù)據(jù)(比如網(wǎng)站日志,用戶行為數(shù)據(jù)等)、關(guān)系型數(shù)據(jù)庫(kù)(比如MySQLOracle等)中的數(shù)據(jù)導(dǎo)入Hadoop中進(jìn)行分析和挖掘

        大數(shù)據(jù)存儲(chǔ)系統(tǒng)HDFSHbase "


        3.1 HDFS1.0進(jìn)行對(duì)比介紹2.0原理、特性與基本架構(gòu)(快照、緩存、異構(gòu)存儲(chǔ))。

        3.2 HBase原理,基本架構(gòu)與案例分析

        3.3 HBase應(yīng)用場(chǎng)景、原理和架構(gòu),典型應(yīng)用案例(互聯(lián)網(wǎng)、銀行)"

        集群資源管理與調(diào)度系統(tǒng)


        4.1 介紹YARN應(yīng)用場(chǎng)景、基本架構(gòu)與資源調(diào)度

        Zookeeper部署及典型應(yīng)用


        5.1 介紹Zookeeper是什么,基本原理及在應(yīng)用

        大數(shù)據(jù)計(jì)算平臺(tái) "介紹主流的三大類(lèi)大數(shù)據(jù)計(jì)算框架,分別是批處理、交互式計(jì)算和流式計(jì)算框架,并選取當(dāng)下主流的開(kāi)源實(shí)現(xiàn)進(jìn)行介紹。


        6.1 批處理計(jì)算框架

        6.1.1 MapReduce2.0基本原理與架構(gòu)、程序編寫(xiě)(使用javaC++php語(yǔ)言)

        6.1.2 數(shù)據(jù)分析系統(tǒng)HivePig應(yīng)用與比較,如何使用其中的海量數(shù)據(jù)

        6.1.3 Spark計(jì)算框架,背景及應(yīng)用案例

        6.2 交互式計(jì)算框架,Impalapresto應(yīng)用場(chǎng)景,基本架構(gòu)和典型應(yīng)用案例

        6.3 流式/實(shí)時(shí)計(jì)算框架,stormSparkStreaming基本架構(gòu)特點(diǎn),及應(yīng)用案例"

        數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)庫(kù) 7.1 MahoutMLlib兩個(gè)主流的分布式數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)庫(kù)的實(shí)現(xiàn)以及應(yīng)用案例。



the end

評(píng)論(0)