大數據架構與數據挖掘

    •  課程目標

      本課程將為大家全面而又深入的介紹Hadoop和Spark平臺的構建流程,涉及Hadoop和Spark系統基礎知識,概念及架構, Hadoop和Spark實戰技巧(數據挖掘和機器學習),Hadoop和Spark經典案例等。

    •  師資團隊

      華清創客企業內訓講師,均是來自各個領域的資深專家,均擁有6年以上大型項目經驗。

    •  培養對象

      1、學員學習本課程應具備基礎知識:1) 了解Java語言; 2) 了解Linux系統;3) 數據挖掘基礎;
      2、適合人群:各類 IT/軟件企業和研發機構的軟件架構師、軟件設計師、程序員。對于懷有設計疑問和問題,需要梳理解答的團隊和個人,效果最佳。

    •  培訓方式

      • 第一種:華清創客講師面授
        課時:共3天,每天6學時,總計18學時
        ◆費用:3600元
        ◆外地學員:代理安排食宿(需提前預定)

        第二種:線上直播授課
        直播課時:共6天,每天3學時,總計18學時;
        輔導:授課期間,輔導老師每天有1小時的輔導直播
        ◆費用:3600元

        第三種:企業訂制培訓
        課時:根據定制的大綱確定課時
        費用:根據課程難度,每課時1500~3000元


         質量保證

      • 1、培訓過程中,如有部分內容理解不透或消化不好,可免費在下期培訓班中重聽;

        2、培訓結束后免費提供一個月的技術支持,充分保證培訓后出效果;

        3、培訓合格學員可享受免費推薦就業機會。

      •  課程大綱

        主題 內容

         

        大數據架構概述 "1. 大數據層級結構

        介紹大數據系統基本架構與流程

        2. Hadoop生態系統概述以及版本演化

        概要介紹Hadoop生態系統及其版本演化歷史,并給出hadoop版本選擇建議。

        3. Spark生態系統概述

         

        概要介紹Spark生態系統及其特點,并與Hadoop對比"

        數據收集系統FlumeSqoop 介紹如何使用flumesqoop兩個系統將外部流式數據(比如網站日志,用戶行為數據等)、關系型數據庫(比如MySQLOracle等)中的數據導入Hadoop中進行分析和挖掘

         

        大數據存儲系統HDFSHbase "1. 1. HDFS 2.0 原理、特性與基本架構

        2. 理論:介紹HDFS 2.0原理與架構,以及使用方式

        3.

        4. 2. HBase原理,基本架構與案例分析

        5. 理論:介紹HBase應用場景、原理和架構,介紹幾個HBase典型應用案例,包括互聯網應用案例和銀行應用案例。"

         

        分布式計算技術MapReduceHive "1. 介紹計算框架MapReduce基本原理,架構及程序設計方式

        2. 動手編寫第一個MapReduce程序

        3. Hive基本原理及使用方式"

         

        分布式計算技術Spark "1. 介紹計算框架Spark基本原理,架構及程序設計方式

        2. Spark程序設計"

         

        數據挖掘與機器學習 "1. 常見的數據挖掘與機器學習算法

        2. Hadoop數據挖掘庫mahout

        3. Spark數據挖掘庫mllib"

         

        應用案例1:基于Hadoop的構建數據倉庫 "1. 數據倉庫基礎介紹

        2. 如何利用大數據系統構建數據倉庫

        使用Flume+HDFS+MapReduce+Hive構建數據倉庫

        3. 數據倉庫基本架構

        4. 數據倉庫應用

        如報表生成"

         

        應用案例2:用戶畫像系統 "1. 什么是用戶畫像系統

        2. 如何構建用戶畫像系統

        使用Flume/sqoop+HDFS+HBase+MapReduce/Spark+redis構建用戶標簽系統

        3. 用數據挖掘方式構建用戶標簽 

        應用邏輯回歸、聚類、分類等機器學習和數據挖掘算法構建用戶標簽

        4. 用戶畫像系統應用

        用戶畫像系統在用戶信用等級分級、大數據營銷中、用戶流失預警、潛在用戶分析、異常檢測與分析等方面的應用"

         

        應用案例3:商品推薦系統 "1. 什么是商品推薦系統

        2. 商品推薦系統基本架構

        使用Flume+HDFS +Spark+Redis構建推薦系統

        3. 推薦算法

        推薦算法詳解"

         

        應用案例4:數據挖掘系統 "1. 什么是數據挖掘系統

        2. 數據挖掘算法的使用

        Spark為主,如何設計和實現邏輯回歸、聚類、分類等機器學習和數據挖掘算法

        3. 數據挖掘的典型應用"

         

the end

評論(0)