大數據處理與挖掘

  •  
    •  課程目標

      本課程對大數據相關的主要技術進行了總體講解。包括大數據的必備基礎知識;Hadoop生態相關的重要知識比如HDFS/YARN/MapReduce、集群、shell的系統講解;并重點講解了Hive相關的理論知識和實戰講解了操作;講解目前大數據領域熱門、火爆、有前景的技術——Spark。從淺入深,基于大量案例實戰,深度剖析和講解Spark,并且會包含完全從企業真實復雜業務需求中抽取出的案例實戰;最后講解了數據分析和數據挖掘技術。

    •  師資團隊

    • 華清創客企業內訓講師,均是來自各個領域的資深專家,均擁有6年以上大型項目經驗。

    •  培養對象

      學員學習本課程應具備下列基礎知識:
      ◆ 具備java\Python等編程語言的基礎;
      ◆ 對大數據開發感興趣的學員;

    •  培訓方式

    第一種:華清創客講師面授
    課時:共3天,每天6學時,總計18學時
    ◆費用(含教材費):3600元
    ◆外地學員:代理安排食宿(需提前預定)

    第二種:線上直播授課
    直播課時:共6天,每天3學時,總計18學時;
    輔導:授課期間,輔導老師每天有1小時的輔導直播
    ◆費用(含教材費):3600元

    第三種:企業訂制培訓
    課時:根據定制的大綱確定課時
    費用:根據課程難度,每課時1500~3000元

      •  質量保證

        1、培訓過程中,如有部分內容理解不透或消化不好,可免費在下期培訓班中重聽;

        2、培訓結束后免費提供一個月的技術支持,充分保證培訓后出效果;

        3、培訓合格學員可享受免費推薦就業機會。

      •  課程大綱

        內容簡介 授課詳細內容


        大數據概覽 "1. 大數據簡介

        2. 大數據處理流程(采集/傳輸/分析/挖掘)

        3. 大數據平臺有哪些及各自特點

        4. 大數據技術有哪些?各自處理哪些場景?"


        Hadoop實戰 "1. Hadoop簡介

        2. HDFS/YARN/MapReduce原理簡單剖析

        3. Hadoop集群配置環境"

        "4. Hadoop常用Shell操作

        5. MapReduce編程簡析及平均分統計操作"


        Hive實戰 "1. Hive數據倉庫集群平臺體系架構

        2. Hive原理與工作機制

        3. Hive安裝配置"

        "4. Hive 應用開發技巧及數據庫表設計

        5. 基于HiveSogou日志分析"


        Spark實踐 "1. Spark簡介

        2. Spark原理深入分析

        3. Spark整合Hadoop安裝配置

        4. Spark整合大數據倉庫Hive實踐"

        "大數據數據分析與挖掘技術


        Spark Mllib" "1. 互聯網金融反欺詐案例分析

        2. Spark RDD編程技巧

        3. 用戶數據特征轉換解析及Spark實現

        4,分類挖掘算法實現及應用

          1) 使用Spark Decision Tree實現金融反欺詐模型

          2) 使用Spark Navie Bayes實現金融反欺詐模型

          3Spark分類算法常用場景及開發流程"




the end

評論(0)