Spark大數據平臺

    •  課程目標

      本課程首先介紹了Spark生態,Spark基礎;深入講了分布式集群的搭建,Spark編程實戰。最后Spark數據分析和數據挖掘MLib,綜合項目實戰。

    •  師資團隊

    • 華清創客企業內訓講師,均是來自各個領域的資深專家,均擁有6年以上大型項目經驗。

    •  培養對象

      學員學習本課程應具備下列基礎知識:
      ◆ 具備Python語言的基礎;
      ◆ 對大數據Spark開發感興趣的學員;

    •  培訓方式

    第一種:華清創客講師面授
    課時:共3天,每天6學時,總計18學時
    ◆費用(含教材費):3600元
    ◆外地學員:代理安排食宿(需提前預定)

    第二種:線上直播授課
    直播課時:共6天,每天3學時,總計18學時;
    輔導:授課期間,輔導老師每天有1小時的輔導直播
    ◆費用(含教材費):3600元

    第三種:企業訂制培訓
    課時:根據定制的大綱確定課時
    費用:根據課程難度,每課時1500~3000元

      •  質量保證

        1、培訓過程中,如有部分內容理解不透或消化不好,可免費在下期培訓班中重聽;

        2、培訓結束后免費提供一個月的技術支持,充分保證培訓后出效果;

        3、培訓合格學員可享受免費推薦就業機會。

      •  課程大綱


        Spark入門及生態體系 概述

        Spark生態

        Spark(內存計算框架)

        SparkSteaming(流式計算框架)

        Spark SQLad-hoc

        MllibMachine Learning

        GraphXbagel將被取代)

        彈性分布式數據集(RDD


        Python Spark基礎介紹 Spark 編程模型

        RDD緩存策略

        Spark Python編程入門

        PySpark

        惰性計算(Lazy Evaluation

        流水線(Pipelines


        分布式集群搭建 SparkHadoopVMware Ubuntu分布式集群搭建全過程

        Ubuntu基本環境配置

        集群安裝準備

        安裝配置Hadoop

        安裝配置Spark


        基于PythonSpark編程實戰 概述

        連接Spark

        初始化Spark

        使用命令行

        彈性分布式數據集(RDD

        RDD操作

        RDD持久化

        在集群上部署

        Python編寫的一個簡單Spark應用


        Spark MLlib的使用 機器學習概念

        Spark MLlib介紹

        Spark MLlib架構解析

        MLlib的算法庫分析

        Spark Python構建分類模型

        使用 Spark MLlib K-means 聚類分析


        Spark案例實戰 "1. 互聯網金融反欺詐案例分析

        2. Spark RDD編程技巧

        3. 用戶數據特征轉換解析及Spark實現

        4,分類挖掘算法實現及應用

          1) 使用Spark Decision Tree實現金融反欺詐模型

          2) 使用Spark Navie Bayes實現金融反欺詐模型

          3Spark分類算法常用場景及開發流程"



the end

評論(0)