Storm實戰課程
-
-
課程目標
這是一套 系統且具有很強實戰性 的Storm課程,從實時流計算及其在新浪、騰訊、360、百度等公司應用分析,到Storm的架構、工作流、機制,再到Storm集群的部署、運行、監控,最后以某上市婚戀網站的真實項目做為案例來詳細講解并帶領大家完成從理論到實戰的進階!
眾所周知,Hadoop在處理海量數據方面有著強大的能力,但是只能進行離線數據分析,而Storm可以幫助我們實現實時流式計算,因此Storm被譽為“實時的Hadoop”。
對于學員來說,在掌握了Hadoop的基礎上,再學會Storm,簡直如虎添翼,在大數據行業里面會有更強的競爭力。 -
師資團隊
華清創客企業內訓講師,均是來自各個領域的資深專家,均擁有6年以上大型項目經驗。
-
培養對象
1、技術出身,了解基本的研發思想即可。
2、小型企業的技術負責人;
3、大中型企業的數據部門相關人員、或是對數據感興趣的其他部門的研發總監、部門經理、一線研發工程師等人員均可; -
培訓方式
-
-
第一種:華清創客講師面授
課時:共3天,每天6學時,總計18學時
◆費用(含教材費):4500元
◆外地學員:代理安排食宿(需提前預定)
第二種:線上直播授課
直播課時:共6天,每天3學時,總計18學時;
輔導:授課期間,輔導老師每天有1小時的輔導直播
◆費用(含教材費):4500元
第三種:企業訂制培訓
課時:根據定制的大綱確定課時
費用:根據課程難度,每課時1500~3000元
質量保證
-
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在下期培訓班中重聽;
2、培訓結束后免費提供一個月的技術支持,充分保證培訓后出效果;
3、培訓合格學員可享受免費推薦就業機會。
-
課程大綱
第一章:初級階段 第一節:實時流式計算介紹 實時流式計算是什么
實時流式計算的特點
實時流式計算使用場景分析
Queue+Worker,S4, Storm,Spark簡單介紹
第二節:認識Storm Storm介紹
Storm特點
Storm優勢
第三節:Storm使用場景 新浪的實時分析平臺
騰訊的實時計算平臺
奇虎360的實時平臺
百度的實時系統
阿里的Jstorm
第二章:中級階段 第四節:Storm的系統架構 主節點(Nimbus)
從節點(Supervisor)
Web節點(Storm UI)
協調節點(Zookeeper)
第五節:Storm的工作流 作業單元(Topology)
數據源編程單元(Spout)
數據處理編程單元(Bolt)
第六節:Storm的并發機制 服務器(Nodes)
JVM虛擬機(Worker)
線程(Executor)
Spout/Bolt實例(Task)
第七節:Storm的數據流 Stream講解(Tuple)
Storm的數據模型
Stream Grouping
第八節:Storm的保障機制 功能性保障:多粒度的并行化
非功能性保障:多級別的可靠性
第三章:高級階段 第九節:Zookeeper講解 Zookeeper介紹
基礎系統安裝
JAVA安裝
Zookeeper搭建
Zookeeper狀態查看命令
第十節:Storm部署 Storm版本發展歷史
本地模式
分布式模式
主節點Nimbus
工作節點Supervisor
Storm UI
Storm配置項
第十一節:項目如何在Storm集群下運行 Storm Java API
Topology創建與提交
Example
第十二節:Kafka講解 Kafka介紹
Kafka的消息持久化和順序讀寫
Kafka的應用
Kafka的客戶端
Storm和Kafka的對接:KafkaSpout
第十三節:Storm集群的監控與管理 主機信息監控
日志監控
Storm UI
第四章:項目實戰 第十四節:業務背景 案例背景
設計目標
分析需求
第十五節:系統架構與模塊設計 整體架構
數據源
數據存儲與處理
第十六節:核心模塊實現 模擬數據實現
日志采集和存儲實現
數據處理實現
第十七節:項目部署上線 上線大致流程
注意事項
監控
第十八節:DRPC DRPC構建與使用
DRPC原理
第十九節:Trident Trident介紹
用Trident實現可靠的實時word統計
第二十節:多語言開發 多語言開發介紹
Python舉例
-
-
-
-
- 贊