第一部份:Spark Streamin深度源碼剖析(上)
(1)Spark Streaming整體架構(gòu)剖析
(2)基于Receiver+Kafka接收數(shù)據(jù)的源碼剖析
(3)基于DStream生成RDD的源碼剖析
(4)基于JobGenerator生成Job的源碼剖析
第二部份:Spark Streaming深度源碼剖析(下)
(1)Spark Streaming Driver容錯的源碼剖析
(2)Spark Streaming Executor容錯的源碼剖析
(3)Spark Streaming State相關(guān)操作的源碼剖析
(4)Spark Streaming Window相關(guān)操作的源碼剖析
第三部份:互聯(lián)網(wǎng)公司用戶流量實時大盤實戰(zhàn)
(1)互聯(lián)網(wǎng)用戶流量分析業(yè)務(wù)介紹
(2)互聯(lián)網(wǎng)用戶流量分析架構(gòu)設(shè)計:Spark Streaming+Kafka+HBase
(3)完成互聯(lián)網(wǎng)用戶流量指標體系的開發(fā)
(4)實時計算作業(yè)上線運維:部署、代碼升級以及監(jiān)控
(5)對Spark Streaming作業(yè)進行初步的性能優(yōu)化
(6)基于前端展示用戶流量分析大盤
第四部份:廣告系統(tǒng)實時數(shù)據(jù)平臺架構(gòu)實戰(zhàn)(上)
(1)廣告系統(tǒng)實時數(shù)據(jù)平臺的業(yè)務(wù)介紹以及架構(gòu)設(shè)計
(2)完成廣告用戶與客戶價值的實時數(shù)據(jù)指標體系開發(fā)
(3)完成廣告運營與營銷活動的實時數(shù)據(jù)指標體系開發(fā)
(4)基于廣告實時數(shù)據(jù)支持的點擊率預(yù)測
(5)基于廣告實時數(shù)據(jù)支持的精準廣告營銷
第五部份:廣告系統(tǒng)實時數(shù)據(jù)平臺架構(gòu)實戰(zhàn)(下)
(1)廣告系統(tǒng)實時數(shù)據(jù)平臺架構(gòu)優(yōu)化設(shè)計
(2)基于Spark Streaming checkpoint實現(xiàn)全流程的容錯機制
(3)基于Spark Streaming實現(xiàn)全流程的exatcly once語義
(4)基于Kafka實現(xiàn)數(shù)據(jù)不丟失的技術(shù)方案
(5)基于前端頁面展示廣告數(shù)據(jù)分析
第六部份:微博熱點話題實時探測系統(tǒng)架構(gòu)實戰(zhàn)(上)
(1)微博熱點話題探測業(yè)務(wù)介紹
(2)微博熱點話題探測系統(tǒng)架構(gòu)設(shè)計
(3)基于Flume+Kafka完成實時微博數(shù)據(jù)的接入
(4)自己動手改進FP-Growth頻繁集挖掘算法
(5)基于改進后的繁集挖掘算法完成熱點話題的實時探測
第七部份:微博熱點話題實時探測系統(tǒng)架構(gòu)實戰(zhàn)(下)
(1)基于Spark自己動手實現(xiàn)word2vec算法
(2)基于自己實現(xiàn)的Spark word2vec算法實現(xiàn)關(guān)聯(lián)熱點話題挖掘
(3)基于Spark Streaming完成實時計算作業(yè)開發(fā)
(4)基于前端頁面展示微博熱點話題
第八部份:微博社交關(guān)系實時挖掘平臺實戰(zhàn)(上)
(1)微博社交關(guān)系實時數(shù)據(jù)分析平臺業(yè)務(wù)介紹以及架構(gòu)設(shè)計
(2)Titan分布式圖數(shù)據(jù)庫介紹
(3)Cassandra分布式NoSQL數(shù)據(jù)庫介紹
(4)Elasticsearch分布式搜索引擎介紹
(5)基于Spark Streaming+GraphX+Titan完成微博社交關(guān)系挖掘
第九部份:微博社交關(guān)系實時挖掘平臺實戰(zhàn)(下)
(1)基于Spark Streaming+文本挖掘完成微博用戶的情感分析
(2)基于Spark Streaming完成微博用戶群分析
(3)基于Spark Streaming完成用戶城市地圖分析
(4)基于Spark Streaming完成熱門話題趨勢分析
(5)基于前端頁面展示微博社交數(shù)據(jù)
第十部份:股票交易分析實時大盤系統(tǒng)實戰(zhàn)
(1)股票分析業(yè)務(wù)介紹
(2)實時股票分析大盤系統(tǒng)架構(gòu)設(shè)計
(3)Druid分布式OLAP引擎介紹
(4)結(jié)合Spark Streaming + Druid完成股票數(shù)據(jù)實時分析
(5)結(jié)合Spark Streaming完成實時熱門股票排行
(6)結(jié)合Spark Streaming完成實時股票走勢預(yù)測
(7)基于前端頁面展示股票分析數(shù)據(jù)
第十一部份:實時用戶畫像系統(tǒng)架構(gòu)實戰(zhàn)
(1)實時用戶畫像組成分析
(2)實時用戶畫像的標簽數(shù)據(jù)字典
(3)實時用戶畫像的興趣度模型
(4)基于Spark Streaming實現(xiàn)一套實時用戶畫像系統(tǒng)
(5)基于ElasticSearch對實時用戶畫像數(shù)據(jù)進行分析
第十二部份:實時個性化推薦系統(tǒng)架構(gòu)實戰(zhàn)(上)
(1)基于Flume+Kafka實現(xiàn)用戶行為的實時采集與清洗
(2)基于實時用戶畫像構(gòu)建數(shù)據(jù)倉庫
(3)針對元數(shù)據(jù)庫構(gòu)建實時索引
(4)基于Spark Streaming完成第一個版實時個性化推薦系統(tǒng)
第十三部份:實時個性化推薦系統(tǒng)架構(gòu)實戰(zhàn)(下)
(1)基于頻繁模式的選擇性集成分類算法
(2)基于選擇性集成分類算法和網(wǎng)頁對用戶進行分類以及興趣組構(gòu)建
(3)基于Spark Streaming+協(xié)同過濾算法實現(xiàn)的實時推薦系統(tǒng)
(4)基于相關(guān)性算法實現(xiàn)的實時個性化推薦冷啟動優(yōu)化方案
|