課程目錄:用Spark和Python通過PySpark處理大數據培訓
4401 人關注
(78637/99817)
課程大綱:

       用Spark和Python通過PySpark處理大數據培訓

 

 

 

介紹

了解大數據

Spark概述

Python概述

PySpark概述

使用彈性分布式數據集框架分發數據
使用Spark API運算符分布計算
設置Python和Spark

設置PySpark

針對Spark使用Amazon Web Services(AWS)EC2實例

設置數據塊

設置AWS EMR集群

學習Python編程的基礎知識

Python入門
使用Jupyter Notebook
使用變量和簡單的數據類型
使用列表
使用 if 語句
使用用戶輸入
處理while循環
實現函數
使用類
處理文件和異常
處理項目、數據、API
學習Spark DataFrame的基礎知識

Spark DataFrames入門
用Spark實現基本操作
使用Groupby和聚合操作
使用時間戳和日期
進行Spark DataFrame項目練習

了解用MLlib進行機器學習

使用MLlib、Spark和Python進行機器學習

了解回歸

學習線性回歸理論
實現回歸評估代碼
進行線性回歸示例練習
學習Logistic回歸理論
實現一個Logistic回歸代碼
進行Logistic回歸示例練習
了解隨機森林(Random Forests)和決策樹(Decision Trees)

學習樹方法論(Tree Methods Theory)
實現決策樹和隨機森林代碼
進行隨機森林分類示例練習
使用K均值聚類

了解K均值聚類理論
實現K均值聚類代碼
進行群集示例練習
使用推薦系統

實現自然語言處理

理解自然語言處理(NLP)
NLP工具概述
進行NLP示例練習
在Python中用Spark進行流式處理

用Spark進行流式處理概述
Spark流數據處理(Spark Streaming)示例練習

主站蜘蛛池模板: 东京热TOKYO综合久久精品| 区三区激情福利综合中文字幕在线一区亚洲视频1| 国产成人亚洲综合无码| 欧美成人综合视频| 久久综合丝袜日本网| 激情伊人五月天久久综合| 亚洲欧美另类成人综合图片| 久久综合狠狠综合久久综合88| 一本色道久久88—综合亚洲精品| 国产亚洲综合网曝门系列| 亚洲国产欧美国产综合久久| 亚洲国产综合精品中文第一| 国产成人亚洲综合一区| 亚洲AV成人潮喷综合网| 国产成人亚洲综合无码| 久久综合久久综合九色| 久久青青草原综合伊人| 久久久久综合中文字幕| 久久久久高潮综合影院| 综合亚洲伊人午夜网| 狠狠色丁香婷婷综合久久来| 狠狠色综合久久久久尤物| 色天使久久综合网天天| 色综合欧美在线视频区| 丁香五月综合久久激情| 国产亚洲综合色就色| 久久久久久久尹人综合网亚洲| 亚洲欧美精品综合中文字幕| 久久九色综合九色99伊人| 色综合久久最新中文字幕| 狠狠色综合网站久久久久久久高清| 色综合久久中文字幕综合网| 狠狠色综合网站久久久久久久高清| 亚洲伊人久久大香线蕉综合图片| 麻豆精品久久精品色综合| 久久久久AV综合网成人| 亚洲丁香色婷婷综合欲色啪| 色8激情欧美成人久久综合电| 国产色婷婷五月精品综合在线| 五月综合激情网| 亚洲狠狠爱综合影院婷婷|