課程目錄:社交網(wǎng)絡(luò)數(shù)據(jù)及文本挖掘方面的專業(yè)技術(shù)培訓(xùn)
4401 人關(guān)注
(78637/99817)
課程大綱:

          社交網(wǎng)絡(luò)數(shù)據(jù)及文本挖掘方面的專業(yè)技術(shù)培訓(xùn)

 

 

 

大數(shù)據(jù)概述
1.大數(shù)據(jù)基本概念、技術(shù)梗概、技術(shù)沿革,以及大數(shù)據(jù)技術(shù)是如何改變?nèi)斯ぶ悄芗夹g(shù)、語音識(shí)別技術(shù)、圖像識(shí)別/視頻理解、自然語言處理技術(shù)等,
以及大數(shù)據(jù)技術(shù)在政府、金融、石油、教育、交通、醫(yī)療衛(wèi)生等行業(yè)的成功案例;
2.大數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)模型、半結(jié)構(gòu)化模型和非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)模型,邏輯模型,以及分析建模工具的常用方法。
數(shù)據(jù)挖掘及Mahout
1.十大常用的并行數(shù)據(jù)挖掘算法、原理、應(yīng)用場(chǎng)景,以及技術(shù)實(shí)戰(zhàn);
2.并行數(shù)據(jù)挖掘平臺(tái)Mahout的技術(shù)架構(gòu)、核心組件的工作原理以及技術(shù);
3.Mahout應(yīng)用開發(fā)技術(shù);4.Mahout項(xiàng)目實(shí)戰(zhàn)。
R語言精要 本著循序漸進(jìn)而又覆蓋R語言重要而有用的基本內(nèi)容原則,
本講從R語言入門開始,以前期的數(shù)據(jù)處理為核心,以實(shí)際案例為載體,
內(nèi)容包括R語言的向量、數(shù)據(jù)框、矩陣運(yùn)算、缺失值和零值的處理、
特別注重用R語言構(gòu)造函數(shù)編程解決實(shí)際問題,詳細(xì)介紹強(qiáng)大的數(shù)據(jù)清洗整理plyr、
zoo、car等常用包和強(qiáng)大的作圖ggplot2包,為使用R語言進(jìn)行數(shù)據(jù)挖掘打下扎實(shí)的工具基礎(chǔ)。
主要案例:案例1:如何用R語言plyr等包合并、排序、分析數(shù)據(jù)并編制香農(nóng)-威納指數(shù);
案例2:如何用R語言編程同時(shí)實(shí)現(xiàn)幾十個(gè)高難度數(shù)據(jù)分析可視化圖片的jpeg格式輸出;
案例3:如何使用R語言進(jìn)行分層或者整群抽樣構(gòu)建訓(xùn)練集與測(cè)試集;案例4:使用ggplot2畫出各種復(fù)雜的圖形。
神經(jīng)網(wǎng)絡(luò)和R語言的實(shí)現(xiàn)
神經(jīng)網(wǎng)絡(luò)由大量的節(jié)點(diǎn)和輸出函數(shù)構(gòu)成邏輯策略,本講介紹其原理,主要通過案例的方式講解R語言實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)算法的過程和注意的事項(xiàng)。
主要案例:案例1:酒的品質(zhì)和種類的神經(jīng)網(wǎng)絡(luò)的分析和預(yù)測(cè);案例2:公司財(cái)務(wù)預(yù)警建模。企業(yè)基于社交網(wǎng)絡(luò)數(shù)據(jù)的收獲
1.潛在商機(jī)的發(fā)現(xiàn),通過數(shù)據(jù)挖掘與分析能夠得到什么?
2.危機(jī)預(yù)警 ,通過數(shù)據(jù)挖掘與分析,可以對(duì)一些網(wǎng)絡(luò)中突然發(fā)布的一條可能對(duì)企業(yè)產(chǎn)生危機(jī)的信息即時(shí)的監(jiān)控;
3.效果預(yù)測(cè), 通過數(shù)據(jù)挖掘與分析讓企業(yè)能花少的錢得到大的產(chǎn)出。
交叉驗(yàn)證比較各個(gè)模型:對(duì)于同一個(gè)數(shù)據(jù),可能有很多模型來擬合,如何衡量和比較模型的精度呢?
本講將介紹交叉驗(yàn)證訓(xùn)練集和測(cè)試集的方法來幫助大家在實(shí)際中選取佳模型進(jìn)行擬合和預(yù)測(cè)。
決策樹(回歸樹)分析和R語言實(shí)現(xiàn)
決策樹是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。本講主要講授兩種為普遍的決策樹算法:CART和C4.5算法,使用rpart和J48函數(shù)進(jìn)行R語言分析。
主要案例:案例1:對(duì)汽車耗油量進(jìn)行決策樹分析并完成相關(guān)目標(biāo)變量的預(yù)測(cè);
案例2:使用決策樹幫助電信局判斷和預(yù)測(cè)客戶辦理寬帶業(yè)務(wù)。使用R語言結(jié)合KNN算法進(jìn)行文本挖掘
文本挖掘,特別是對(duì)中文的文本挖掘日趨重要。
本講介紹文本挖掘的原理和方法,幫助大家使用R語言在大量的非結(jié)構(gòu)化的數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的信息,
抽取潛在有用的數(shù)據(jù),發(fā)現(xiàn)適合模式,實(shí)現(xiàn)可視化結(jié)果展示。
主要案例:案例:使用R語言結(jié)合KNN算法對(duì)網(wǎng)頁(Web)進(jìn)行文本挖掘(含分詞、分類、可視化等)。

主站蜘蛛池模板: 伊人久久成人成综合网222| 久久久久综合国产欧美一区二区| 久久综合香蕉国产蜜臀AV| 色欲香天天综合网无码| 在线综合亚洲中文精品| 亚洲国产综合91精品麻豆| 国产欧美日韩综合AⅤ天堂| 色天使亚洲综合在线观看| 中文字幕亚洲综合久久菠萝蜜| 色综合天天综合给合国产| 色噜噜狠狠色综合日日| 色综合久久无码五十路人妻| 91精品国产色综合久久| 天天综合色天天综合色hd| 激情综合网五月| 狠狠色伊人亚洲综合成人| 亚洲AV综合色一区二区三区| 激情综合一区二区三区| 亚洲综合精品网站在线观看| 插插插色欲综合网| 国产精品综合色区在线观看| 亚洲欧美综合区自拍另类| 亚洲国产综合91精品麻豆| 亚洲欧洲国产成人综合在线观看| 久久久综合香蕉尹人综合网| 国产综合一区二区在线观看| 欧美综合欧美视频| 色综合色天天久久婷婷基地| 图图资源网亚洲综合网站| 亚洲av综合av一区| 国产成人亚洲综合色影视| 亚洲欧洲日产国产综合网| 国产激情综合在线观看| 狠狠亚洲婷婷综合色香五月排名| 久久综合伊人77777麻豆| 亚洲欧美日韩综合一区| 99久久国产综合精品女同图片| 在线综合+亚洲+欧美中文字幕| 国产综合亚洲专区在线| 一个色综合导航| 亚洲精品国产第一综合99久久|