主題 |
授課內(nèi)容 |
引子 |
本次培訓(xùn)主要結(jié)合電商的實際應(yīng)用,闡述了自然語言處理(NLP),數(shù)據(jù)挖掘(DM)和機器學(xué)習(xí)(ML)算法的落地和產(chǎn)出過程,對于在大數(shù)據(jù)處理方面的技巧和變現(xiàn)能力會有很大的提升。 |
第一單元
關(guān)聯(lián)規(guī)則(Apriori)算法在實際應(yīng)用中的優(yōu)化 |
該單元介紹基本關(guān)聯(lián)規(guī)則算法在電商實際訂單數(shù)據(jù)中的問題,以及對于問題空間預(yù)估保證提升空間的前提下,優(yōu)化關(guān)聯(lián)規(guī)則模型的過程。 |
1、?傳統(tǒng)關(guān)聯(lián)規(guī)則算法
2、“最佳拍檔”中的關(guān)聯(lián)規(guī)則
講述了基本的關(guān)聯(lián)規(guī)則算法
3、問題發(fā)現(xiàn)與分析
(1)訂單數(shù)據(jù)反作弊
(2)數(shù)據(jù)+算法融合的角度
(3)badcase實例印證
4、效果空間預(yù)估
5、算法改進
6、效果的衡量
(1)上線前:Debug工具
(2)上線:ABtest系統(tǒng)
7、ROI分析
8、案例啟示&下一步嘗試 |
第二單元
商品評論排序?qū)τ谟脩糍徺I的影響
? |
該單元介紹了如何處理用戶產(chǎn)生的商品評論,將其按照價值由大到小進行排序,評論的價值取決于影響用戶快速決策購買商品的信息量。 |
1、背景介紹
2、評論排序因素
3、內(nèi)容相關(guān)性計算
(1)商品內(nèi)容表示
(2)評論內(nèi)容表示
(3)商品和評論的相似性計算
4、排序模型
5、效果評估
(1)測試方法
(2)衡量指標(biāo)
(3)效果對比及分析
6、作弊與反作弊
7、評論智能排序-ROI分析 |
第三單元
商品“冷啟動” -基于語義主題的新品推薦
? |
該單元以電商商品推薦為例,講述了在沒有用戶行為的情況下,如何將小眾或新上市的商品進行準(zhǔn)確的展現(xiàn),提高用戶體驗的同時帶來更多的流量。 |
1、馬太效應(yīng)
2、商品的冷啟動
3、基于內(nèi)容的主題特征抽取
(1)語義主題特征
(2)特征關(guān)聯(lián)
4、正負樣本形成
5、CTR預(yù)估模型
6、效果衡量與分析 |
第四單元
用戶行為分析
? |
根據(jù)不同場景的用戶行為,挖掘潛在有價值信息或者用戶意圖。 |
1、商品互補類識別
2、?優(yōu)質(zhì)用戶挖掘
3、?品牌相似性計算
4、?用戶點擊商品行為建模
5、?用戶新聞興趣建模
6、?長尾query的智能糾錯? |