大數據下的分布式
數據挖掘方法(訓練單機型+分布式的預測: 傳統機器學習算法+Mapreduce 分布式預測,)
Apache Spark MLlib
推薦與廣告精準投放:
自然語言的部分
文本聚類,文本分類(標簽),同義詞
用戶profile還原,標簽體系
推薦算法的策略
類之間的lift, 類內的lift, 如何精準
如何構建推薦算法的閉環
邏輯回歸,RankingSVM,
特征識別:(深度學習與圖形的自動特征識別)
自然語言
中文分詞
主題模型(文本聚類)
文本分類
提取關鍵詞
語義分析 sementic parser, word2vec到詞向量
RNN Long short-term memory (TSTM) Architecture
|