目 錄
第1章 緒論
.1.1 理解大數據挖掘
1.1.1 大數據挖掘的定義
1.1.2 大數據挖掘的任務
1.1.3 大數據挖掘的特點
1.1.4 大數據挖掘與相關技術的差異
.1.2 大數據挖掘的相關技術
1.2.1 大數據獲取
1.2.2 大數據存儲與管理
1.2.3 大數據可視化
.1.3 小結
參考文獻
第2章 大數據計算框架
.2.1 HDFS
.2.2 MapReduce
2.2.1 MapReduce框架及范例
2.2.2 MapReduce存在的問題和解決方法
.2.3 NoSQL(非關系型)數據庫
2.3.1 NoSQL數據庫的分類
2.3.2 NoSQL數據庫實例
.2.4 SQL(關系型)數據庫
2.4.1 Apache HIVE
2.4.2 其他SQL數據庫
.2.5 小結
參考文獻
第3章關聯分析
.3.1 關聯分析的基本概念
3.1.1 關聯分析的定義
3.1.2 關聯規則的定義
3.1.3 關聯規則的分類
.3.2 關聯規則挖掘的原理
3.2.1 挖掘簡單關聯規則
3.2.2 挖掘量化關聯規則
3.2.3 挖掘多層關聯規則
3.2.4 挖掘多維關聯規則
.3.3 關聯規則挖掘的基礎算法
3.3.1 Apriori算法
3.3.2 Apriori算法的優化
3.3.3 FP-Growth算法
3.3.4 序列模式挖掘算法
.3.4 挖掘算法的進階方法
3.4.1 USpan:高效用序列模式挖掘算法
3.4.2 HulsMaR:基于MapReduCC的序列模式挖掘算法
.3.5 小結
參考文獻
第4章 聚類分析
.4.1 聚類分析的基本概念
4.1.1 簇與聚類
4.1.2 相似性度量和聚類原理
.4.2 聚類分析的基礎算法
4.1.1 層次的方法——單連接算法、BIRCH算法
4.2.2 劃分的方法——κ-means和κ-medoids算法
4.2.3 基于密度的方法——OPTICS算法
.4.3 聚類分析的進階方法
4.3.1 Density Peaks算法(AA算法)
4.3.2 κ-means:真基于MapReduce的κ-means算法
.4.4 小結
參考文獻
用戶名或密碼錯誤