格式:PDF
类型:扫描版
大小:6.87M
出版信息
作者: (美)吴信东(Xindong Wu) / (美),库玛尔 ,(Vipin Kumar)
出版社: 清华大学出版社
副标题: 数据挖掘十大算法
原作名: The Top the Algorithms in Data Mining
译者: 李文波 / 吴素研
出版年: 2013-5
页数: 154
定价: 39.00元
ISBN: 9787302310617
简介
《世界著名计算机教材精选:数据挖掘十大算法》详细介绍了在实际中用途最广、影响最大的十种数据挖掘算法,这十种算法是数据挖掘领域的顶级专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。《世界著名计算机教材精选:数据挖掘十大算法》对每一种算法都进行了多个角度的深入剖析,包括算法历史、算法过程、算法特性、软件实现、前沿发展等,此外,在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。
目录
第1章 C4.5
1.1 引言
1.2 算法描述
1.3 算法特性
1.3.1 决策树剪枝
1.3.2 连续型属性
1.3.3 缺失值处理
1.3.4 规则集诱导
1.4 软件实现
1.5 示例
1.5.1 Golf数据集
1.5.2 Soybean数据集
1.6 高级主题
1.6.1 二级存储
1.6.2 斜决策树
1.6.3 特征选择
1.6.4 集成方法
1.6.5 分类规则
1.6.6 模型重述
1.7 习题
参考文献
第2章 k-means
2.1 引言
2.2 算法描述
2.3 可用软件
2.4 示例
2.5 高级主题
2.6 小结
2.7 习题
参考文献
第3章 SVM:支持向量机
3.1 支持向量分类器
3.2 支持向量分类器的软间隔优化
3.3 核技巧
3.4 理论基础
3.5 支持向量回归器
3.6 软件实现
3.7 当前和未来的研究
3.7.1 计算效率
3.7.2 核的选择
3.7.3 泛化分析
3.7.4 结构化支持向量机的学习
3.8 习题
参考文献
第4章 Apriori
4.1 引言
4.2 算法描述
4.2.1 挖掘频繁模式和关联规则
4.2.2 挖掘序列模式
4.2.3 讨论
4.3 软件实现
4.4 示例
4.4.1 可行示例
4.4.2 性能评估
4.5 高级主题
4.5.1 改进Apriori类型的频繁模式挖掘
4.5.2 无候选的频繁模式挖掘
4.5.3 增量式方法
4.5.4 稠密表示:闭合模式和最大模式
4.5.5 量化的关联规则
4.5.6 其他的重要性/兴趣度度量方法
4.5.7 类别关联规则
4.5.8 使用更丰富的形式:序列、树和图
4.6 小结
4.7 习题
参考文献
第5章 EM
5.1 引言
5.2 算法描述
……
第6章 PageRank
第7章 AdaBoost
第8章 kNN!k-最近邻
第9章 Naive Bayes
第10章 CART:分类和回归树