sparkmlib算法使用有代码输入输出.docx
《sparkmlib算法使用有代码输入输出.docx》由会员分享,可在线阅读,更多相关《sparkmlib算法使用有代码输入输出.docx(43页珍藏版)》请在优知文库上搜索。
1、目录笫1章分类与回归61. 1支持向量机61.1.1 算法描述和定义61.1.2 输入参数和含义71.1.3代码展示71.1.4应用场景81.2逻辑回归81.2.1 算法描述和定义81.2.2 输入参数和含义81.2.3代码展示81.2.4应用场景81.3 线性回归91.3.1 算法描述和定义91.3.2 输入参数和含义101.3.3 代码展示101.3.4 应用场景101.4 朴素贝叶斯111.4.1 4.1算法描述和含义111.4.2 输入参数和含义111.4.3 代码展示111.4.4 应用场景121.5 决策树121.5 .1算法描述和定义121.5.2 输入参数和含义121.5.3
2、代码展示121.5.4 应用场景131.6 随机森林141.6.2 算法描述和定义141.6.3 输入参数和含义141.6.4 代码展示141.6.5 应用场景151.7 梯度提升树151.7 .1算法描述和定义151.7.2 输入参数和含义151.7.3 代码展示151.7.4 应用场景171.8 保序回归171.8.2 算法描述和定义171.8.3 输入参数和含义171.8.4 代码展示171.8.5 应用场景18第2章协同过速192.1 算法描述和定义192.2 输入参数和含义192.3 代码展示192.4 应用场景21第3章聚类223. 1K-MEAXS223.1.1 算法描述和定义2
3、23.1.2 输入参数和含义223.1.3 代码展示223. 1.4应用场景243.2 高斯退合243.2.1 算法描述和定义243.2.2 输入参数和含义243.2.3 代码展示253.2.4 2.4应用场景253.3 快速迭代聚类(图片)253.3.1 算法描述和定义253.3.2 输入参数和含义263.3.3 代码展示273.3.4 应用场景273.4 三层贝叶斯概率模型283.4.1 算法描述和定义283.4.2 输入参数和含义303.4.3 代码展示313.4.4 应用场景313.5 二分K-MEAXS聚类313.5.1算法描述和定义313.5.2输入叁数和含义323.5.3代码展示
4、323.5.4应用场景333.6流K-MEANS333.6.1算法描述和定义333. 6.2输入参数和含义333.6.3代码展示333.6.4应用场景34第4章降维算法354. 1奇异值分解354.1.1 算法描述和定义354. 1.2输入参数和含义354. 1.3代码展示354. 1.4应用场景364.2主成分分析(PCA)364.2.1 算法描述和定义364.2.2 2.2输入参数和含义364.2.3 代码展示364.2.4 应用场景37第5章统计385. 1相关统计385.1.1算法描述和定义385.1.2输入参数和含义385. 1.3代码展示385. 1.4应用场景385.2 分层采样
5、385. 2.1算法描述和定义386. 2.2输入参数和含义387. 2.3代码展示398. 2.4应用场景395.3 假设检脱395.3.1算法描述和定义395.3.2输入参数和含义391.1.3 代码展示391.1.4 应用场景5.4 流式显著性测试错误!未定义书签.错误!未定义书笠.偌误!未定义书筌.错误!未定义书签.错误!未定义书签.IO5.4.1 算法描逑和定义5.4.2 输入参数和含义5.4.3 4.3代码展示5.4.4 应用场景5.5 随机数发生器5.5.1 算法描述和定义405.5.2 输入参数和含义405.5.3 代码展示405.5.4 5.4应用场景41错误!未定义书签.错
6、误!未定义书筌.错误!未定义书签.错误!未定义书笠.传误!未定义书笈.5.6 核密度估计5.6.1 算法描述和定义5.6.2 输入参数和含义5. 6.3代码展示6. 6.4应用场景第6章特征抽取和变换417. 1TE-IDH436.1.1算法描述和定义436.1.2输入参数和含义436.1.3代码展示436.1.4应用场景446.2词到变量446.2.1 算法描述和定义446.2.2 输入参数和含义446.2.3 代码展示456.2.4 应用场景456.3标准化466.3.1算法描逑和定义466.3.2 输入参数和含义466.3.3 代码展示466.3.4 应用场景466.4正规化466.4.
7、1算法描述和定义166.4.2输入参数和含义476.4.3代码展示476.4.4应用场景47第1章分类与回归1.1 支持向量机1.1.1 算法描述和定义 原创性(非组合)的具有明显亘观几何意义的分类算法,具有较高的准确率 源于VaPnik和CherVOnenkiS关于统计学习的早期工作(1971年),第一Ii有关论文由Boser、Guyon.VaPnik发表在1992年(参考文档见麻家炜书9.10节) 思想直观,但细节异常复杂,内容涉及凸分折算法,核函数,神经网络等高深的领域.几乎可以写成单独的大部头专著.大部分非专业人士会觉得难以理解. 某名人评论:SVM是让IS用败学家J1.正得到应用的一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- sparkmlib 算法 使用 代码 输入输出