Mahout算法2014-04-24 csdn博客 yueyedeaiMahout 包括协同过滤,基于User和Item的推荐;kmeans、Fuzzy-kmeans 、Mean shift 、 Dirichlet process 、LDA聚类;奇异值分解;并行频繁项集挖掘;补充的贝叶斯分类、随机森林决策 树分类。一、分类算法(一)Logistic 回归(SGD)(二)Bayesian(三)SVM(四)Perceptron 和Winnow(五)神经网络(六)随机森林(七)受限玻尔兹曼机(八)Boosting(九)HMM(十)Online Passive Aggressive二、聚类算法(一)Canopy(二)K-Means(三)Fuzzy K-means(四)EM(五)Mean shift(六)层次聚类(七)Dirichlet process(八)LDA(九)Spectral(十)MinHash(十一)Top Down三、推荐算法Mahout包括简单的非并行的推荐和基于Hadoop的并行推荐的实现。(一)非并行推荐(二)分布式的基于Item的协同过滤(三)并行矩阵分解的协同过滤四、关联规则挖掘算法并行FP-Growth五、回归Locally Weighted Linear Regression六、降维(一)SVD(二)SSVD(三)PCA(四)ICA(五)GDA七、进化算法八、向量相似性计算(一)RowSimilarityJob用于计算Item之间的距离,是分布式的。(二)VectorDistanceJob在Map端连接,计算向量集中两两向量之间的距离。