Welcome

首页 / 软件开发 / 数据结构与算法 / Mahout算法

Mahout算法2014-04-24 csdn博客 yueyedeaiMahout 包括协同过滤,基于User和Item的推荐;kmeans、Fuzzy-kmeans 、Mean shift 、 Dirichlet process 、LDA聚类;奇异值分解;并行频繁项集挖掘;补充的贝叶斯分类、随机森林决策 树分类。

一、分类算法

(一)Logistic 回归(SGD)

(二)Bayesian

(三)SVM

(四)Perceptron 和Winnow

(五)神经网络

(六)随机森林

(七)受限玻尔兹曼机

(八)Boosting

(九)HMM

(十)Online Passive Aggressive

二、聚类算法

(一)Canopy

(二)K-Means

(三)Fuzzy K-means

(四)EM

(五)Mean shift

(六)层次聚类

(七)Dirichlet process

(八)LDA

(九)Spectral

(十)MinHash

(十一)Top Down

三、推荐算法

Mahout包括简单的非并行的推荐和基于Hadoop的并行推荐的实现。

(一)非并行推荐

(二)分布式的基于Item的协同过滤

(三)并行矩阵分解的协同过滤

四、关联规则挖掘算法

并行FP-Growth

五、回归

Locally Weighted Linear Regression

六、降维

(一)SVD

(二)SSVD

(三)PCA

(四)ICA

(五)GDA

七、进化算法

八、向量相似性计算

(一)RowSimilarityJob

用于计算Item之间的距离,是分布式的。

(二)VectorDistanceJob

在Map端连接,计算向量集中两两向量之间的距离。