開発元 | Apache Software Foundation |
---|---|
最新版 |
0.13.0
/ 2017年4月17日 |
リポジトリ | |
プログラミング 言語 | Java |
対応OS | Cross-platform |
サポート状況 | Active |
種別 | machine learning |
ライセンス | Apache 2.0 Licence |
公式サイト |
mahout |
Apache Mahoutは、Apache Software Foundationが管理する機械学習アルゴリズムのオープンソース・ソフトウェアである。Apache Mahoutは、協調フィルタリングやクラスタリング、クラス分類に特化されたスケーラブルなアルゴリズムを実装している。これらの実装の多くは、Apache Hadoopのプラットフォームが使用されている。[1][2]Mahoutでは、一般的な線形代数や統計などの数学操作のためのJavaライブラリやプリミティブ型を提供している。Mahoutは現在開発中であり、実装されたアルゴリズムの数は急速に増えている。しかし、アルゴリズムの種類は未だ満たされたものとは言えない。[3]
Mahoutのコアとなるクラスタリング、クラス分類のアルゴリズムは、Apache HadoopのMapReduceのパラダイム上に実装されているが、これによってHadoopを利用しないと実装が制限されるわけではない。したがって、単一ノード、もしくはHadoopクラスタ以外での実行も推奨されている。 例えば、Mahoutを使う上でメインディッシュとなる、協調フィルタリングによるレコメンダシステムコンポーネントは、Hadoopを使わない環境でも実行することができる。 Pregel(Google社で開発)ライクなGiraphなどの開発途上のプロジェクトとの統合も積極的に議論されている。