異常検知における局所外れ値因子法(きょくしょはずれちいんしほう、英: local outlier factor, LOF)は Markus M. Breunig、Hans-Peter Kriegel(英語版)、Raymond T. Ng、Jörg Sander によって2000年に提案されたアルゴリズムで、任意のデータ点での、近傍点に対する局所的な変動を測ることによって異常を発見するものである[1]。
Feature Bagging for Outlier Detection(外れ値に対する特徴バギング) [6]は、データの複数の射影に対して局所外れ値因子法を実行し、結果を結合することで、高次元での検知の質を高める。これは異常検知に対するアンサンブル学習アプローチの最初の例であり、他の変種については脚注[7]を参照。
Local Outlier Probability (LoOP)[8](局所外れ値確率)は局所外れ値因子法から派生した手法だが、あまり込み入っていない(inexpensive)局所的統計量を用いることで、結果がパラメータ k の選択に鋭敏に左右されないようにしている。また出力値は 区間の値に規格化されている。
Interpreting and Unifying Outlier Scores[9](外れ値スコアの解釈および統合)は、ユーザビリティ向上のために統計的スケーリングを用いてLOFの外れ値スコアを区間 の値へ規格化することを提案するもので、LoOPの改善案とみることができる。
On Evaluation of Outlier Rankings and Outlier Scores[10](外れ値ランキングと外れ値スコアの評価)は、LOFの変種や別のアルゴリズムを用いた、高度な異常検知アンサンブル構築法同士の類似度および相違度を測る手法を提案する。上述の Feature Bagging for Outlier Detection を改善したものである。
Local outlier detection reconsidered: a generalized view on locality with applications to spatial, video, and network outlier detection[3](局所外れ値検知再考:空間・映像・ネットワークでの外れ値検知を用いた局所性への一般的視点)は、様々な局所外れ値検知手法(例えば、LOF, simplified version of LOF, LoOP)における一般的なパターンを議論し、一般的なフレームワークを抽象している。このフレームワークは続いて、地理データ、動画ストリーミング、著者ネットワーク等における外れ値検知に応用される。
^ abcdSchubert, E.; Zimek, A.; Kriegel, H. -P. (2012). “Local outlier detection reconsidered: A generalized view on locality with applications to spatial, video, and network outlier detection”. Data Mining and Knowledge Discovery. doi:10.1007/s10618-012-0300-z.
^Campos, Guilherme O.; Zimek, Arthur; Sander, Jörg; Campello, Ricardo J. G. B.; Micenková, Barbora; Schubert, Erich; Assent, Ira; Houle, Michael E. (2016). “On the evaluation of unsupervised outlier detection: measures, datasets, and an empirical study”. Data Mining and Knowledge Discovery. doi:10.1007/s10618-015-0444-8. ISSN1384-5810.
^Lazarevic, A.; Kumar, V. (2005). “Feature bagging for outlier detection”. Proc. 11th ACM SIGKDD international conference on Knowledge Discovery in Data Mining: 157–166. doi:10.1145/1081870.1081891.
^Zimek, A.; Campello, R. J. G. B.; Sander, J. R. (2014). “Ensembles for unsupervised outlier detection”. ACM SIGKDD Explorations Newsletter15: 11. doi:10.1145/2594473.2594476.