行列の乱択スケッチを用いたデータストリーム上の異常検知

担当:北澤 拓也

題目:行列の乱択スケッチを用いたデータストリーム上の異常検知

概要:
ストリームデータの解析には時間・空間の両面で制約があり、絶えず到来するデータに基づき既知の結果を近似的かつ高速に逐次更新することが要求される。

本発表ではそのようなタスクに対するアプローチや諸問題[1] の概要を述べるとともに、Huangら[2] によって近年提案されたデータストリーム上での異常検知手法を紹介する。また、原論文とは異なる実データを用いた実験の結果を報告し、今後検討されるべき課題を議論する。

提案された手法では、過去に観測した正常なベクトル列が張る空間への射影を考えることにより、新たに到来したベクトルの異常を判定する。そして正常なベクトル列が張る空間の基底を高速かつ精度保証付きで逐次更新するために、行列の乱択スケッチが用いられている。

参考文献:
[1] D. Brzezinski, “Mining Data Streams with Concept Drift,” Master’s thesis, Poznan University of Technology, Poznan, Poland, 2010.

[2] H. Huang and S. Kasiviswanathan, “Streaming Anomaly Detection Using Randomized Matrix Sketching,” http://bit.ly/1FaDw6S.