自己組織化マップ(Self-organizing maps)

自己組織化マップ(SOM: Self-organizing maps、Kohonenマップともいう)は、多次元データの順序づけられた代表(=秩序だった表現)を作成するもので、複雑さを単純化し、有意義な関係性を明らかにするために使用されています。SOMは、教師なしニューラルネットワークの実用的でロバスト(頑健)な方式で、1980年代の初期にTeuvo Kohonen 教授によって紹介されてから、たくさんの応用の技術的基盤として用いられ、多数の論文が書かれてきました。

回帰とのアナロジー

SOM手法は、多次元データ空間をより低次元の要約に変換するノンパラメトリック回帰手法としてみなすことができます。回帰平面がオリジナル・データの要約であるのとよく似て、SOMはデータ分布の表現(=代表)を生成しますが、決定的な違いは、この表現が非線形であることです。

データマイニングの目的では、2次元の6角形グリッドによるSOMがほぼ標準となっています。グリッド上の“ノード” は、 いわゆる“参照ベクトル”が結びつけられたもので、それぞれはオリジナルのデータ空間の領域を区別するための点です。数値、多変量データの集合から開始して、グリッド上のこれらの参照ベクトルは、徐々にデータ分布の固有の(本質的な)形に適合してゆき、それに従って、近傍のノードの参照ベクトルもデータ空間の近くの領域に落ち着きます。したがって、グリッド上の順序は、データ内の近傍を反映していて、グリッド上に出現しているランドスケープからデータ分布の特徴を直接読み取れます。

Map grid

このパワフルなデータ表現の方法は、市販の多くの主要データマイニング製品でも提供されています。Viscoveryシステムでは、 SOM手法が基盤となって、さらにその上でたくさんの分析・統計テクニックが適用されます。 Viscovery は、統計学の知識レベルにかかわらず、誰でもが結果の分析モデルを理解できる直感的でビジュアルな環境内で、SOMと従来の統計手法をシステマティックに融合します。基本のKohonenアルゴリズムに精通する必要もさらさらありません。Viscoveryでは、SOMの作成プロセスの詳細は、ユーザーから隔離されており、ユーザーは、アプリケーションを通して、よく調整された設定とデフォルトの環境内でガイドされます。

他の分析手法と連動

Viscoveryでは、可視化テクニックを幅広い観点で使用するために、学習されたSOMに格納されたデータ表現をシステマティックに変換します。Viscoveryを使用すると、従属性の評価、データ分布の特徴の調査、クラスタの発見、あるいは新しいデータのモニタリングのために、—わずかのオプション選択で—直感的で洞察的なプロセスが現出します。

データ探索の能力に加えて、Viscovery は、クラス分類や予測モデルの作成・適用のために、たくさんの統計テクニックを採用しており、そのすべては、ワークフローでガイドされるプロジェクト環境に埋め込まれています。Viscoveryのデータマイニング製品は、スコアリング・モデルやセグメンテーション、さらにはそれらの適用や実行環境へのリアルタイム統合を提供します。

Mu技術的背景およびSOMの分野の革新的なアルゴリズムの多くは、Kohonen教授(ヘルシンキ工科大学・コンピュータ・アンド・インフォメーション・サイエンス研究所長)のSOMテクノロジーの創造、革新、普及での傑出した貢献によるところが大です。複数の新しいコンセプトの創始者として、 Kohonen教授は、たくさんの学術論文、さらにスタンダードな教科書である “Self-Organizing Maps”をはじめ、複数の書籍の著者です。科学の発展への彼の種々の貢献は、幾度も表彰され称賛されてきました。