Closed ytakashina closed 7 years ago
群平均法によるクラスタリング結果。 鎖効果がひどい。
|-[ 16 ]
+-|-[ 21 ]
+-|-[ 17 ]
+-|-[ 3 ]
+-|-[ 8 ]
+-|-[ 4 ]
+-|-[ 30 ]
+-|-[ 12 ]
+-|-[ 35 ]
+-|-[ 10 ]
+-|-[ 19 ]
+-|-[ 6 ]
+-|-[ 28 ]
+-|-[ 29 ]
+-|-[ 33 ]
+-|-[ 0 ]
+-|-|-[ 13 ]
| +-[ 36 ]
+-|-[ 18 ]
+-|-[ 26 ]
+-|-[ 7 ]
+-|-[ 24 ]
+-|-[ 32 ]
+-|-[ 31 ]
+-|-[ 14 ]
+-|-|-[ 20 ]
| +-|-[ 9 ]
| +-[ 23 ]
+-|-|-[ 34 ]
| +-|-[ 1 ]
| +-|-[ 5 ]
| +-|-[ 15 ]
| +-[ 27 ]
+-|-[ 25 ]
+-|-[ 2 ]
+-|-[ 11 ]
+-|-[ 22 ]
+-[ 37 ]
しかしこれはコードが間違っているというよりは、データセットの性質がそうなってしまっているのかもしれない。下は系列間の相互情報量を行列として並べたもの(ソート済み)。
とりあえずやったといえばやったのでCloseします。 今後、RかPythonでデータの素性をより詳しく調べたほうが良いかもしれない。 相関などが強すぎると多重共線性などの問題が起こる可能性がある(HTMだと起こらない気もする)。
36 に書いただが、系列同士を相互情報量を基準としてAHCでクラスタリングすることで、HTMのネットワーク構造を決めるときのヒントを得られそう。
とくに凝集型階層的クラスタリングを使えばデンドログラムをそのままネットワークに使えそう。