ytakashina / HTMResearch

0 stars 0 forks source link

系列同士を相互情報量でクラスタリング #42

Closed ytakashina closed 7 years ago

ytakashina commented 7 years ago

36 に書いただが、系列同士を相互情報量を基準としてAHCでクラスタリングすることで、HTMのネットワーク構造を決めるときのヒントを得られそう。

とくに凝集型階層的クラスタリングを使えばデンドログラムをそのままネットワークに使えそう。

ytakashina commented 7 years ago

群平均法によるクラスタリング結果。 鎖効果がひどい。

|-[ 16 ]
+-|-[ 21 ]
  +-|-[ 17 ]
    +-|-[ 3 ]
      +-|-[ 8 ]
        +-|-[ 4 ]
          +-|-[ 30 ]
            +-|-[ 12 ]
              +-|-[ 35 ]
                +-|-[ 10 ]
                  +-|-[ 19 ]
                    +-|-[ 6 ]
                      +-|-[ 28 ]
                        +-|-[ 29 ]
                          +-|-[ 33 ]
                            +-|-[ 0 ]
                              +-|-|-[ 13 ]
                                | +-[ 36 ]
                                +-|-[ 18 ]
                                  +-|-[ 26 ]
                                    +-|-[ 7 ]
                                      +-|-[ 24 ]
                                        +-|-[ 32 ]
                                          +-|-[ 31 ]
                                            +-|-[ 14 ]
                                              +-|-|-[ 20 ]
                                                | +-|-[ 9 ]
                                                |   +-[ 23 ]
                                                +-|-|-[ 34 ]
                                                  | +-|-[ 1 ]
                                                  |   +-|-[ 5 ]
                                                  |     +-|-[ 15 ]
                                                  |       +-[ 27 ]
                                                  +-|-[ 25 ]
                                                    +-|-[ 2 ]
                                                      +-|-[ 11 ]
                                                        +-|-[ 22 ]
                                                          +-[ 37 ]

しかしこれはコードが間違っているというよりは、データセットの性質がそうなってしまっているのかもしれない。下は系列間の相互情報量を行列として並べたもの(ソート済み)。

sorted

ytakashina commented 7 years ago

とりあえずやったといえばやったのでCloseします。 今後、RかPythonでデータの素性をより詳しく調べたほうが良いかもしれない。 相関などが強すぎると多重共線性などの問題が起こる可能性がある(HTMだと起こらない気もする)。