Closed KazApps closed 1 month ago
現在使われているNNUEのアーキテクチャには関係ないかもしれませんが、FeatureTransformer::Transform
において、AVX-512のコードのみ
for (IndexType i = 1; i < kRefreshTriggers.size(); ++i) {
...
}
がなくsum
を正しく更新できてないような気がするので、修正しました(間違っていたらすみません)。
素晴らしいです!ありがとうございます!
AVX-512のコードがクラッシュする原因としては、
の2点だったようで、そこを修正することで正常に動作するようになりました。 ただ、R9-7945HXではnpsの向上は誤差でした。このサイトにもある通りZEN4でのAVX-512に実装ではしょうがないのかもしれませんが。Xeonではもう少しnpsが向上するかもしれません。