axinc-ai / ailia-models-unity

Unity version of ailia models repository
45 stars 4 forks source link

Implement tokenizer for stable diffusion #136

Closed kyakuno closed 3 months ago

kyakuno commented 3 months ago
kyakuno commented 3 months ago

"a photograph of an astronaut riding a hors"の場合、従来の

49406 320 8853 539 550 18376 6765 320 4558 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 

49406 320 8853 539 550 18376 553 570 5215 320 71 1127 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 49407 

になり、微妙に挙動が異なる。

kyakuno commented 3 months ago

Pythonだと従来の方なので、Tokenizerが怪しい。

tensor([[49406,   320,  8853,   539,   550, 18376,  6765,   320,  4558, 49407,
         49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407,
         49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407,
         49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407,
         49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407,
         49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407,
         49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407, 49407,
         49407, 49407, 49407, 49407, 49407, 49407, 49407]])
kyakuno commented 3 months ago

CLIPのSimpleTokenizerと、transformersのCLIPTokenizerで挙動が異なる?

kyakuno commented 3 months ago

ailia Tokenizerの方に問題があったため、ailia Tokenizerを1.1.12に更新。