Open kyakuno opened 4 months ago
// ailiaTokenizerの出力は、末尾にSOTが含まれ、Paddingが含まれない
// CLIPの場合は、SOTもAIモデルに渡す必要があるので、Paddingのみ行う
// JapaneseCLIPの場合は、先頭にCLS IDを付与して、末尾のSOTを削除し、Paddingを行う必要がある
// CLIPのトークンの例
// 'dog' : [49406 = cls 1929 49407 = sot]
// ailiaTokenizerの出力
// 'dog' : [49406 = cls 1929 49407 = sot 0 = pad]
// JapaneseCLIPのトークンの例
// '犬' : [ 4 = cls 9 1651 3 = pad ...]
// ailiaTokenizerの出力
// '犬' : [ 9 1651 2 = sot]
https://github.com/axinc-ai/ailia-models/tree/master/image_classification/japanese-clip