AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
17 stars 0 forks source link

MEGABYTE: Predicting Million-byte Sequences with Multiscale Transformers, Lili Yu+, N/A, arXiv'23 #682

Open AkihikoWatanabe opened 1 year ago

AkihikoWatanabe commented 1 year ago

URL

AkihikoWatanabe commented 1 year ago

byte列のsequenceからpatch embeddingを作成することで、tokenizer freeなtransformerを提案。 byte列で表現されるデータならなんでも入力できる。つまり、理論上なんでも入力できる。