Как embedding'и получить и какой они длины?

ai-forever / ru-gpts

Russian GPT3 models.

Apache License 2.0

2.08k stars 442 forks source link

For example

from transformers import GPT2LMHeadModel, GPT2Tokenizer
import torch
model_name_or_path = "sberbank-ai/rugpt3small_based_on_gpt2"
tokenizer = GPT2Tokenizer.from_pretrained(model_name_or_path)
model = GPT2LMHeadModel.from_pretrained(model_name_or_path).cuda()
text = "Александр Сергеевич Пушкин родился в "
input_ids = tokenizer.encode(text, return_tensors="pt").cuda()
with torch.no_grad():
    out = model(input_ids)
out = out.logits.cpu()
print(out.shape)

ai-forever / ru-gpts

Как embedding'и получить и какой они длины? #96