Open AlexanderBobryakov opened 1 month ago
Тут прикладываю mvp (без ONNX):
from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline
import pandas as pd
# Загрузка предобученной модели и токенизатора
model_name = "cross-encoder/nli-roberta-base"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
# Создание пайплайна для классификации текстов
classifier = pipeline('zero-shot-classification', model=model, tokenizer=tokenizer)
# Пример текста для классификации
text = "Как настроить CI/CD для проекта на GitLab?"
# Возможные категории
candidate_labels = ["DevOps", "IT", "Frontend", "Backend", "Data Science", "Machine Learning", "Cybersecurity", "Cloud Computing", "Mobile Development", "Game Development", "Database Administration"]
# Классификация текста
result = classifier(text, candidate_labels)
# Форматирование результата в человекочитаемый вид
df = pd.DataFrame({
'Category': result['labels'],
'Score': result['scores']
})
print(f"Predicted Category: {predicted_category}\n")
print("Detailed Scores:")
print(df)
Так как я тут скидываю прям готовое решение, то ожидаю от тебя:
TO-BE: