vas3k / python-glr-parser

Попытка сделать свой GLR-парсер для русского языка на Python
141 stars 26 forks source link

Вопрос по использованию #9

Open paullarionov opened 8 years ago

paullarionov commented 8 years ago

Привет!

Только начал вникать в твой проект и оба примера не работают:

  1. Парсинг дозировки лекарства - не опознает токен по словарю
  2. В словарь не добавить токен u"р-p"

Можешь помочь? Спасибо!


# -*- coding: utf-8 -*-
from glr import GLRParser

dictionaries = {
    u"DOSE": [u"мг", u"мл"],
    u"RASTVOR": [u"раствор", u"рр", u"р-p"]
}

grammar = u"""
    S = num DOSE | RASTVOR
"""

glr = GLRParser(grammar, dictionaries=dictionaries, debug=True)

text = u"примовист р-р для /в в введ.0,25 ммоль/мл шприц 10 мл №1 под заказ"
for parsed in glr.parse(text):
    print "FOUND:", parsed
paullarionov commented 8 years ago

А еще, можно ли как-то понять по какому правилу сработал текст. Или в моем случае если я хочу из одной и тоже строки распарсить дозировку, форму выпуска, количество - нужно 3 разных парсера и прогона?

paullarionov commented 8 years ago

Судя по всему num вообще не работает