WolfgangFahl / ProceedingsTitleParser

Shallow Semantic Parser to extract metadata from scientific proceedings titles
Apache License 2.0
3 stars 1 forks source link

Invalid Crossref event with cyrillic letters #67

Closed WolfgangFahl closed 1 year ago

WolfgangFahl commented 3 years ago

dump of /Users/wf/Documents/pyworkspace/ProceedingsTitleParser/storage/../cache/Event_crossref.db has size 16.9 MB SQL error unrecognized token: "'МИНИСТЕРСТВО ПРОСВЕЩЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ" in line 47692: INSERT INTO "Event_crossref" VALUES('Актуальные проблемы коррекционной педагогики и специальной психологии. Развитие обучающихся с ограниченными возможностями здоровья в условиях традиционного и дистанционного взаимодействия','Воронеж','crossref','Актуальные проблемы коррекционной педагогики и специальной психологии. Развитие обучающихся с ограниченными возможностями здоровья в условиях традиционного и дистанционного взаимодействия. материалы XVII Регионального научно-практического семинара с международным участием','10.47438/978-5-00044-791-8_2020','10.47438/978-5-00044-791-8_2020','https://api.crossref.org/v1/works/10.47438/978-5-00044-791-8_2020',NULL,NULL,'МИНИСТЕРСТВО ПРОСВЕЩЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ SQL error near "ФЕДЕРАЛЬНОЕ": syntax error in line 47693: ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ» ',NULL,2020)

Seems to be MINISTRY OF EDUCATION OF THE RUSSIAN FEDERATION ...