inukshuk / anystyle

Fast citation reference parsing
https://anystyle.io
Other
1.06k stars 91 forks source link

Added 10 citations with 40 fields total #176

Open pantsonfire opened 2 years ago

pantsonfire commented 2 years ago

But it divided it into 40 citations. Even without reading Chinese, one can tell this is 10 citations not 40. How can I fix?

Example:

图中坐者即此次赴东亚聚会之太虚上人顷已返申左坐者为青囊法师右为昭三法师后左立者为钱化佛氏右为王晓籁君合摄于海上雪窦寺[照片] 联益之友 1925 第10期 1

社长太虚大师[照片] 海潮音 1925 第6卷 第9期 1页

苏州报恩北寺礼请太虚法师讲仁王护国经摄影(时民国乙丑秋八月)[照片] 海潮音 1925 第6卷 第10期 1页

太虚法师在苏州报恩北寺讲经摄影[照片] 世界佛教居士林林刊 1926 第11期 1页

新嘉坡龙山寺欢迎太虚法师大会摄影[照片] 海潮音 1926 第7卷 第10期 1页

星洲名流欢迎太虚法师之雅集[照片] 海潮音 1926 第7卷 第10期 1页

中华学校童子军在鸿山寺欢迎太虚法师摄影[照片] 海潮音 1926 第7卷 第11期 1页

星洲讲经会欢迎太虚法师上岸摄影[照片] 海潮音 1926 第7卷 第10期 1页

太虚法师在北京佛学研究会摄影[照片] 海潮音 1926 第7卷 第8期 1页

闽南各团体在南普陀欢迎太虚法师摄影[照片] 海潮音 1926 第7卷 第11期 1页

inukshuk commented 2 years ago

The parser expects one reference per line as input, so these references so the appropriate lines need to be joined first. (We have some heuristics to join consecutive lines in the Finder model, but those are limited to latin script and punctuation).