macbre / wbc

Publications from Wielkopolska Biblioteka Cyfrowa converted from DJVU to text format
http://www.wbc.poznan.pl/dlibra
BSD 3-Clause "New" or "Revised" License
0 stars 0 forks source link
archive djvu poznan python wbc

wbc

Build status

Skrypt importujący publikacje na licencji Fair Use w formacie DJVU z zasobów Wielkopolskiej Biblioteki Cyfrowej

Wymagania

sudo apt-get install djvulibre-bin python3-lxml

virtualenv --system-site-packages env3 -p python3
source env3/bin/activate

pip install -U -e .

Pobieranie

fetch [--no-fetch] <ID publikacji>

Struktura katalogów

 - publications/
   - <ID publikacji>/
     - index.json
     - issues/
       - <rocznik>
         - <ID numeru>.txt

xmlpipe2

Aby wygenerować plik dla źródła SphinxSE xmlpipe2:

generate_xml 106644 | gzip -c > 106644.xml.gz
generate_xml 106644,142333 | gzip -c > kronika_gazeta_wielkiego_ksiestwa.xml.gz

Publikacje