PMKrol / CC-SJP

Polish dictionary for mobile readers based on SJP.pl, Wikipedia and Wiktionary
16 stars 1 forks source link

Metadane przy wyborze słownika #4

Open robertdrozd opened 1 year ago

robertdrozd commented 1 year ago

Gdy wybieramy słownik na PB, pojawia się pod etykietą "Inne", a nie "Polish". Może to kwestia jakichś metadanych, które nie zostały ustawione?

scr0200_wybor_slownika

madalinski commented 1 year ago

Sprawdziłem chyba wszystkie możliwe kombinacje z tagami, ale jak dotąd bez powodzenia 🙃

PMKrol commented 1 year ago

Zobaczmy co na mobileread nam powiedzą ;)

madalinski commented 1 year ago

Trzymam kciuki - sprawdzałem kilka ze słowników tam wrzucanych przy okazji analizy formatu nagłówków w xdxf... i w żadnym to nie działało 🫣 Chyba trzeba pójść głębiej, do źródła converter.exe Edit: https://www.mobileread.com/forums/showpost.php?p=3923322&postcount=6

PMKrol commented 1 year ago

W międzyczasie: to.

PMKrol commented 1 year ago

W kodzie convertera można znaleźć ciągi znaków:

any key to continue --�k�full_name�b�description�ar�?xml�xdxf�i�lang_from�lang_to�unclosed xml tag�LANG_TO�LANG_FROM�internal error: *zpos != 0�&�<�>�"�cannot open input XDXF file�this file is not in XDXF format�1.2.3������� deflate 1.2.3 Copyright 1995-2005 Jean-loup Gailly ����

Jeszcze nie próbowałem tego dekompilować i analizować, bo to nie jest rzecz którą często robię ;) ...ale ewidentnie program tych słów szuka. Trzeba tylko dowiedzieć się gdzie... image

@madalinski , czy mógłbyś wypróbować to: <xdxf lang_from="eng" lang_to="eng" format="visual">

madalinski commented 1 year ago

obraz

<?xml version="1.0" encoding="UTF-8" ?>
<xdxf lang_from="eng" lang_to="eng" format="visual">
    <full_name>tag xdxf lang_from eng lang_to eng</full_name>
<?xml version="1.0" encoding="UTF-8" ?>
<xdxf LANG_FROM="eng" LANG_TO="eng" format="visual">
    <full_name>w tagu xdxf LANG_FROM eng LANG_TO eng</full_name>
<?xml version="1.0" encoding="UTF-8" ?>
<xdxf LANG_FROM="ENG" LANG_TO="ENG" format="visual">
    <full_name>w tagu xdxf LANG_FROM ENG LANG_TO ENG wielkie</full_name>
<?xml version="1.0" encoding="UTF-8" ?>
<xdxf lang_from="eng" lang_to="eng" format="visual">
    <full_name>tag xdxf lang_from eng lang_to eng</full_name>
<?xml version="1.0" encoding="UTF-8" ?>
<lang_from "eng">
<lang_to "eng">
<xdxf format="visual">
    <full_name>testowy - przed xdxf w tagach lang_from lang_to</full_name>
<?xml version="1.0" encoding="UTF-8" ?>
<xdxf format="visual">
<lang_from>eng</lang_from>
<lang_to>eng</lang_to>
    <full_name>testowy - za xdxf</full_name>
<?xml version="1.0" encoding="UTF-8" ?>
<xdxf format="visual">
<lang_from "eng">
<lang_to "eng">
    <full_name>testowy - za xdxf w tagach lang_from lang_to</full_name>
<?xml version="1.0" encoding="UTF-8" ?>
<xdxf>
<from xml:lang="en"/>
<to xml:lang="en"/>
    <full_name>xml lang za xdxf</full_name>
madalinski commented 1 year ago

Eureka! obraz Tyle, że takie rozwiązanie odpada dla większości użytkowników. W katalogach PB znalazłem plik bazy danych z rozpisanymi słownikami, i dodałem odpowiedni wpis 😅 obraz

PMKrol commented 1 year ago

Grubo, ale niekoniecznie jest to zła opcja. Zakładając, że większość użytkowników nie zmienia tej bazy, można by udostępniać słownik wraz z pbdicts podstawowym z dopisanym słownikiem cc-sjp. Da się wpisać w file gwiazdkę? Żeby wszystkie SJP-PocketBook-*.dic rozpoznawał jako PL?

edit. udostępnij mi proszę, jeśli możesz, plik bazy. edit2. O! i plik słownika, który działa natywnie z oznaczeniem języka. Może tam coś znajdziemy.

PMKrol commented 1 year ago
<?xml version="1.0" encoding="UTF-8" ?>
<xdxf format="visual">
<lang_from>eng</lang_from>
<lang_to>eng</lang_to>
    <full_name>testowy - za xdxf</full_name>

a to wielkimi literami?

madalinski commented 1 year ago

Wpisać się da, ale gwiazdka nic nie daje.

Próbowałem wielkimi, również bez "full_name" (skoro po wpisaniu do bazy nazwę "połyka"), ale nic z tego.

pbdicts.zip obraz

PMKrol commented 1 year ago

A jakbyś skopiował plik ze słownikiem, który działa natywnie z inną nazwą - wpada do Other czy tam gdzie trzeba?

madalinski commented 1 year ago

Do natywnych słowników niestety nie mam dostępu - prawdopodobnie są na jakiejś chronionej partycji. Próbowałem je znaleźć i podejrzeć co mają w środku, i tak własnie trafiłem na tę bazę.

PMKrol commented 1 year ago

image To gdzieś tu jest! Ale chyba jestem za wąski na taką głęboką analizę softu...

PMKrol commented 1 year ago

@madalinski, wysłałem Tobie maila ze słownikami wypakowanymi z firmware PocketBooka ^^

Użyłem tego na tym.

madalinski commented 1 year ago

Po wrzuceniu na PB najpierw wylądowały we właściwych kategoriach, więc zmieniłem nazwy plików... i wleciały do "other" 😅 Edit: Był jeden wyjątek - "English_German.dic" po zmianie nazwy na "angielsko-niemiecki.dic" nadal był w kategorii "English" ... ale wychodzi na to, że jedynie dlatego, że w nazwie miał "English-German" (które było kompatybilne z wpisem w bazie), gdy zmieniłem to (nazwę) w pliku *.dic to dołączył do reszty.

PMKrol commented 1 year ago

No, to chyba mamy case closed jako niemożliwe do rozwiązania. Skoro nawet oryginalne słowniki nie są rozpoznawane poprawnie, to tylko modyfikacja bazy danych.

Dzięki.