ebandal / H2Orestart

한컴파일을 LibreOffice에서 읽을 수 있도록 하는 extension입니다.
GNU General Public License v3.0
75 stars 6 forks source link

글자 누락 및 표 텍스트 잘림 증상, 그리고 HWPX에서의 폰트 이상현상 #33

Open cyhbank opened 2 months ago

cyhbank commented 2 months ago

안녕하세요? 건강하시죠?

항상 ebandal님에게 감사함을 느끼면서...

오랜만에 한글 변환 테스트 중 첨부한 문서와 같이 오류 증상이 있어 문의드립니다.

테스트문서 원본과 변환 문서 pdf를 비교해 보시면 3 페이지 하단의 표 안에 텍스트가 비정상 표시되는 것과 년도와 서명 텍스트가 누락되고 있습니다. 4 페이지의 상단 표에서도 5번 항목 2개가 누락되고 있고, 마지막 페이지의 특정 표에서는 텍스트가 잘려서 보이지 않습니다.

그리고 테스트문서2와 같은 hwpx 문서 변환된 pdf는 보시는 바와 같이 폰트가 깨지거나 블럭표시가 되어서 나옵니다.

이상입니다. 테스트문서.zip

감사합니다~

ebandal commented 2 months ago

안녕하세요. 오류에 대해 리포팅해주셔서 감사합니다. 리포팅 덕분에 조금씩이나마 개선의 길을 가고 있습니다.

H2Orestart 확장의 목표가 한컴과 유사하게 보이는 수준이지만, 정도가 사람마다 편차가 있으니 한컴의 대체 용도로 사용하고자 하시는 분들께는 불편함이 있을것입니다. 기술적으로 극복하지 못하는 첫번째는 한컴폰트입니다. 한컴에서는 한컴 전용폰트 사용이 당연하지만, 한컴 외부에서는 전용폰트를 사용할 수 없고, 폰트상의 글자 폭, 글자 사이의 간격 들을 유사하게 만든다고 해도 문서마다 덜 유사하게, 더 유사하게 보이는 차이가 발생합니다. 그럼에도 대체제로 사용하시겠다면 전체 문서의 폰트크기를 1pt씩 줄여보세요 공간이 작아서 보이지 않았던 글자들이 웬만큼 보일것으로 예상합니다. 그럼 확장에서 아예 1pt씩 줄여서 변환하면 되지 않느냐 의문을 가지실 수도 있겠습니다만, 다른 형태의 문서 변환에서 차이가 커지게 되니 한면만 보고 선택하기엔 어려운 내용입니다.

또 다른 허들은 테이블입니다. 한컴의 테이블을 그림개체처럼 다룰 수 있지만, 리브레오피스에서는 테이블은 그림개체처럼 사용하지 못하여 프레임을 만들어 그 안에 테이블을 넣고 있습니다. 테이블의 특성도 차이가 있어서 글자나 문단처럼 흉내내기가 까다롭습니다. 테이블내에 테이블이 있고, 또 내부 테이블 안에 또 테이블을 넣는 경우, 모든 개체들이 한컴처러 자연스럽게 나오지 못하는 경우가 생깁니다. 여러번 시도하지만 결과가 따라오지 못하네요.

그외에도 문단 글간격이나 개체모음등 수많은 것들이 호불호가 있을 것입니다. 저도 한컴문서에 하나씩 바꿔보면서 내용을 알아가고, 비슷하게 만들도록 하겠습니다.

hwpx문서 변환시 폰트가 깨지거나 블럭표시가 되어 나오는 것은 100% 오류가 맞고, 이는 다음번 릴리스시 개선하겠습니다.

감사합니다.

cyhbank commented 2 months ago

ebandal님의 열정에 감사드리며... 저도 기회가 된다면 개선하는데 조금이나마 일조할 수 있도록 노력해보겠습니다. 건강하세요~

OctopusET commented 1 month ago

https://aur.archlinux.org/packages/ttf-ms-fonts

위 패키지에서 윈도우의 폰트를 추출하는 것 처럼 hancom 폰트를 추출하는 방법이 있다면 폰트 문제를 해결 할 수 있을 것 같습니다

ebandal commented 1 month ago

@OctopusET 한컴폰트 사용은 기술적인 문제에 앞서 저작권 문제가 있습니다. 아래 정리된 글을 보시면 이해하실 수 있습니다. https://dobiho.com/57477/