leedasom66 / libhangul

Automatically exported from code.google.com/p/libhangul
GNU Lesser General Public License v2.1
0 stars 0 forks source link

세벌식옛글에서 초성+종성 입력할 때 #7

Open GoogleCodeExporter opened 8 years ago

GoogleCodeExporter commented 8 years ago
What steps will reproduce the problem?
1. 쉘에서 hangul -s -k 3y -i ka 라고 명령을 내립니다.
2. 화면에 <U+1100 U+1160 U+11BC>가 출력됩니다.

What is the expected output? What do you see instead?
 <U+1100 U+1160 U+11BC>는 well-formed 문자열이 아닙니다. <U+1100 U+1160 U+115F U+1160 U+11BC>가 출력되어야 할 것으로 보입니다.

What version of the product are you using? On what operating system?
 v0.1.0 on max os x

Please provide any additional information below.
 http://www.unicode.org/reports/tr29/tr29-25.html#Transforming_Into_SKS 여기를 보면, 초성 다음에 중성 아닌 것이 올 때 중성채움을 삽입하고, 종성 앞에 중성 아닌 것이 올 때 초성채움과 중성채움을 삽입하도록 정하고 있습니다. 특히 표7을 보세요. 또한 국내표준인 KS X 1026-1: 2007도 같은 취지입니다. http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3422.pdf

Original issue reported on code.google.com by nomosno...@gmail.com on 13 Aug 2014 at 9:59

GoogleCodeExporter commented 8 years ago
전에는 초성+종성을 한 음절로 처리했던 것 같은데,
표준이 바뀐 것인지, 제가 착각했던 것인지는 잘 
모르겠네요.

두 번째 문서도 읽어 보고 싶은데 연결이 안됩니다.
혹시 유효한 다른 링크가 있다면 알려주시면 
감사하겠습니다.

위 내용대로라면 초성+종성을 두음절로 처리해야 하는데,
그러면 세벌식에서 모아치기를 하는 경우 초성+종성 상태를 
두음절로 표시하게 되는 문제가 발생합니다.
이 문제를 어떻게 처리하는 것이 좋을지 생각좀 해보는 
것이 좋겠습니다.

Original comment by choe.hwanjin@gmail.com on 14 Aug 2014 at 2:56

GoogleCodeExporter commented 8 years ago
아, 아직도 연결이 안 되는군요. 제가 사본을 갖고 있으니 
이걸로 보세요. 특히 7.5절과 7.8절을 중점적으로 보십시오. 
http://ktug.org/~nomos/stuffs/n3422.pdf

요는, 음절 경계를 확정한 다음에 마지막 단계에서 
채움문자를 삽입하라는 것입니다. 모아치기 루틴을 다 
적용한 후에 그래도 <L V T?> 음절로 구성되지 않은 경우 
채움문자가 들어가도록 하면 되는데, 물론 프로그래밍의 
관점에서는 간단한 문제가 아닐 수 있겠습니다. 어쨌든 
현재 libhangul의 출력은 문제가 있습니다.

Original comment by nomosno...@gmail.com on 14 Aug 2014 at 3:57