rosettatype / hyperglot

Hyperglot: a database and tools for detecting language support in fonts
http://hyperglot.rosettatype.com
GNU General Public License v3.0
166 stars 23 forks source link

Please add support for Gurage languages (Ethiopic_Extended-B) #134

Closed MariannaPaszkowska closed 10 months ago

MariannaPaszkowska commented 1 year ago

Hi there, it would be great if you could add support for the Gurage languages.

Here is more information: https://en.wikipedia.org/wiki/Ethiopic_Extended-B https://www.unicode.org/charts/PDF/U1E7E0.pdf

kontur commented 11 months ago

Hey @MariannaPaszkowska thanks for the suggestion. I found some general overview on Wikipedia, but do you know of any sources that would have those languages' orthographies with the Ethiopic Extended B characters? Generally speaking, we don't add unicode ranges, but language orthographies using them.

MariannaPaszkowska commented 11 months ago

Hi Johannes! Here is a source that @moyogo (thanks, Denis!) has shared with me: https://github.com/keymanapp/keyboards/blob/master/release/gff/gff_gurage/source/GurageTyping-English.pdf
"Note: this doesnโ€™t include the legacy letters used in the previous orthography (some of which are listed in https://www.unicode.org/L2/L2021/21037-gurage-adds.pdf )."

NeilSureshPatel commented 11 months ago

I have orthographies for 9 languages that Daniel Yacob sent me once. Orthography Heat Maps

He put this together for building lexical models but the center table on each language tab has the complete orthography for that language.

kontur commented 11 months ago

Thanks to both of you. Would the list of languages in Daniel's spreadsheet be a good first addition? Do all of those languages have ISO codes, or are some not standardized or dialects only?

@https://github.com/dyacob (I'm guessing at the user name ;) ) are you okay with your spreadsheet data being used to compile some first drafts for these languages to include?

I'm also happy to do the technical input to Hyperglot if someone wants to suggest actual lists of characters here, e.g.:

Language name: โ€ฆ
ISO Code: โ€ฆ
Characters: โ€ฆ
NeilSureshPatel commented 11 months ago

If Daniel is ok with us using the data set, I can compile the character lists. Each of those languages have ISO Codes:

Amharic am
Awngi awn
Blin byn
Harari har
Gurage sgw
Tigrinya ti
Tigrinya Eritraen ti-ER
Tigrinya Ethiopic ti-ET
Tigre tig
Xamtanga xan

If Daniel doesn't respond here in a day or so I can send him an email.

kontur commented 11 months ago

Argh, I should have probably used @dyacob ... must have pasted the whole URL to the profile by accident. Let's hope this reaches Daniel :)

dyacob commented 11 months ago

Hi @kontur , I found a GitHub alert this morning ๐Ÿ˜Š . I regret that I'm not familiar with the Hyperglot project, but I understand the goal from the README.md. Regarding the spreadsheet of letter frequencies, you are more than welcome to use it in any way that you find helpful.

When I view the spreadsheet via Google Sheets, letters in the Gurage tab appear broken in places, appearing like punctuation and other symbols. So I suggest going to: File > Download > Microsoft Excel (.xlsm) to retrieve the original, then viewing the spreadsheet with Excel. The internal macros help with sorting, but can be disabled. The spreadsheet uses the Abyssinica SIL font which contains the new Extended-B letters. My guess is that the Google Sheets webfont does not yet have them, thus the Ethio-Mojibake. I can also mail the spreadsheet or CSV files of the data.

There is little or no text with Ethiopic Extended-B letters to be found online, in large part because font updates haven't reached users yet. There is an old and new Gurage orthography, so when detecting a language based on letters, hyperglot would have to look for both. Some background is in UTN 49 , see the attached PDF at the bottom. The appendix on page 13 has a table of the "Modern Gurage Syllabary", these are the letters needed to write in-language. Gurage will also borrow a lot of lone words from Amharic which uses letters not in the table. LMK if similar tables would help for the other Ethiopian languages.

NeilSureshPatel commented 11 months ago

Thanks @dyacob! @kontur I can assemble the glyph lists and post them when they are ready. The exemplars should be straight forward. How are auxiliary glyphs defined in Hyperglot? Do they include anything that may be used for loan words? i.e. per Daniel's note should we include all the Amharic letters that are not part of the Gurage language in its auxiliary set? Sorting this out will be a bit more work for each language.

NeilSureshPatel commented 11 months ago

@kontur Here are the exemplar character sets.

Language name: Awngi
ISO Code: awn
Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆง แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ€ แŠ แŠ‚ แŠƒ แŠ„ แŠ… แŠ† แŠˆ แŠŠ แŠ‹ แŠŒ แŠ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠง แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แ‹ธ แ‹น แ‹บ แ‹ป แ‹ผ แ‹ฝ แ‹พ แ‹ฟ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ” แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ— 

Language name: Blin
ISO Code: byn
Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆง แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ€ แŠ แŠ‚ แŠƒ แŠ„ แŠ… แŠ† แŠˆ แŠŠ แŠ‹ แŠŒ แŠ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠง แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แ‹ธ แ‹น แ‹บ แ‹ป แ‹ผ แ‹ฝ แ‹พ แ‹ฟ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ” แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ—

Language name: Gurage
ISO Code: sgw
Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— ๐žŸจ ๐žŸฉ แˆ— ๐žŸช ๐žŸซ ๐žŸ  ๐žŸก ๐žŸข ๐žŸฃ ๐žŸค ๐žŸฅ ๐žŸฆ แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แŽ€ ๐žŸญ แˆŸ ๐žŸฎ แŽƒ แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆง แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แŽ„ ๐žŸณ แ‰ง ๐žŸด แŽ‡ แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ€ แŠ แŠ‚ แŠƒ แŠ„ แŠ… แŠ† แŠˆ แŠŠ แŠ‹ แŠŒ แŠ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠง แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แ‹ธ แ‹น แ‹บ แ‹ป แ‹ผ แ‹ฝ แ‹พ แ‹ฟ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ” แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แŽˆ แŽˆ แ ๐žŸผ แŽ‹ แ แ‘ แ’ แ“ แ” แ• แ– แ— แŽŒ ๐žŸฝ แ— ๐žŸพ แŽ 

Language name: Harari
ISO Code: har
Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆง แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ€ แŠ แŠ‚ แŠƒ แŠ„ แŠ… แŠ† แŠˆ แŠŠ แŠ‹ แŠŒ แŠ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠง แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แ‹ธ แ‹น แ‹บ แ‹ป แ‹ผ แ‹ฝ แ‹พ แ‹ฟ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ” แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ— 

Language name: Tigre
ISO Code: tig
Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆง แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ€ แŠ แŠ‚ แŠƒ แŠ„ แŠ… แŠ† แŠˆ แŠŠ แŠ‹ แŠŒ แŠ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠง แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แ‹ธ แ‹น แ‹บ แ‹ป แ‹ผ แ‹ฝ แ‹พ แ‹ฟ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ” แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ— 

Language name: Tigrinya
ISO Code: ti
Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆง แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ€ แŠ แŠ‚ แŠƒ แŠ„ แŠ… แŠ† แŠˆ แŠŠ แŠ‹ แŠŒ แŠ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠง แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ— 

Language name: Xamtanga
ISO Code: xan
Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆง แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ€ แŠ แŠ‚ แŠƒ แŠ„ แŠ… แŠ† แŠˆ แŠŠ แŠ‹ แŠŒ แŠ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠง แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แ‹ธ แ‹น แ‹บ แ‹ป แ‹ผ แ‹ฝ แ‹พ แ‹ฟ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ” แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ— 
kontur commented 11 months ago

Thank you very much @NeilSureshPatel and @dyacob.

Please have a look at this commit and feel free to use the commenting feature (below the commit, or add a blue [+] on any of the specific lines) to point out anything off you might notice or feel you'd want to add additionally. I've marked these orthographies with validity: draft for now; ideally we'd want a linguist or native expert to verify those, but we may still set them to preliminary eventually so they get included in the web app and default CLI validation. The orthography heatmaps seem to be just ephemeral sources so don't qualify as source per se, but let me know if you deem any other source material relevant to mention.

We had Tigrinya in the DB already but with a more concise character set, all the other language are new additions ๐Ÿ’ฏ

dyacob commented 11 months ago

@kontur & @NeilSureshPatel , the exemplars look good at a glance. I'll add references for each and will double-check against the references. Probably won't get to it until the weekend.

moyogo commented 11 months ago

Should sgw be more specific than "Gurage"? https://iso639-3.sil.org/code/sgw names it "Sebat Bet Gurage".

NeilSureshPatel commented 11 months ago

@dyacob elaborates on the dialects and terminology in UTN49 section 2. According to this it appears that Gurage is the preferred term for all dialects. I haven't checked to see if the other dialects have ISO tags. Maybe we need to replicate the data across multiple tags to capture them all?

dyacob commented 11 months ago

Hi All, I was working on references when I realized that the Tigre list of characters had some non-Tigre letters (แ‹น แ‹บ แ‹ป แ‹ผ แ‹ฝ แ‹พ แ‹ฟ ... แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ” stood out). I guess this came from the Heatmap file? I'm realizing now how it could be misleading. An explanation:

The first column in the tables of (usually) 44 rows of letters is meant to be a maximal potential list of letters that might be found in corpus. It's not intended to be the Tigre (for example) language syllabary, the non-Tigre letter rows might become populated due to borrowed words (usually personal or place names), and often typographical errors.

It is a little interesting to see how frequently non-Tigre letters get used (and which ones) in Tigre literature. But then you have to know Tigre phonology to make this analysis, and the heatmap tables aren't illuminating here. So I should update the heatmaps to indicate the language-specific orthographies so the difference is clear.

Apologies for the confusion here. I'll adjust the lists that @NeilSureshPatel posted and will add the references, but will need another evening to do so.

kontur commented 11 months ago

@dyacob ah thanks, that's insightful, and makes sense. We do distinguish between base and auxiliary characters, so for example accented ร  รก are auxiliary characters for English since they are used only in load words but still frequent enough that we consider them relevant. If those non Tigre characters are of the same category, we could list them as auxiliary, if that is applicable. Generally speaking, we want the base list of characters to be quite condensed and really specific to the language and orthography, so I'm also okay with just dropping them so we don't include clutter and maybe's. If you can post character list corrections like Neil did above that would be superb; it really takes language specialists for this work, so we very much appreciate the effort!

dyacob commented 10 months ago

FWIW, I've been slowly working on a reference for Ethio-Eri orthographies, so if there is interest in the Hyperglot project to track the letter inventories of additional languages that use Ethiopic script (or have used in the past), the following is a list of what could be provided:

Name ISO Code Current / Past Usage
Amharic am, amh Current
Argobba agj Current
Awngi awn Current
Basketo bst Current
Bench bcq Past (199x โ€“ 2008)
Bilin byn Current
Dawro dwr Past
Dizin mdx Current
Gamo gmv Past
Gedeo drs Current (1986 - )
Geโ€™ez gez Current (Extinct)
Gofa gof Past
Gumuz guk Past
Hammer-Banna amf Current
Harari har Current
Inor ior Current (as per โ€œGurageโ€)
Kambaata ktb Current
Kistane gru Current (as per โ€œGurageโ€)
Konso kxc Past (1970s โ€“ 2012)
Meโ€™en mym Past
Mesqan mvz Current (as per โ€œGurageโ€)
Mursi muz Past
Oromo om, orm Past (until 1991)
Qebena* alw Current
Qimant ahg Current
Sebat Bet Gurage sgw Current (as per โ€œGurageโ€)
Sidamo sid Past (until 1993)
Siltโ€™e stv Current
Suri suq Past
Tigre tig Current
Tigrinya ti, tir Current
Wolaita wal Past
Xamtanga xan Current
Yemsa jnj Current
Zay zwa Current

As came up earlier, a number of languages roll up into the broader term "Gurage" which is preferred now as the inclusive term for any language spoken within the "Gurage Zone" (an administrative region of Ethiopia). In the past, "Sebat Bet" often equated to "Gurage", and vice versa, which then created the perception of one group favored above the rest. Modern usage as promoted by the Gurage Zone Authority is to for "Gurage" to serve as an umbrella term and to also apply a common orthography across the zone.

dyacob commented 10 months ago

Geสพez

Language name: Geสพez ISO Code: gez Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆง แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แŠ€ แŠ แŠ‚ แŠƒ แŠ„ แŠ… แŠ† แŠˆ แŠŠ แŠ‹ แŠŒ แŠ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ—

Blin

Language name: Blin ISO Code: byn Characters [Min]: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ– แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แˆ แ‰ แŠ แ‹ แŒ แ แŽ

Modern Blin adds additional series to accommodate words from neighboring languages and European languages (e.g. "แ‰จ")

Non-Blin Series: แ‰จ แ‰ธ แŠ˜ แŒธ แŒฐ แ‹˜ แ‹  แ

Characters [Max]: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ– แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ‘ แ’ แ“ แ” แ• แ– แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ

References: Alibekit, Tekie. Transliteration of Blin from Geโ€™ez Script to Latin. 2021. Oslo. Daberi Blin Language Forum. https://www.daberi.org/Daberi-filer/Language-filer/Blin%20from%20Ge%e2%80%99ez%20Script%20to%20Latin.pdf

Alibekit, Tekie. Blin Letters of Geez Alphabet. 2002. Daberi Blin Language Forum. https://www.daberi.org/Daberi-filer/Language-filer/Blin%20Letters%20of%20Geez%20Alphabet%20(Blina%20Fdelat%20Gi'ezu)%202002,%20by%20Tekie%20Alibekit.pdf

Abrha, Abdella. แŒƒแˆ…แˆซแ‹ญ - แŠฅแŠ•แŒแˆŠแ‹ แ‰ฅแˆŠแŠ• แ‰–แˆ‹แ‰ต แŠฅแŠ•แ‹ตแ‰ฃ, Jahray - English Blin Dictionary , 2023.

Harari

Language name: Harari ISO Code: har Characters [Min]: แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠ  แŠ  แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แˆ แ‰ แŠ แ‹ แŒ แ แŽ

The minimal Harari syllabary was provided by the Harari regional government office in 1998 during a survey for the national script standard (ES-781). The maximal Harari orthography was developed by the Harari Language Research Academy and adds letters to aid in the transcription of Arabic and for the rendering of neighboring languages, primarily Amharic. The syllabary seen on Wikipedia for Harari should be disregarded. It was developed by a diaspora group in Australia as an experimental orthography aimed at addressing a number of linguistic issues but was not later adopted by a Harari institute in Ethiopia.

Non-Harari Series: แˆ€ แˆ  แŠ€ แ‹ แ‹  แŒฐ แŒธ แ€ แ

Characters [Max]: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แŠ€ แŠ แŠ‚ แŠƒ แŠ„ แŠ… แŠ† แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠ  แŠ  แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ‘ แ’ แ“ แ” แ• แ–

References: Harari Language Research Academy. "แ‰แˆซแˆต" - แŒฉแ‰…แ‰ฒ แŠชแ‰ณแ‰ฅ, "Quras" - Chuqti Kitab. Harari Language Research Academy. 2002 (2009EC). Harar, Ethiopia.

Tigre

Language name: Tigre ISO Code: tig Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ‘ แ’ แ“ แ” แ• แ–

Modern Tigre may also include the แŠ€ family to support the transcription of Arabic words. แŠ€ was also used briefly by foreign researchers during the 19th century to record Tigre lexicons.

References:

Kekia, Omar M. Kekia. Dehai Tigre Page, 1996. Dehai Eritrea Online. https://www.people.vcu.edu/~gasmerom/Eritrean_languages/tigre/

Bible Society of Ethiopia, แŠญแ‰ณแ‰ฅ แ‰…แ‹ฑแˆต , Bible Society of Ethiopia. Nairobi. 1991.

Gurage

Language name: Gurage ISO Code: sgw, ior, gru, mvz Characters: แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– ๐žŸจ ๐žŸฉ แˆ— ๐žŸช ๐žŸซ ๐žŸ  ๐žŸก ๐žŸข ๐žŸฃ ๐žŸค ๐žŸฅ ๐žŸฆ แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แŽ€ ๐žŸญ แˆŸ ๐žŸฎ แŽƒ แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆธ แˆน แˆบ แˆป แˆผ แˆผ แˆพ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ ๐žŸฐ แ‰‹ ๐žŸฑ ๐žŸฒ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แŽ„ ๐žŸณ แ‰ง ๐žŸด แŽ‡ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ ๐žŸต แŠณ ๐žŸถ ๐žŸท แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ ๐žŸธ แŒ“ ๐žŸน ๐žŸบ แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แˆ แ‰ แŠ แ‹ แŒ แ แŽ แŽˆ ๐žŸป แ ๐žŸผ แŽ‹ แ แ‘ แ’ แ“ แ” แ• แ– แŽŒ ๐žŸฝ แ— ๐žŸพ แŽ

The series: แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– above is incorporated into the modern syllabary for the transcription of non-Gurage words.

Legacy Gurage Characters: แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แŽ€ แŽ แˆŸ แŽ‚ แŽƒ แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆธ แˆน แˆบ แˆป แˆผ แˆผ แˆพ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ ๐žŸฐ แ‰‹ ๐žŸฑ ๐žŸฒ โท€ โท โท‚ โทƒ โท„ โท… โท† แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แŽ„ แŽ… แ‰ง แŽ† แŽ‡ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ ๐žŸต แŠณ ๐žŸถ ๐žŸท โทˆ โท‰ โทŠ โท‹ โทŒ โท โทŽ โท โท‘ โท’ โท“ โท” โท• โท– แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ ๐žŸธ แŒ“ ๐žŸน ๐žŸบ โท˜ โท™ โทš โท› โทœ โท โทž แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แˆ แ‰ แŠ แ‹ แŒ แ แŽ แŽˆ แŽ‰ แ แŽŠ แŽ‹ แ แ‘ แ’ แ“ แ” แ• แ– แŽŒ แŽ แ— แŽŽ แŽ

Xamtanga

Language name: Xamtanga (aka Ximtanga, Khamtanga, Khimtanga) ISO Code: xan Characters[Min]: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ” แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ—

Characters[Max]: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆง แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž โถ“ โถ” แŒŸ โถ• โถ” แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ—

Note: There has been a lot of experimentation with Xamtanga orthographies with consistent information virtually non-existent. The maximal list is generated from the newspaper corpus scraping used to produce the Xamtanga heatmap. The minimal list removes series that were not also found in the table produced by Dr. Alimeraw. Dr. Alimeraw was a native speaker who tried to promote additional letters for Xamtanga that have not been adopted by Unicode or the Xamtanga community (thus his experimental letters are omitted).

References: Gebre-Hiwet , Alimeraw. The Phonology and Orthography of Ximtanga, 2008, Addis Ababa. https://www.academia.edu/87678722/The_Phonology_and_Orthography_of_Ximtanga

Awngi

Language name: Awngi ISO Code: awn Characters[Min]: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠง แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ–

Note: Reliable, and current, information for Awngi orthographies is difficult to come by. The maximal list is informed by the newspaper archive corpus scraping used to produce the Awngi heatmap. The minimal list removes series that are not in Awngi phonology as per the research of linguist Andreas Joswig.

Characters[Max]: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠง แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ˜ แŒ™ แŒš แŒ› แŒœ แŒ แŒž แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ–

Ethiopian Tigrinya

Language name: Ethiopian Tigrinya ISO Code: ti-ET Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆ  แˆก แˆข แˆฃ แˆค แˆฅ แˆฆ แˆง แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ€ แŠ แŠ‚ แŠƒ แŠ„ แŠ… แŠ† แŠˆ แŠŠ แŠ‹ แŠŒ แŠ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แ€ แ แ‚ แƒ แ„ แ… แ† แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ—

Eritrean Tigrinya

Language name: Eritrean Tigrinya ISO Code: ti-ER Characters: แˆ€ แˆ แˆ‚ แˆƒ แˆ„ แˆ… แˆ† แˆˆ แˆ‰ แˆŠ แˆ‹ แˆŒ แˆ แˆŽ แˆ แˆ แˆ‘ แˆ’ แˆ“ แˆ” แˆ• แˆ– แˆ— แˆ˜ แˆ™ แˆš แˆ› แˆœ แˆ แˆž แˆŸ แˆจ แˆฉ แˆช แˆซ แˆฌ แˆญ แˆฎ แˆฏ แˆฐ แˆฑ แˆฒ แˆณ แˆด แˆต แˆถ แˆท แˆธ แˆน แˆบ แˆป แˆผ แˆฝ แˆพ แˆฟ แ‰€ แ‰ แ‰‚ แ‰ƒ แ‰„ แ‰… แ‰† แ‰ˆ แ‰Š แ‰‹ แ‰Œ แ‰ แ‰ แ‰‘ แ‰’ แ‰“ แ‰” แ‰• แ‰– แ‰˜ แ‰š แ‰› แ‰œ แ‰ แ‰  แ‰ก แ‰ข แ‰ฃ แ‰ค แ‰ฅ แ‰ฆ แ‰ง แ‰จ แ‰ฉ แ‰ช แ‰ซ แ‰ฌ แ‰ญ แ‰ฎ แ‰ฏ แ‰ฐ แ‰ฑ แ‰ฒ แ‰ณ แ‰ด แ‰ต แ‰ถ แ‰ท แ‰ธ แ‰น แ‰บ แ‰ป แ‰ผ แ‰ฝ แ‰พ แ‰ฟ แŠ แŠ‘ แŠ’ แŠ“ แŠ” แŠ• แŠ– แŠ— แŠ˜ แŠ™ แŠš แŠ› แŠœ แŠ แŠž แŠŸ แŠ  แŠก แŠข แŠฃ แŠค แŠฅ แŠฆ แŠจ แŠฉ แŠช แŠซ แŠฌ แŠญ แŠฎ แŠฐ แŠฒ แŠณ แŠด แŠต แŠธ แŠน แŠบ แŠป แŠผ แŠฝ แŠพ แ‹€ แ‹‚ แ‹ƒ แ‹„ แ‹… แ‹ˆ แ‹‰ แ‹Š แ‹‹ แ‹Œ แ‹ แ‹Ž แ‹ แ‹‘ แ‹’ แ‹“ แ‹” แ‹• แ‹– แ‹˜ แ‹™ แ‹š แ‹› แ‹œ แ‹ แ‹ž แ‹Ÿ แ‹  แ‹ก แ‹ข แ‹ฃ แ‹ค แ‹ฅ แ‹ฆ แ‹ง แ‹จ แ‹ฉ แ‹ช แ‹ซ แ‹ฌ แ‹ญ แ‹ฎ แ‹ฐ แ‹ฑ แ‹ฒ แ‹ณ แ‹ด แ‹ต แ‹ถ แ‹ท แŒ€ แŒ แŒ‚ แŒƒ แŒ„ แŒ… แŒ† แŒ‡ แŒˆ แŒ‰ แŒŠ แŒ‹ แŒŒ แŒ แŒŽ แŒ แŒ’ แŒ“ แŒ” แŒ• แŒ  แŒก แŒข แŒฃ แŒค แŒฅ แŒฆ แŒง แŒจ แŒฉ แŒช แŒซ แŒฌ แŒญ แŒฎ แŒฏ แŒฐ แŒฑ แŒฒ แŒณ แŒด แŒต แŒถ แŒท แŒธ แŒน แŒบ แŒป แŒผ แŒฝ แŒพ แŒฟ แˆ แ‰ แŠ แ‹ แŒ แ แŽ แ แ แ‘ แ’ แ“ แ” แ• แ– แ—

Notes

kontur commented 10 months ago

Hey @dyacob superb, thank you so much for those, I will update the database with those. How do I interpret the "Non-xxx series", are they from loan words mostly, or to be excluded? I suppose Characters[min] and [max] map to what we call "base" and "auxiliary", but for example Harari has แˆ€ is in both the Non-Harari series and the [max].

We most definitely would be interested including any other languages using the Ge'ez script. What does the qualifier "past" in your list mean โ€” the language is no longer officially regarded as individual language, as opposed to "extinct"?

dyacob commented 10 months ago

Hi @kontur I added word lists until I ran out of time last evening. I can continue adding lists to this issue ticket, or is it better to start another?

The "min" vs "max" is meant to be informative. The references will usually have a table that shows the "max" syllabary for the language. The prose may then explain that some letters are added for interlingual needs. In a purely Harari language document for example, the non-Harari letters would not be found. I add the non- lists for clarity since it may not be easy to spot them in the "max" lists. So in essence: max = min + non , "where" the non set was chosen by a language authority.

Going forward, I can just provide the min list if that's better.

With "past", it indicates that the language had used a Ge'ez orthography previously but later decided to move to a Latin orthography for whatever reason. During the time that a Ge'ez orthography was used, some small amount of literature was produced (possibly only a New Testament translation). "past" vs "current" might also help set a priority level for support on various projects. Though Ge'ez language is "extinct", it is analogous to Latin language where it is no longer anyone's first language but is still important and widely used for religious studies and church ceremonies.

kontur commented 10 months ago

Hey @dyacob thanks for the clarification. Please include both min and max/non โ€” min is what we are most interested in, but we can and should list the non characters as auxiliary if we have good research on what is actually encountered in everyday use.

We do categorize orthographies by their status, so past would map well to what we call a historical orthographyโ€”once in use, but no longer. We have used this both for languages overall, but also for specific orthographies; sometimes there is no new or current in-use orthography and the historical orthography remains as the only. We also have some cases in the database with a similar progression as you describe, e.g. a former native script orthography being surpassed in use by another script, see this one here for example. Note: We would also be very much interested in the current Latin orthographies used, or transliterations (which we keep as separate orthographies) if you have knowledge of them. We are thankful for any bit, though, the main Ge'ez orthographies being decidedly more hard to come by and a valuable addition indeed.

I can wrap up the languages from this thread and adjust their character sets as per the lists you posted above. Feel free to start a new discussion thread for adding the other languages where you can just post lists like you have done above for me to process. Or if you are comfortable with it, fork the repository and send a pull request with your additions made straight to lib/hyperglot/xxx.yaml files based on the ISO codes; I can fill in the other database information for those files, as long as you're adding the character lists, possibly the language name in it's script, and sources if there are any of note.

You can see this commit with the updated character sets.

Should the character lists for awn and xan also be reviewed still? I've added them on Neil's first list of extracted characters, but since you've reviewed those for the other languages I reckon they need refinement, too?

Also note in the changes for sgw I've marked the other included languages you noted like so:

includes:
- ior
- gru
- mvz

so this is a notation we have available in Hyperglot for macro languages that include other languages โ€” just in case this is relevant for other languages as well; it can be done! :)

Thanks once more for your efforts on this, it is much appreciated.

kontur commented 10 months ago

Sidequestion: We have the script listed as Ge'ez'/Fidel but I am wondering how useful/relevant the "Fidel" actually is. Seems like all sources call the script "Ge'ez". Should we, too? Not sure what the original logic was.

dyacob commented 10 months ago

On Ge'ez/Fidel (note no apostrophe after the "z"). I don't think "Fidel" adds much if the context is already scripts. Ge'ez is also the language name, so "Fidel" may help ground the context in the script vs language. "Ge'ez Fidel" without the slash, would imply the fidel of the Ge'ez language (vs "Amharic Fidel", "Tigrinya Fidel"). Where "Fidel" is roughly "Alphabet" though understood to be a syllabary.

"Ge'ez/Ethiopic" might be an option. There seems to be a shift toward "Ge'ez" in recent years as more Ethiopians and Eritreans have come online and the term has been slowly popularized. The Unicode Consortium went with "Ethiopic" in the 1990s simply for the wider name recognition in the western world, "Ethiopic" though was virtually unknown in Ethiopia save for academicians. That's changed in the last two decades, "Ethiopic" has crept inward and "Ge'ez" outward.

dyacob commented 10 months ago

I've updated the list of languages and characters. I'll try forks and PRs to add the others over the weeks ahead.

kontur commented 10 months ago

The language from this thread are now included in release 0.5.2, thank you all for the contributions! :)

@dyacob just PR or open a new issue for adding further languages and let me know if I can provide any assistance.