toss / es-hangul

A modern JavaScript library for handling Hangul characters.
https://es-hangul.slash.page/
MIT License
1.24k stars 83 forks source link

[Feature]: 욕 마스킹 기능이 있으면 좋을 것 같아요 #196

Closed minsoo-web closed 2 weeks ago

minsoo-web commented 1 month ago

Description

한글에는 너무 많은 욕이 있습니다. 한글 도메인을 담은 es-hangul 이 마스킹을 해줄 수 있는 기능이 있으면 너무 좋을 것 같아요.

Possible Solution

es-hangul 에서 제공하는 욕설 (국립국어권에 등재된 욕설) dict 를 제공하고, 사용자가 추가로 설정할 수 있는 인터페이스면 좋을 것 같아요

etc.

No response

manudeli commented 1 month ago

josa와 비슷하게 이런 인터페이스면 좋을 거 같네요. 리뷰가 많은 곳에서 필요한 기능일 수 있겠네요

yock("<욕설>아", { replaceChr: "*" }) // **아로 변경
seungrodotlee commented 1 month ago

영어나 특수문자를 섞어 사용하는 욕설이나, 자모음을 분리하여 사용하는 욕설 등 변형된 욕설들(ex. tlqkf, ^^ㅣ발, ㅅㅣ발)도 disassemble 된 데이터를 기반으로, 유사도를 측정하거나 특정 기호들을 치환하여 비교하는 형태로 잡아낼 수도 있을 것 같네요!

okinawaa commented 1 month ago

MVP로는, 마스킹(치환) 하는것은 사용하는 개발자에게 위임한 뒤, 한글인 욕설을 detect하는 것도 좋을 것 같아요!

po4tion commented 1 month ago

@minsoo-web 님 혹시 국립국어원에 등재된 욕설 링크 공유 가능하신가요?

minsoo-web commented 1 month ago

안녕하세요, @po4tion 제가 이슈에 적은 내용은 욕설이 정리된 링크 또는 문서가 있다는 형태로 적은 것 같네요.

찾아보니 국립국어원에서 제공하는 공식 문서나 오픈 API(공공데이터 포털)는 없는 것 같았습니다. 다만, 표준국어대사전의 상세 검색에서 속되게 이르는 말 이라는 검색어를 통해 대략적인 데이터를 크롤링할 수 있을 것으로 보입니다.

image

okinawaa commented 3 weeks ago

es-hangul의 역할은 욕설들의 리스트만 제공해주면 될 것 같다고 생각합니다. 욕설인지 여부를 체크하거나, 욕설을 마스킹하거나 하는 추가적인 처리들은 사용하는 쪽에 위임하는것이 좋을 것 같아요.

욕설 리스트 또한 어떤 서비스에서는 어떤 단어를 욕설로 볼지, 욕설로 보지 않을지 모호한 부분이 있을 것 같아요. 법적으로 한국어 욕설리스트가 딱 정해져 있지도 않은 것 같고요.

이렇게 유연한 특징을 가진 욕설과 같은 경우는 es-hangul에서 다루기보다는 서비스 개발자들이 구현하는것이 es-hangul의 유지보수성 및 서비스 개발자들의 비즈니스 구현가능성 측면에서 더 좋다고 생각합니다.

okinawaa commented 2 weeks ago

추가적인 논의가 없어 이슈 닫도록 하겠습니다! 니즈가 있으시다면, 다시 이슈 올려주세요! 감사합니다