한 한달전 제가 생각했는데
지금 현재 존재하는 한글을 지원하는 regex library등으로는 한글의 모든 패턴을 표현하기엔 부족한것 같습니다.
영어는 문자가 단어의 최소단위여서 abc등 알파벳으로 모든걸 표현할수 있는데
한글은 문자가 최소 단위가 아니라고 생각합니다
한글은 문자가 있고 예) 한
문자 안에는 초성 중성 종성의 기호들이 있습니다 예) ㅎ, ㅏ, ㄴ
그리고 ㅏ ㅑ ㅗ ㅕ ㅚ ㅟ ㅒ 등의 중성에는 ., ㅣ, ㅡ 중성 기호의 반복으로 이루어져 있습니다.
그래서 예를 들어
양파 껍질처럼 한 한글의 문자는 문자안에 기호, 기호안에 중성기호로 건설되있습니다.
제가 말씀드리고 싶은건…
.,ㅣ,ㅡ 기호의 집합으로 모든 중성기호를 표현하며
ㄱ, ㅏ , ㄴ 등의 기호로 모든 한 문자를 표현하며
[간글] 로 모든 단어의 조합을 표현하는게 원하는 바입니다.
그래서 한글의 한 문자는 세개의 껍질의 겹으로 여러가지를 표현할수 있습니다.