sed 기본정규식의 dot (.) 매칭의 설명을 보면
.
Matches any character, including newline.
이라고 되어 있는 것으로 봐서는 locale 에 따라서 적절하게 한 *글자*를 매칭시켜 줘야 할 것 같은데
EUC-KR, CP949, EUC-JP 등 locale을 변경시켜봐도 한 글자가 아니라 한 바이트를 매칭시키는 것 같습니다.
사용한 정확한 LC_ALL 은
ko_KR.cp949
ko_KR.EUC-KR
ja_JP.euc
ja_JP.EUC-JP
등입니다.
그래서 한 바이트만 매칭되도록 동작하나보다 생각했더니 utf-8 에 대해서는 한 바이트가 아니라 한 글자로 매칭시키는 결과를 보여줬습니다.
% man sed 의 매뉴얼 페이지를 보면