한자어 썸네일형 리스트형 한자어가 우리말을 얼마나 애매 모호하게 만드는지 알아봤습니다. 한국어 언어 처리나 검색 엔진 튜닝을 하다 보면 '한자어' 때문에 발생하는 중의성이 정말 많습니다. 문제의 시작은 이렇습니다. 家 : 집 가 價 : 값 가 可 : 옳을 가 加 : 더할 가 假 : 거짓 가 ... (이하 24개 생략) -----> 한글로 쓰면 모두 '가' '가'가 너무 극단적인가 하면 그렇지도 않습니다. '사'는 60개 입니다. 키보드로 '사' 치고 한자키 눌러 보면 알 수 있습니다. 상황이 이러하니, 어떤 단어가 '***가***' 이렇게 생겼다면 '가' 부분에서 29개의 의미적 중의성이 발생합니다. 좀더 자세히 알아보려고 간단한 프로그램을 만들어 돌려봤습니다. 얘기 더 나가기 전에 용어 정리 한번 하는게 좋을 듯 합니다. 한자 : '家', '羅' 이런 것들 한자 독음 : 한자를 한글로 읽.. 더보기 이전 1 다음