Query Segmentation을 위한 알고리즘? (SK플래닛 Code Sprint)
글쓴이: bbiro / 작성시간: 목, 2014/05/15 - 11:54오전
SK플래닛에서 주최하는 코드 경진대회에서 올해 1라운드 문제로 통계에 기반한 문자열 분리에 관한 문제가 제출되었습니다.
https://codesprint.skplanet.com/2014/participation/round1_intro.htm
이 문제는 머신러닝과 관련된 것 같은데, 머신러닝에 경험이 없는 사람은 어떤 걸 먼저 알아야 할까요? 관련 문서나 구글 키워드를 조언해 주시면 고맙겠습니다.
"word segmentation machine learning" 으로 구글검색했는데 논문 pdf 만 몇개 나오고 예제 코드 같은 것은 찾기가 어려워 이렇게 질문을 올립니다.
Forums:
찾아보니 자료가 많이 나오네요.
english word segmentation algorithm 이라는 검색어를 사용했더니 재미있는 자료들이 좀 나옵니다.
개중에 이것은 해당 문제와 매우 유사한 내용을 담고 있습니다. 소스 코드도 들어 있고요. http://arxiv.org/ftp/arxiv/papers/1105/1105.6162.pdf
구글 스칼라에서 english word segmentation statistical algorithm를 검색해도 꽤 나오네요.
다만 인터넷에 공개된 자료는 거의 대부분의 유효 참가자가 이미 검토했다고 봐야 하기 때문에, 어떻게든 뭔가 획기적으로 개선된 점을 더 넣어야만 입상이 가능하지 않을까 생각해봅니다.
--
답변 고맙습니다^^ 조언해주신 내용을 토대로 공부해
답변 고맙습니다^^ 조언해주신 내용을 토대로 공부해 보겠습니다.
댓글 달기