shell 스크립트로 합계 구하기
글쓴이: 일퍼센트 / 작성시간: 금, 2012/07/20 - 1:05오전
데이터가
1.txt
20 한국
10 미국
5 중국
2.txt
10 한국
5 미국
3.txt
20 한국
10 미국
10 일본
결과
50 한국
25 미국
5 중국
10 일본
txt별로 키워드 카운트를 SUM한 값을 구하고 싶습니다.
각 파일을 read하고 awk, sed를 이용해서 키워드 파싱을 한 다은 같은 키워드 일경우 카운트를 SUM을 하면 될 것 같은데..
데이터 건수가 100만건 넘는 데이터 입니다. HASH 같은 기능은 없나요?
Forums:
아무튼, awk가 associative array가
아무튼, awk가 associative array가 있습니다.
associative array는 보통, binary tree 또는 hash map으로 구현되어 있겠죠.
어짜피 전 세계 나라의 갯수는 200~250일뿐입니다.
그렇게 적은 숫자에서는
hash를 하던, binary search를 하던, 큰 차이를 못느낄것입니다.
심지어, 나라 갯수가 한국,미국,중국,일본(4개)같이 몇개 되지도 않으면
linear search를 해도 아무런 차이를 못느낄 것입니다.
데이터의 건수가 1억건이든, 1조건이든
어짜피 검색할 키워드(나라이름)는 몇개 안되니
아무거나 쓰세요.
댓글 달기