MATRIX DATA PARSING문의합니다-R OR PYTHON
글쓴이: cadava / 작성시간: 화, 2013/10/15 - 12:41오후
몇 개의 dataset을 합치려고 합니다.
이 dataset은 correlation coefficient가 들어가있습니다.
만약 2 개의 dataset이 있다면,
1.dataset=6753 * 6753 matrix
2.dataset=5673 * 5673 matrix
1,2 dataset을 합하여 이렇게 만들고 싶습니다.(output dataset)..
파일 예시를 첨부하였습니다.
즉...
1. dataset 과 2.dataset을 정렬하는 것인데요.
일부 겹치는 것의 값을 일렬되게 표시하고
없는 것은 NA로 표시하고 싶습니다.
R"이나 python으로 어떻게 하면 될까요?
혼자 씨름하다가 도저히 안되서.. 문의드립니다.
감사합니다.
Forums:
겹치는 것의 의미가 애매한 것 같습니다. 상관계수
겹치는 것의 의미가 애매한 것 같습니다.
상관계수 행렬이니 symmetric할 것이고...
rownames나 colnames가 있어서 매칭이 가능하다고 하면
unique(rownames(a), rownames(b)) 하셔서 합쳐진 행렬의 크기를 구하신다음 matrix 생성하시고
match 함수를 이용하여 이름을 매칭하시고 인덱스를 만드신 다음 넣으면 될 것 같습니다.
댓글 달기