C언어에서 루프 언롤링에 대해 질문드립니다.
ARM의 SystemS/W에 대해 공부하는 중인데,
언롤링 : 루프문의 몸체를 여러 번 반복하여 적음으로써 같은 비율만큼 반복수를 줄여주는 방법
하지만 너무 많은 언롤링은 코드 사이즈를 증가시키고, 캐시 성능을 감소시킨다고 알고 있습니다.
궁금한 부분은,
Try to arrange that the number of elements in arrays are multiples of four or eight. You
can then unroll loops easily by two, four, or eight times without worrying about the
leftover array elements.
"배열에서 element의 수는 4나 8의 배수가 되도록 정렬해야 함."
"그러면 배열요소를 추가해야 할 지에 대해 고민하지 않고 루프를 2,4,8배로 쉽게 언롤링시킬 수 있다."
이 부분이 이해가 안갑니다ㅠ