대표적인 병렬처리 프로그래밍 기법 - CPU - 복잡한 연산, 단일 성능이 높음 (Clock Speed)- GPU - 단순한 연산, 단일 성능이 낮음, ALU 동시에 구동 가능, 프로그래밍에 제한이 있음 A는 한 번에 1개의 공을 옮길 수 있고 1초에 한번 작업을 할 수 있다. (Latency : 1, Throughput : 1) B는 한 번에 4개의 공을 옮길 수 있고 2초에 한번 작업을 할 수 있다. (Latency : 2, Throughput : 2)(버스와 스포츠가 라고 생각할 수도 있다.) 전력 효율을 높이기 위해서 CPU 는 점점 latency 를 줄여가고 GPU 는 throughput 을 늘려간다. 배열 정보, index는 grid size 와 block size로 정의된다.grid size..