'프로그래밍/CUDA' 카테고리의 글 목록

CUDA Tutorial

대표적인 병렬처리 프로그래밍 기법 - CPU - 복잡한 연산, 단일 성능이 높음 (Clock Speed)- GPU - 단순한 연산, 단일 성능이 낮음, ALU 동시에 구동 가능, 프로그래밍에 제한이 있음 A는 한 번에 1개의 공을 옮길 수 있고 1초에 한번 작업을 할 수 있다. (Latency : 1, Throughput : 1) B는 한 번에 4개의 공을 옮길 수 있고 2초에 한번 작업을 할 수 있다. (Latency : 2, Throughput : 2)(버스와 스포츠가 라고 생각할 수도 있다.) 전력 효율을 높이기 위해서 CPU 는 점점 latency 를 줄여가고 GPU 는 throughput 을 늘려간다. 배열 정보, index는 grid size 와 block size로 정의된다.grid size..

프로그래밍/CUDA 2018.06.12

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

낭만고양이

프로그래밍/CUDA 1

티스토리툴바