안녕하세요.
책을 보던 중 7장 관련 질문이 있어 문의 드립니다.
7.1.3 GPU 구조와 최적의 배치 크기 부분을 살펴보고 있는 중입니다.
연산 시간과 HBM -> SRAM 모델 파라미터 이동 시간이 같을 때가 최적이라고 말씀 주신 부분에 대한 질문입니다.
제 생각에는 "SRAM 모델 파라미터 이동 -> 연산" 과정이 병렬로 실행되지 못하고 순차적으로 실행될 것으로 생각되는데,
(왜냐하면 연산 과정 중 SRAM의 데이터를 참조하지 않을까 해서...)
이런 경우 파라미터 이동 시간과 연산 시간이 같을 때가 최적이라고 생각해도 좋은지 궁금합니다.
연산 하는 와중에 SRAM 모델 파라미터 이동이 병렬로 수행이 가능하다면 두 시간이 같은 부분이 최적의 점으로 쉽게 이해가 되나,
순차적으로 실행되는 경우라면 조금 이해가 잘 안되는 부분이 있습니다.
좋은 책 잘 보고 있습니다.
위 내용 한번 확인해주시면 감사하겠습니다.
안녕하세요.
책을 보던 중 7장 관련 질문이 있어 문의 드립니다.
7.1.3 GPU 구조와 최적의 배치 크기 부분을 살펴보고 있는 중입니다.
연산 시간과 HBM -> SRAM 모델 파라미터 이동 시간이 같을 때가 최적이라고 말씀 주신 부분에 대한 질문입니다.
제 생각에는 "SRAM 모델 파라미터 이동 -> 연산" 과정이 병렬로 실행되지 못하고 순차적으로 실행될 것으로 생각되는데,
(왜냐하면 연산 과정 중 SRAM의 데이터를 참조하지 않을까 해서...)
이런 경우 파라미터 이동 시간과 연산 시간이 같을 때가 최적이라고 생각해도 좋은지 궁금합니다.
연산 하는 와중에 SRAM 모델 파라미터 이동이 병렬로 수행이 가능하다면 두 시간이 같은 부분이 최적의 점으로 쉽게 이해가 되나,
순차적으로 실행되는 경우라면 조금 이해가 잘 안되는 부분이 있습니다.
좋은 책 잘 보고 있습니다.
위 내용 한번 확인해주시면 감사하겠습니다.