안녕하세요.
우선, 귀중한 코드 공유해주셔서 감사합니다. 도움 많이 받고 있습니다. :)
질문이 두개 있습니다.
-
training 시 사용하는 stock feature 중 per, pbr, roe는 여기서 데이터를 조정(일종의 정규화?)하는데
open, high, low, close, volume은 어느 곳에서 하는 제가 찾지를 못했습니다.
혹시 저 feature는 정규화를 하지 않고 사용하는지요?
-
ReinforcementLearner.run()에서 replay buffer를 사용하는 곳을 찾지 못했습니다.
혹시 replay buffer를 사용하지 않는지요?
감사합니다~