Q-Learning
오늘을 강화학습의 중요한 알고리즘 중 하나인 Q-learning에 대해 포스팅을 해보려고 합니다. 이 포스팅을 이해하시려면 강화학습의 기본적인 개념들과 action, state, reward
에 대한 개념을 아셔야 된다고 생각됩니다. 만약기회가 된다면 해당되는 개념들에 대해 따로 정리해보는 시간을 가져보도록하겠습니다.
LOCS developments Blog
오늘을 강화학습의 중요한 알고리즘 중 하나인 Q-learning에 대해 포스팅을 해보려고 합니다. 이 포스팅을 이해하시려면 강화학습의 기본적인 개념들과 action, state, reward
에 대한 개념을 아셔야 된다고 생각됩니다. 만약기회가 된다면 해당되는 개념들에 대해 따로 정리해보는 시간을 가져보도록하겠습니다.
이장은 feature column에 대해 설명해보도록 하겠습니다. feature column는 raw data와 Estimator사이의 중재자 역할을 한다고 생각하시면 됩니다. feature column은 Estimator가 raw data를 사용할 수 있는 형식으로 변환시키는 다양한 형식을 가지고 있으며 실험을 쉽게 할 수 있게 만들어 줍니다.
본격적으로 tf.data 에 관하여 알아봅시다. tf.data는 단순할 뿐 아니라 재사용이 가능하고 복잡한 입력 파이프 라인도 구축할 수 있습니다. 예를 들어 이미지 모델의 파이프 라인은 분산 파일 시스템의 파일에서 데이터를 가져온 후 각 이미지 데이터셋을 섞고 배치를 적용하는 것을 매우 직관적이고 쉽게 만들 수 있습니다.
최근 많이 사용되고 있는 tf.data API에 대해 설명해보려고 합니다. 딥러닝으로 개발을 하면 데이터를 전처리하고 데이터 파이프라인을 구성하는데 더 많은 시간이 걸리는 것을 알 수 있습니다. 텐서플로우에는 다양한 데이터 전처리 및 데이터 파이프라인 모듈들이 있지만 최근 들어 많이 사용되고 있는 tf.data API를 사용하면 보다 쉽고 빠르게 데이터를 처리할 수 있으므로 모델 개발에 더 집중할 수 있습니다.
이 글은 스타일을 모아둔 것입니다. 소스 코드를 확인하여 스타일을 적용하는 방법을 알아보세요.