Ayaan

  • 홈
  • 태그
  • 방명록

강화학습 1

강화학습 기본 개념 정리

1. 순차적 의사결정 문제 어떤 의사결정을 하고 그로 인해 상황이 바뀌고, 다음 상황에서 또 다시 어떤 행동을 하고 이처럼 각 상황에 따라 하는 행동이 다음에 영향을 주며, 결국 연이은 행동을 잘 선택해야하는 문제가 순차적 의사결정 문제임 2. 보상 보상이란 의사결정을 얼마나 자랗고 있는지를 알려주는 신호 강화학습의 목적은 과정에서 받는 보상의 총합, 즉 누적보상을 최대화하는 것임 - 내가 어떤 행동을 하면 그것에 대해 얼마나 잘하고 잇는지를 평가만 해줌, 어떻게 해야 높은 보상을 얻을 수 있는지는 안알려줌 - 보상이 낮았던 행동은 덜하고 보상이 높았던 행동들은 더하면서 보상을 최대화하려고 함 - 강화학습은 스칼라 형태의 보상이 있는 경우에만 적용 가능 - 희소할 수 있으며 지연될 수도 있다는 특징이 있..

Artificial Intelligence/강화 학습 2024.01.07
이전
1
다음
프로필사진

  • Battery Management System +.. (3)
    • 논문 리뷰 (2)
      • EMS (1)
      • Battery (0)
      • 강화학습 (1)
    • AWS 서버 만들기 (0)
    • BMS 전공 서적 정리 (0)
      • Battery Management Systems .. (0)
      • Battery Management Systems,.. (0)
    • Artificial Intelligence (1)
      • 강화 학습 (1)
      • 트랜스포머 (0)

Tag

DeepReinforcement Learning Based Active Network Management and Emergency Load-Shedding Control for Power Systems, CVPO, 강화학습, 보상, SACPER, reinforcement, 에이전트, 스마트그리드 #EMS # 신재생에너지,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

  2025. 11  
일 월 화 수 목 금 토
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.