1. 알고리즘 설명 - Deep Reinforcement Learning 본 논문에서 DRL은 전력 시스템의 주파수 제어 작업에서 더 빠른 탐색기반 DDPG(Deep Deterministic Policy Gradient)와 진동의 필요한 특징을 포착하기 위해 설계된 보상 기능을 제시하여 통신 지연 및 비선형성 문제를 해결 - SACPER 이 알고리즘은 ANM(Active Network Management)의 순차적 의사결정 문제를 해결하기 위해서 제안됨 SACPER은 안정성 향상과 수렴 속도 측면에서 평가되었으며, ANM 문제를 최적화하고 에너지 손실 및 운영 제약 위반을 최소화함 - CVPO 이 알고리즘은 비상 부하 차단(ELS)제어 문제를 해결하기 위해 소개됨 CVPO는 안전 제약 우선 순위 문제를 ..