“双碳”背景下 ,光储充电站逐渐成为未来充电站的一种主流形式 。为提高光储充电站的经济效益并降低二 氧化碳 排放 ,提出了一种基于改进深度强化学习的光储充电站实时控制策略 。首先 ,建立以碳排放最小与运行成本最低为目标的优化 模型并将其转换为马尔可夫决策过程;其次 ,提出了一种基于经验继承机制的粒子群优化-深度确定性策略梯度算法(Particle swarm optimization-Deep Determini公tic Policy Gradient ,Pso-DDPG);最后 , 考虑动态碳排放因子开展算例分析 ,验证了所 提Pso-DDPG策略的有效性。