基于多智能体深度强化学习的车联网通信资源分配优化python源代码+文档说明.zip

共20个文件

py：13个

pyc：6个

txt：1个

版权申诉

网络

python

5星 · 超过95%的资源 90 浏览量 2024-04-27 20:13:57 上传评论 1 收藏 82KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

基于多智能体深度强化学习的车联网通信资源分配优化python源代码+文档说明.zip （20个子文件）

基于多智能体深度强化学习的车联网通信资源分配优化python源代码+文档说明

SAMADDPG

Environment_marl.py 31KB

DDPG_method.py 11KB

MADQN

madqn.py 14KB

replay_memory.py 2KB

Environment_marl.py 30KB

__pycache__

replay_memory.cpython-37.pyc 1KB

Environment_marl.cpython-37.pyc 16KB

Random

Environment_marl.py 32KB

random.py 6KB

MADDPG

replay_buffer.py 6KB

model_agent_maddpg.py 5KB

replay_memory.py 1KB

segment_tree.py 5KB

Environment_marl.py 33KB

maddpg.py 13KB

__pycache__

model_agent_maddpg.cpython-37.pyc 3KB

Environment_marl.cpython-37.pyc 17KB

segment_tree.cpython-37.pyc 5KB

replay_buffer.cpython-37.pyc 6KB

使用说明.txt 2KB

基于多智能体深度强化学习的车联网通信资源分配优化. A brief introduction of this work is as follows: 无线网络的高速发展为车联网提供了更好的支持，但是如何为高速移动车辆提供更高质量的服务仍然是一个挑战.通过分析多个车对车（Vehicle-to-Vehicle， V2V）链路重用的车对基础设施（Vehicle-to-Infrastructure， V2I）链路占用的频谱，研究了基于连续动作空间的多智能体深度强化学习的车联网中的频谱共享问题.车辆高移动性带来的信道的快速变化为集中式管理网络资源带来了局限性，因此将资源共享建模为多智能体深度强化学习问题，提出一种基于分布式执行的多智能体深度确定性策略梯度（Multi-Agent Deep Deterministic Policy Gradient， MADDPG）算法.每个智能体与车联网环境进行交互并观察到自己的局部状态，均获得一个共同的奖励，通过汇总其他智能体的动作集中训练Critic网络，从而改善各个智能体选取的功率控制.通过设计奖励函数和训练机制，多智能体算法可以实现分布式资源分配，有效提高了V2I链路的总容量和V2V链路的传输速率. 本文发表在北京交通大学学报，链接 Citation @article{方维维2022基于多智能体深度强化学习的车联网通信资源分配优化, title={基于多智能体深度强化学习的车联网通信资源分配优化}, author={方维维 and 王云鹏 and 张昊 and 孟娜}, journal={北京交通大学学报}, volume={46}, number={2}, pages={64--72}, year={2022} } Stargazers over time Stargazers over time

评论收藏

内容反馈

版权申诉