编者按 :本文来自微信公众号 新智元(ID :AI_era) ,逐客令创业邦经授权转载 ,人造日企头图来源摄图网一旦人类掌握了可控核聚变能,太阳突破将可拥有无穷不尽的精准清洁能源。广告可御可甜 有颜有料 惩罚整蛊任你选 >>进入直播间与主播亲密互动×要知道,放电发布反馈控制对于「托卡马克装置」的实现运行至关重要 。而控制系统会主动管理磁线圈 ,可控以控制拉长离子体的核聚不稳定性,防止破坏性的变新垂直事件发生。此外,月日人类若能实现对等离子体电流、消息位置和形状的中方最强精确控制 ,还可以实现热排放 ,多家倒闭甚至对其能量的破产管理 。一直以来 ,逐客令科学家们致力于研究等离子体配置变化对这些相关量的影响。因此就需要能够用于新配置,以及围绕标称场景快速变化的系统 。传统上 ,等离子体的精确控制是通过等离子体电流、形状和位置的连续闭环来实现的 。在这种模式下 ,控制设计者预先计算出一组前馈线圈电流,然后为每个受控量建立反馈回路 。等离子体形状和位置无法直接测量,必须通过磁场测量实时间接估算 。尤其是等离子体的形状,必须使用平衡重构代码进行实时估算 。虽然这类系统已成功稳定了大范围的放电 ,但其设计不仅具有挑战性 ,还耗时,特别是针对新型等离子体情况。值得一体的是,强化学习(RL)已成为构建实时控制系统的另一种全新范式。2022年 ,DeepMind团队登上Nature的一篇论文表明,RL设计的系统能够成功实现「托卡马克磁控制」的主要功能 。论文地址:https://www.nature.com/articles/s41586-021-04301-9这项工作提出了一个系统,RL智能体通过与FGE 托卡马克模拟器交互,学习控制托卡马克配置变量(TCV) 。智能体学习的控制策略随后被集成到TCV控制系统中 ,通过观察TCV的磁场测量,并为所有19个磁控线圈输出控制指令