为了解决预测服务不准确且昂贵的问题,Microsoft 和 TempoQuest 与 AceCAST 合作加速风能预测。新平台比早期基于 CPU 的模型更加精确和及时,可每小时提供以兆瓦为单位的可再生能源发电预测。
为了正确预测可再生能源生产公司需要准确的天气模型。这进一步有助于制定更好的应对自然灾害的行动计划。在最近的 GTC 会议上, 微软 和 TempoQuest 提到并详细介绍了他们的工作 NVIDIA.
该项目旨在解决能源和气候问题。这是当前的需要,因为无法预测和 无效的天气预报已经造成约 7140 亿美元的损失 2022年。
为了解决这个问题,公司需要经济高效但快速准确的天气预报模型。在这三者中,TempoQuest 可实现超本地低延迟环境和天气预报。
它是 NVIDIA 启动计划的成员。该公司表示, “我们的团队是多学科的,涵盖大气科学、气象学、高性能计算、人工智能、机器学习、工程等。我们一直是将 GPU 引入环境领域的领先采用者。”
引用的有关该公司的其他内容包括:
- 它是第一个以可用作服务天气预报系统的方式开发GPU软件的公司。
- 第一家将天气研究和预报 (WRF) 移植到 GPU 的公司
- 此外,第一个是创建比基于 CPU 的预测更便宜的快速且高分辨率的预测。
该公司受益于NVIDIA在Microsoft Azure上移动传统 天气研究与预报 软件到 GPU。此外,还提供小于公里的分辨率和 1 分钟到 1 小时的时间分辨率。这样,它还可以更快地预测太阳能和风能资源产生的电力。

公用事业公司整合可再生能源面临的挑战
风速和云层覆盖等环境因素会影响风能和太阳能。这使得主要利用风能和太阳能来维护电网变得具有挑战性。
在发电量不足的日子里 可再生 资源,公用事业公司使用旋转储备,即发电机产生的碳基电力。有了更好、更快、准确的天气预报,预测可再生能源发电量将变得更加容易。
将更多可再生能源纳入电网 公司必须建造更高电压的输电线路和塔。但更重要的是,新一代站点以及所有这些都将增加运营和资本成本。
使用 GPU 加速天气研究和预测
AceCAST 或加速预测是运行 WRF 的结果,WRF 已被 160 个国家/地区的 50,000 名用户使用。 WRF 被移植到具有 NVIDIA GPU 的 x86 系统上运行。
它使用专有的 OpenACC 和 CUDA,并且 在多节点和 mullet-GPU 系统上扩展。 AceCAST 支持所有主要的 WRF 名单选项、物理方案和动力学。
另外,它是所有现有 WRF 配置的直接替代品。 AceCAST 的诸多优势包括更快的解决方案、更高的精度、更高的分辨率、更低的计算成本以及对天气现象的出色本地化感知。
AceCAST验证和性能的成本分析
检查CPU WRF 到GPU WRF 的差异是否在可接受的容差范围内。模型性能在空间预测和多个时间范围内进行了测试。
最后,经过数千个测试用例的验证,确保AceCAST产生的结果与CPU WRF相同。在Microsoft Azure上运行性能测试后,发现性能和成本存在巨大差异。看看
1. 基于 CPU 的 WRF – 标准 HB120rs_v3 虚拟机 (HBv3):
- 120 个 AMD EPYC™ 7V73X 系列 (Milan-X) CPU 内核
- 450 GB RAM(350 GB/秒内存带宽)
- 200 Gb/秒 HDR InfiniBand
- 2 个 1 TB NVME SSD 磁盘
- NCAR WRF 4.2.2
- 使用并行网络 CDF
- 使用 Intel 编译器和 MPI 编译
2. GPU加速WRF – 标准ND96amsrA100_v4(NDmv4):
- 8 个 NVIDIA A100 张量核心 GPU (80GB)
- NVLink 3.0(200 Gb/s HDR InfiniBand)
- 96 个 AMD EPYC™ 7V12 系列 (Rome) CPU 内核
- 8 个 1 TB NVME SSD 磁盘
- AceCAST 2.1
- 使用 OpenACC 和 CUDA 的专有实施
- 使用 MPI 在多节点和多 GPU 上进行扩展
3. Azure 托管 Lustre 文件系统
- 40TiB 存储 Azure 托管容量
- 最大吞吐量 10000 MB/秒
根据获得的结果,AceCAST 比基于 CPU 的 WRF 实现了约 9 倍的加速。从 18 个 CPU 节点获得的结果与从 1 个 GPU 节点获得的结果相似。
这些结果表明公用事业公司可以准确预测可再生能源 力量 一代。这样可以避免过度停电,并可以提供可靠的电力。
对于 AceCAST 3.0.1 的另一个测试,使用了带有外部域的嵌套域。外域为 500 万个网格点(430x331x38v),网格间距为 15 公里;内域为 8000 万个网格点(1551x1361x38v),网格间距为 3 公里。
从获得的结果得出结论: AceCAST 的运行速度比 WRF 内域快 16.8 倍。此外,与基于 CPU 的 WRF 相比,它的运行速度提高了约 7%,成本降低了 75%。这意味着公用事业公司将每天每小时在特定地点准确地进行兆瓦级的电力预测。
Microsoft 和 TempoQuest 与 AceCAST 合作加速风能预测。随之而来的是,社会和全球将发生重大变化。
来源: NVIDIA



