AI如何打破气象预测瓶颈,解决新能源行业“靠天吃饭”的难题?
作者:米塔碳(杭州)智能科技有限公司时间:2025-04-18 我要发布
近年来,随着算力和数据量的爆炸性增长,人工智能(AI)的应用正以惊人的速度发展,成为全球科技竞争的核心领域。尤其在中美之间,AI已不单单是技术的较量,更是国家综合实力的角逐。中国提出的“新质生产力”理念,明确了AI技术的实用方向,强调将AI深度应用于生产与创新,推动各行业的数字化和智能化升级。特别在新能源领域,随着“3060”双碳政策的提出,新能源行业在加速发展的同时,也面临着巨大的技术挑战。
据国家能源局发布的2024全年电力工业统计数据显示:新能源装机容量呈现出惊人的增长态势。截至12月底,全国累计发电装机容量已达到33.5亿千瓦,同比增长14.6%。其中,太阳能发电装机容量达到8.9亿千瓦,同比增长45.2%;风电装机容量为5.2亿千瓦,同比增长18.0%。
这一快速增长的背后,蕴藏着对AI技术深度渗透的巨大需求,尤其是在新能源发电的精确预测和运维管理中,AI的应用将为行业带来颠覆性的变化。
AI+新能源:如何实现“新质生产力”?可从以下几方面考虑
1)人工智能天气预报:精准的全球和新能源场站天气预测;
2)新能源发电功率预测:基于气象数据,准确预测场站发电量;
3)新能源场站智能运维:涵盖安全监测、故障预警等运维工作;
4)电力交易市场预测与辅助决策:对电力市场价格变化的预测,支持智能化决策。
本期,我们重点探讨AI在全球天气预测中的应用,这也是璞云大模型的核心竞争力之一。
新能源发电“靠天吃饭”,风力和阳光直接影响发电量,天气的波动性带来了较大的不稳定性,这种不稳定的电源接入电网,必然会影响电网的安全。因此,准确预测新能源发电功率是新能源行业面临的第一大挑战。此外,负荷预测和电价预测也与天气密切相关。可以说,新能源行业的根本需求之一就是“给老天爷算命”,即做好准确的天气预报。
目前,气象预报主要依赖数值模拟方式,通过超级计算机进行复杂的运算。这些预报方法通常需要数小时才能完成一轮预测,虽然精度较高,但速度较慢,难以满足新能源行业的需求。得益于气象行业的科学性和规范性,气象数据格式非常规范,无需大量人工清洗,且数据量庞大,天然适合采用大模型进行预报。
因此,近年来国内外有很多公司、高校机构都对气象大模型开展了很多的研究,国外有 DeppMind的Graphcast、GenCast,国内有华为的PanGu、复旦??的FuXi,以及米塔碳的璞云-PuYun。
此处先提及几个基本概念。
ERA5再分析数据,由欧洲气象中心(EC)提供,其质量接近地面实测数据(GT),空间分辨率为0.25度(相当于约25km x 25km),时间分辨率为1小时。由于ERA5数据的高质量,它成为气象模型训练的重要基础。然而,ERA5数据与实时数据之间存在约5天的延迟,这意味着基于ERA5数据训练的模型无法直接应用于生产。
上述提到的所有气象大模型的研究均基于ERA5数据进行建模,预测未来10至15天的天气情况,涵盖气压层的温度、气压、湿度、风速,地表的2米温度、10米风速、海平面气压和降水量等指标。且所有大模型的预测时间间隔均为6小时,而这也是没办法直接用于生产的重要原因(新能源发电行业常见的时间分辨率为15分钟)。
需要指出的是,当前全球天气预报领域的开源模型大多已固定为可执行版本,仅能直接使用,无法进行二次训练,而且这些模型缺乏100米风速和辐射等关键数据,且输入数据基于ERA5,存在5天的时间延迟,难以满足实时需求。除非结合实时数据进行微调,但开源模型并未提供相关代码,无法完成这一过程。因此,开源模型仅适合实验和试用,在业务应用层面还相差甚远,只有具备核心技术并自主研发的公司,才能训练出符合实际业务需求、能够直接应用于新能源行业的气象大模型。
回到正题,以上模型均为自回归模型,也就是模型产生的输出,也可以用作输入,这种模型理论上可以进行一直预报,甚至达到万年的预测,但其有效性通常只持续10至15天。
DeepMind的GraphCast、GenCast都是基于GNN的网络。GraphCast率先用GNN来进行全球天气预报,并且提出了很多范式,比如先训练一个基础模型,用于预测下一个时刻,这个是一个很好的思路。以前我们训练这样长自回归步数的模型,需要加入各种稳定训练的技巧,比如teacher forcing,即在下一个自回归时,有一定概率使用真值来作为输入。那么,如果我们只预测下一个时间步呢?
GraphCast在这个阶段使用了32卡训练了30万步,得到了一个非常强大的基础模型。之后再利用这个模型,进行自回归训练,自回归的步数从2-12,先训练步数为2的,训练1k steps,再训练步数为3的,训练1k steps......一直到步数为12的,这样微调阶段只训练了11k steps,远远小于预训练阶段。注意这里只训练了12步,还记得之前说的时间分辨率为6小时吗?12步即72小时3天,在推理应用阶段可以预测40步,即240小时10天。
第二个范式为级联,一个模型辅助预测5天,再来一个模型负责5-10天,这样就可以接力下去,模型多力量大,不过GraphCast只是在论文里提到这个思路,自己并没有这么做。
再看复旦的FuXi,基于SwinTransformer构建了未来15天的天气预测大模型,和GraphCast主要的差异点在于模型架构不一样,以及GraphCast使用了级联策略,使用三个模型接力进行预测,大幅度降低了累计误差。
与以上提到的模型不同,米塔碳璞云大模型着眼于为实际生产业务提供服务。设计之初,璞云就明确考虑到两个关键问题:
1)ERA5数据存在5天的延迟,且其分辨率为25km,过于粗糙,无法满足新能源场站精确预测的需求;
2)固定的分辨率不利于灵活的业务应用。
因此,璞云在设计时明确要求了:
1)支持任意分辨率的气象预测;
2)能够满足生产环境中每日进行精准预测的需求。
为此,璞云利用海量ERA5数据进行基础模型的训练,并通过实况0.1度数据进行微调,从而实现了高分辨率(0.1度)的全球气象预报。不仅具备每日实况场驱动的能力,还能准确预测未来15天的气象情况,时间间隔为1小时,且与EC的HRES高分辨率系统完全对齐。
璞云创新的使用了LKA FCN的方式,将卷积网络再次带回到时序预测,大核卷积不仅可以模仿自注意力机制,同时使用卷积来提取相邻区域的气象变化过程,同时还可以进行任意分辨率的预测。
输入是0.25度,输出就是0.25度,输入是0.1度,输出也就是0.1度;每次需要32卡-64卡GPU进行训练,每次训练成本在数十万到百万级别。我们可以根据业务需要定制模型,因此我们的模型可真正实现业务需求的落地应用。
?
紧接着,再提出气象大模型领域的几个通用问题:
1)预报平滑,未来7天之后,极端天气的预报能力几乎丧失。
尽管当前各大气象模型在RMSE上已经远远超越了EC数值预报方法,但在训练过程中,模型通常使用均方误差(MSE)作为损失函数,这不可避免地导致了输出的平滑化,即愈发趋向均值,最终使得长时间预报的输入图极其模糊。
2)目前气象大模型的训练成本仍然较高,急需国产化算力来降本增效。
在此,我司具备多年气象领域经验的专家团队,经过三年的深入研究,已成功复现了主流气象大模型,现将一些经验分享如下。
1)无论是GNN、Transformer还是大核卷积,模型结构本身对于最终结果的影响并不如预期重要。气象领域拥有大量历史数据,而当前的模型尚未能充分利用这些庞大的数据量。现阶段,通过增大模型的参数量,往往能获得不错的效果,但这也意味着更高的训练算力成本。
2)气象大模型的关键不在于过多的“魔改”,而在于合理的范式设计。只要模型结构能满足行业需求,许多复杂的调整其实并不必要。
3)要将气象大模型成功应用于新能源行业,需要完成大量论文之外的工作。米塔碳在这些工作中付出了巨大的努力,才使得气象大模型能够顺利落地并直接用于生产。
除此之外,璞云还受邀参与了中国气象局主办的人工智能示范计划,利用中国气象局提供的近45年再分析数据开展模型训练,并将其全面私有化部署在中国气象局。该项目取得了显著的正面成果,充分验证了我们的技术优势和应用效果。
最后和大家汇报一下,我司目前正在推进一项气象大模型的研发工作,待成果完成后,我们会将开源该模型并与训练结果一同分享,惠及更多行业伙伴!