碳管理知识库的“钢筋骨架”如何炼成?丨基于LLM 的碳管理架构演进(二)
作者:米塔碳(杭州)智能科技有限公司时间:2025-04-18 我要发布
当科技圈为DeepSeek-R1的数学推理能力沸腾时,联合国气候数据库悄然更新了一组刺痛行业的数据:全球Top500企业的碳核算报告中,超60%企业未更新排放因子超5年,而AI模型在真实碳管理场景中的幻觉误差率竟高达42%。
清华大学最新发布的《Deepseek与AI幻觉》也指出:AI生成内容中普遍存在的“幻觉”现象,在某些领域可能引发严重后果。
2025年3月25日Vectara发布的主流大模型幻觉排行榜
?
这种落差暴露出碳管理领域的关键矛盾:一方面,政策法规、排放数据等技术方案正呈指数级增长;另一方面,传统的信息处理方式已完全跟不上实时决策的需求。
要破解这个困局,就必须为碳管理知识库构建全新的"钢筋骨架"。
?
?
01
LLMs:碳管理智能化的“基座模型”
大语言模型(LLMs)作为AI领域的基础设施,凭借千亿级参数规模与Transformer架构,已在多行业展现颠覆性潜力:
?
例如,在自然语言处理(NLP)领域,LLMs可以用于文本生成、情感分析、问答系统等任务;在图像生成领域,LLMs可以与生成对抗网络(GAN)等技术结合,实现文本到图像的转换;此外,LLMs还在教育、医疗、金融等领域提供了个性化服务。
?
现行业渗透现状如下:国际巨头如Google LaMDA、OpenAI GPT-4持续迭代,国内百度文心一言、科大讯飞星火等也在加速行业适配。
据Gartner预测,到2025年,70%的垂直领域知识库将深度集成LLMs技术。
截至2025年3月底Artificial Analysis统计的大语言模型排行榜
?
但现实挑战同样尖锐:幻觉问题、时效性问题和数据安全等问题依旧让人头疼,这将进一步限制LLMs在真实场景中的应用。
许多研究表明,采用检索增强生成(RAG)技术能有效缓解上述问题,RAG为LLMs提供了从数据源检索信息的能力,并以此为基础生成回答。
?
?
?
02
RAG:为LLMs装上“专业导航仪”
RAG的工作原理如下图所示。
可以理解为“检索+生成”,前者主要利用向量数据库的高效存储和检索能力,通过融合相似性检索和全文检索等多种检索方式,召回问题相关的目标知识;后者则利用大模型的能力和prompt工程,将检索召回的知识作为上下文提供给大模型,生成最终答案。
RAG框架示意图
?
目前关于RAG的研究范式是不断发展的,可分为三个阶段(如下图所示):
?
(1)Naive RAG:作为最基础的RAG范式,它通过添加相关上下文到语言模型的输入中来增强模型的回答。
这种方法通常涉及将文本分割成小块,使用Transformer Encoder模型将这些小块转换为向量,并将这些向量汇总到一个索引中。
在使用时,创建一个针对大语言模型的提示,指导模型根据搜索步骤中找到的上下文回答用户的查询。
?
(2)Advanced RAG:这种范式在简单RAG范式的基础上进行了优化,包括检索前优化、检索优化和检索后优化。
检索前优化集中在数据索引优化和查询优化上,检索优化涉及混合搜索和重新排序,而检索后优化则关注于如何通过重新排序或其他技术提高检索结果的相关性。
?
(3)Modular RAG:模块化RAG是一种有机组合多种模块的RAG,这些模块可以根据不同的任务和应用场景进行定制化。
这种方法通过预训练、微调并对所有组件进行对齐,作为一个整体集成系统,通过语言模型和检索器的双重反向传播来最大化性能。
?
RAG的三种范式比较
?
这些RAG类型的检索增强过程通过不同的技术和优化方法,提高了RAG系统在检索相关知识和生成准确答案方面的能力,同时也增强了系统的灵活性和可扩展性。
?
?
?
03
LLMs在碳领域中的应用
当前关于LLM在碳领域中的应用正逐渐增多,包括在数据收集与整合、碳排放计算、减排策略优化和可视化与报告等方面。
?
例如:Faiz等人专为密集型和混合专家(MoE)大型语言模型设计的端到端碳足迹预测模型LLMCarbon,能够显著提高各种LLM碳足迹估算的准确性,包括训练、推理、实验和存储过程中的操作碳排放和隐含碳排放。
?
LLMCarbon基于大型语言模型的变压器二氧化碳当量排放量估算
?
当前,基于大语言模型的碳管理解决方案正加速形成规模化应用生态,典型代表包括:中创碳知(SinoCarbonAI)、度能3.0、佳华碳精灵及CarbonAI。
随着钢铁、水泥等高耗能行业试点项目的落地验证,AI驱动的碳管理工具正从单点突破迈向跨领域协同的可持续发展阶段。
?
碳管理知识库的智能化进阶,本质上是LLMs的泛化能力、RAG的精准校准与行业知识图谱的深度耦合——这不仅需要技术架构的精密设计,更要求对碳排放核算范式的系统性解构。
在即将展开的系列研究中,我们将以钢铁行业作为切口,揭示碳管理智能体的核心构建逻辑——从数据架构设计到智能体部署,解码知识库与大语言模型融合的关键路径。
敬请期待!
关于我们
米塔碳 (Meta Carbon)智能科技有限公司,是一家专注于人工智能技术研发的科技型公司,公司愿景是将AI技术垂直应用到行业中,赋能企业智能化发展。
公司依托自研人工智能底座,在能源电力、金融科技领域创新应用,孵化出面向行业的人工智能产品,致力于为客户提供优质的服务。
?