六大ESG评级机构相关性0.61:为什么同一家公司评分天壤之别?
2022 年,Aggregate Confusion 项目(MIT/Zurich 的研究团队)比较了六大 ESG 评级机构对同一组公司的评分,发现它们之间的相关性只有约 0.61。
作为对比:信用评级机构(穆迪 vs 标普)对同一发行人的信用评级,相关性超过 0.99。
这意味着什么?如果你拿着 ESG 评级去做”负责任投资”,你的决策很可能取决于你用的是哪家评级机构,而不是公司的真实 ESG 表现。
这节课解剖 ESG 评级”为什么不可靠”的三个根本原因。
六大 ESG 评级机构(MSCI、Sustainalytics、S&P Global、ISS、Refinitiv、FTSE Russell)对同一家公司可以给出截然不同的评分——这不是因为有人在说谎,而是因为它们在衡量根本不同的东西,只是都用了”ESG”这个标签。
一、三种分歧来源
Berg、Koelbel 和 Rigobon(2022 年 Review of Finance)系统化地拆解了评级分歧,发现来源于三类问题:
1.1 范围分歧(Scope Disagreement)——衡量哪些属性?
不同机构覆盖的 ESG 议题范围不同:
MSCI 关注的”S”维度可能包括”员工多样性”和”人力资本发展”,而 Sustainalytics 的”S”更强调”社区关系”和”供应链劳工标准”。
结果: 对同一家公司,一家机构评估的是它最擅长的 ESG 方面,另一家评估的是它没有改善的方面——评分当然不同。
1.2 测量分歧(Measurement Disagreement)——怎么测量同一属性?
即使两家机构都关注”碳排放强度”,测量方式也可能不同:
- 每单位营收的排放量,还是每单位产品的排放量?
- 是否包含 Scope 3?
- 数据是公司自报,还是估算?
结果: 对同一家公司的同一指标,测量出来的数值可能差 30-50%。
1.3 权重分歧(Weight Disagreement)——不同维度如何合并成总分?
即使两家机构测量到了完全相同的数据,最终分数也取决于权重:
- MSCI 把”G”(治理)的权重设为 30%,“E”为 35%,“S”为 35%
- 另一家机构可能把”E”设为 60%(更强调气候风险)
对一家治理出色但环境表现一般的公司,权重不同 → 总分天壤之别。
二、一个让人不安的案例:亚马逊
亚马逊的 ESG 评分(2022 年):
- MSCI:AA(高评分,第二高档)
- Sustainalytics:高风险(即低分,在仓储物流行业排名靠后)
两家机构看的是同一家公司,为什么分歧如此之大?
MSCI 对亚马逊的”G”(治理)和”E”(环境承诺,包括”2040 年净零”承诺)给予高分。
Sustainalytics 更关注”S”(社会)维度:亚马逊仓库工人的工作条件(高受伤率、严苛的绩效监控)、工会关系(积极反对工会化)、以及供应链劳工实践。
这不是谁说谎,而是两家机构在衡量不同的东西,并且都用”ESG”来命名它们的结果。
三、自报数据与”洗绿”的结构性问题
大多数 ESG 评级依赖公司自行披露的数据,这产生了结构性的信息不对称:
“披露即得分”的悖论: 部分 ESG 评级方法中,公司只要披露了某个指标(无论数值好坏),就能得分——因为”透明度”被奖励。这鼓励公司增加披露,但不一定鼓励改善实际 ESG 表现。
大公司优势: 大型上市公司有资源雇用专职 ESG 团队,制作精美的可持续发展报告,在技术上满足所有评级机构的数据要求——即使其实际 ESG 表现不如一家没有专职团队的中小企业。
第三方验证的缺失: 财务审计有 Big 4 的严格独立审计;ESG 数据的”第三方保证”(Third-Party Assurance)目前是自愿性的,执行标准远低于财务审计。欧盟 CSRD(2024 年起逐步实施)将要求大型上市公司的可持续发展报告接受独立验证——但全球范围内的标准化还很远。
四、评级机构的商业模式:被付款方的利益冲突
ESG 评级机构的主要收入来源是:
- 发行人付费(Issuer Pays):公司付费获得评级(类似信用评级)——存在与信用评级类似的利益冲突:评级机构有动机维持客户关系,避免过于严苛的评分
- 投资者付费(Investor Pays):机构投资者订阅评级数据服务——利益冲突较少,但投资者可能偏好支持其既有策略的评级结果
MSCI 和 Sustainalytics 主要是”投资者付费”模式;而一些提供”ESG 评级申请”服务(公司主动申请评级以用于市场营销)的机构,存在更明显的利益冲突。
五、怎么用 ESG 评级(以及怎么不用)
不应该做的事情:
- 把单一机构的 ESG 评分当作”ESG 表现”的绝对衡量
- 用 ESG 高分来代替对公司具体 ESG 实践的深入分析
- 忽视评级方法论(不知道评级机构在测量什么,就用了它的分数)
可以做的事情:
- 交叉比较多家评级机构(如果在多家机构都评分低,更有说服力)
- 下沉到底层数据:直接看公司的 Scope 1/2 排放数据、董事会独立比例等原始指标
- 关注评级分歧的来源:如果两家机构分歧大,追问是”范围”、“测量”还是”权重”不同——这本身就是研究机会
为什么重要
ESG 评级的低相关性,对整个 ESG 投资行业都是一个根本性的方法论挑战。
如果两家权威机构的评分相关性只有 0.61,那么声称”投资高 ESG 评分公司”的基金,彼此之间持有的股票可能完全不同——它们使用了同一个标签,但实际上在做完全不同的事情。
对投资者的实践建议: 与其相信 ESG 评级,不如理解它的局限。ESG 评级是信息工具,不是答案。把它当作”筛选框架”(帮你找到需要深入研究的公司),而不是”决策依据”(直接决定买卖)。
延伸阅读 / 公开资源
- Wikipedia - MSCI ESG ratings:MSCI ESG 评级方法论概述
- Wikipedia - Sustainalytics:Sustainalytics 的历史和方法论
- YouTube - “ESG ratings divergence”:多家研究机构对 ESG 评级分歧的量化研究解读
- Wikipedia - Greenwashing:洗绿的定义、案例和识别方法
- YouTube - “ESG data problem”:ESG 数据质量问题的系统分析