数据运营系列（三）：熵权法如何确定指标权重构建评价体系

原創

2020-05-30 16:30

1. 熵权法

信息论基本原理解释信息是系统有序性的度量单位，而熵可以度量系统的无序程度；如果某个指标的信息熵越小，该指标提供的信息量越大，指标变异程度(方差)高，因此在综合评价中所起作用理当越大，权重就应该越高。熵权法的基本原理就是根据指标变异性的大小来确定客观权重。一般来说，这个方法相比于AHP专家打分更客观。熵权法确定指标权重的推导过程如下：

第一步：数据标准化

将各个指标的数据进行标准化处理。假设给定了k个指标，其中。假设对各指标数据标准化后的值为，那么

第二步：求各指标的信息熵

根据信息论中信息熵的定义，一组数据的信息熵计算为：

，其中

第三步：确定各指标权重

根据信息熵的计算公式，计算出各个指标的信息熵为。通过信息熵计算各指标的权重：

2. 评价体系之确定指标权重并计算样本得分

比如最近某快递公司在多地设置了快递点，但是快递点运营状态如何从数据上来获知，有哪些快递点需要取消，哪些快递点需要扩大经营？如何为给出每个快递点的具体得分，从而设置奖惩制度。这里建立一个评价体系，评价体系中包括能很好衡量快递点经营效果的指标，每个快递点都有这些指标的数据，因为熵权法可以自己计算出各个指标的权重，那么避免了专家打分法等主观权重带来的偏见，因此从该数据基础上即可获得各个快递点的得分。

熵权法计算过程：

求解过程放在了Excel，公众号后台回复“熵权法”即可获取。

第一步：数据标准化。假设有11个快递点参与评价，评价体系中包括以下7个子指标，以下指标数据通过归一化公式已实现数据标准化。

表1 数据标准化

第二步：求各指标的信息熵

表2 求解各数据的Pij

表3 求解信息熵Ei

第三步：求各指标权重，见表3倒数第一行。

第四步：各快递点得分，见表3最后一列。可以看到快递点S6得分最高。

数据运营系列（三）：熵权法如何确定指标权重构建评价体系

1. 熵权法

2. 评价体系之确定指标权重并计算样本得分

这种嵌套字典类型的数据，我想把它读取到df里，如何操作？

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

iNeuOS工业互联网操作系统，增加电力IEC104协议

微服务实践k8s&dapr开发部署实验（3）订阅发布

數據人如何提升自己？

這份99頁的PDF，幫你徹底搞定Pandas數據分析！（附8W源數據）

技術驅動業務？來潑個冷水吧......

數據產品的價值是什麼？

統計學出身但編程一般，該選擇數據分析還是挖掘算法？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結