企业管理的108个问题 · 第31问

上一问我们聊了 OKR 和 KPI 怎么搭配使用（第30问），”怎么定目标”的问题有了答案，接下来就是更让人头疼的问题：怎么评价？ 尤其是绩效评估——每个管理者都做过，但没几个管理者真做得好的环节。

我问过很多管理者一个问题：”你觉得自己在绩效评估中，能做到百分之百公平公正吗？”

回答普遍很诚实：

“做不到。”
“我尽力了，但总有人不满意。”
“年底打分的时候我就头疼——打低了得罪人，打高了公司 HR 找我。”

更扎心的是，当员工被匿名问”你觉得公司的绩效评估公平吗”时——有超过 70% 的人回答”不公平”。

这是一个巨大的鸿沟。管理者觉得自己已经很努力了，员工却觉得你在敷衍甚至偏心。问题出在哪？

这一篇，我们把”老好人打分”这个痼疾彻底拆解一遍，然后给你一套可落地的方案。

一、为什么管理者会变成”老好人”？

在讨论”怎么治”之前，先搞清楚”病因”。管理者打分趋同、不敢拉开差距，背后至少有四个深层原因。

原因一：评价标准模糊，管理者自己也没底

很多公司的绩效评估表上写着：

“工作态度：优/良/中/差”
“团队协作：优/良/中/差”
“执行力：优/良/中/差”

但什么是”优”级的工作态度？什么算”差”？没有明确定义。

当你自己都说不清楚标准时，你当然不敢打低分——因为员工反问一句”我哪里差了”你根本没法回答。

原因二：缺乏日常记录，全凭”印象分”

这是最普遍的问题。很多管理者的绩效评估逻辑是这样的：

年底了，该打分 → 回忆一下小明今年做了什么 → 好像…还行？→ 那就给个 B+ 吧。

问题在于：人脑的记忆是高度不靠谱的。近因效应（最近的表现影响最大）和首因效应（第一印象影响最大）会严重扭曲你的评估。而且人对”负面信息”的记忆比”正面信息”更持久——如果你的团队里有一个人犯过一次大错，你可能会不自觉地把他的整体评价拉低，哪怕他后面九个月都表现得很好。

没有记录的评价，本质上就是”凭感觉”。凭感觉打出来的分，谁敢说是公平的？

原因三：害怕冲突，逃避”硬谈话”

这是最人性化的原因。给一个朝夕相处的下属打低分 → 意味着你需要面对他的不满、委屈、甚至眼泪 → 这个画面太难受了 → 干脆给个平均分算了。

我见过一个非常典型的管理者，他带的团队有 12 个人，他给 11 个人打了”超出预期”，1 个人打了”符合预期”。理由是：”我不想影响大家的年终奖。”

但结果是什么？真正优秀的员工觉得”我做得那么好，和混日子的人评分一样，那我为什么要努力？”——老好人的打分看似保护了所有人的面子，实际上伤害了最优秀的那批人。

原因四：评估目的混淆——是分奖金，还是促进成长？

很多公司把绩效评估跟”发奖金””调薪””晋升”直接挂钩，而且是一个强关联——你得 A 我就给你加多少钱，你得 C 你就扣多少钱。

这种”跟钱死死绑定”的模式下，管理者天然会趋向”少数人得高分，大多数人都拿平均分”的分布。因为打得太尖锐，团队里就有人拿不到钱，甚至走人——管理者承受不起这个后果。

评估工具被同时用于”裁判”和”教练”两个角色，而这两个角色需要的心理状态是完全相反的。裁判需要区分高低，教练需要帮助成长——你在同一件事上同时做这两件事，一定做不好。

二、”老好人打分”的四个直接后果

你以为老好人是”不得罪人”？恰恰相反，老好人打分的长期代价远高于”打真实分”。

后果一：优秀的人先走

很简单的道理——如果你团队里最优秀的人和最平庸的人拿的奖金一样多，你觉得优秀的人会怎么想？

他们会觉得：“这个地方不尊重能力。”

然后他们就会开始找下家。而平庸的人会留下来，因为他们觉得”这个公司挺舒服的”。

劣币驱逐良币，是”老好人打分”最隐蔽也最致命的后果。

后果二：员工不知道该往哪努力

如果所有人的评分都一样，对员工来说：“我努力工作没有任何额外的回报，我躺平也没有任何惩罚。”

那么理性的选择是什么？躺平。

评估的意义不在于打分本身，而在于传递信号——告诉员工什么行为是被鼓励的，什么行为是需要改进的。

后果三：管理者的权威被削弱

当一个管理者无法给出有区分度的评价时，员工会认为他”没有判断力”或者”不敢做判断”。这样的管理者，在团队中的话语权会越来越弱。

后果四：HR 系统失效

如果全公司所有人的评分都集中在”良好”，HR 的末位淘汰、晋升筛选、人才盘点就全部失去了数据基础。HR 只能依靠”印象”来做人才决策，又回到了凭感觉的状态。

一个老好人管理者，毁掉的不是一个员工的成长机会，而是整个组织的公平感。

三、如何解决？一套”防老好人”的绩效评估系统

解决了”为什么”和”后果是什么”，接下来是最核心的部分——到底怎么做？

第一步：建立清晰的”行为锚定”评价标准

把模糊的评价维度换成具体的行为描述。这是最基础也最关键的一步。

错误示范（太模糊）：

执行力：优 / 良 / 中 / 差

正确示范（行为锚定）：

卓越（5分）： 主动提前完成任务，且在过程中发现了流程上的问题并推动了优化。上级不需要做任何跟进。
良好（4分）： 按时高质量完成任务，偶尔需要上级的催促或指导。
合格（3分）： 基本按时完成任务，质量符合要求，但需要上级持续跟进和反馈。
待改进（2分）： 经常延期，或交付质量不达标，需要上级反复纠正。
不合格（1分）： 多次无法完成任务，或者交付结果严重偏离预期。

关键是：每一个等级都有”可观察的行为描述”，而不是”形容词”。

这样，当你给一个人打 2 分的时候，你可以说：”小明，三月份你负责的 XXX 项目延期了两周，五月份的 YYY 报告数据错误率超过 10%，这就是’待改进’的标准。”——有据可依，不伤感情。

第二步：引入”关键事件记录法”（Critical Incident Technique）

这是消除”近因效应”的最佳武器。

做法很简单：管理者每个季度（甚至每个月）给每个下属记录 2-3 个关键事件，分正反两面。

正面关键事件： 这个季度的”高光时刻”——他做了什么超出预期的事情？
待改进事件： 这个季度出现的问题——哪里做得不够好？当时是怎么处理的？

关键：这些记录必须是在事件发生后一周内完成的，不能等到年底再去回忆。

实战技巧：每周花 15 分钟，打开一个表格（或者用飞书文档），给每个直接下属更新一条”本周值得记录的点”。到了年底绩效评估的时候，你的表格里已经有四五十条素材了。

这样打出来的分，不是”我觉得他不错”，而是”有理有据的评判”。当员工质疑你的打分时，你可以拿出每一个具体的事件来说话。

第三步：强制分布 + 相对排名（适度使用）

强制分布（Forced Distribution）是一把双刃剑。用得好，它能倒逼管理者做出区分；用得不好，它会破坏团队协作。

推荐的做法：不强制分布的比例，但要求管理者在评价给出后，对下属进行”相对排名”。

具体来说：

做完绝对值评分后，管理者要做一件事——把所有下属按”整体贡献度”排序，分出前 30%、中间 60%、后 10%。

这个排序不需要对外公开，但它本身是对管理者的一种”倒逼”——当你发现自己把所有人都排在前 30% 的时候，你就会意识到自己的评价有问题了。

一些优秀公司的做法（参考）：

谷歌的前身是强制”末位 10%”淘汰，现在改成了”有区分但不强制淘汰”的模式
微软在 2013 年废除了”强制排名堆叠”，转向更注重团队协作的评估方式
字节跳动的做法是：强制区分，但不强制淘汰——允许给你打出”差评”，但不意味着这个人必须走

一个务实的建议：要求每个管理者在年终评估时，必须区分出”超出预期（前 20%）”、”符合预期（中间 70%）”和”有待改进（后 10%）”三个档次。如果有人给了所有人”符合预期”，HR 需要介入——你是在认真评估吗？

第四步：绩效评估与薪酬调整”半脱钩”

前面提到，”裁判”和”教练”的角色混在一起是根本问题之一。解决的方法就是——把”发奖金”和”促成长”两个环节分开。

怎么做？

一年做两次”对话”：

年中的”发展对话”： 只谈成长，不谈钱。管理者的角色是教练——帮员工分析优势、找到改进空间、制定下半年的发展计划。这个谈话不打分、不评级、不挂钩薪酬。
年底的”评价对话”： 基于全年的关键事件记录和指标数据，给出等级评价。这个评价与奖金分配和调薪挂钩。

这样做的意义是什么？

年中那次谈话，因为没有”钱”的因素，管理者和员工都能更坦诚地面对问题。管理者不会因为”打低分要扣钱”而退缩，员工也不会把”改进建议”理解为”否定”。到了年底，”评价结果”只是一个全年的”总结性判断”——有前面大半年的坦诚沟通做铺垫，员工已经不会感到意外了。

第五步：引入”校准会议”（Calibration Meeting）

这是很多大公司（如亚马逊、谷歌）都在用的方法论。

做法： 评估结束后，所有同级别管理者和 HR 坐在一起，对各自的评估结果进行”交叉校准”。

校准会议上讨论的问题：

“你给小明打了超出预期，但在我们组的合作项目中，他经常失联——这个你怎么看？”
“你给小红打了符合预期，但去年她获得了全公司的最佳项目奖——这是不是前后矛盾？”
“你团队里 80% 的人都是超出预期——你是不是标准太松了？”

校准会议的好处： 让不同管理者之间的”松紧度”趋于一致。每个管理者有自己的”打分风格”（有的人天生严厉，有的人天生宽松），校准会议就是把这些差异拉到一个共同的基准线上。

小公司怎么办： 不需要像大公司那样搞一整天。只需要拿出 1-2 小时，把各部门的评分分布列出来看看——如果某个部门的评分分布明显偏离平均值，就一起讨论一下原因。

四、真实案例：一家 200 人公司怎么做绩效评估改革

为了让你看到这些方法落地的样子，分享一个真实案例。

公司背景： 一家 200 人的 SaaS 企业，研发 + 销售 + 服务三条线。

改革前面临的问题： 绩效评估形同虚设——95% 的人是”符合预期”，每年晋升全靠”谁跟领导关系好”。优秀员工流失率高达 25%。

改革后做的三件事：

建立行为锚定评价体系： HR 联合各部门负责人，花了三周时间，为每个核心岗位定义了 4-5 个”关键行为维度”，每个维度有 5 级行为描述。这一个动作就让原来模糊的”表现”变成了可衡量的”行为”。
引入季度关键事件记录： 每个管理者每个季度必须提交一次”下属关键事件清单”。HR 会随机抽查——如果某个管理者的记录空白，意味着他没有尽到管理责任。
实施”年中发展对话 + 年底评价对话”的双轨制： 上半年只谈成长，下半年给评价。同时引入了部门间的”校准会议”。

结果：

第一年结束时，评分分布变成了：超出预期 22%、符合预期 68%、有待改进 10%
第二年，优秀员工的流失率从 25% 下降到 12%
员工对”绩效评估公平性”的满意度从 38% 提升到了 72%

不是因为他们做了什么惊天动地的事情，而是因为他们解决了最基本的公平问题。

五、一个实用工具：绩效评估”自检清单”

作为管理者，在每次绩效评估前，问自己这几个问题：

我有没有基于具体事实和记录，而不是”总体印象”来打分？
我对每个下属的评分，是否都能说出至少 2-3 个具体事例来支撑？
我有没有因为近因效应或首因效应而扭曲了某人的评价？
我是否对不同下属使用了相同的标准、而不是因人而异？
我的评分分布是否有区分度？还是所有人都挤在中间？
我在评估前，有没有和下属进行过至少一次正式的反馈对话（不是年底才通知结果）？

如果以上有任何一条的答案是”没有”或”不确定”，那你的评估大概率是不够公平的。

写到最后

绩效评估之所以难，是因为它不仅是管理工具，更是一场对管理者人格的考试。

它考你的：是敢不敢做出艰难判断，是有没有用心去观察每一个下属的成长，是愿不愿意花时间做记录和反思。

一个”老好人”管理者可能得到所有人的喜欢，但得不到任何人的尊重。而一个公平的管理者，可能让一些人难受，但会让最优秀的人愿意追随。

记住这句话——

评价的公平感，不来自于评分的高低，而来自于”有没有依据”。 当你扎扎实实地把每一个评分都建立在实际行为和记录之上时，即使有人对你的结论不满，他也无法质疑你的过程。

这就是”公平公正”的底层逻辑——不是让所有人满意，而是让所有人信服。

⬅️ 返回目录
明日预告：第32问 —— 核心人才突然提出离职，该怎么挽留？

本文作者：Samjoe Yang

本文链接： https://need.uno/031-ru-he-gong-ping-gong-zheng-de-zuo-ji-xiao-ping-gu/

更新于 2026-07-19

# 职场 # 企业管理 # 人力 # 运营 # 管理心得

如何公平公正地做绩效评估，避免"老好人"打分？