企业管理的108个问题 · 第31问
上一问我们聊了 OKR 和 KPI 怎么搭配使用(第30问),”怎么定目标”的问题有了答案,接下来就是更让人头疼的问题:怎么评价? 尤其是绩效评估——每个管理者都做过,但没几个管理者真做得好的环节。
我问过很多管理者一个问题:”你觉得自己在绩效评估中,能做到百分之百公平公正吗?”
回答普遍很诚实:
“做不到。”
“我尽力了,但总有人不满意。”
“年底打分的时候我就头疼——打低了得罪人,打高了公司 HR 找我。”
更扎心的是,当员工被匿名问”你觉得公司的绩效评估公平吗”时——有超过 70% 的人回答”不公平”。
这是一个巨大的鸿沟。管理者觉得自己已经很努力了,员工却觉得你在敷衍甚至偏心。问题出在哪?
这一篇,我们把”老好人打分”这个痼疾彻底拆解一遍,然后给你一套可落地的方案。
一、为什么管理者会变成”老好人”?
在讨论”怎么治”之前,先搞清楚”病因”。管理者打分趋同、不敢拉开差距,背后至少有四个深层原因。
原因一:评价标准模糊,管理者自己也没底
很多公司的绩效评估表上写着:
- “工作态度:优/良/中/差”
- “团队协作:优/良/中/差”
- “执行力:优/良/中/差”
但什么是”优”级的工作态度?什么算”差”?没有明确定义。
当你自己都说不清楚标准时,你当然不敢打低分——因为员工反问一句”我哪里差了”你根本没法回答。
原因二:缺乏日常记录,全凭”印象分”
这是最普遍的问题。很多管理者的绩效评估逻辑是这样的:
年底了,该打分 → 回忆一下小明今年做了什么 → 好像…还行?→ 那就给个 B+ 吧。
问题在于:人脑的记忆是高度不靠谱的。近因效应(最近的表现影响最大)和首因效应(第一印象影响最大)会严重扭曲你的评估。而且人对”负面信息”的记忆比”正面信息”更持久——如果你的团队里有一个人犯过一次大错,你可能会不自觉地把他的整体评价拉低,哪怕他后面九个月都表现得很好。
没有记录的评价,本质上就是”凭感觉”。凭感觉打出来的分,谁敢说是公平的?
原因三:害怕冲突,逃避”硬谈话”
这是最人性化的原因。给一个朝夕相处的下属打低分 → 意味着你需要面对他的不满、委屈、甚至眼泪 → 这个画面太难受了 → 干脆给个平均分算了。
我见过一个非常典型的管理者,他带的团队有 12 个人,他给 11 个人打了”超出预期”,1 个人打了”符合预期”。理由是:”我不想影响大家的年终奖。”
但结果是什么?真正优秀的员工觉得”我做得那么好,和混日子的人评分一样,那我为什么要努力?”——老好人的打分看似保护了所有人的面子,实际上伤害了最优秀的那批人。
原因四:评估目的混淆——是分奖金,还是促进成长?
很多公司把绩效评估跟”发奖金””调薪””晋升”直接挂钩,而且是一个强关联——你得 A 我就给你加多少钱,你得 C 你就扣多少钱。
这种”跟钱死死绑定”的模式下,管理者天然会趋向”少数人得高分,大多数人都拿平均分”的分布。因为打得太尖锐,团队里就有人拿不到钱,甚至走人——管理者承受不起这个后果。
评估工具被同时用于”裁判”和”教练”两个角色,而这两个角色需要的心理状态是完全相反的。裁判需要区分高低,教练需要帮助成长——你在同一件事上同时做这两件事,一定做不好。
二、”老好人打分”的四个直接后果
你以为老好人是”不得罪人”?恰恰相反,老好人打分的长期代价远高于”打真实分”。
后果一:优秀的人先走
很简单的道理——如果你团队里最优秀的人和最平庸的人拿的奖金一样多,你觉得优秀的人会怎么想?
他们会觉得:“这个地方不尊重能力。”
然后他们就会开始找下家。而平庸的人会留下来,因为他们觉得”这个公司挺舒服的”。
劣币驱逐良币,是”老好人打分”最隐蔽也最致命的后果。
后果二:员工不知道该往哪努力
如果所有人的评分都一样,对员工来说:“我努力工作没有任何额外的回报,我躺平也没有任何惩罚。”
那么理性的选择是什么?躺平。
评估的意义不在于打分本身,而在于传递信号——告诉员工什么行为是被鼓励的,什么行为是需要改进的。
后果三:管理者的权威被削弱
当一个管理者无法给出有区分度的评价时,员工会认为他”没有判断力”或者”不敢做判断”。这样的管理者,在团队中的话语权会越来越弱。
后果四:HR 系统失效
如果全公司所有人的评分都集中在”良好”,HR 的末位淘汰、晋升筛选、人才盘点就全部失去了数据基础。HR 只能依靠”印象”来做人才决策,又回到了凭感觉的状态。
一个老好人管理者,毁掉的不是一个员工的成长机会,而是整个组织的公平感。
三、如何解决?一套”防老好人”的绩效评估系统
解决了”为什么”和”后果是什么”,接下来是最核心的部分——到底怎么做?
第一步:建立清晰的”行为锚定”评价标准
把模糊的评价维度换成具体的行为描述。这是最基础也最关键的一步。
错误示范(太模糊):
- 执行力:优 / 良 / 中 / 差
正确示范(行为锚定):
- 卓越(5分): 主动提前完成任务,且在过程中发现了流程上的问题并推动了优化。上级不需要做任何跟进。
- 良好(4分): 按时高质量完成任务,偶尔需要上级的催促或指导。
- 合格(3分): 基本按时完成任务,质量符合要求,但需要上级持续跟进和反馈。
- 待改进(2分): 经常延期,或交付质量不达标,需要上级反复纠正。
- 不合格(1分): 多次无法完成任务,或者交付结果严重偏离预期。
关键是:每一个等级都有”可观察的行为描述”,而不是”形容词”。
这样,当你给一个人打 2 分的时候,你可以说:”小明,三月份你负责的 XXX 项目延期了两周,五月份的 YYY 报告数据错误率超过 10%,这就是’待改进’的标准。”——有据可依,不伤感情。
第二步:引入”关键事件记录法”(Critical Incident Technique)
这是消除”近因效应”的最佳武器。
做法很简单:管理者每个季度(甚至每个月)给每个下属记录 2-3 个关键事件,分正反两面。
- 正面关键事件: 这个季度的”高光时刻”——他做了什么超出预期的事情?
- 待改进事件: 这个季度出现的问题——哪里做得不够好?当时是怎么处理的?
关键:这些记录必须是在事件发生后一周内完成的,不能等到年底再去回忆。
实战技巧:每周花 15 分钟,打开一个表格(或者用飞书文档),给每个直接下属更新一条”本周值得记录的点”。到了年底绩效评估的时候,你的表格里已经有四五十条素材了。
这样打出来的分,不是”我觉得他不错”,而是”有理有据的评判”。当员工质疑你的打分时,你可以拿出每一个具体的事件来说话。
第三步:强制分布 + 相对排名(适度使用)
强制分布(Forced Distribution)是一把双刃剑。用得好,它能倒逼管理者做出区分;用得不好,它会破坏团队协作。
推荐的做法:不强制分布的比例,但要求管理者在评价给出后,对下属进行”相对排名”。
具体来说:
做完绝对值评分后,管理者要做一件事——把所有下属按”整体贡献度”排序,分出前 30%、中间 60%、后 10%。
这个排序不需要对外公开,但它本身是对管理者的一种”倒逼”——当你发现自己把所有人都排在前 30% 的时候,你就会意识到自己的评价有问题了。
一些优秀公司的做法(参考):
- 谷歌的前身是强制”末位 10%”淘汰,现在改成了”有区分但不强制淘汰”的模式
- 微软在 2013 年废除了”强制排名堆叠”,转向更注重团队协作的评估方式
- 字节跳动的做法是:强制区分,但不强制淘汰——允许给你打出”差评”,但不意味着这个人必须走
一个务实的建议:要求每个管理者在年终评估时,必须区分出”超出预期(前 20%)”、”符合预期(中间 70%)”和”有待改进(后 10%)”三个档次。如果有人给了所有人”符合预期”,HR 需要介入——你是在认真评估吗?
第四步:绩效评估与薪酬调整”半脱钩”
前面提到,”裁判”和”教练”的角色混在一起是根本问题之一。解决的方法就是——把”发奖金”和”促成长”两个环节分开。
怎么做?
一年做两次”对话”:
- 年中的”发展对话”: 只谈成长,不谈钱。管理者的角色是教练——帮员工分析优势、找到改进空间、制定下半年的发展计划。这个谈话不打分、不评级、不挂钩薪酬。
- 年底的”评价对话”: 基于全年的关键事件记录和指标数据,给出等级评价。这个评价与奖金分配和调薪挂钩。
这样做的意义是什么?
年中那次谈话,因为没有”钱”的因素,管理者和员工都能更坦诚地面对问题。管理者不会因为”打低分要扣钱”而退缩,员工也不会把”改进建议”理解为”否定”。到了年底,”评价结果”只是一个全年的”总结性判断”——有前面大半年的坦诚沟通做铺垫,员工已经不会感到意外了。
第五步:引入”校准会议”(Calibration Meeting)
这是很多大公司(如亚马逊、谷歌)都在用的方法论。
做法: 评估结束后,所有同级别管理者和 HR 坐在一起,对各自的评估结果进行”交叉校准”。
校准会议上讨论的问题:
- “你给小明打了超出预期,但在我们组的合作项目中,他经常失联——这个你怎么看?”
- “你给小红打了符合预期,但去年她获得了全公司的最佳项目奖——这是不是前后矛盾?”
- “你团队里 80% 的人都是超出预期——你是不是标准太松了?”
校准会议的好处: 让不同管理者之间的”松紧度”趋于一致。每个管理者有自己的”打分风格”(有的人天生严厉,有的人天生宽松),校准会议就是把这些差异拉到一个共同的基准线上。
小公司怎么办: 不需要像大公司那样搞一整天。只需要拿出 1-2 小时,把各部门的评分分布列出来看看——如果某个部门的评分分布明显偏离平均值,就一起讨论一下原因。
四、真实案例:一家 200 人公司怎么做绩效评估改革
为了让你看到这些方法落地的样子,分享一个真实案例。
公司背景: 一家 200 人的 SaaS 企业,研发 + 销售 + 服务三条线。
改革前面临的问题: 绩效评估形同虚设——95% 的人是”符合预期”,每年晋升全靠”谁跟领导关系好”。优秀员工流失率高达 25%。
改革后做的三件事:
建立行为锚定评价体系: HR 联合各部门负责人,花了三周时间,为每个核心岗位定义了 4-5 个”关键行为维度”,每个维度有 5 级行为描述。这一个动作就让原来模糊的”表现”变成了可衡量的”行为”。
引入季度关键事件记录: 每个管理者每个季度必须提交一次”下属关键事件清单”。HR 会随机抽查——如果某个管理者的记录空白,意味着他没有尽到管理责任。
实施”年中发展对话 + 年底评价对话”的双轨制: 上半年只谈成长,下半年给评价。同时引入了部门间的”校准会议”。
结果:
- 第一年结束时,评分分布变成了:超出预期 22%、符合预期 68%、有待改进 10%
- 第二年,优秀员工的流失率从 25% 下降到 12%
- 员工对”绩效评估公平性”的满意度从 38% 提升到了 72%
不是因为他们做了什么惊天动地的事情,而是因为他们解决了最基本的公平问题。
五、一个实用工具:绩效评估”自检清单”
作为管理者,在每次绩效评估前,问自己这几个问题:
- 我有没有基于具体事实和记录,而不是”总体印象”来打分?
- 我对每个下属的评分,是否都能说出至少 2-3 个具体事例来支撑?
- 我有没有因为近因效应或首因效应而扭曲了某人的评价?
- 我是否对不同下属使用了相同的标准、而不是因人而异?
- 我的评分分布是否有区分度?还是所有人都挤在中间?
- 我在评估前,有没有和下属进行过至少一次正式的反馈对话(不是年底才通知结果)?
如果以上有任何一条的答案是”没有”或”不确定”,那你的评估大概率是不够公平的。
写到最后
绩效评估之所以难,是因为它不仅是管理工具,更是一场对管理者人格的考试。
它考你的:是敢不敢做出艰难判断,是有没有用心去观察每一个下属的成长,是愿不愿意花时间做记录和反思。
一个”老好人”管理者可能得到所有人的喜欢,但得不到任何人的尊重。而一个公平的管理者,可能让一些人难受,但会让最优秀的人愿意追随。
记住这句话——
评价的公平感,不来自于评分的高低,而来自于”有没有依据”。 当你扎扎实实地把每一个评分都建立在实际行为和记录之上时,即使有人对你的结论不满,他也无法质疑你的过程。
这就是”公平公正”的底层逻辑——不是让所有人满意,而是让所有人信服。
⬅️ 返回目录
明日预告:第32问 —— 核心人才突然提出离职,该怎么挽留?
本文作者:Samjoe Yang
本文链接: https://need.uno/031-ru-he-gong-ping-gong-zheng-de-zuo-ji-xiao-ping-gu/
版权声明:本作品采用 知识共享署名-相同方式共享 4.0 国际许可协议 进行许可。
评论