评估驱动Skill开发 Evolution Log 2026-04-15: 来自 anthropic-best-practices 的认知:先明确真实问题构建评估场景,再编写刚好满足评估的最小Skill内容,避免编写解决不存在问题的冗余内容的开发方法