介绍
# Excel weekly dashboards at scale
## 目的 设计可刷新的 Excel 仪表板(Power Query + 结构化表格 + 数据验证 + 透视报表)。
## 何时使用 - 触发条件: - 为此文件构建一个 Power Query 流水线,使其每周自动刷新且无需人工干预。 - 将其转换为带有验证列表和清晰数据录入规则的结构化表格。 - 创建一个基于透视表的周报仪表板,并带有年份和 ISO 周的切片器。 - 修复此 Excel 模型,使其在出现新列时刷新不会中断。 - 设计一个可重复使用的 KPI 包,能够从 CSV 文件夹中更新。 - 请勿在以下情况使用… - 您需要高级预测/估值建模(此技能用于可重复的报表流水线)。 - 您需要构建 BI 工具(如 Power BI/Tableau)而不是 Excel。 - 您需要以网页抓取作为主要数据摄入方式。
## 输入 - 必需项: - 源数据文件:CSV、XLSX、DOCX 导出的表格或 PDF 导出的表格(由用户提供)。 - “周”的定义(首选 ISO 周)以及所需的 KPI 字段。 - 可选项: - 数据字典 / 列定义。 - 已知的“不良数据”模式以供验证(例如,空的 PayNumber、无效日期)。 - 需要重构的现有工作簿。 - 示例: - 包含每周 CSV 导出的文件夹:`exports/2026-W02/*.csv` - 每月列都会变化的单一 XLSX 转储文件
## 输出 - 如果仅要求**制定计划(默认)**:分步构建计划 + Power Query 步骤 + 工作表布局 + 验证规则。 - 如果明确要求**生成产物**: - `workbook_spec.md`(工作簿结构和命名表) - `power_query_steps.pq`(M 代码模板) - `refresh-checklist.md`(来自 `assets/`) 成功标准 = 添加新一周的文件后,在无需手动编辑的情况下刷新即可生效,且验证能够捕获错误行。
## 工作流 1. 识别源类型(CSV/XLSX/DOCX/PDF 导出)和稳定的业务键(例如 PayNumber)。 2. 定义规范表架构: - 必需列、类型、允许值以及“未知”值的处理方式。 3. 使用 Power Query 设计摄入: - 首选**文件夹摄入** + 合并,并对“缺失列”进行防御性处理。 - 规范化列名(去除空格、统一大小写、合并空格)。 4. 设计清洗与验证: - 创建一个 **Data_Staging** 查询(原始规范化数据)和一个 **Data_Clean** 查询(已验证数据)。 - 添加验证列(例如 `IsValidPayNumber`、`IsValidDate`、`IssueReason`)。 5. 构建报表层: - 基于 **Data_Clean** 创建透视表 - 切片器:Year、ISOWeek;以及运营维度 6. 添加“刷新状态”工作表: - 上次刷新时间戳、行计数、查询错误标志、存在的最新周数据 7. 如果出现以下情况,请停止并向用户询问: - 必需的 KPI/列未指定, - 源文件不包含任何稳定的键, - 周定义/时区规则不清晰, - 在未提供导出文件的情况下,PDF/DOCX 表格无法可靠提取。
## 输出格式 在制定**计划**时,使用此模板:
```text WORKBOOK PLAN - Sheets: - Data_Staging (query output) - Data_Clean (query output + validation flags) - Dashboard (pivots/charts) - Refresh_Status (counts + health checks) - Canonical Schema: - <Column>: <Type> | Required? | Validation - Power Query: - Query 1: Ingest_<name> (Folder/File) - Query 2: Clean_<name> - Key transforms: <bullets> - Validation rules: - <rule> -> <action> - Pivot design: - Rows/Columns/Values - Slicers ```
如果要求生成产物,还需输出: - `assets/power-query-folder-ingest-template.pq`(已适配) - `assets/refresh-checklist.md`
## 安全与边界情况 - 默认为只读:提供计划 + 代码片段,除非用户明确要求生成文件。 - 切勿删除或覆盖用户文件;为输出建议新文件名。 - 坚持“无静默失败”原则:包含行数检查和可见的错误标志。 - 对于 PDF/DOCX 源,要求用户提供导出的表格(CSV/XLSX),或明确标注提取风险。
## 示例 - 输入:“包含 PayNumber/Name/Date 的每周 CSV 文件夹。” 输出:文件夹摄入 PQ 模板 + 架构 + 刷新状态检查 + 透视仪表板计划。
- 输入:“出现新列时刷新中断。” 输出:防御性缺失列逻辑 + 列规范化 + 类型化架构计划。