XLSX Skill logo

XLSX Skill

打开

Anthropic 官方 Skill,用于全面的电子表格创建、编辑和分析,支持公式、格式化、数据分析和可视化。

分享:

概述

XLSX Skill 是 Anthropic 官方发布的 Claude Skills 之一,旨在全面创建、编辑和分析电子表格,完全支持公式、格式化、数据分析和可视化。此 Skill 使 Claude 能够专业地处理 Excel 文件(.xlsx、.xlsm)和相关格式(.csv、.tsv),处理从简单数据操作到复杂财务模型的所有内容。

该 Skill 强调使用 Excel 公式而不是硬编码值,确保电子表格保持动态和可更新。它包含财务模型的广泛质量标准、自动公式重新计算和全面的错误检测。

核心功能

1. 电子表格创建

创建专业的 Excel 文件:

  • 公式: 自动更新的动态计算
  • 格式化: 字体、颜色、对齐、边框
  • 结构: 多个工作表、表格、图表
  • 样式: 单元格样式和条件格式
  • 丰富内容: 图像、超链接、注释

2. 数据分析

使用 pandas 分析电子表格数据:

  • 读取和处理 Excel 文件
  • 统计分析和聚合
  • 数据转换和清理
  • 多工作表操作
  • 导出到各种格式

3. 公式重新计算

使用 LibreOffice 自动计算公式:

  • 重新计算所有工作表中的所有公式
  • 全面的错误检测(#REF!、#DIV/0!、#VALUE! 等)
  • 带有位置的详细错误报告
  • 用于自动化处���的 JSON 输出

4. 财务模型标准

专业的财务建模约定:

  • 色彩编码: 输入为蓝色,公式为黑色,链接为绿色
  • 数字格式: 带有单位的货币,零为破折号,负数用括号
  • 公式构建: 单独单元格中的假设,记录的硬编码
  • 错误预防: 要求零公式错误

5. 质量保证

全面的验证和验证:

  • 公式错误检测
  • 单元格引用验证
  • 除以零检查
  • 跨工作表引用验证
  • 边缘情况测试

使用场景

  • 财务模型: 构建动态财务预测和分析
  • 数据分析: 分析和转换大型数据集
  • 报告: 生成格式化的业务报告
  • 预算: 使用公式创建和跟踪预算
  • 仪表板: 构建数据可视化仪表板
  • 数据导入/导出: 在 Excel 和其他格式之间转换

技术实现

创建电子表格

使用 openpyxl 进行公式和格式化:

from openpyxl import Workbook
from openpyxl.styles import Font, PatternFill

wb = Workbook()
sheet = wb.active
sheet['A1'] = 'Revenue'
sheet['B1'] = '=SUM(B2:B10)'  # 公式,不是硬编码值
sheet['A1'].font = Font(bold=True, color='0000FF')
wb.save('output.xlsx')

分析数据

使用 pandas 进行数据操作:

import pandas as pd

df = pd.read_excel('file.xlsx')
df.describe()  # 统计分析
df.to_excel('output.xlsx', index=False)

重新计算公式

通过 recalc.py 脚本使用 LibreOffice:

python recalc.py output.xlsx

返回带有错误详细信息和位置的 JSON。

关键要求

使用公式,不是硬编码值

始终使用 Excel 公式而不是在 Python 中计算:

错误 - 硬编码:

total = df['Sales'].sum()
sheet['B10'] = total  # 硬编码 5000

正确 - 使用公式:

sheet['B10'] = '=SUM(B2:B9)'  # 动态公式

零公式错误

每个 Excel 文件必须以零公式错误交付:

  • #REF! (无效引用)
  • #DIV/0! (除以零)
  • #VALUE! (错误的数据类型)
  • #N/A (不可用)
  • #NAME? (无法识别的名称)

使用 recalc.py 脚本验证和修复所有错误。

财务模型标准

色彩编码

行业标准约定:

  • 蓝色文本: 用户将更改的硬编码输入
  • 黑色文本: 所有公式和计算
  • 绿色文本: 来自同一工作簿内其他工作表的链接
  • 红色文本: 外部文件链接
  • 黄色背景: 需要注意的关键假设

数字格式

专业格式规则:

  • 年份: 文本字符串("2024" 不是 "2,024")
  • 货币: $#,##0 格式,标题中包含单位("Revenue ($mm)")
  • : 显示为 "-",包括百分比
  • 百分比: 0.0% 格式(一位小数)
  • 负数: 括号 (123) 不是减号 -123

公式构建

最佳实践:

  • 将假设放在单独的单元格中
  • 使用单元格引用而不是硬编码值
  • 记录所有硬编码的数据源
  • 验证所有单元格引用
  • 使用边缘情况测试

工作流程

标准流程

  1. 选择工具: 数据用 pandas,公式/格式用 openpyxl
  2. 创建/加载: 创建新文件或加载现有文件
  3. 修改: 添加数据、公式、格式
  4. 保存: 写入文件
  5. 重新计算(强制性): python recalc.py output.xlsx
  6. 验证: 修复任何错误并再次重新计算

公式验证检查清单

  • 首先测试 2-3 个样本引用
  • 验证列映射(列 64 = BL)
  • 检查行偏移(DataFrame 行 5 = Excel 行 6)
  • 使用 pd.notna() 处理 NaN 值
  • 检查分母是否除以零
  • 验证跨工作表引用
  • 测试边缘情况

错误检测

recalc.py 脚本返回全面的错误信息:

{
  "status": "errors_found",
  "total_errors": 2,
  "total_formulas": 42,
  "error_summary": {
    "#REF!": {
      "count": 2,
      "locations": ["Sheet1!B5", "Sheet1!C10"]
    }
  }
}

修复已识别的错误并重新计算,直到状态为 "success"。

最佳实践

库选择

  • pandas: 数据分析、批量操作、简单导出
  • openpyxl: 公式、格式化、Excel 特定功能

使用 openpyxl

  • 单元格索引从 1 开始(row=1, column=1 = A1)
  • 使用 data_only=True 读取值(但不要保存 - 会丢失公式!)
  • 公式被保留但在 recalc.py 运行之前不会被评估
  • 对于大文件: read_only=Truewrite_only=True

使用 pandas

  • 指定数据类型以避免推断问题
  • 对大文件读取特定列
  • 使用 parse_dates 正确处理日期

依赖项

  • openpyxl: Excel 文件操作
  • pandas: 数据分析
  • LibreOffice: 公式重新计算
  • defusedxml: 安全的 XML 解析

总结

XLSX Skill 使 Claude 能够创建专业的、动态的电子表格,包含公式、格式化和全面的质量保证。通过行业标准约定、自动公式重新计算和零错误要求,此 Skill 确保电子表格可靠、可维护,并���业务、金融和数据分析用例专业构建。

评论

还没有评论。成为第一个评论的人!