10.6 案例:为投研团队构建智能体知识库

面向经管学生、研究者与从业者的 AI 智能体设计教材

作者

李学恒、林建浩、严翊歆

发布于

2026-05-11

10.6 配图

某投研团队管理 300 余份文档,包括卖方研报、上市公司财报和监管政策文件。团队选择 LLM Wiki 模式构建知识库,目标是让智能体持续积累行业知识,而非每次查询都从头检索。

项目目录

invest-research-kb/
├── raw/                    # 原始资料层(人工管理,智能体只读)
│   ├── reports/            #   卖方研报(按行业分目录)
│   ├── filings/            #   上市公司财报(按公司分目录)
│   └── policies/           #   监管政策文件
├── wiki/                   # 维基知识层(智能体维护)
│   ├── index.md            #   总索引:所有 wiki 页面目录
│   ├── log.md              #   操作日志
│   ├── companies/          #   公司知识页(每家公司一个文件)
│   ├── industries/         #   行业知识页(每个行业一个文件)
│   └── concepts/           #   概念知识页(估值方法、政策术语等)
├── schema/                 # 规则层
│   └── CLAUDE.md           #   知识库操作规范
└── outputs/                # 查询产出(研究备忘、对比分析等)

raw/ 目录由研究员手动维护,智能体不修改其中内容。wiki/ 目录由智能体在摄入和查询过程中自动创建和更新。

配置文件

schema/CLAUDE.md 定义了知识库的操作规范:

# 投研知识库操作规范

## 项目概述
本项目为投研团队的 LLM Wiki 知识库。raw/ 存放原始资料(人工管理,
智能体只读),wiki/ 存放编译后的知识页面(智能体维护),outputs/ 存放
查询产出。

## Wiki 页面格式
每个 wiki 页面必须包含以下 YAML frontmatter:

    ---
    title: 条目名称(如"宁德时代")
    type: company | industry | concept | source
    sources:
      - raw/reports/new-energy/2026Q1-solar-outlook.pdf
    updated: 2026-04-20
    ---

正文使用 Markdown 格式,关键数据标注来源文件路径。
页面之间用 [[wikilink]] 语法互相引用。

## Ingest 规则
- 读取 raw/ 中的新文档,提取核心观点、数据和结论
- 更新或创建对应的 wiki 页面(公司页、行业页、概念页)
- 新建页面必须填写完整的 YAML frontmatter
- 更新 wiki/index.md,为新页面添加索引条目(含一句话摘要)
- 在 wiki/log.md 记录本次摄入操作:日期、源文件、影响的
  wiki 页面列表

## Query 规则
- 先读取 wiki/index.md 定位相关页面
- 综合多个 wiki 页面回答问题,标注信息来源
- 如果综合答案构成新知识,写入 wiki/ 新页面并更新 wiki/log.md;研究报告等产出物写入 outputs/
- 回答中引用的数据必须标注 wiki 页面路径和原始来源

## Lint 规则
- 检查 wiki 页面间是否存在矛盾观点(如不同研报对同一公司
  的相反评级)
- 标记超过 90 天未更新的页面为待审查
- 发现 raw/ 中有文档未被摄入时,输出提醒
- 检查孤立页面(无任何其他页面引用的条目)
- 输出格式:按严重程度分为"矛盾""过期""未摄入""孤立"
  四类,每类列出具体页面

用户操作

团队收到一份新的新能源行业研报后,研究员将文件放入 raw/reports/new-energy/ 目录,然后执行摄入:

▶ Claude Code
/ingest-report 请摄入 raw/reports/new-energy/2026Q1-solar-outlook.pdf,更新相关的行业页和公司页

摄入完成后,智能体自动更新了 wiki/industries/solar-energy.md 和三个公司页面。研究员在准备周报时查询知识库:

▶ Claude Code
/query-wiki 对比隆基绿能和通威股份 2025-2026 年的产能扩张策略,标注信息来源

每月月初,团队运行一次审校检查:

▶ Claude Code
/lint-wiki 运行知识库健康检查,重点关注矛盾观点和过期内容

智能体扫描全部 wiki 页面后,报告发现两份研报对光伏组件价格走势给出了相反判断,并列出 12 个超过 90 天未更新的公司页面。研究员根据报告决定哪些页面需要补充新资料。