Report

从小红书/公众号/榜单中提取并沉淀“Agent Skills”的可执行方案

在无法直接核验跳转链接内容的前提下,给出可落地的采集-抽取-验证-发布流水线与落库模板

整理多来源 Agent Skills,抽取结构化并入库

2026-02-02 20:39
AgentSkillsskills库内容提取ObsidianRemotion视频生成

TL;DR

  • 我这里将“skills”定义为:可被 AI Agent/自动化流程复用的任务模块(提示词模板、脚本、工具封装);不是“个人能力清单”。
  • 你提供的线索覆盖:Agent Skills 聚合/热榜(提到 skills.sh、Vercel 24h 热度榜)、Research Skills 开源(提到“82 个 research skills”)、视频相关 skills(含 Remotion 与一篇公众号“视频 skills”)。原文链接目前无法在线核验。
  • 不建议在未拿到正文前“凭印象列技能名”;更稳妥是先把原文采集到本地,再让 LLM 做结构化抽取并保留可回溯的 source 片段。
  • 本报告给出:统一的 skill schema、抽取提示词要点、Remotion 类视频 skill 的 PoC 路径,以及如何把这些条目沉淀到 Obsidian/GitHub 并可检索发布。

Key Insights

  • 这些来源的“skills”很可能混合了三种形态:可执行工具(如视频渲染/自动化脚本)、方法论/检查清单(如 UI 质量提升)、资源聚合/榜单(热度排行/目录)。必须在 schema 中区分 type,否则难以复用与测试。
  • “装了这个 skills 什么都有了”的表述通常意味着“安装器/技能包/注册表”思路:需要明确运行时、依赖、版本、权限(读写文件/调用网络/调用第三方 API)。
  • 你希望把 UI 提升技巧也纳入 skills,说明 skills 库不应只收“代码工具”,还应支持“交付物模板”(如 UI 评审清单、Vibe Coding 提示词、组件规范)。
  • 若要复刻“Vercel 24h 热度榜”效果,技能条目除内容外还要有可度量的元数据:更新频率、使用量代理指标(stars/下载/引用/站点访问)、最后验证时间与可运行状态。

Playbook

  • 明确目标与边界:skills 的消费端是谁(Cursor/Claude/自建 Agent/Obsidian),以及每条 skill 的最小验收标准(能跑通/能复述/能产出可交付物)。
  • 采集原文并可回溯:对每个 xhslink/公众号页做“标题+正文+关键图/表”复制与截图,记录 source_url、采集时间、是否需要登录;注意遵守平台条款与版权边界(尽量抽取结构与要点,不整段搬运)。
  • 结构化抽取与去重:用 LLM 将正文转成统一 YAML/JSON;要求输出包含:name、type、trigger、inputs、steps、outputs、deps、quality_checks、source(含原文片段/定位),并做同义合并(例如“视频生成/短视频/Remotion 渲染”)。
  • 验证、发布与索引:对可执行类 skill 做 PoC(最少一次成功运行日志);对方法论类 skill 做示例输入输出;在 GitHub 建目录与自动生成索引(README/站点搜索),用 GitHub Actions 做 lint、去重、构建与定时更新。

id: <slug>
name: <技能名称>
type: executable | playbook | directory
category: agent | research | video | ui | growth
trigger: <何时使用/用户意图>
inputs:
  - <输入1>
tools:
  - <工具/依赖,例如 node, python, remotion>
steps:
  - <步骤1>
outputs:
  - <输出物,例如 mp4_path / report_md>
quality_checks:
  - <如何验收,例如“渲染成功且时长正确”>
source:
  url: <原文链接>
  note: <无法在线核验/已人工复制/需登录>

Diagrams

Decision Map ↑ Control / Consistency Speed / Convenience → 1 方案 A(本报告采用):ski… 2 方案 B(另一种定义分支):s… C 先做“目录型 skills(d… D 做“安装器/技能包”路线(接近…
Options · 速度 vs 可控性 的决策图(基于 Options 文本自动定位)
Execution Steps 1 明确目标与边界 2 采集原文并可回溯 3 结构化抽取与去重 4 验证、发布与索引 5 <输入1> 6 <工具/依赖,例如… 7 <步骤1> 8 <输出物,例如 m…
Playbook · 执行步骤时间线(基于 Playbook 文本自动提取)

Options

  • 方案 A(本报告采用):skills=Agent 可复用模块;用 YAML/JSON 定义接口,代码/提示词实现分离,面向工具调用(适配 LangChain Tools / OpenAI/Anthropic 工具调用等)。
  • 方案 B(另一种定义分支):skills=“个人/团队技能与方法论清单”;以 Obsidian 笔记为主(模板+示例+清单),不追求可执行,只追求可复用表达与检索。
  • 方案 C:先做“目录型 skills(directory)”;不抽正文,只做带标签的链接索引与摘要,等需要时再深挖抽取,成本最低但复用度较弱。
  • 方案 D:做“安装器/技能包”路线(接近你提到的“装了这个 skills 什么都有了”);需要额外解决:依赖管理、权限、跨平台、版本与安全审计,适合后期规模化。

Expert Views

  • 开源维护者(paraphrase):更看重贡献门槛与一致性;建议用 frontmatter/YAML schema + linter,把“如何新增一个 skill、如何验收、如何标注来源/许可”写成 CONTRIBUTING。
  • AI Agent 工程师(paraphrase):关注可控与可测试;可执行 skill 要有确定的输入输出、幂等性、失败重试/超时策略,并把外部 API key 通过环境变量注入,避免写死。
  • 产品/增长运营(paraphrase):热榜与案例(“三个月做到 700”)的价值在“分发路径可复用”;建议每条热门 skill 配 1 个 Demo、1 个 30 秒动图/短视频、1 个一键运行方式,提升传播与转化。
  • 合规/版权顾问(paraphrase):平台内容二次分发风险高;更稳妥是“抽取结构化要点 + 链接回原文 + 自己补充可运行实现”,避免直接搬运原文完整段落与图片。

Evidence & Confidence

  • “来源包含 xhslink 多条链接 + 公众号 1 条链接 + 与 skills/sh/热榜相关描述”置信度:high(直接来自你在 GitHub issue 的记录)。
  • “Remotion 可用于代码生成视频,适合作为视频类 skill 的实现底座”置信度:high(Remotion 为公开项目与常见用法)。
  • “xhslink/公众号正文内容与具体 skill 列表无法在当前对话中直接核验,因此不能给出精确 Top10/82 条明细”置信度:high(当前未提供正文,且跳转内容需在线访问/登录)。
  • “Vercel 存在 24 小时 skills 热度榜/skills.sh 是聚合站或工具”置信度:low(仅来自转述且未提供可核验的官方链接;需你补充页面截图或可访问 URL)。

Next Steps

  • 你把每个链接的正文(或复制文本/截图)贴到同一处(一个文档或 issue comment);我即可按 schema 批量抽取成结构化条目并输出可直接入库的 YAML/MD。
  • 选定落库形态:推荐“Obsidian note + YAML frontmatter + GitHub 版本管理”,并用 Dataview/自建脚本生成索引与标签页。
  • 先从 1 条视频类 skill 打样(Remotion):明确输入(脚本/分镜/素材)、输出(mp4)、依赖(node/remotion)、验收(渲染成功/时长),跑通后再扩展到“82 research skills/Top10 agent skills/UI 提升”。
  • 补齐发布与增长闭环:为每条 skill 生成 1 个最小 Demo、1 个一键运行命令、1 个失败排查段落;之后再考虑热榜(按 stars/更新频率/使用量代理指标)。

Details (Optional)

Details

TL;DR

  • 我这里将“skills”定义为:可被 AI Agent/自动化流程复用的任务模块(提示词模板、脚本、工具封装);不是“个人能力清单”。
  • 你提供的线索覆盖:Agent Skills 聚合/热榜(提到 skills.sh、Vercel 24h 热度榜)、Research Skills 开源(提到“82 个 research skills”)、视频相关 skills(含 Remotion 与一篇公众号“视频 skills”)。原文链接目前无法在线核验。
  • 不建议在未拿到正文前“凭印象列技能名”;更稳妥是先把原文采集到本地,再让 LLM 做结构化抽取并保留可回溯的 source 片段。
  • 本报告给出:统一的 skill schema、抽取提示词要点、Remotion 类视频 skill 的 PoC 路径,以及如何把这些条目沉淀到 Obsidian/GitHub 并可检索发布。

Key Insights

  • 这些来源的“skills”很可能混合了三种形态:可执行工具(如视频渲染/自动化脚本)、方法论/检查清单(如 UI 质量提升)、资源聚合/榜单(热度排行/目录)。必须在 schema 中区分 type,否则难以复用与测试。
  • “装了这个 skills 什么都有了”的表述通常意味着“安装器/技能包/注册表”思路:需要明确运行时、依赖、版本、权限(读写文件/调用网络/调用第三方 API)。
  • 你希望把 UI 提升技巧也纳入 skills,说明 skills 库不应只收“代码工具”,还应支持“交付物模板”(如 UI 评审清单、Vibe Coding 提示词、组件规范)。
  • 若要复刻“Vercel 24h 热度榜”效果,技能条目除内容外还要有可度量的元数据:更新频率、使用量代理指标(stars/下载/引用/站点访问)、最后验证时间与可运行状态。

Playbook

  • 明确目标与边界:skills 的消费端是谁(Cursor/Claude/自建 Agent/Obsidian),以及每条 skill 的最小验收标准(能跑通/能复述/能产出可交付物)。
  • 采集原文并可回溯:对每个 xhslink/公众号页做“标题+正文+关键图/表”复制与截图,记录 source_url、采集时间、是否需要登录;注意遵守平台条款与版权边界(尽量抽取结构与要点,不整段搬运)。
  • 结构化抽取与去重:用 LLM 将正文转成统一 YAML/JSON;要求输出包含:name、type、trigger、inputs、steps、outputs、deps、quality_checks、source(含原文片段/定位),并做同义合并(例如“视频生成/短视频/Remotion 渲染”)。
  • 验证、发布与索引:对可执行类 skill 做 PoC(最少一次成功运行日志);对方法论类 skill 做示例输入输出;在 GitHub 建目录与自动生成索引(README/站点搜索),用 GitHub Actions 做 lint、去重、构建与定时更新。

id: <slug>
name: <技能名称>
type: executable | playbook | directory
category: agent | research | video | ui | growth
trigger: <何时使用/用户意图>
inputs:
  - <输入1>
tools:
  - <工具/依赖,例如 node, python, remotion>
steps:
  - <步骤1>
outputs:
  - <输出物,例如 mp4_path / report_md>
quality_checks:
  - <如何验收,例如“渲染成功且时长正确”>
source:
  url: <原文链接>
  note: <无法在线核验/已人工复制/需登录>

Expert Views

  • 开源维护者(paraphrase):更看重贡献门槛与一致性;建议用 frontmatter/YAML schema + linter,把“如何新增一个 skill、如何验收、如何标注来源/许可”写成 CONTRIBUTING。
  • AI Agent 工程师(paraphrase):关注可控与可测试;可执行 skill 要有确定的输入输出、幂等性、失败重试/超时策略,并把外部 API key 通过环境变量注入,避免写死。
  • 产品/增长运营(paraphrase):热榜与案例(“三个月做到 700”)的价值在“分发路径可复用”;建议每条热门 skill 配 1 个 Demo、1 个 30 秒动图/短视频、1 个一键运行方式,提升传播与转化。
  • 合规/版权顾问(paraphrase):平台内容二次分发风险高;更稳妥是“抽取结构化要点 + 链接回原文 + 自己补充可运行实现”,避免直接搬运原文完整段落与图片。

Options

  • 方案 A(本报告采用):skills=Agent 可复用模块;用 YAML/JSON 定义接口,代码/提示词实现分离,面向工具调用(适配 LangChain Tools / OpenAI/Anthropic 工具调用等)。
  • 方案 B(另一种定义分支):skills=“个人/团队技能与方法论清单”;以 Obsidian 笔记为主(模板+示例+清单),不追求可执行,只追求可复用表达与检索。
  • 方案 C:先做“目录型 skills(directory)”;不抽正文,只做带标签的链接索引与摘要,等需要时再深挖抽取,成本最低但复用度较弱。
  • 方案 D:做“安装器/技能包”路线(接近你提到的“装了这个 skills 什么都有了”);需要额外解决:依赖管理、权限、跨平台、版本与安全审计,适合后期规模化。

Evidence & Confidence

  • “来源包含 xhslink 多条链接 + 公众号 1 条链接 + 与 skills/sh/热榜相关描述”置信度:high(直接来自你在 GitHub issue 的记录)。
  • “Remotion 可用于代码生成视频,适合作为视频类 skill 的实现底座”置信度:high(Remotion 为公开项目与常见用法)。
  • “xhslink/公众号正文内容与具体 skill 列表无法在当前对话中直接核验,因此不能给出精确 Top10/82 条明细”置信度:high(当前未提供正文,且跳转内容需在线访问/登录)。
  • “Vercel 存在 24 小时 skills 热度榜/skills.sh 是聚合站或工具”置信度:low(仅来自转述且未提供可核验的官方链接;需你补充页面截图或可访问 URL)。

Next Steps

  • 你把每个链接的正文(或复制文本/截图)贴到同一处(一个文档或 issue comment);我即可按 schema 批量抽取成结构化条目并输出可直接入库的 YAML/MD。
  • 选定落库形态:推荐“Obsidian note + YAML frontmatter + GitHub 版本管理”,并用 Dataview/自建脚本生成索引与标签页。
  • 先从 1 条视频类 skill 打样(Remotion):明确输入(脚本/分镜/素材)、输出(mp4)、依赖(node/remotion)、验收(渲染成功/时长),跑通后再扩展到“82 research skills/Top10 agent skills/UI 提升”。
  • 补齐发布与增长闭环:为每条 skill 生成 1 个最小 Demo、1 个一键运行命令、1 个失败排查段落;之后再考虑热榜(按 stars/更新频率/使用量代理指标)。

Sources

Sources

Closing Summary

  • 结论:整理多来源 Agent Skills,抽取结构化并入库
  • 下一步:请先确认 skills 要运行在什么环境(Cursor/Claude/自建 Agent/仅 Obsidian),以及最终想要的条目格式(YAML/JSON/Markdown)。

One next action

请先确认 skills 要运行在什么环境(Cursor/Claude/自建 Agent/仅 Obsidian),以及最终想要的条目格式(YAML/JSON/Markdown)。