Knowledge Audit

Molly_AI 日志库体检与可视化方案

2026-01-31 · 个人 · LifeOS · 00-LifeOS/DailyRecord/2022-2024-Molly_AI

对 3 条样本(2023-12-25、2024-08-30、2024-08-31)的结构问题、价值提取与可视化方案

当前文件量不大,但 frontmatter 损坏与格式混杂(Logseq / Notion 导出痕迹)会显著抬高后续检索与统计成本。本报告给出可执行的最小改造路径,并展示可视化落地方式。

AuditKnowledge HygieneVisualizationTime TrackingEvergreen Notes

结论:这组记录的最大瓶颈不是内容,而是结构不可被机器稳定解析(frontmatter 损坏 + 格式混杂)。先做最小结构化清洁,就能把“时间/主题/来源”做成可视化仪表盘,并把 3 条记录里的关键经验沉淀成可复用资产。
Notes
3
Date Span
2023-12-25 → 2024-08-31
DONE (total)
11
Clock (min, structured)
45.1
Wiki Links (unique)
28
Wiki Links (total)
45
URLs (total)
28
Top Topic
logseq (9)

要先修的结构问题

这些问题会直接阻断 Dataview、统计脚本、以及后续自动报告。

YAML 头部损坏
3/3 文件存在 frontmatter 分隔符重复/粘连,Obsidian/Dataview 很难稳定解析。
格式混杂
同时出现 Logseq 属性(DONE/LOGBOOK/renderer)与 Notion 导出痕迹(URL 编码文件名、元数据行)。
链接与资源可移植性弱
存在 file://、远程图片、以及至少 1 个未随文件夹存在的本地附件引用。
统计口径不一致
只有 2024-08-30 有结构化 CLOCK;其余为叙述或零散时间点,难以做长期趋势。

已经存在的价值信息(可沉淀)

把“今天学到什么”转成“以后能直接复用什么”。

Logseq 时间记录
TODO→DOING 自动计时;LOGBOOK/CLOCK 可用于统计。
Logseq 多端同步(Git)
参考 Logseq-Git-Sync-101;用 hooks 做 pull/push;注意 macOS 隐藏文件与 chmod。
Mermaid 渲染
需要插件与特定 renderer;部分语法(如 click/link)在图片渲染下不兼容。
Expo 语音转文字
遇到 @expo/config-plugins 版本链问题时,可用 package.json overrides 解决。
Watchman 故障
遇到运行异常可尝试 watchman shutdown-server(记录中验证可用)。

可视化怎么做(先小后大)

先做 2 张最有杠杆的图
  • 时间:每天 Clock 分钟数(趋势 + 断点)。
  • 主题:Wiki link Top(你最近在学什么)。
再扩展的 3 个方向
  • 来源:外部链接域名分布(输入源质量)。
  • 产出:从 DailyRecord → Evergreen 的转化率。
  • 项目:按 Project/Area 聚合(PARA)。
STRUCTURE Capture DailyRecord 原始记录 Normalize 统一 YAML / 命名 / 链接 Distill 萃取可复用资产 Visualize & Review Dashboard / 周回顾 / 报告 Outcome:记录可检索、可统计、可复盘;同一套数据同时服务“当下执行”和“长期积累”。
建议的信息流:Capture → Normalize → Distill → Visualize & Review。
DATA SNAPSHOT LinesDONEClock(min)WikiURLs 2023-12-25 · Expo30400.00142024-08-30 · Logseq2311045.140112024-08-31 · Plan2310.053
样本数据快照(每个指标按列归一化):Lines / DONE / Clock / Wiki / URLs。
Top Topics / Top Sources(自动统计)

Top Wiki Topics

logseq
9
logseq/多端同步
4
Time
2
notion
2
markdown
2
PM
2
知识点
2
mermaid
2

Top URL Hosts

github.com
8
docs.expo.dev
3
www.youtube.com
2
stackoverflow.com
2
blog.expo.dev
2
mp.weixin.qq.com
2
www.notion.so
1
blog.logrocket.com
1

优化路线图(可执行)

  1. 定义这份目录的用途:Molly_AI 是“AI 学习/工具实验”还是“开发项目日志”?写一句话放在目录索引里。
  2. 修复 frontmatter:保证 --- 正确闭合;把 goals_assoc/tags/summary 变成可解析字段。
  3. 统一日期与命名:建议 YYYY-MM-DD;避免混用下划线与长标题(长标题可放在一级标题)。
  4. 把“价值点”迁移成资产:把本报告的 5 条价值卡片各自变成一条可复用笔记(checklist / snippet / FAQ)。
  5. 上可视化最小闭环:先做 2 个图:时间(Clock)趋势 + 主题(Wiki link)Top;每周回顾时更新一次。

Best Minds 视角(模拟)

以下为基于公开思想的总结性转述(paraphrase)。

Tiago Forte · Building a Second Brain
Thesis: 先把“可复用”当作记录的默认目标:Capture→Organize→Distill→Express;用 PARA 让条目自动落到项目/领域。
Limit: 如果不做定期回顾,系统会变成更大的“收集箱”。
Andy Matuschak · Evergreen Notes
Thesis: 把高价值内容拆成可链接的原子笔记;让未来的你能用“问题→答案”的路径快速命中。
Limit: 需要投入编辑成本;对纯流水账收益不高。
Sönke Ahrens · Smart Notes
Thesis: 把“过程记录”与“永久笔记”分开:前者保留上下文,后者只留下可论证、可复用的结论。
Limit: 如果没有明确写作/输出目标,永久笔记会缺乏牵引。
Edward Tufte · Information Design
Thesis: 把可视化当作“压缩信息密度”的方式:少装饰、强对比、直接标注数值;让图表成为决策工具。
Limit: 数据口径不统一时,图会制造虚假的确定性。

可选方案

Option 适合 收益 代价 关键风险 第一步
A. 最小清洁 先把可视化跑起来 Dataview/统计立刻可用 需要一次性整理格式 后续又引入混合格式 修复 3/3 frontmatter + 统一命名
B. 轻量系统 要稳定复盘与产出 形成周回顾与主题地图 需要模板与每周 30 分钟维护 没有“输出牵引”导致回顾中断 新增 MOC + 周回顾模板
C. 自动报告 内容规模将明显增长 月/季报告自动生成,支持分享 需要脚本/字段规范 字段不稳定导致数据漂移 定义 schema(date/topics/time)并回填

Evidence & Confidence

Claim Evidence Confidence
目录内仅 3 个 Markdown 文件 文件扫描结果 High
frontmatter 分隔符存在损坏,影响自动解析 文件头部 --- 重复/粘连 High
可计算的结构化 Clock 仅出现于 2024-08-30 LOGBOOK/CLOCK 解析 High
存在至少 1 个本地附件引用未随目录出现 相对路径图片引用无法在目录中找到 Medium

Sources(本地文件)

Closing Summary

One next action:先把这 3 个文件的 frontmatter 修好并统一日期命名,然后用同一套字段跑出第一版“时间 + 主题”仪表盘(哪怕只有 3 条数据)。从这一刻开始,你的 DailyRecord 就能累积成可复用资产。
把记录变成可复用的资产。
— Closing note