Knowledge Audit
Molly_AI 日志库体检与可视化方案
2026-01-31 · 个人 · LifeOS · 00-LifeOS/DailyRecord/2022-2024-Molly_AI
对 3 条样本(2023-12-25、2024-08-30、2024-08-31)的结构问题、价值提取与可视化方案
当前文件量不大,但 frontmatter 损坏与格式混杂(Logseq / Notion 导出痕迹)会显著抬高后续检索与统计成本。本报告给出可执行的最小改造路径,并展示可视化落地方式。
AuditKnowledge HygieneVisualizationTime TrackingEvergreen Notes
结论:这组记录的最大瓶颈不是内容,而是结构不可被机器稳定解析(frontmatter 损坏 + 格式混杂)。先做最小结构化清洁,就能把“时间/主题/来源”做成可视化仪表盘,并把 3 条记录里的关键经验沉淀成可复用资产。
Notes
3
Date Span
2023-12-25 → 2024-08-31
DONE (total)
11
Clock (min, structured)
45.1
Wiki Links (unique)
28
Wiki Links (total)
45
URLs (total)
28
Top Topic
logseq (9)
要先修的结构问题
这些问题会直接阻断 Dataview、统计脚本、以及后续自动报告。
YAML 头部损坏
3/3 文件存在 frontmatter 分隔符重复/粘连,Obsidian/Dataview 很难稳定解析。
格式混杂
同时出现 Logseq 属性(DONE/LOGBOOK/renderer)与 Notion 导出痕迹(URL 编码文件名、元数据行)。
链接与资源可移植性弱
存在 file://、远程图片、以及至少 1 个未随文件夹存在的本地附件引用。
统计口径不一致
只有 2024-08-30 有结构化 CLOCK;其余为叙述或零散时间点,难以做长期趋势。
已经存在的价值信息(可沉淀)
把“今天学到什么”转成“以后能直接复用什么”。
Logseq 时间记录
TODO→DOING 自动计时;LOGBOOK/CLOCK 可用于统计。
Logseq 多端同步(Git)
参考 Logseq-Git-Sync-101;用 hooks 做 pull/push;注意 macOS 隐藏文件与 chmod。
Mermaid 渲染
需要插件与特定 renderer;部分语法(如 click/link)在图片渲染下不兼容。
Expo 语音转文字
遇到 @expo/config-plugins 版本链问题时,可用 package.json overrides 解决。
Watchman 故障
遇到运行异常可尝试 watchman shutdown-server(记录中验证可用)。
可视化怎么做(先小后大)
先做 2 张最有杠杆的图
- 时间:每天 Clock 分钟数(趋势 + 断点)。
- 主题:Wiki link Top(你最近在学什么)。
再扩展的 3 个方向
- 来源:外部链接域名分布(输入源质量)。
- 产出:从 DailyRecord → Evergreen 的转化率。
- 项目:按 Project/Area 聚合(PARA)。
Top Topics / Top Sources(自动统计)
Top Wiki Topics
Top URL Hosts
优化路线图(可执行)
- 定义这份目录的用途:Molly_AI 是“AI 学习/工具实验”还是“开发项目日志”?写一句话放在目录索引里。
- 修复 frontmatter:保证
---正确闭合;把goals_assoc/tags/summary变成可解析字段。 - 统一日期与命名:建议
YYYY-MM-DD;避免混用下划线与长标题(长标题可放在一级标题)。 - 把“价值点”迁移成资产:把本报告的 5 条价值卡片各自变成一条可复用笔记(checklist / snippet / FAQ)。
- 上可视化最小闭环:先做 2 个图:时间(Clock)趋势 + 主题(Wiki link)Top;每周回顾时更新一次。
Best Minds 视角(模拟)
以下为基于公开思想的总结性转述(paraphrase)。
Tiago Forte · Building a Second Brain
Thesis: 先把“可复用”当作记录的默认目标:Capture→Organize→Distill→Express;用 PARA 让条目自动落到项目/领域。
Limit: 如果不做定期回顾,系统会变成更大的“收集箱”。
Andy Matuschak · Evergreen Notes
Thesis: 把高价值内容拆成可链接的原子笔记;让未来的你能用“问题→答案”的路径快速命中。
Limit: 需要投入编辑成本;对纯流水账收益不高。
Sönke Ahrens · Smart Notes
Thesis: 把“过程记录”与“永久笔记”分开:前者保留上下文,后者只留下可论证、可复用的结论。
Limit: 如果没有明确写作/输出目标,永久笔记会缺乏牵引。
Edward Tufte · Information Design
Thesis: 把可视化当作“压缩信息密度”的方式:少装饰、强对比、直接标注数值;让图表成为决策工具。
Limit: 数据口径不统一时,图会制造虚假的确定性。
可选方案
| Option | 适合 | 收益 | 代价 | 关键风险 | 第一步 |
|---|---|---|---|---|---|
| A. 最小清洁 | 先把可视化跑起来 | Dataview/统计立刻可用 | 需要一次性整理格式 | 后续又引入混合格式 | 修复 3/3 frontmatter + 统一命名 |
| B. 轻量系统 | 要稳定复盘与产出 | 形成周回顾与主题地图 | 需要模板与每周 30 分钟维护 | 没有“输出牵引”导致回顾中断 | 新增 MOC + 周回顾模板 |
| C. 自动报告 | 内容规模将明显增长 | 月/季报告自动生成,支持分享 | 需要脚本/字段规范 | 字段不稳定导致数据漂移 | 定义 schema(date/topics/time)并回填 |
Evidence & Confidence
| Claim | Evidence | Confidence |
|---|---|---|
| 目录内仅 3 个 Markdown 文件 | 文件扫描结果 | High |
| frontmatter 分隔符存在损坏,影响自动解析 | 文件头部 --- 重复/粘连 |
High |
| 可计算的结构化 Clock 仅出现于 2024-08-30 | LOGBOOK/CLOCK 解析 | High |
| 存在至少 1 个本地附件引用未随目录出现 | 相对路径图片引用无法在目录中找到 | Medium |
Sources(本地文件)
00-LifeOS/DailyRecord/2022-2024-Molly_AI/20231225 尝试实现expo speech to text f1b956904b1e43b7a26b6daf9b2ab373.md00-LifeOS/DailyRecord/2022-2024-Molly_AI/2024_08_30.md00-LifeOS/DailyRecord/2022-2024-Molly_AI/2024_08_31.md
Closing Summary
One next action:先把这 3 个文件的 frontmatter 修好并统一日期命名,然后用同一套字段跑出第一版“时间 + 主题”仪表盘(哪怕只有 3 条数据)。从这一刻开始,你的 DailyRecord 就能累积成可复用资产。
把记录变成可复用的资产。
— Closing note