Skip to content

南京大学仙林图书馆《菜根日记》数字化存档,《菜根日记》是南大一群喜欢泡图书馆的馆u自发在图书馆二楼大厅处留下的心声记录。为防止数据丢失,特建此仓库来维护《菜根日记》

Notifications You must be signed in to change notification settings

yama-lei/caigen-diary

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

菜根日记存档

菜根日记是南大同学线下自发的日记活动,记录了来图书馆学习的同学们的思绪:吐槽,抱怨,鼓励……流露着真实的南大人的心声。 但是菜根日记可能存在着被清空的风险(也许某一天被某一位同学不小心删除了?或者是图书馆更换电脑了),因此数字化保存有一定的必要,所以我计划维护这个仓库,作为菜根日记的数字化存档。

目前草根日记采取如下更新方式:

image-20251017223126286

内容来源

南京大学仙林校区一楼大门进去之后,有两台醒目的自助电脑,上面有同学们自发记录的日记,可以在上面进行匿名记录。

image-20251017163925613

电子存档频率

由仓库所有者yama,约1-2天存档一次

数字化存档形式

1. 原始文本文件

位于 raw/ 目录,保存的是同学们自己维护的日记源文件。

2. JSON格式

位于 data/json/ 目录,按月份和日期组织:(经过脚本处理之后的文件)

补充,在2025年10月17日前的数据在data/json下,此后的数据在backend/data/json下,后续会整理

{
  "date": "2025-06-22",
  "entries": [
    "校门口早餐车的肉包竟然味道相当凑合,是我被泥喃食堂pua太久了吗?",
    "今天预报名了 不要将梦想埋没"
  ]
}

3. sql数据库

因为本人不会数据库,也觉得一个小项目如果单独外界数据库实在是太麻烦了,就用了sqlite。在backend/data下面可以找到

4. 校内访问网址

源代码放在仓库里面,可以自行部署,后续数据库和json文件我也会同步更新。

校内访问地址:菜根日记存档 校外访问地址:菜根日记存档 如果想要把菜根日记集成在其他的应用中(或者只需要后端),可以使用这个端口:172.26.8.119:8005

文档在172.26.8.119:8005/docs中,没有鉴权,应该不会有人滥用,因为应该没多少人关注这个


讲个有趣的问题,你知道最近一个月有多少人在“大雪深埋”吗?

image-20251017164122054

你知道游客来图书馆参观的感悟是什么吗?

image

开发架构

前端vue+tailwindcss

后端python

工作流n8n

数据库sqlite

情绪识别使用的是aliyun的模型(效果很一般,但是看在50w次免费调用的份上,我原谅它了)

Challenges

  • 重复项。
  • Need hunam in the loop。

TODOS

  • 解决重复识别/错误识别问题(只能做一些工程上的调优:prompt,缩短context以减少错误,etc)
  • 减少hunam in the loop(目前还是需要我手动复制粘贴。。text->update目前已经是全自动了,现在我可以完全不需要登录服务器进行任何操作)
  • 更加详尽的内容分析
  • 合并其他的校园论坛信息(表白墙偶尔也能贡献几条不错的内容;以及我还想把已经成为历史的LilyBBS单独设一个板块(https://github.com/LadderOperator/LilyBBS_DATA?tab=readme-ov-file)

TimeLine

  • 2025-10 Setup Caigen-diary.
  • 2025-11 Fix some bugs and setup an simple webhook to upload newest entries directly from the two compiuters in the libary.y

About

南京大学仙林图书馆《菜根日记》数字化存档,《菜根日记》是南大一群喜欢泡图书馆的馆u自发在图书馆二楼大厅处留下的心声记录。为防止数据丢失,特建此仓库来维护《菜根日记》

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published