context compaction rag / kb 内置一个向量数据库和kb管理能力吧,kb_search,管理界面简单点,cpu做embedding就够 template --- 时间观察app ---