docs(architecture): add crates/memory to architecture spec

lingcoder · lingcoder · commit ece44c734ff4 · 2026-04-15T00:10:34.000+08:00
- Add memory crate to Layer 2 table, ASCII diagram, CC mapping
- Add section 6.15 with full module/type/feature documentation
- Update session section to reflect memory extraction
- Renumber cli (6.17), daemon (6.18), global state (6.19)
- Add MemoryRanker trait, LlmMemoryRanker (feature-gated)
- Update Cargo.toml files and lockfile for new dependencies
diff --git a/Cargo.lock b/Cargo.lock
diff --git a/crates/agent/Cargo.toml b/crates/agent/Cargo.toml
@@ -7,6 +7,10 @@ license.workspace = true
 repository.workspace = true
 description = "Multi-agent orchestration for Crab Code"
 
+[features]
+default = []
+mem-ranker = ["crab-memory/mem-ranker"]
+
 [dependencies]
 crab-common.workspace = true
 crab-core.workspace = true
diff --git a/crates/cli/Cargo.toml b/crates/cli/Cargo.toml
@@ -53,6 +53,7 @@ full = [
     "crab-api/vertex",
     "crab-process/pty",
     "crab-telemetry/otlp",
+    "crab-agent/mem-ranker",
 ]
 
 [lints]
diff --git a/crates/memory/Cargo.toml b/crates/memory/Cargo.toml
@@ -7,12 +7,20 @@ license.workspace = true
 repository.workspace = true
 description = "File-based memory system for Crab Code"
 
+[features]
+default = []
+mem-ranker = ["dep:crab-api", "dep:crab-core", "dep:tokio"]
+
 [dependencies]
 crab-common.workspace = true
 serde.workspace = true
 serde_json.workspace = true
 serde_yml.workspace = true
 dunce.workspace = true
+# optional — only for mem-ranker feature
+crab-api = { workspace = true, optional = true }
+crab-core = { workspace = true, optional = true }
+tokio = { workspace = true, optional = true }
 
 [dev-dependencies]
 tempfile.workspace = true
diff --git a/crates/memory/src/lib.rs b/crates/memory/src/lib.rs
@@ -7,6 +7,8 @@ pub mod age;
 pub mod index;
 pub mod paths;
 pub mod prompt;
+#[cfg(feature = "mem-ranker")]
+pub mod ranker;
 pub mod relevance;
 pub mod security;
 pub mod store;
@@ -15,7 +17,9 @@ pub mod types;
 
 pub use index::{IndexEntry, MemoryIndex, Truncation};
 pub use prompt::MemoryPromptBuilder;
-pub use relevance::{MemorySelector, ScoredMemory};
+#[cfg(feature = "mem-ranker")]
+pub use ranker::LlmMemoryRanker;
+pub use relevance::{MemoryRanker, MemorySelector, ScoredMemory};
 pub use store::{MemoryFile, MemoryStore};
 pub use team::TeamMemoryStore;
 pub use types::{
diff --git a/crates/memory/src/ranker.rs b/crates/memory/src/ranker.rs
@@ -0,0 +1,222 @@
+//! LLM-driven memory ranking via sidequery.
+//!
+//! Gated behind the `mem-ranker` Cargo feature. Uses a lightweight LLM
+//! call to select the most relevant memories from a manifest.
+
+use std::future::Future;
+use std::pin::Pin;
+use std::sync::Arc;
+
+use crab_api::LlmBackend;
+use crab_api::types::MessageRequest;
+use crab_core::message::Message;
+use crab_core::model::ModelId;
+
+use crate::relevance::{MemoryRanker, format_manifest};
+use crate::store::MemoryFile;
+
+const SYSTEM_PROMPT: &str = "\
+You select memories relevant to the user's query.\n\
+Return JSON: {\"selected\": [\"file1.md\", \"file2.md\"]}\n\
+Be selective — only include clearly relevant memories.\n\
+If nothing matches, return {\"selected\": []}.\
+";
+
+/// LLM-driven memory ranker using a sidequery to a fast model.
+pub struct LlmMemoryRanker {
+    backend: Arc<LlmBackend>,
+    model: ModelId,
+}
+
+impl LlmMemoryRanker {
+    /// Create a ranker using the given backend and model.
+    pub fn new(backend: Arc<LlmBackend>, model: ModelId) -> Self {
+        Self { backend, model }
+    }
+}
+
+impl MemoryRanker for LlmMemoryRanker {
+    fn rank(
+        &self,
+        query: &str,
+        manifest: &str,
+        max_count: usize,
+    ) -> Pin<Box<dyn Future<Output = crab_common::Result<Vec<String>>> + Send + '_>> {
+        let query = query.to_string();
+        let manifest = manifest.to_string();
+        Box::pin(async move {
+            let user_msg = format!(
+                "Query: {query}\n\nAvailable memories (select up to {max_count}):\n{manifest}"
+            );
+
+            let req = MessageRequest {
+                model: self.model.clone(),
+                messages: std::borrow::Cow::Owned(vec![Message::user(&user_msg)]),
+                system: Some(SYSTEM_PROMPT.to_string()),
+                max_tokens: 256,
+                tools: vec![],
+                temperature: Some(0.0),
+                cache_breakpoints: vec![],
+                budget_tokens: None,
+                response_format: None,
+                tool_choice: None,
+            };
+
+            let response = self.backend.send_message(req).await.map_err(|e| {
+                crab_common::Error::Other(format!("memory ranker LLM call failed: {e}"))
+            })?;
+
+            let text = response.message.text();
+            parse_ranker_response(&text, &manifest)
+        })
+    }
+}
+
+/// Parse the JSON response from the ranker and filter to valid filenames.
+///
+/// Accepts: `{"selected": ["file1.md", "file2.md"]}` or just the array.
+/// Filters out any filenames not present in the manifest.
+fn parse_ranker_response(response_text: &str, manifest: &str) -> crab_common::Result<Vec<String>> {
+    // Try to extract JSON from the response (may be wrapped in markdown code blocks)
+    let json_text = extract_json(response_text);
+
+    // Try parsing as {"selected": [...]}
+    if let Ok(obj) = serde_json::from_str::<serde_json::Value>(&json_text)
+        && let Some(arr) = obj.get("selected").and_then(|v| v.as_array())
+    {
+        let filenames: Vec<String> = arr
+            .iter()
+            .filter_map(|v| v.as_str().map(String::from))
+            .collect();
+        return Ok(filter_valid_filenames(&filenames, manifest));
+    }
+
+    // Try parsing as a plain array
+    if let Ok(arr) = serde_json::from_str::<Vec<String>>(&json_text) {
+        return Ok(filter_valid_filenames(&arr, manifest));
+    }
+
+    // Couldn't parse — return empty (graceful degradation, no error)
+    Ok(Vec::new())
+}
+
+/// Extract JSON from text that may be wrapped in markdown code fences.
+fn extract_json(text: &str) -> String {
+    let text = text.trim();
+    // Strip ```json ... ``` wrapper
+    if let Some(start) = text.find('{')
+        && let Some(end) = text.rfind('}')
+    {
+        return text[start..=end].to_string();
+    }
+    if let Some(start) = text.find('[')
+        && let Some(end) = text.rfind(']')
+    {
+        return text[start..=end].to_string();
+    }
+    text.to_string()
+}
+
+/// Keep only filenames that appear in the manifest text.
+fn filter_valid_filenames(filenames: &[String], manifest: &str) -> Vec<String> {
+    filenames
+        .iter()
+        .filter(|f| manifest.contains(f.as_str()))
+        .cloned()
+        .collect()
+}
+
+/// Select memories using LLM ranking, falling back to keyword scoring on error.
+pub async fn select_with_ranker(
+    ranker: &LlmMemoryRanker,
+    memories: &[MemoryFile],
+    query: &str,
+    max_count: usize,
+) -> Vec<MemoryFile> {
+    let manifest = format_manifest(memories);
+
+    match ranker.rank(query, &manifest, max_count).await {
+        Ok(selected_filenames) if !selected_filenames.is_empty() => {
+            // Return memories matching selected filenames, preserving ranker order
+            selected_filenames
+                .iter()
+                .filter_map(|name| memories.iter().find(|m| m.filename == *name))
+                .cloned()
+                .collect()
+        }
+        _ => {
+            // Fallback to keyword scoring
+            let selector = crate::relevance::MemorySelector {
+                max_memories: max_count,
+                ..Default::default()
+            };
+            selector
+                .select_by_keywords(memories, query)
+                .into_iter()
+                .map(|s| s.file)
+                .collect()
+        }
+    }
+}
+
+// ── Tests ─────────────────────────────────────────────────────────────
+
+#[cfg(test)]
+mod tests {
+    use super::*;
+
+    const SAMPLE_MANIFEST: &str = "\
+user_role.md — Senior Rust developer [user]\n\
+feedback_style.md — Prefers terse responses [feedback]\n\
+project_auth.md — Working on auth rewrite [project]\n\
+";
+
+    #[test]
+    fn parse_valid_json_object() {
+        let response = r#"{"selected": ["user_role.md", "feedback_style.md"]}"#;
+        let result = parse_ranker_response(response, SAMPLE_MANIFEST).unwrap();
+        assert_eq!(result, vec!["user_role.md", "feedback_style.md"]);
+    }
+
+    #[test]
+    fn parse_json_in_code_fence() {
+        let response = "```json\n{\"selected\": [\"user_role.md\"]}\n```";
+        let result = parse_ranker_response(response, SAMPLE_MANIFEST).unwrap();
+        assert_eq!(result, vec!["user_role.md"]);
+    }
+
+    #[test]
+    fn parse_plain_array() {
+        let response = r#"["user_role.md", "project_auth.md"]"#;
+        let result = parse_ranker_response(response, SAMPLE_MANIFEST).unwrap();
+        assert_eq!(result, vec!["user_role.md", "project_auth.md"]);
+    }
+
+    #[test]
+    fn parse_empty_selected() {
+        let response = r#"{"selected": []}"#;
+        let result = parse_ranker_response(response, SAMPLE_MANIFEST).unwrap();
+        assert!(result.is_empty());
+    }
+
+    #[test]
+    fn parse_invalid_json_returns_empty() {
+        let response = "I don't know what to select";
+        let result = parse_ranker_response(response, SAMPLE_MANIFEST).unwrap();
+        assert!(result.is_empty());
+    }
+
+    #[test]
+    fn filter_hallucinated_filenames() {
+        let response = r#"{"selected": ["user_role.md", "nonexistent.md", "fake.md"]}"#;
+        let result = parse_ranker_response(response, SAMPLE_MANIFEST).unwrap();
+        assert_eq!(result, vec!["user_role.md"]);
+    }
+
+    #[test]
+    fn extract_json_from_text() {
+        assert_eq!(extract_json("  {\"a\": 1}  "), "{\"a\": 1}");
+        assert_eq!(extract_json("```json\n[1,2]\n```"), "[1,2]");
+        assert_eq!(extract_json("plain text"), "plain text");
+    }
+}
diff --git a/crates/memory/src/relevance.rs b/crates/memory/src/relevance.rs
@@ -140,6 +140,44 @@ impl MemorySelector {
     }
 }
 
+// ─── MemoryRanker trait ─────────────────────────────────────────
+
+use std::future::Future;
+use std::pin::Pin;
+
+/// Interface for LLM-driven memory selection.
+///
+/// Implementors rank memory files against a query and return the most
+/// relevant filenames. The default [`MemorySelector::select_by_keywords`]
+/// is the zero-cost local fallback.
+pub trait MemoryRanker: Send + Sync {
+    /// Select up to `max_count` relevant memory filenames from `manifest`.
+    ///
+    /// Returns a list of filenames that appear in the manifest.
+    fn rank(
+        &self,
+        query: &str,
+        manifest: &str,
+        max_count: usize,
+    ) -> Pin<Box<dyn Future<Output = crab_common::Result<Vec<String>>> + Send + '_>>;
+}
+
+/// Format memory files as a text manifest for LLM-based selection.
+///
+/// Each line: `filename — description [type]`
+pub fn format_manifest(memories: &[MemoryFile]) -> String {
+    use std::fmt::Write;
+    let mut out = String::new();
+    for mem in memories {
+        let _ = writeln!(
+            out,
+            "{} — {} [{}]",
+            mem.filename, mem.metadata.description, mem.metadata.memory_type
+        );
+    }
+    out
+}
+
 // ─── Tests ──────────────────────────────────────────────────────
 
 #[cfg(test)]
@@ -253,6 +291,17 @@ mod tests {
         assert!(picked.is_empty());
     }
 
+    #[test]
+    fn format_manifest_output() {
+        let memories = vec![
+            make_file("role", "Senior Rust dev", "body", MemoryType::User),
+            make_file("style", "Terse responses", "body", MemoryType::Feedback),
+        ];
+        let manifest = format_manifest(&memories);
+        assert!(manifest.contains("role.md — Senior Rust dev [user]"));
+        assert!(manifest.contains("style.md — Terse responses [feedback]"));
+    }
+
     #[test]
     fn select_sorts_by_score_descending() {
         let feedback = make_file("fb", "d", "b", MemoryType::Feedback);
diff --git a/docs/architecture.md b/docs/architecture.md

Original file line number	Diff line number	Diff line change
`@@ -53,6 +53,7 @@ full = [`
`53`	`53`	`"crab-api/vertex",`
`54`	`54`	`"crab-process/pty",`
`55`	`55`	`"crab-telemetry/otlp",`
	`56`	`+ "crab-agent/mem-ranker",`
`56`	`57`	`]`
`57`	`58`
`58`	`59`	`[lints]`