VoltAgent · omeraplak · Apr 1, 2026 · Apr 1, 2026 · Apr 1, 2026 · Apr 1, 2026
diff --git a/.changeset/funny-ravens-wave.md b/.changeset/funny-ravens-wave.md
@@ -0,0 +1,48 @@
+---
+"@voltagent/core": patch
+"@voltagent/server-core": patch
+---
+
+feat: persist selected assistant message metadata to memory
+
+You can enable persisted assistant message metadata at the agent level or per request.
+
+```ts
+const result = await agent.streamText("Hello", {
+  memory: {
+    userId: "user-1",
+    conversationId: "conv-1",
+    options: {
+      messageMetadataPersistence: {
+        usage: true,
+        finishReason: true,
+      },
+    },
+  },
+});
+```
+
+With this enabled, fetching messages from memory returns assistant `UIMessage.metadata`
+with fields like `usage` and `finishReason`, not just stream-time metadata.
+
+REST API requests can enable the same behavior with `options.memory.options`:
+
+```bash
+curl -X POST http://localhost:3141/agents/assistant/text \
+  -H "Content-Type: application/json" \
+  -d '{
+    "input": "Hello",
+    "options": {
+      "memory": {
+        "userId": "user-1",
+        "conversationId": "conv-1",
+        "options": {
+          "messageMetadataPersistence": {
+            "usage": true,
+            "finishReason": true
+          }
+        }
+      }
+    }
+  }'
+```
diff --git a/packages/core/src/agent/agent.spec.ts b/packages/core/src/agent/agent.spec.ts
@@ -1877,6 +1877,36 @@ Use pandas and summarize findings.`.split("\n"),
   });
 
   describe("Memory Integration", () => {
+    const persistedUsage = {
+      promptTokens: 10,
+      completionTokens: 5,
+      totalTokens: 15,
+      cachedInputTokens: 0,
+      reasoningTokens: 0,
+    };
+
+    const providerUsage = {
+      inputTokens: 10,
+      outputTokens: 5,
+      totalTokens: 15,
+    };
+
+    const createAssistantResponseMessages = (text: string): ModelMessage[] => [
+      {
+        role: "assistant",
+        content: [{ type: "text", text }],
+      },
+    ];
+
+    const getLastAssistantMessage = async (
+      memory: Memory,
+      userId: string,
+      conversationId: string,
+    ) => {
+      const messages = await memory.getMessages(userId, conversationId);
+      return [...messages].reverse().find((message) => message.role === "assistant");
+    };
+
     it("should initialize with memory", () => {
       const memory = new Memory({
         storage: new InMemoryStorageAdapter(),
@@ -1957,6 +1987,166 @@ Use pandas and summarize findings.`.split("\n"),
       // as they're handled by the MemoryManager class
     });
 
+    it("should persist usage and finish reason in assistant message metadata for generateText", async () => {
+      const memory = new Memory({
+        storage: new InMemoryStorageAdapter(),
+      });
+
+      const agent = new Agent({
+        name: "TestAgent",
+        instructions: "Test",
+        model: mockModel as any,
+        memory,
+      });
+
+      vi.mocked(ai.generateText).mockResolvedValue({
+        text: "Persisted response",
+        content: [{ type: "text", text: "Persisted response" }],
+        reasoning: [],
+        files: [],
+        sources: [],
+        toolCalls: [],
+        toolResults: [],
+        finishReason: "stop",
+        usage: providerUsage,
+        warnings: [],
+        request: {},
+        response: {
+          id: "test-response",
+          modelId: "test-model",
+          timestamp: new Date(),
+          messages: createAssistantResponseMessages("Persisted response"),
+        },
+        steps: [],
+      } as any);
+
+      await agent.generateText("Hello", {
+        memory: {
+          userId: "user-metadata",
+          conversationId: "conv-metadata",
+          options: {
+            messageMetadataPersistence: true,
+          },
+        },
+      });
+
+      const assistantMessage = await getLastAssistantMessage(
+        memory,
+        "user-metadata",
+        "conv-metadata",
+      );
+
+      expect(assistantMessage).toBeDefined();
+      expect(assistantMessage?.metadata).toEqual(
+        expect.objectContaining({
+          operationId: expect.any(String),
+          usage: persistedUsage,
+          finishReason: "stop",
+        }),
+      );
+    });
+
+    it("should persist usage and finish reason in assistant message metadata for streamText", async () => {
+      const memory = new Memory({
+        storage: new InMemoryStorageAdapter(),
+      });
+
+      const agent = new Agent({
+        name: "TestAgent",
+        instructions: "Test",
+        model: mockModel as any,
+        memory,
+      });
+
+      vi.mocked(ai.streamText).mockImplementation((args: any) => {
+        const finalResult = {
+          text: "Persisted stream response",
+          finishReason: "stop",
+          usage: providerUsage,
+          totalUsage: providerUsage,
+          warnings: [],
+          response: {
+            id: "stream-response",
+            modelId: "test-model",
+            timestamp: new Date(),
+            messages: createAssistantResponseMessages("Persisted stream response"),
+          },
+          steps: [],
+          providerMetadata: undefined,
+        };
+
+        const fullStream = (async function* () {
+          try {
+            yield {
+              type: "start" as const,
+            };
+            yield {
+              type: "text-delta" as const,
+              id: "text-1",
+              delta: "Persisted stream response",
+              text: "Persisted stream response",
+            };
+            yield {
+              type: "finish" as const,
+              finishReason: "stop",
+              totalUsage: providerUsage,
+            };
+          } finally {
+            await args.onFinish?.(finalResult);
+          }
+        })();
+
+        return {
+          text: Promise.resolve("Persisted stream response"),
+          textStream: (async function* () {
+            yield "Persisted stream response";
+          })(),
+          fullStream,
+          usage: Promise.resolve(providerUsage),
+          finishReason: Promise.resolve("stop"),
+          warnings: [],
+          toUIMessageStream: vi.fn(),
+          toUIMessageStreamResponse: vi.fn(),
+          pipeUIMessageStreamToResponse: vi.fn(),
+          pipeTextStreamToResponse: vi.fn(),
+          toTextStreamResponse: vi.fn(),
+          partialOutputStream: undefined,
+        } as any;
+      });
+
+      const result = await agent.streamText("Hello", {
+        memory: {
+          userId: "user-stream-metadata",
+          conversationId: "conv-stream-metadata",
+          options: {
+            messageMetadataPersistence: {
+              usage: true,
+              finishReason: true,
+            },
+          },
+        },
+      });
+
+      for await (const _part of result.fullStream) {
+        // Consume stream to trigger mocked onFinish.
+      }
+
+      const assistantMessage = await getLastAssistantMessage(
+        memory,
+        "user-stream-metadata",
+        "conv-stream-metadata",
+      );
+
+      expect(assistantMessage).toBeDefined();
+      expect(assistantMessage?.metadata).toEqual(
+        expect.objectContaining({
+          operationId: expect.any(String),
+          usage: persistedUsage,
+          finishReason: "stop",
+        }),
+      );
+    });
+
     it("should read memory but skip persistence when memory.options.readOnly is true", async () => {
       const memory = new Memory({
         storage: new InMemoryStorageAdapter(),
@@ -2248,6 +2438,7 @@ Use pandas and summarize findings.`.split("\n"),
         conversationPersistence: {
           mode: "finish",
         },
+        messageMetadataPersistence: false,
         memory: {
           userId: "memory-user",
           conversationId: "memory-conv",
@@ -2262,6 +2453,9 @@ Use pandas and summarize findings.`.split("\n"),
               mode: "step",
               debounceMs: 120,
             },
+            messageMetadataPersistence: {
+              usage: true,
+            },
           },
         },
       });
@@ -2281,6 +2475,10 @@ Use pandas and summarize findings.`.split("\n"),
           mode: "step",
           debounceMs: 120,
         },
+        messageMetadataPersistence: {
+          usage: true,
+          finishReason: false,
+        },
       });
     });
 
@@ -2305,6 +2503,9 @@ Use pandas and summarize findings.`.split("\n"),
             conversationPersistence: {
               mode: "finish",
             },
+            messageMetadataPersistence: {
+              finishReason: true,
+            },
           },
         },
       });
@@ -2325,6 +2526,10 @@ Use pandas and summarize findings.`.split("\n"),
         conversationPersistence: {
           mode: "finish",
         },
+        messageMetadataPersistence: {
+          usage: false,
+          finishReason: true,
+        },
       });
     });
   });