fix: handle agent_message event in MCP server streaming response

The MCP server's process_streaming_response() only captured agent_thought events but agent-chat mode apps emit agent_message events containing the actual LLM answer. This caused the MCP response to return empty text or only internal reasoning instead of the real answer. fixes #32526
2026-05-09 21:28:25 +08:00 · 2026-02-25 01:14:06 +05:30 · 2026-02-25 01:14:06 +05:30 · 62e4ca0a6b
commit 62e4ca0a6b
parent 3abfbc0246
2 changed files with 44 additions and 8 deletions
--- a/api/core/mcp/server/streamable_http.py
+++ b/api/core/mcp/server/streamable_http.py
@ -203,16 +203,23 @@ def extract_answer_from_response(app: App, response: Any) -> str:
 def process_streaming_response(response: RateLimitGenerator) -> str:
    """Process streaming response for agent chat mode"""
    answer = ""
+    last_thought = ""
    for item in response.generator:
        if isinstance(item, str) and item.startswith("data: "):
            try:
                json_str = item[6:].strip()
                parsed_data = json.loads(json_str)
-                if parsed_data.get("event") == "agent_thought":
-                    answer += parsed_data.get("thought", "")
+                event = parsed_data.get("event")
+                if event in ("message", "agent_message"):
+                    answer += parsed_data.get("answer", "")
+                elif event == "agent_thought":
+                    thought = parsed_data.get("thought", "")
+                    if thought:
+                        last_thought = thought
            except json.JSONDecodeError:
                continue
-    return answer
+    return answer or last_thought
+


 def process_mapping_response(app: App, response: Mapping) -> str:
--- a/api/tests/unit_tests/core/mcp/server/test_streamable_http.py
+++ b/api/tests/unit_tests/core/mcp/server/test_streamable_http.py
@ -357,21 +357,50 @@ class TestUtilityFunctions:
        assert result == expected

    def test_extract_answer_from_streaming_response(self):
-        """Test extracting answer from streaming response"""
+        """Test extracting answer from streaming response with agent_message events"""
        app = Mock(spec=App)

-        # Mock RateLimitGenerator
        mock_generator = Mock(spec=RateLimitGenerator)
        mock_generator.generator = [
            'data: {"event": "agent_thought", "thought": "thinking..."}',
-            'data: {"event": "agent_thought", "thought": "more thinking"}',
-            'data: {"event": "other", "content": "ignore this"}',
+            'data: {"event": "agent_message", "answer": "Hello "}',
+            'data: {"event": "agent_message", "answer": "World"}',
+            'data: {"event": "message_end", "metadata": {}}',
            "not data format",
        ]

        result = extract_answer_from_response(app, mock_generator)

-        assert result == "thinking...more thinking"
+        assert result == "Hello World"
+
+    def test_extract_answer_from_streaming_response_message_event(self):
+        """Test extracting answer from streaming response with message event"""
+        app = Mock(spec=App)
+
+        mock_generator = Mock(spec=RateLimitGenerator)
+        mock_generator.generator = [
+            'data: {"event": "message", "answer": "Hello from chat"}',
+        ]
+
+        result = extract_answer_from_response(app, mock_generator)
+
+        assert result == "Hello from chat"
+
+    def test_extract_answer_from_streaming_response_fallback_to_thought(self):
+        """Test extracting answer falls back to thought when no message events"""
+        app = Mock(spec=App)
+
+        mock_generator = Mock(spec=RateLimitGenerator)
+        mock_generator.generator = [
+            'data: {"event": "agent_thought", "thought": "thinking..."}',
+            'data: {"event": "agent_thought", "thought": "more thinking"}',
+            'data: {"event": "other", "content": "ignore this"}',
+        ]
+
+        result = extract_answer_from_response(app, mock_generator)
+
+        assert result == "more thinking"
+

    def test_process_mapping_response_invalid_mode(self):
        """Test processing mapping response with invalid app mode"""