From b0b398c934ea1bbdadfe4725ccca6f708a6a96c0 Mon Sep 17 00:00:00 2001
From: Max Isbey <224885523+maxisbey@users.noreply.github.com>
Date: Sat, 20 Jun 2026 17:03:12 +0000
Subject: [PATCH 1/6] Buffer per-request StreamableHTTP streams to avoid
 serial-router head-of-line block

The serial message_router forwards each response with a blocking send into
a per-request buffer-0 stream whose only consumer (sse_writer) is started
lazily via nested start_soon. Under concurrent requests one not-yet-receiving
consumer parks the router and head-of-line blocks every other in-flight
response on the session.

Give the three _request_streams[EventMessage] sites a small bounded buffer
so the router can deposit and move on. The sse_stream dict streams stay at
0 (downstream of the router; buffering them would relax per-client
backpressure without helping the race).

Fixes #1764.
---
 src/mcp/server/streamable_http.py           | 19 ++++++--
 tests/server/test_streamable_http_router.py | 51 +++++++++++++++++++++
 2 files changed, 66 insertions(+), 4 deletions(-)
 create mode 100644 tests/server/test_streamable_http_router.py

diff --git a/src/mcp/server/streamable_http.py b/src/mcp/server/streamable_http.py
index c1c8a0f61..b4d03ed58 100644
--- a/src/mcp/server/streamable_http.py
+++ b/src/mcp/server/streamable_http.py
@@ -13,7 +13,7 @@
 from contextlib import asynccontextmanager
 from dataclasses import dataclass
 from http import HTTPStatus
-from typing import Any
+from typing import Any, Final
 
 import anyio
 import pydantic_core
@@ -59,6 +59,11 @@
 # Special key for the standalone GET stream
 GET_STREAM_KEY = "_GET_stream"
 
+# Buffer for the per-request `_request_streams` so the serial `message_router`
+# can deposit a response and move on instead of head-of-line blocking the
+# whole session on a lazily-started `sse_writer`. See #1764.
+REQUEST_STREAM_BUFFER_SIZE: Final = 16
+
 # Session ID validation pattern (visible ASCII characters ranging from 0x21 to 0x7E)
 # Pattern ensures entire string contains only valid characters by using ^ and $ anchors
 SESSION_ID_PATTERN = re.compile(r"^[\x21-\x7E]+$")
@@ -524,7 +529,9 @@ async def _handle_post_request(self, scope: Scope, request: Request, receive: Re
             # Extract the request ID outside the try block for proper scope
             request_id = str(message.id)
             # Register this stream for the request ID
-            self._request_streams[request_id] = anyio.create_memory_object_stream[EventMessage](0)
+            self._request_streams[request_id] = anyio.create_memory_object_stream[EventMessage](
+                REQUEST_STREAM_BUFFER_SIZE
+            )
             request_stream_reader = self._request_streams[request_id][1]
 
             if self.is_json_response_enabled:
@@ -703,7 +710,9 @@ async def standalone_sse_writer():
             try:
                 # Create a standalone message stream for server-initiated messages
 
-                self._request_streams[GET_STREAM_KEY] = anyio.create_memory_object_stream[EventMessage](0)
+                self._request_streams[GET_STREAM_KEY] = anyio.create_memory_object_stream[EventMessage](
+                    REQUEST_STREAM_BUFFER_SIZE
+                )
                 standalone_stream_reader = self._request_streams[GET_STREAM_KEY][1]
 
                 async with sse_stream_writer, standalone_stream_reader:
@@ -893,7 +902,9 @@ async def send_event(event_message: EventMessage) -> None:
                             await self._maybe_send_priming_event(stream_id, sse_stream_writer, replay_protocol_version)
 
                             # Create new request streams for this connection
-                            self._request_streams[stream_id] = anyio.create_memory_object_stream[EventMessage](0)
+                            self._request_streams[stream_id] = anyio.create_memory_object_stream[EventMessage](
+                                REQUEST_STREAM_BUFFER_SIZE
+                            )
                             msg_reader = self._request_streams[stream_id][1]
 
                             # Forward messages to SSE
diff --git a/tests/server/test_streamable_http_router.py b/tests/server/test_streamable_http_router.py
new file mode 100644
index 000000000..94b72e0dc
--- /dev/null
+++ b/tests/server/test_streamable_http_router.py
@@ -0,0 +1,51 @@
+"""Regression coverage for the StreamableHTTP per-session response router."""
+
+import anyio
+import pytest
+
+from mcp.server.streamable_http import (
+    REQUEST_STREAM_BUFFER_SIZE,
+    EventMessage,
+    StreamableHTTPServerTransport,
+)
+from mcp.shared.message import SessionMessage
+from mcp.types import JSONRPCResponse
+
+
+@pytest.mark.anyio
+async def test_router_unconsumed_request_stream_does_not_block_siblings() -> None:
+    """A response whose `sse_writer` is not yet receiving must not park the router (#1764).
+
+    Drives the routing layer directly (the production race does not reproduce
+    on loopback), so this pins the router semantics, not the call sites.
+    """
+    transport = StreamableHTTPServerTransport(mcp_session_id="sid", is_json_response_enabled=False)
+    streams = transport._request_streams
+    async with transport.connect() as (_read_stream, write_stream):
+        # Model two concurrent POSTs at the point _handle_post_request has
+        # registered the per-request stream but A's sse_writer has not yet
+        # reached its first receive().
+        streams["A"] = anyio.create_memory_object_stream[EventMessage](REQUEST_STREAM_BUFFER_SIZE)
+        streams["B"] = anyio.create_memory_object_stream[EventMessage](REQUEST_STREAM_BUFFER_SIZE)
+        a_send, a_recv = streams["A"]
+        b_reader = streams["B"][1]
+        b_received = anyio.Event()
+
+        async def consume_b() -> None:
+            async with b_reader:
+                await b_reader.receive()
+                b_received.set()
+
+        async def server_writes() -> None:
+            await write_stream.send(SessionMessage(JSONRPCResponse(jsonrpc="2.0", id="A", result={})))
+            await write_stream.send(SessionMessage(JSONRPCResponse(jsonrpc="2.0", id="B", result={})))
+
+        async with anyio.create_task_group() as tg:
+            tg.start_soon(consume_b)
+            tg.start_soon(server_writes)
+            with anyio.fail_after(5):
+                await b_received.wait()
+            # A's response was buffered for its (late) consumer, not dropped.
+            assert a_send.statistics().current_buffer_used == 1
+            await a_recv.aclose()
+            await a_send.aclose()

From dde2df983e9b4550ac89a9bbbd13e12c5cdcbba4 Mon Sep 17 00:00:00 2001
From: Max Isbey <224885523+maxisbey@users.noreply.github.com>
Date: Sat, 20 Jun 2026 19:02:37 +0000
Subject: [PATCH 2/6] Store priming event before request dispatch so storage
 order == wire order
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Splits the old _maybe_send_priming_event into _mint_priming_event (store +
return wire dict) and _run_sse_writer (forward request_stream onto the wire).
The POST handler now awaits _mint_priming_event before writer.send(), so the
priming row is in the event store before the server can produce any message
for that request id — ordering by data dependency, not scheduler timing.

The replay path keeps its priming event (test_streamable_http_multiple_reconnections
relies on it as a stream-re-registered signal); its replay→live-tail ordering
window is pre-existing and orthogonal.

Also extracts the inline sse_writer closure to a method (drops _handle_post_request
below the C901 threshold) and widens the SSE-dict stream type to SSEEvent
(dict[str, Any]) — the previous dict[str, str] was a lie masked by the old
helper's Any parameter, since priming events carry retry: int.
---
 src/mcp/server/streamable_http.py           | 114 ++++++++++----------
 tests/server/test_streamable_http_router.py |  52 ++++++++-
 tests/shared/test_streamable_http.py        |  89 +++------------
 3 files changed, 122 insertions(+), 133 deletions(-)

diff --git a/src/mcp/server/streamable_http.py b/src/mcp/server/streamable_http.py
index b4d03ed58..dcb067dc8 100644
--- a/src/mcp/server/streamable_http.py
+++ b/src/mcp/server/streamable_http.py
@@ -12,6 +12,7 @@
 from collections.abc import AsyncGenerator, Awaitable, Callable
 from contextlib import asynccontextmanager
 from dataclasses import dataclass
+from functools import partial
 from http import HTTPStatus
 from typing import Any, Final
 
@@ -71,6 +72,8 @@
 # Type aliases
 StreamId = str
 EventId = str
+# An SSE event-dict as accepted by sse-starlette (`event`, `data`, `id`, `retry`).
+SSEEvent = dict[str, Any]
 
 
 @dataclass
@@ -174,7 +177,7 @@ def __init__(
                 MemoryObjectReceiveStream[EventMessage],
             ],
         ] = {}
-        self._sse_stream_writers: dict[RequestId, MemoryObjectSendStream[dict[str, str]]] = {}
+        self._sse_stream_writers: dict[RequestId, MemoryObjectSendStream[SSEEvent]] = {}
         self._terminated = False
         # Idle timeout cancel scope; managed by the session manager.
         self.idle_scope: anyio.CancelScope | None = None
@@ -261,31 +264,48 @@ async def close_standalone_stream_callback() -> None:
 
         return SessionMessage(message, metadata=metadata)
 
-    async def _maybe_send_priming_event(
-        self,
-        request_id: RequestId,
-        sse_stream_writer: MemoryObjectSendStream[dict[str, Any]],
-        protocol_version: str,
-    ) -> None:
-        """Send priming event for SSE resumability if event_store is configured.
+    async def _mint_priming_event(self, stream_id: StreamId, protocol_version: str) -> SSEEvent | None:
+        """Store the priming cursor for `stream_id` and return its SSE wire form.
 
-        Only sends priming events to clients with protocol version >= 2025-11-25,
-        which includes the fix for handling empty SSE data. Older clients would
-        crash trying to parse empty data as JSON.
+        Called before the request is dispatched so the priming row precedes
+        anything `message_router` can store for this stream. Returns `None`
+        when no event store is configured or the client predates 2025-11-25
+        (older clients cannot parse the empty-data event).
         """
         if not self._event_store:
-            return
-        # Priming events have empty data which older clients cannot handle.
+            return None
         if not is_version_at_least(protocol_version, "2025-11-25"):
-            return
-        priming_event_id = await self._event_store.store_event(
-            str(request_id),  # Convert RequestId to StreamId (str)
-            None,  # Priming event has no payload
-        )
-        priming_event: dict[str, str | int] = {"id": priming_event_id, "data": ""}
+            return None
+        priming_event_id = await self._event_store.store_event(stream_id, None)
+        priming_event: SSEEvent = {"id": priming_event_id, "data": ""}
         if self._retry_interval is not None:
             priming_event["retry"] = self._retry_interval
-        await sse_stream_writer.send(priming_event)
+        return priming_event
+
+    async def _run_sse_writer(
+        self,
+        request_id: RequestId,
+        sse_stream_writer: MemoryObjectSendStream[SSEEvent],
+        request_stream_reader: MemoryObjectReceiveStream[EventMessage],
+        priming_event: SSEEvent | None,
+    ) -> None:
+        """Forward `_request_streams[request_id]` onto the SSE wire for one POST."""
+        try:
+            async with sse_stream_writer, request_stream_reader:
+                if priming_event is not None:
+                    await sse_stream_writer.send(priming_event)
+                async for event_message in request_stream_reader:
+                    await sse_stream_writer.send(self._create_event_data(event_message))
+                    if isinstance(event_message.message, JSONRPCResponse | JSONRPCError):
+                        break
+        except anyio.ClosedResourceError:  # pragma: lax no cover
+            logger.debug("SSE stream closed by close_sse_stream()")
+        except Exception:  # pragma: lax no cover
+            logger.exception("Error in SSE writer")
+        finally:
+            logger.debug("Closing SSE writer")
+            self._sse_stream_writers.pop(request_id, None)
+            await self._clean_up_memory_streams(request_id)
 
     def _create_error_response(
         self,
@@ -339,7 +359,7 @@ def _get_session_id(self, request: Request) -> str | None:
         """Extract the session ID from request headers."""
         return request.headers.get(MCP_SESSION_ID_HEADER)
 
-    def _create_event_data(self, event_message: EventMessage) -> dict[str, str]:
+    def _create_event_data(self, event_message: EventMessage) -> SSEEvent:
         """Create event data dictionary from an EventMessage."""
         event_data = {
             "event": "message",
@@ -579,40 +599,16 @@ async def _handle_post_request(self, scope: Scope, request: Request, receive: Re
                     await self._clean_up_memory_streams(request_id)
             else:
                 # Create SSE stream
-                sse_stream_writer, sse_stream_reader = anyio.create_memory_object_stream[dict[str, str]](0)
+                sse_stream_writer, sse_stream_reader = anyio.create_memory_object_stream[SSEEvent](0)
 
                 # Store writer reference so close_sse_stream() can close it
                 self._sse_stream_writers[request_id] = sse_stream_writer
 
-                async def sse_writer():
-                    # Get the request ID from the incoming request message
-                    try:
-                        async with sse_stream_writer, request_stream_reader:
-                            # Send priming event for SSE resumability
-                            await self._maybe_send_priming_event(request_id, sse_stream_writer, protocol_version)
-
-                            # Process messages from the request-specific stream
-                            async for event_message in request_stream_reader:
-                                # Build the event data
-                                event_data = self._create_event_data(event_message)
-                                await sse_stream_writer.send(event_data)
-
-                                # If response, remove from pending streams and close
-                                if isinstance(event_message.message, JSONRPCResponse | JSONRPCError):
-                                    break
-                    except anyio.ClosedResourceError:  # pragma: lax no cover
-                        # Expected when close_sse_stream() is called
-                        logger.debug("SSE stream closed by close_sse_stream()")
-                    except Exception:  # pragma: lax no cover
-                        logger.exception("Error in SSE writer")
-                    finally:
-                        logger.debug("Closing SSE writer")
-                        self._sse_stream_writers.pop(request_id, None)
-                        await self._clean_up_memory_streams(request_id)
-
-                # Create and start EventSourceResponse
-                # SSE stream mode (original behavior)
-                # Set up headers
+                # Store the priming event before the request is dispatched so its
+                # event-store position precedes anything message_router can store
+                # for this id (storage order == wire order by construction).
+                priming_event = await self._mint_priming_event(request_id, protocol_version)
+
                 headers = {
                     "Cache-Control": "no-cache, no-transform",
                     "Connection": "keep-alive",
@@ -621,7 +617,9 @@ async def sse_writer():
                 }
                 response = EventSourceResponse(
                     content=sse_stream_reader,
-                    data_sender_callable=sse_writer,
+                    data_sender_callable=partial(
+                        self._run_sse_writer, request_id, sse_stream_writer, request_stream_reader, priming_event
+                    ),
                     headers=headers,
                 )
 
@@ -704,7 +702,7 @@ async def _handle_get_request(self, request: Request, send: Send) -> None:
             return
 
         # Create SSE stream
-        sse_stream_writer, sse_stream_reader = anyio.create_memory_object_stream[dict[str, str]](0)
+        sse_stream_writer, sse_stream_reader = anyio.create_memory_object_stream[SSEEvent](0)
 
         async def standalone_sse_writer():
             try:
@@ -880,7 +878,7 @@ async def _replay_events(self, last_event_id: str, request: Request, send: Send)
             replay_protocol_version = request.headers.get(MCP_PROTOCOL_VERSION_HEADER, DEFAULT_NEGOTIATED_VERSION)
 
             # Create SSE stream for replay
-            sse_stream_writer, sse_stream_reader = anyio.create_memory_object_stream[dict[str, str]](0)
+            sse_stream_writer, sse_stream_reader = anyio.create_memory_object_stream[SSEEvent](0)
 
             async def replay_sender():
                 try:
@@ -898,8 +896,12 @@ async def send_event(event_message: EventMessage) -> None:
                             # Register SSE writer so close_sse_stream() can close it
                             self._sse_stream_writers[stream_id] = sse_stream_writer
 
-                            # Send priming event for this new connection
-                            await self._maybe_send_priming_event(stream_id, sse_stream_writer, replay_protocol_version)
+                            # Prime the resumed connection so the client sees the stream
+                            # is re-registered. The replay→live-tail ordering window here
+                            # is pre-existing and tracked separately.
+                            priming_event = await self._mint_priming_event(stream_id, replay_protocol_version)
+                            if priming_event is not None:  # pragma: no branch
+                                await sse_stream_writer.send(priming_event)
 
                             # Create new request streams for this connection
                             self._request_streams[stream_id] = anyio.create_memory_object_stream[EventMessage](
diff --git a/tests/server/test_streamable_http_router.py b/tests/server/test_streamable_http_router.py
index 94b72e0dc..91cf18d9e 100644
--- a/tests/server/test_streamable_http_router.py
+++ b/tests/server/test_streamable_http_router.py
@@ -5,11 +5,27 @@
 
 from mcp.server.streamable_http import (
     REQUEST_STREAM_BUFFER_SIZE,
+    EventCallback,
+    EventId,
     EventMessage,
+    EventStore,
     StreamableHTTPServerTransport,
+    StreamId,
 )
 from mcp.shared.message import SessionMessage
-from mcp.types import JSONRPCResponse
+from mcp.types import JSONRPCMessage, JSONRPCResponse
+
+
+class _OrderTrackingStore(EventStore):
+    def __init__(self) -> None:
+        self.stored: list[tuple[StreamId, JSONRPCMessage | None]] = []
+
+    async def store_event(self, stream_id: StreamId, message: JSONRPCMessage | None) -> EventId:
+        self.stored.append((stream_id, message))
+        return str(len(self.stored))
+
+    async def replay_events_after(self, last_event_id: EventId, send_callback: EventCallback) -> StreamId | None:
+        raise NotImplementedError
 
 
 @pytest.mark.anyio
@@ -49,3 +65,37 @@ async def server_writes() -> None:
             assert a_send.statistics().current_buffer_used == 1
             await a_recv.aclose()
             await a_send.aclose()
+
+
+@pytest.mark.anyio
+async def test_priming_event_is_stored_before_any_routed_message() -> None:
+    """`_mint_priming_event` is awaited before the request is dispatched, so the
+    priming row precedes every `message_router` store for that stream regardless
+    of when `sse_writer` is scheduled.
+    """
+    store = _OrderTrackingStore()
+    transport = StreamableHTTPServerTransport(mcp_session_id="sid", is_json_response_enabled=False, event_store=store)
+    streams = transport._request_streams
+
+    async with transport.connect() as (_read_stream, write_stream):
+        # POST handler step: mint priming for "A" before dispatch.
+        priming = await transport._mint_priming_event("A", "2025-11-25")
+        assert priming is not None
+        streams["A"] = anyio.create_memory_object_stream[EventMessage](REQUEST_STREAM_BUFFER_SIZE)
+        a_send, a_recv = streams["A"]
+
+        # Server emits 5 messages for "A" with no sse_writer scheduled. Each
+        # write_stream.send() rendezvous-hands to message_router, which stores
+        # then deposits into A's buffer; reading them back proves the router
+        # has finished storing.
+        for i in range(5):
+            await write_stream.send(SessionMessage(JSONRPCResponse(jsonrpc="2.0", id="A", result={"n": i})))
+        with anyio.fail_after(5):
+            for _ in range(5):
+                await a_recv.receive()
+        await a_recv.aclose()
+        await a_send.aclose()
+
+    assert store.stored[0] == ("A", None)
+    assert [sid for sid, _ in store.stored] == ["A"] * 6
+    assert all(msg is not None for _, msg in store.stored[1:])
diff --git a/tests/shared/test_streamable_http.py b/tests/shared/test_streamable_http.py
index 7ceac8e86..d0d052cd2 100644
--- a/tests/shared/test_streamable_http.py
+++ b/tests/shared/test_streamable_http.py
@@ -1636,80 +1636,30 @@ async def test_handle_sse_event_skips_empty_data() -> None:
 
 @pytest.mark.anyio
 async def test_priming_event_not_sent_for_old_protocol_version() -> None:
-    """_maybe_send_priming_event skips for old protocol versions (backwards compat)."""
-    # Create a transport with an event store
-    transport = StreamableHTTPServerTransport(
-        "/mcp",
-        event_store=SimpleEventStore(),
-    )
-
-    # Create a mock stream writer
-    write_stream, read_stream = anyio.create_memory_object_stream[dict[str, Any]](1)
-
-    try:
-        # Call _maybe_send_priming_event with OLD protocol version - should NOT send
-        await transport._maybe_send_priming_event("test-request-id", write_stream, "2025-06-18")
-
-        # Nothing should have been written to the stream
-        assert write_stream.statistics().current_buffer_used == 0
-
-        # Now test with NEW protocol version - should send
-        await transport._maybe_send_priming_event("test-request-id-2", write_stream, "2025-11-25")
-
-        # Should have written a priming event
-        assert write_stream.statistics().current_buffer_used == 1
-    finally:
-        await write_stream.aclose()
-        await read_stream.aclose()
+    """`_mint_priming_event` skips for old protocol versions (backwards compat)."""
+    transport = StreamableHTTPServerTransport("/mcp", event_store=SimpleEventStore())
+    assert await transport._mint_priming_event("test-request-id", "2025-06-18") is None
+    assert await transport._mint_priming_event("test-request-id-2", "2025-11-25") is not None
 
 
 @pytest.mark.anyio
 async def test_priming_event_not_sent_without_event_store() -> None:
-    """_maybe_send_priming_event returns early when no event_store is configured."""
-    # Create a transport WITHOUT an event store
+    """`_mint_priming_event` returns `None` when no event_store is configured."""
     transport = StreamableHTTPServerTransport("/mcp")
-
-    # Create a mock stream writer
-    write_stream, read_stream = anyio.create_memory_object_stream[dict[str, Any]](1)
-
-    try:
-        # Call _maybe_send_priming_event - should return early without sending
-        await transport._maybe_send_priming_event("test-request-id", write_stream, "2025-11-25")
-
-        # Nothing should have been written to the stream
-        assert write_stream.statistics().current_buffer_used == 0
-    finally:
-        await write_stream.aclose()
-        await read_stream.aclose()
+    assert await transport._mint_priming_event("test-request-id", "2025-11-25") is None
 
 
 @pytest.mark.anyio
 async def test_priming_event_includes_retry_interval() -> None:
-    """_maybe_send_priming_event includes the retry field when retry_interval is set."""
-    # Create a transport with an event store AND retry_interval
+    """`_mint_priming_event` includes the retry field when `retry_interval` is set."""
     transport = StreamableHTTPServerTransport(
         "/mcp",
         event_store=SimpleEventStore(),
         retry_interval=5000,
     )
-
-    # Create a mock stream writer
-    write_stream, read_stream = anyio.create_memory_object_stream[dict[str, Any]](1)
-
-    try:
-        # Call _maybe_send_priming_event with new protocol version
-        await transport._maybe_send_priming_event("test-request-id", write_stream, "2025-11-25")
-
-        # Should have written a priming event with retry field
-        assert write_stream.statistics().current_buffer_used == 1
-
-        # Read the event and verify it has retry field
-        event = await read_stream.receive()
-        assert "retry" in event
-        assert event["retry"] == 5000
-    finally:
-        await write_stream.aclose()
-        await read_stream.aclose()
+    event = await transport._mint_priming_event("test-request-id", "2025-11-25")
+    assert event is not None
+    assert event["retry"] == 5000
 
 
 @pytest.mark.anyio
@@ -1746,26 +1696,13 @@ async def test_close_sse_stream_callback_not_provided_for_old_protocol_version()
 
 @pytest.mark.anyio
 async def test_priming_event_not_sent_for_unknown_protocol_version() -> None:
-    """_maybe_send_priming_event treats unrecognized version strings conservatively.
+    """`_mint_priming_event` treats unrecognized version strings conservatively.
 
     A garbage version must not be mistaken for a future one (lexicographically
     "zzz" sorts after every date-shaped revision).
     """
-    transport = StreamableHTTPServerTransport(
-        "/mcp",
-        event_store=SimpleEventStore(),
-    )
-
-    write_stream, read_stream = anyio.create_memory_object_stream[dict[str, Any]](1)
-
-    try:
-        await transport._maybe_send_priming_event("test-request-id", write_stream, "zzz")
-
-        # Nothing should have been written to the stream
-        assert write_stream.statistics().current_buffer_used == 0
-    finally:
-        await write_stream.aclose()
-        await read_stream.aclose()
+    transport = StreamableHTTPServerTransport("/mcp", event_store=SimpleEventStore())
+    assert await transport._mint_priming_event("test-request-id", "zzz") is None
 
 
 @pytest.mark.anyio

From 127b20942f73ca54d72b15865b150525b3ce9721 Mon Sep 17 00:00:00 2001
From: Max Isbey <224885523+maxisbey@users.noreply.github.com>
Date: Sat, 20 Jun 2026 20:35:45 +0000
Subject: [PATCH 3/6] Mint priming before per-request state; cover old-pv
 replay path

Hoists _mint_priming_event to the top of the SSE arm so a user EventStore
raising on the priming row returns a 500 with no per-request state allocated
(previously _request_streams[id] and _sse_stream_writers[id] leaked for the
session). The shared _request_streams registration is pushed into each branch.

Adds an old-pv-reconnect test in test_hosting_resume.py covering the
priming_event-is-None replay arm; drops the no-branch pragma. The new
priming-failure test covers the outer except handler, so its pragmas and the
dead 'if writer:' check are removed.
---
 src/mcp/server/streamable_http.py             | 40 ++++++-------
 .../transports/test_hosting_resume.py         | 40 +++++++++++++
 tests/server/test_streamable_http_router.py   | 57 +++++++++++++++++++
 3 files changed, 115 insertions(+), 22 deletions(-)

diff --git a/src/mcp/server/streamable_http.py b/src/mcp/server/streamable_http.py
index dcb067dc8..f30689975 100644
--- a/src/mcp/server/streamable_http.py
+++ b/src/mcp/server/streamable_http.py
@@ -546,15 +546,13 @@ async def _handle_post_request(self, scope: Scope, request: Request, receive: Re
                 else request.headers.get(MCP_PROTOCOL_VERSION_HEADER, DEFAULT_NEGOTIATED_VERSION)
             )
 
-            # Extract the request ID outside the try block for proper scope
             request_id = str(message.id)
-            # Register this stream for the request ID
-            self._request_streams[request_id] = anyio.create_memory_object_stream[EventMessage](
-                REQUEST_STREAM_BUFFER_SIZE
-            )
-            request_stream_reader = self._request_streams[request_id][1]
 
             if self.is_json_response_enabled:
+                self._request_streams[request_id] = anyio.create_memory_object_stream[EventMessage](
+                    REQUEST_STREAM_BUFFER_SIZE
+                )
+                request_stream_reader = self._request_streams[request_id][1]
                 # Process the message
                 metadata = ServerMessageMetadata(request_context=request)
                 session_message = SessionMessage(message, metadata=metadata)
@@ -598,16 +596,18 @@ async def _handle_post_request(self, scope: Scope, request: Request, receive: Re
                 finally:
                     await self._clean_up_memory_streams(request_id)
             else:
-                # Create SSE stream
-                sse_stream_writer, sse_stream_reader = anyio.create_memory_object_stream[SSEEvent](0)
+                # Mint the priming event before any per-request state exists:
+                # `EventStore.store_event` is user code and may raise, in which
+                # case the outer handler returns a 500 with nothing to clean up.
+                # Still strictly precedes dispatch, so storage order == wire order.
+                priming_event = await self._mint_priming_event(request_id, protocol_version)
 
-                # Store writer reference so close_sse_stream() can close it
+                sse_stream_writer, sse_stream_reader = anyio.create_memory_object_stream[SSEEvent](0)
                 self._sse_stream_writers[request_id] = sse_stream_writer
-
-                # Store the priming event before the request is dispatched so its
-                # event-store position precedes anything message_router can store
-                # for this id (storage order == wire order by construction).
-                priming_event = await self._mint_priming_event(request_id, protocol_version)
+                self._request_streams[request_id] = anyio.create_memory_object_stream[EventMessage](
+                    REQUEST_STREAM_BUFFER_SIZE
+                )
+                request_stream_reader = self._request_streams[request_id][1]
 
                 headers = {
                     "Cache-Control": "no-cache, no-transform",
@@ -638,10 +638,7 @@ async def _handle_post_request(self, scope: Scope, request: Request, receive: Re
                 finally:
                     await sse_stream_reader.aclose()
 
-        except Exception as err:  # pragma: lax no cover
-            # Reached only when something raises during POST handling outside
-            # the per-SSE-stream guard above; whether tests reach this depends
-            # on client teardown timing.
+        except Exception as err:
             logger.exception("Error handling POST request")
             response = self._create_error_response(
                 f"Error handling POST request: {err}",
@@ -649,9 +646,8 @@ async def _handle_post_request(self, scope: Scope, request: Request, receive: Re
                 INTERNAL_ERROR,
             )
             await response(scope, receive, send)
-            if writer:
-                await writer.send(Exception(err))
-            return  # pragma: no cover
+            await writer.send(Exception(err))
+            return
 
     async def _handle_get_request(self, request: Request, send: Send) -> None:
         """Handle GET request to establish SSE.
@@ -900,7 +896,7 @@ async def send_event(event_message: EventMessage) -> None:
                             # is re-registered. The replay→live-tail ordering window here
                             # is pre-existing and tracked separately.
                             priming_event = await self._mint_priming_event(stream_id, replay_protocol_version)
-                            if priming_event is not None:  # pragma: no branch
+                            if priming_event is not None:
                                 await sse_stream_writer.send(priming_event)
 
                             # Create new request streams for this connection
diff --git a/tests/interaction/transports/test_hosting_resume.py b/tests/interaction/transports/test_hosting_resume.py
index b22df0ff2..47e7781f8 100644
--- a/tests/interaction/transports/test_hosting_resume.py
+++ b/tests/interaction/transports/test_hosting_resume.py
@@ -182,6 +182,46 @@ async def count(ctx: Context) -> str:
     )
 
 
+@requirement("hosting:resume:priming")
+async def test_a_pre_2025_11_25_reconnect_replays_without_minting_a_priming_event() -> None:
+    """A pre-2025-11-25 client reconnecting via Last-Event-ID gets the replay with no priming row.
+
+    The store-length assertion is the load-bearing proof that no priming cursor was minted.
+    """
+    release = anyio.Event()
+    store = SequencedEventStore()
+    mcp = MCPServer("resumable")
+
+    @mcp.tool()
+    async def count(ctx: Context) -> str:
+        await ctx.info("tick 1")  # pyright: ignore[reportDeprecated]
+        await release.wait()
+        await ctx.info("tick 2")  # pyright: ignore[reportDeprecated]
+        return "counted"
+
+    async with mounted_app(mcp, event_store=store, retry_interval=0) as (http, _):
+        session_id = await initialize_via_http(http)
+        with anyio.fail_after(5):
+            async with http.stream(
+                "POST", "/mcp", content=_tools_call(1, "count", {}), headers=base_headers(session_id=session_id)
+            ) as response:
+                _, first = await _read_events(response, 2)
+            release.set()
+            await store.wait_until_stored(6)
+            old_client_headers = base_headers(session_id=session_id) | {
+                "mcp-protocol-version": "2025-06-18",
+                "last-event-id": first.id,
+            }
+            async with http.stream("GET", "/mcp", headers=old_client_headers) as replay:  # pragma: no branch
+                assert replay.status_code == 200
+                missed = await _read_events(replay, 2)
+
+    assert [(event.id, bool(event.data)) for event in missed] == snapshot([("5", True), ("6", True)])
+    # No priming cursor was minted on reconnect: the store still holds only the six rows
+    # written before the GET (init priming+response, POST priming, tick 1, tick 2, result).
+    assert len(store._events) == 6
+
+
 @requirement("hosting:resume:bad-event-id")
 async def test_an_unknown_last_event_id_yields_an_empty_replay_stream() -> None:
     """A Last-Event-ID the event store cannot map produces an empty SSE stream rather than an error.
diff --git a/tests/server/test_streamable_http_router.py b/tests/server/test_streamable_http_router.py
index 91cf18d9e..c3b03a1f9 100644
--- a/tests/server/test_streamable_http_router.py
+++ b/tests/server/test_streamable_http_router.py
@@ -2,6 +2,7 @@
 
 import anyio
 import pytest
+from starlette.types import Message, Scope
 
 from mcp.server.streamable_http import (
     REQUEST_STREAM_BUFFER_SIZE,
@@ -28,6 +29,14 @@ async def replay_events_after(self, last_event_id: EventId, send_callback: Event
         raise NotImplementedError
 
 
+class _PrimingFailingStore(EventStore):
+    async def store_event(self, stream_id: StreamId, message: JSONRPCMessage | None) -> EventId:
+        raise RuntimeError("backend unavailable")
+
+    async def replay_events_after(self, last_event_id: EventId, send_callback: EventCallback) -> StreamId | None:
+        raise NotImplementedError
+
+
 @pytest.mark.anyio
 async def test_router_unconsumed_request_stream_does_not_block_siblings() -> None:
     """A response whose `sse_writer` is not yet receiving must not park the router (#1764).
@@ -99,3 +108,51 @@ async def test_priming_event_is_stored_before_any_routed_message() -> None:
     assert store.stored[0] == ("A", None)
     assert [sid for sid, _ in store.stored] == ["A"] * 6
     assert all(msg is not None for _, msg in store.stored[1:])
+
+
+@pytest.mark.anyio
+async def test_priming_store_failure_leaves_no_per_request_state() -> None:
+    """`EventStore.store_event` raising on the priming row must not leak per-request entries."""
+    transport = StreamableHTTPServerTransport(
+        mcp_session_id=None,
+        is_json_response_enabled=False,
+        event_store=_PrimingFailingStore(),
+    )
+
+    body = b'{"jsonrpc":"2.0","id":"req-1","method":"tools/list","params":{}}'
+    scope: Scope = {
+        "type": "http",
+        "method": "POST",
+        "path": "/",
+        "query_string": b"",
+        "headers": [
+            (b"accept", b"application/json, text/event-stream"),
+            (b"content-type", b"application/json"),
+            (b"mcp-protocol-version", b"2025-11-25"),
+        ],
+    }
+    body_sent = False
+
+    async def receive() -> Message:
+        nonlocal body_sent
+        if not body_sent:
+            body_sent = True
+            return {"type": "http.request", "body": body, "more_body": False}
+        raise NotImplementedError
+
+    sent: list[Message] = []
+
+    async def asgi_send(message: Message) -> None:
+        sent.append(message)
+
+    async with transport.connect() as (read_stream, _write_stream):
+        async with anyio.create_task_group() as tg:
+            tg.start_soon(transport.handle_request, scope, receive, asgi_send)
+            with anyio.fail_after(5):
+                forwarded = await read_stream.receive()
+            assert isinstance(forwarded, Exception)
+
+    assert transport._request_streams == {}
+    assert transport._sse_stream_writers == {}
+    assert sent[0]["type"] == "http.response.start"
+    assert sent[0]["status"] == 500

From 1f1cb4813b675afb5e845018bfb8998261018e76 Mon Sep 17 00:00:00 2001
From: Max Isbey <224885523+maxisbey@users.noreply.github.com>
Date: Mon, 22 Jun 2026 11:14:42 +0000
Subject: [PATCH 4/6] replay_sender finally + replace _mint_priming_event unit
 tests with end-to-end

Adds a finally to replay_sender (mirroring _run_sse_writer) so resumed
connections clean up _sse_stream_writers[stream_id] and _request_streams[stream_id]
on disconnect. Nested inside the stream_id-is-set block so no edge-case
None-handling is needed.

Drops the four unit tests that poked _mint_priming_event directly and adds an
end-to-end test in test_hosting_resume.py asserting the event store records
[(S, priming), (S, msg1), ..., (S, response)] for a real POST through a real
MCPServer + transport. The dropped tests' branches remain covered by the
existing high-level tests in the same file.
---
 src/mcp/server/streamable_http.py             | 48 ++++++++++---------
 .../transports/test_hosting_resume.py         | 37 ++++++++++++++
 tests/shared/test_streamable_http.py          | 39 ---------------
 3 files changed, 63 insertions(+), 61 deletions(-)

diff --git a/src/mcp/server/streamable_http.py b/src/mcp/server/streamable_http.py
index f30689975..2a2834e9c 100644
--- a/src/mcp/server/streamable_http.py
+++ b/src/mcp/server/streamable_http.py
@@ -889,28 +889,32 @@ async def send_event(event_message: EventMessage) -> None:
 
                         # If stream ID not in mapping, create it
                         if stream_id and stream_id not in self._request_streams:  # pragma: no branch
-                            # Register SSE writer so close_sse_stream() can close it
-                            self._sse_stream_writers[stream_id] = sse_stream_writer
-
-                            # Prime the resumed connection so the client sees the stream
-                            # is re-registered. The replay→live-tail ordering window here
-                            # is pre-existing and tracked separately.
-                            priming_event = await self._mint_priming_event(stream_id, replay_protocol_version)
-                            if priming_event is not None:
-                                await sse_stream_writer.send(priming_event)
-
-                            # Create new request streams for this connection
-                            self._request_streams[stream_id] = anyio.create_memory_object_stream[EventMessage](
-                                REQUEST_STREAM_BUFFER_SIZE
-                            )
-                            msg_reader = self._request_streams[stream_id][1]
-
-                            # Forward messages to SSE
-                            async with msg_reader:
-                                async for event_message in msg_reader:
-                                    event_data = self._create_event_data(event_message)
-
-                                    await sse_stream_writer.send(event_data)
+                            try:
+                                # Register SSE writer so close_sse_stream() can close it
+                                self._sse_stream_writers[stream_id] = sse_stream_writer
+
+                                # Prime the resumed connection so the client sees the stream
+                                # is re-registered. The replay→live-tail ordering window here
+                                # is pre-existing and tracked separately.
+                                priming_event = await self._mint_priming_event(stream_id, replay_protocol_version)
+                                if priming_event is not None:
+                                    await sse_stream_writer.send(priming_event)
+
+                                # Create new request streams for this connection
+                                self._request_streams[stream_id] = anyio.create_memory_object_stream[EventMessage](
+                                    REQUEST_STREAM_BUFFER_SIZE
+                                )
+                                msg_reader = self._request_streams[stream_id][1]
+
+                                # Forward messages to SSE
+                                async with msg_reader:
+                                    async for event_message in msg_reader:
+                                        event_data = self._create_event_data(event_message)
+
+                                        await sse_stream_writer.send(event_data)
+                            finally:
+                                self._sse_stream_writers.pop(stream_id, None)
+                                await self._clean_up_memory_streams(stream_id)
                 except anyio.ClosedResourceError:  # pragma: lax no cover
                     # Expected when close_sse_stream() is called
                     logger.debug("Replay SSE stream closed by close_sse_stream()")
diff --git a/tests/interaction/transports/test_hosting_resume.py b/tests/interaction/transports/test_hosting_resume.py
index 47e7781f8..333989011 100644
--- a/tests/interaction/transports/test_hosting_resume.py
+++ b/tests/interaction/transports/test_hosting_resume.py
@@ -113,6 +113,43 @@ async def test_a_post_sse_stream_begins_with_a_priming_event_and_stamps_every_ev
     )
 
 
+@requirement("hosting:resume:priming")
+async def test_the_priming_row_is_stored_before_any_handler_output_for_that_stream() -> None:
+    """The priming cursor is the first row the event store records for a request's stream.
+
+    The POST handler stores the priming row before dispatching the request, so by construction
+    it precedes anything `message_router` can store for that stream id.
+    """
+    store = SequencedEventStore()
+    mcp = MCPServer("resumable")
+
+    @mcp.tool()
+    async def burst(ctx: Context) -> str:
+        await ctx.info("a")  # pyright: ignore[reportDeprecated]
+        await ctx.info("b")  # pyright: ignore[reportDeprecated]
+        await ctx.info("c")  # pyright: ignore[reportDeprecated]
+        return "done"
+
+    async with mounted_app(mcp, event_store=store, retry_interval=0) as (http, _):
+        session_id = await initialize_via_http(http)
+        with anyio.fail_after(5):
+            async with http.stream(  # pragma: no branch
+                "POST", "/mcp", content=_tools_call(2, "burst", {}), headers=base_headers(session_id=session_id)
+            ) as response:
+                await _read_events(response, 5)
+
+    # initialize wrote two rows (its own priming + response); everything after is this call.
+    call_rows = store._events[2:]
+    stream_id = call_rows[0][0]
+    assert [(s, None if m is None else type(m).__name__) for s, m in call_rows] == [
+        (stream_id, None),
+        (stream_id, "JSONRPCNotification"),
+        (stream_id, "JSONRPCNotification"),
+        (stream_id, "JSONRPCNotification"),
+        (stream_id, "JSONRPCResponse"),
+    ]
+
+
 @requirement("hosting:resume:replay")
 @requirement("hosting:resume:stream-scoped")
 @requirement("hosting:resume:buffered-replay")
diff --git a/tests/shared/test_streamable_http.py b/tests/shared/test_streamable_http.py
index d0d052cd2..5360e56ff 100644
--- a/tests/shared/test_streamable_http.py
+++ b/tests/shared/test_streamable_http.py
@@ -1634,34 +1634,6 @@ async def test_handle_sse_event_skips_empty_data() -> None:
         await read_stream.aclose()
 
 
-@pytest.mark.anyio
-async def test_priming_event_not_sent_for_old_protocol_version() -> None:
-    """`_mint_priming_event` skips for old protocol versions (backwards compat)."""
-    transport = StreamableHTTPServerTransport("/mcp", event_store=SimpleEventStore())
-    assert await transport._mint_priming_event("test-request-id", "2025-06-18") is None
-    assert await transport._mint_priming_event("test-request-id-2", "2025-11-25") is not None
-
-
-@pytest.mark.anyio
-async def test_priming_event_not_sent_without_event_store() -> None:
-    """`_mint_priming_event` returns `None` when no event_store is configured."""
-    transport = StreamableHTTPServerTransport("/mcp")
-    assert await transport._mint_priming_event("test-request-id", "2025-11-25") is None
-
-
-@pytest.mark.anyio
-async def test_priming_event_includes_retry_interval() -> None:
-    """`_mint_priming_event` includes the retry field when `retry_interval` is set."""
-    transport = StreamableHTTPServerTransport(
-        "/mcp",
-        event_store=SimpleEventStore(),
-        retry_interval=5000,
-    )
-    event = await transport._mint_priming_event("test-request-id", "2025-11-25")
-    assert event is not None
-    assert event["retry"] == 5000
-
-
 @pytest.mark.anyio
 async def test_close_sse_stream_callback_not_provided_for_old_protocol_version() -> None:
     """close_sse_stream callbacks are only provided for protocol versions that support polling."""
@@ -1694,17 +1666,6 @@ async def test_close_sse_stream_callback_not_provided_for_old_protocol_version()
     assert session_msg_new.metadata.close_standalone_sse_stream is not None
 
 
-@pytest.mark.anyio
-async def test_priming_event_not_sent_for_unknown_protocol_version() -> None:
-    """`_mint_priming_event` treats unrecognized version strings conservatively.
-
-    A garbage version must not be mistaken for a future one (lexicographically
-    "zzz" sorts after every date-shaped revision).
-    """
-    transport = StreamableHTTPServerTransport("/mcp", event_store=SimpleEventStore())
-    assert await transport._mint_priming_event("test-request-id", "zzz") is None
-
-
 @pytest.mark.anyio
 async def test_close_sse_stream_callback_not_provided_for_unknown_protocol_version() -> None:
     """close_sse_stream callbacks are withheld when the client's version is unrecognized."""

From ac6cc7df8c9942ae987154880549fbb8ccbab07b Mon Sep 17 00:00:00 2001
From: Max Isbey <224885523+maxisbey@users.noreply.github.com>
Date: Mon, 22 Jun 2026 13:04:02 +0000
Subject: [PATCH 5/6] Generic 500 body in outer POST except; make leak-test
 assertion load-bearing

The outer except now returns a fixed message instead of embedding the
exception text in the response body, matching the convention in runner.py
and jsonrpc_dispatcher.py (detail goes to logger.exception).

Moves the _request_streams/_sse_stream_writers emptiness assertions inside
the connect() context so connect()'s own teardown doesn't make them vacuous,
and asserts the store's exception message is absent from the 500 body.
---
 src/mcp/server/streamable_http.py           | 2 +-
 tests/server/test_streamable_http_router.py | 8 ++++++--
 2 files changed, 7 insertions(+), 3 deletions(-)

diff --git a/src/mcp/server/streamable_http.py b/src/mcp/server/streamable_http.py
index 2a2834e9c..f8aec6c9e 100644
--- a/src/mcp/server/streamable_http.py
+++ b/src/mcp/server/streamable_http.py
@@ -641,7 +641,7 @@ async def _handle_post_request(self, scope: Scope, request: Request, receive: Re
         except Exception as err:
             logger.exception("Error handling POST request")
             response = self._create_error_response(
-                f"Error handling POST request: {err}",
+                "Error handling POST request",
                 HTTPStatus.INTERNAL_SERVER_ERROR,
                 INTERNAL_ERROR,
             )
diff --git a/tests/server/test_streamable_http_router.py b/tests/server/test_streamable_http_router.py
index c3b03a1f9..87dde072d 100644
--- a/tests/server/test_streamable_http_router.py
+++ b/tests/server/test_streamable_http_router.py
@@ -151,8 +151,12 @@ async def asgi_send(message: Message) -> None:
             with anyio.fail_after(5):
                 forwarded = await read_stream.receive()
             assert isinstance(forwarded, Exception)
+        # handle_request has returned; connect()'s finally (which clears
+        # _request_streams unconditionally) has not yet run.
+        assert transport._request_streams == {}
+        assert transport._sse_stream_writers == {}
 
-    assert transport._request_streams == {}
-    assert transport._sse_stream_writers == {}
     assert sent[0]["type"] == "http.response.start"
     assert sent[0]["status"] == 500
+    body = b"".join(m.get("body", b"") for m in sent if m["type"] == "http.response.body")
+    assert b"backend unavailable" not in body

From 45fcc1fb0914db86197a377bcf2d3479d9a52888 Mon Sep 17 00:00:00 2001
From: Max Isbey <224885523+maxisbey@users.noreply.github.com>
Date: Mon, 22 Jun 2026 14:31:22 +0000
Subject: [PATCH 6/6] Drop tautological priming-order unit test; cover
 retry_interval-None arc via e2e

The synthetic test called _mint_priming_event itself then asserted it was
stored first, which proves the test's own statement order rather than that
_handle_post_request mints before dispatch. The e2e test in test_hosting_resume.py
already pins the real contract through the production handler; dropping
retry_interval= from that test (it doesn't reconnect) also covers the
retry_interval-is-None branch via the real path.
---
 .../transports/test_hosting_resume.py         |  2 +-
 tests/server/test_streamable_http_router.py   | 46 -------------------
 2 files changed, 1 insertion(+), 47 deletions(-)

diff --git a/tests/interaction/transports/test_hosting_resume.py b/tests/interaction/transports/test_hosting_resume.py
index 333989011..f88521dbb 100644
--- a/tests/interaction/transports/test_hosting_resume.py
+++ b/tests/interaction/transports/test_hosting_resume.py
@@ -130,7 +130,7 @@ async def burst(ctx: Context) -> str:
         await ctx.info("c")  # pyright: ignore[reportDeprecated]
         return "done"
 
-    async with mounted_app(mcp, event_store=store, retry_interval=0) as (http, _):
+    async with mounted_app(mcp, event_store=store) as (http, _):
         session_id = await initialize_via_http(http)
         with anyio.fail_after(5):
             async with http.stream(  # pragma: no branch
diff --git a/tests/server/test_streamable_http_router.py b/tests/server/test_streamable_http_router.py
index 87dde072d..4f6286c4d 100644
--- a/tests/server/test_streamable_http_router.py
+++ b/tests/server/test_streamable_http_router.py
@@ -17,18 +17,6 @@
 from mcp.types import JSONRPCMessage, JSONRPCResponse
 
 
-class _OrderTrackingStore(EventStore):
-    def __init__(self) -> None:
-        self.stored: list[tuple[StreamId, JSONRPCMessage | None]] = []
-
-    async def store_event(self, stream_id: StreamId, message: JSONRPCMessage | None) -> EventId:
-        self.stored.append((stream_id, message))
-        return str(len(self.stored))
-
-    async def replay_events_after(self, last_event_id: EventId, send_callback: EventCallback) -> StreamId | None:
-        raise NotImplementedError
-
-
 class _PrimingFailingStore(EventStore):
     async def store_event(self, stream_id: StreamId, message: JSONRPCMessage | None) -> EventId:
         raise RuntimeError("backend unavailable")
@@ -76,40 +64,6 @@ async def server_writes() -> None:
             await a_send.aclose()
 
 
-@pytest.mark.anyio
-async def test_priming_event_is_stored_before_any_routed_message() -> None:
-    """`_mint_priming_event` is awaited before the request is dispatched, so the
-    priming row precedes every `message_router` store for that stream regardless
-    of when `sse_writer` is scheduled.
-    """
-    store = _OrderTrackingStore()
-    transport = StreamableHTTPServerTransport(mcp_session_id="sid", is_json_response_enabled=False, event_store=store)
-    streams = transport._request_streams
-
-    async with transport.connect() as (_read_stream, write_stream):
-        # POST handler step: mint priming for "A" before dispatch.
-        priming = await transport._mint_priming_event("A", "2025-11-25")
-        assert priming is not None
-        streams["A"] = anyio.create_memory_object_stream[EventMessage](REQUEST_STREAM_BUFFER_SIZE)
-        a_send, a_recv = streams["A"]
-
-        # Server emits 5 messages for "A" with no sse_writer scheduled. Each
-        # write_stream.send() rendezvous-hands to message_router, which stores
-        # then deposits into A's buffer; reading them back proves the router
-        # has finished storing.
-        for i in range(5):
-            await write_stream.send(SessionMessage(JSONRPCResponse(jsonrpc="2.0", id="A", result={"n": i})))
-        with anyio.fail_after(5):
-            for _ in range(5):
-                await a_recv.receive()
-        await a_recv.aclose()
-        await a_send.aclose()
-
-    assert store.stored[0] == ("A", None)
-    assert [sid for sid, _ in store.stored] == ["A"] * 6
-    assert all(msg is not None for _, msg in store.stored[1:])
-
-
 @pytest.mark.anyio
 async def test_priming_store_failure_leaves_no_per_request_state() -> None:
     """`EventStore.store_event` raising on the priming row must not leak per-request entries."""