synapse-old/synapse/util/ratelimitutils.py

# -*- coding: utf-8 -*-
# Copyright 2015, 2016 OpenMarket Ltd
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

import collections
import contextlib
import logging

from twisted.internet import defer

from synapse.api.errors import LimitExceededError
from synapse.logging.context import (
    PreserveLoggingContext,
    make_deferred_yieldable,
    run_in_background,
)

logger = logging.getLogger(__name__)


class FederationRateLimiter(object):
    def __init__(self, clock, config):
        """
        Args:
            clock (Clock)
            config (FederationRateLimitConfig)
        """

        def new_limiter():
            return _PerHostRatelimiter(clock=clock, config=config)

        self.ratelimiters = collections.defaultdict(new_limiter)

    def ratelimit(self, host):
        """Used to ratelimit an incoming request from a given host

        Example usage:

            with rate_limiter.ratelimit(origin) as wait_deferred:
                yield wait_deferred
                # Handle request ...

        Args:
            host (str): Origin of incoming request.

        Returns:
            context manager which returns a deferred.
        """
        return self.ratelimiters[host].ratelimit()


class _PerHostRatelimiter(object):
    def __init__(self, clock, config):
        """
        Args:
            clock (Clock)
            config (FederationRateLimitConfig)
        """
        self.clock = clock

        self.window_size = config.window_size
        self.sleep_limit = config.sleep_limit
        self.sleep_sec = config.sleep_delay / 1000.0
        self.reject_limit = config.reject_limit
        self.concurrent_requests = config.concurrent

        # request_id objects for requests which have been slept
        self.sleeping_requests = set()

        # map from request_id object to Deferred for requests which are ready
        # for processing but have been queued
        self.ready_request_queue = collections.OrderedDict()

        # request id objects for requests which are in progress
        self.current_processing = set()

        # times at which we have recently (within the last window_size ms)
        # received requests.
        self.request_times = []

    @contextlib.contextmanager
    def ratelimit(self):
        # `contextlib.contextmanager` takes a generator and turns it into a
        # context manager. The generator should only yield once with a value
        # to be returned by manager.
        # Exceptions will be reraised at the yield.

        request_id = object()
        ret = self._on_enter(request_id)
        try:
            yield ret
        finally:
            self._on_exit(request_id)

    def _on_enter(self, request_id):
        time_now = self.clock.time_msec()

        # remove any entries from request_times which aren't within the window
        self.request_times[:] = [
            r for r in self.request_times if time_now - r < self.window_size
        ]

        # reject the request if we already have too many queued up (either
        # sleeping or in the ready queue).
        queue_size = len(self.ready_request_queue) + len(self.sleeping_requests)
        if queue_size > self.reject_limit:
            raise LimitExceededError(
                retry_after_ms=int(self.window_size / self.sleep_limit)
            )

        self.request_times.append(time_now)

        def queue_request():
            if len(self.current_processing) >= self.concurrent_requests:
                queue_defer = defer.Deferred()
                self.ready_request_queue[request_id] = queue_defer
                logger.info(
                    "Ratelimiter: queueing request (queue now %i items)",
                    len(self.ready_request_queue),
                )

                return queue_defer
            else:
                return defer.succeed(None)

        logger.debug(
            "Ratelimit [%s]: len(self.request_times)=%d",
            id(request_id),
            len(self.request_times),
        )

        if len(self.request_times) > self.sleep_limit:
            logger.debug("Ratelimiter: sleeping request for %f sec", self.sleep_sec)
            ret_defer = run_in_background(self.clock.sleep, self.sleep_sec)

            self.sleeping_requests.add(request_id)

            def on_wait_finished(_):
                logger.debug("Ratelimit [%s]: Finished sleeping", id(request_id))
                self.sleeping_requests.discard(request_id)
                queue_defer = queue_request()
                return queue_defer

            ret_defer.addBoth(on_wait_finished)
        else:
            ret_defer = queue_request()

        def on_start(r):
            logger.debug("Ratelimit [%s]: Processing req", id(request_id))
            self.current_processing.add(request_id)
            return r

        def on_err(r):
            # XXX: why is this necessary? this is called before we start
            # processing the request so why would the request be in
            # current_processing?
            self.current_processing.discard(request_id)
            return r

        def on_both(r):
            # Ensure that we've properly cleaned up.
            self.sleeping_requests.discard(request_id)
            self.ready_request_queue.pop(request_id, None)
            return r

        ret_defer.addCallbacks(on_start, on_err)
        ret_defer.addBoth(on_both)
        return make_deferred_yieldable(ret_defer)

    def _on_exit(self, request_id):
        logger.debug("Ratelimit [%s]: Processed req", id(request_id))
        self.current_processing.discard(request_id)
        try:
            # start processing the next item on the queue.
            _, deferred = self.ready_request_queue.popitem(last=False)

            with PreserveLoggingContext():
                deferred.callback(None)
        except KeyError:
            pass
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`# -- coding: utf-8 --`
copyrights 2016-01-06 21:26:29 -07:00			`# Copyright 2015, 2016 OpenMarket Ltd`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`#`
			`# Licensed under the Apache License, Version 2.0 (the "License");`
			`# you may not use this file except in compliance with the License.`
			`# You may obtain a copy of the License at`
			`#`
			`# http://www.apache.org/licenses/LICENSE-2.0`
			`#`
			`# Unless required by applicable law or agreed to in writing, software`
			`# distributed under the License is distributed on an "AS IS" BASIS,`
			`# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.`
			`# See the License for the specific language governing permissions and`
			`# limitations under the License.`

run isort 2018-07-09 00:09:20 -06:00			`import collections`
			`import contextlib`
			`import logging`

Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`from twisted.internet import defer`

			`from synapse.api.errors import LimitExceededError`
Move logging utilities out of the side drawer of util/ and into logging/ (#5606) 2019-07-03 08:07:04 -06:00			`from synapse.logging.context import (`
Fix logcontext leaks in rate limiter 2018-05-03 04:16:36 -06:00			`PreserveLoggingContext,`
run isort 2018-07-09 00:09:20 -06:00			`make_deferred_yieldable,`
			`run_in_background,`
Fix logcontext leaks in rate limiter 2018-05-03 04:16:36 -06:00			`)`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00
			`logger = logging.getLogger(__name__)`


			`class FederationRateLimiter(object):`
Make all the rate limiting options more consistent (#5181) 2019-05-15 11:06:04 -06:00			`def __init__(self, clock, config):`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`"""`
			`Args:`
			`clock (Clock)`
Make all the rate limiting options more consistent (#5181) 2019-05-15 11:06:04 -06:00			`config (FederationRateLimitConfig)`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`"""`
Fixes to the federation rate limiter (#5621) - Put the default window_size back to 1000ms (broken by #5181) - Make the `rc_federation` config actually do something - fix an off-by-one error in the 'concurrent' limit - Avoid creating an unused `_PerHostRatelimiter` object for every single incoming request 2019-07-05 04:10:19 -06:00
			`def new_limiter():`
			`return _PerHostRatelimiter(clock=clock, config=config)`

			`self.ratelimiters = collections.defaultdict(new_limiter)`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00
			`def ratelimit(self, host):`
Performance improvements and refactor of Ratelimiter (#7595) While working on https://github.com/matrix-org/synapse/issues/5665 I found myself digging into the `Ratelimiter` class and seeing that it was both: * Rather undocumented, and * causing a lot of config checks This PR attempts to refactor and comment the `Ratelimiter` class, as well as encourage config file accesses to only be done at instantiation. Best to be reviewed commit-by-commit. 2020-06-05 03:47:20 -06:00			`"""Used to ratelimit an incoming request from a given host`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00
			`Example usage:`

			`with rate_limiter.ratelimit(origin) as wait_deferred:`
			`yield wait_deferred`
			`# Handle request ...`

			`Args:`
			`host (str): Origin of incoming request.`

			`Returns:`
Fixes to the federation rate limiter (#5621) - Put the default window_size back to 1000ms (broken by #5181) - Make the `rc_federation` config actually do something - fix an off-by-one error in the 'concurrent' limit - Avoid creating an unused `_PerHostRatelimiter` object for every single incoming request 2019-07-05 04:10:19 -06:00			`context manager which returns a deferred.`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`"""`
Fixes to the federation rate limiter (#5621) - Put the default window_size back to 1000ms (broken by #5181) - Make the `rc_federation` config actually do something - fix an off-by-one error in the 'concurrent' limit - Avoid creating an unused `_PerHostRatelimiter` object for every single incoming request 2019-07-05 04:10:19 -06:00			`return self.ratelimiters[host].ratelimit()`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00

			`class _PerHostRatelimiter(object):`
Make all the rate limiting options more consistent (#5181) 2019-05-15 11:06:04 -06:00			`def __init__(self, clock, config):`
			`"""`
			`Args:`
			`clock (Clock)`
			`config (FederationRateLimitConfig)`
			`"""`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`self.clock = clock`

Make all the rate limiting options more consistent (#5181) 2019-05-15 11:06:04 -06:00			`self.window_size = config.window_size`
			`self.sleep_limit = config.sleep_limit`
			`self.sleep_sec = config.sleep_delay / 1000.0`
			`self.reject_limit = config.reject_limit`
			`self.concurrent_requests = config.concurrent`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00
Make FederationRateLimiter queue requests properly popitem removes the most recent item by default [1]. We want the oldest. Fixes #3524 [1]: https://docs.python.org/2/library/collections.html#collections.OrderedDict.popitem 2018-07-13 09:19:40 -06:00			`# request_id objects for requests which have been slept`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`self.sleeping_requests = set()`
Make FederationRateLimiter queue requests properly popitem removes the most recent item by default [1]. We want the oldest. Fixes #3524 [1]: https://docs.python.org/2/library/collections.html#collections.OrderedDict.popitem 2018-07-13 09:19:40 -06:00
			`# map from request_id object to Deferred for requests which are ready`
			`# for processing but have been queued`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`self.ready_request_queue = collections.OrderedDict()`
Make FederationRateLimiter queue requests properly popitem removes the most recent item by default [1]. We want the oldest. Fixes #3524 [1]: https://docs.python.org/2/library/collections.html#collections.OrderedDict.popitem 2018-07-13 09:19:40 -06:00
			`# request id objects for requests which are in progress`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`self.current_processing = set()`
Make FederationRateLimiter queue requests properly popitem removes the most recent item by default [1]. We want the oldest. Fixes #3524 [1]: https://docs.python.org/2/library/collections.html#collections.OrderedDict.popitem 2018-07-13 09:19:40 -06:00
			`# times at which we have recently (within the last window_size ms)`
			`# received requests.`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`self.request_times = []`

Use contextlib.contextmanager instead of a custom class 2015-03-02 06:32:44 -07:00			`@contextlib.contextmanager`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`def ratelimit(self):`
Use contextlib.contextmanager instead of a custom class 2015-03-02 06:32:44 -07:00			# `contextlib.contextmanager` takes a generator and turns it into a
			`# context manager. The generator should only yield once with a value`
			`# to be returned by manager.`
			`# Exceptions will be reraised at the yield.`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00
Use contextlib.contextmanager instead of a custom class 2015-03-02 06:32:44 -07:00			`request_id = object()`
			`ret = self._on_enter(request_id)`
			`try:`
			`yield ret`
			`finally:`
			`self._on_exit(request_id)`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00
			`def _on_enter(self, request_id):`
			`time_now = self.clock.time_msec()`
Make FederationRateLimiter queue requests properly popitem removes the most recent item by default [1]. We want the oldest. Fixes #3524 [1]: https://docs.python.org/2/library/collections.html#collections.OrderedDict.popitem 2018-07-13 09:19:40 -06:00
			`# remove any entries from request_times which aren't within the window`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`self.request_times[:] = [`
Run Black. (#5482) 2019-06-20 03:32:02 -06:00			`r for r in self.request_times if time_now - r < self.window_size`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`]`

Make FederationRateLimiter queue requests properly popitem removes the most recent item by default [1]. We want the oldest. Fixes #3524 [1]: https://docs.python.org/2/library/collections.html#collections.OrderedDict.popitem 2018-07-13 09:19:40 -06:00			`# reject the request if we already have too many queued up (either`
			`# sleeping or in the ready queue).`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`queue_size = len(self.ready_request_queue) + len(self.sleeping_requests)`
			`if queue_size > self.reject_limit:`
			`raise LimitExceededError(`
Run Black. (#5482) 2019-06-20 03:32:02 -06:00			`retry_after_ms=int(self.window_size / self.sleep_limit)`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`)`

			`self.request_times.append(time_now)`

			`def queue_request():`
Fixes to the federation rate limiter (#5621) - Put the default window_size back to 1000ms (broken by #5181) - Make the `rc_federation` config actually do something - fix an off-by-one error in the 'concurrent' limit - Avoid creating an unused `_PerHostRatelimiter` object for every single incoming request 2019-07-05 04:10:19 -06:00			`if len(self.current_processing) >= self.concurrent_requests:`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`queue_defer = defer.Deferred()`
			`self.ready_request_queue[request_id] = queue_defer`
Make FederationRateLimiter queue requests properly popitem removes the most recent item by default [1]. We want the oldest. Fixes #3524 [1]: https://docs.python.org/2/library/collections.html#collections.OrderedDict.popitem 2018-07-13 09:19:40 -06:00			`logger.info(`
			`"Ratelimiter: queueing request (queue now %i items)",`
			`len(self.ready_request_queue),`
			`)`

Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`return queue_defer`
			`else:`
			`return defer.succeed(None)`

			`logger.debug(`
			`"Ratelimit [%s]: len(self.request_times)=%d",`
Run Black. (#5482) 2019-06-20 03:32:02 -06:00			`id(request_id),`
			`len(self.request_times),`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`)`

			`if len(self.request_times) > self.sleep_limit:`
Run Black. (#5482) 2019-06-20 03:32:02 -06:00			`logger.debug("Ratelimiter: sleeping request for %f sec", self.sleep_sec)`
Make FederationRateLimiter queue requests properly popitem removes the most recent item by default [1]. We want the oldest. Fixes #3524 [1]: https://docs.python.org/2/library/collections.html#collections.OrderedDict.popitem 2018-07-13 09:19:40 -06:00			`ret_defer = run_in_background(self.clock.sleep, self.sleep_sec)`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00
			`self.sleeping_requests.add(request_id)`

			`def on_wait_finished(_):`
Run Black. (#5482) 2019-06-20 03:32:02 -06:00			`logger.debug("Ratelimit [%s]: Finished sleeping", id(request_id))`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`self.sleeping_requests.discard(request_id)`
			`queue_defer = queue_request()`
			`return queue_defer`

			`ret_defer.addBoth(on_wait_finished)`
			`else:`
			`ret_defer = queue_request()`

			`def on_start(r):`
Run Black. (#5482) 2019-06-20 03:32:02 -06:00			`logger.debug("Ratelimit [%s]: Processing req", id(request_id))`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`self.current_processing.add(request_id)`
			`return r`

			`def on_err(r):`
Fix logcontext leaks in rate limiter 2018-05-03 04:16:36 -06:00			`# XXX: why is this necessary? this is called before we start`
			`# processing the request so why would the request be in`
			`# current_processing?`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`self.current_processing.discard(request_id)`
			`return r`

			`def on_both(r):`
			`# Ensure that we've properly cleaned up.`
			`self.sleeping_requests.discard(request_id)`
			`self.ready_request_queue.pop(request_id, None)`
			`return r`

			`ret_defer.addCallbacks(on_start, on_err)`
			`ret_defer.addBoth(on_both)`
Fix logcontext leaks in rate limiter 2018-05-03 04:16:36 -06:00			`return make_deferred_yieldable(ret_defer)`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00
			`def _on_exit(self, request_id):`
Run Black. (#5482) 2019-06-20 03:32:02 -06:00			`logger.debug("Ratelimit [%s]: Processed req", id(request_id))`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`self.current_processing.discard(request_id)`
			`try:`
Make FederationRateLimiter queue requests properly popitem removes the most recent item by default [1]. We want the oldest. Fixes #3524 [1]: https://docs.python.org/2/library/collections.html#collections.OrderedDict.popitem 2018-07-13 09:19:40 -06:00			`# start processing the next item on the queue.`
			`_, deferred = self.ready_request_queue.popitem(last=False)`
Fix logcontext leaks in rate limiter 2018-05-03 04:16:36 -06:00
			`with PreserveLoggingContext():`
			`deferred.callback(None)`
Move federation rate limiting out of transport layer 2015-02-27 08:41:52 -07:00			`except KeyError:`
			`pass`