improved performance by extracting accented chars to top level

2016-05-03 10:40:30 +10:00 · 2016-05-03 10:40:30 +10:00 · c587cbb793
parent 31c4448f6e
commit c587cbb793
1 changed files with 7 additions and 5 deletions
--- a/youtube_dl/utils.py
+++ b/youtube_dl/utils.py
@ -89,6 +89,11 @@ KNOWN_EXTENSIONS = (
    'wav',
    'f4f', 'f4m', 'm3u8', 'smil')
 # needed for sanitizing filenames in restricted mode
 ACCENT_CHARS = dict(zip('ÂÃÄÀÁÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþÿ',
                        itertools.chain('AAAAAA', ['AE'], 'CEEEEIIIIDNOOOOOOUUUUYP', ['ss'],
                                        'aaaaaa', ['ae'], 'ceeeeiiiionoooooouuuuypy')))
 def preferredencoding():
    """Get preferred encoding.
@ -365,11 +370,8 @@ def sanitize_filename(s, restricted=False, is_id=False):
    Set is_id if this is not an arbitrary string, but an ID that should be kept if possible
    """
    def replace_insane(char):
-        accents = dict(zip('ÂÃÄÀÁÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþÿ',
+        if restricted and char in ACCENT_CHARS:
-                           itertools.chain('AAAAAA', ['AE'], 'CEEEEIIIIDNOOOOOOUUUUYP', ['ss'],
+            return ACCENT_CHARS[char]
                                           'aaaaaa', ['ae'], 'ceeeeiiiionoooooouuuuypy')))
        if restricted and char in accents:
            return accents[char]
        if char == '?' or ord(char) < 32 or ord(char) == 127:
            return ''
        elif char == '"':