yt-dlp/yt_dlp/extractor/bilibili.py

import base64
import functools
import hashlib
import itertools
import math
import re
import time
import urllib.parse

from .common import InfoExtractor, SearchInfoExtractor
from ..dependencies import Cryptodome
from ..networking.exceptions import HTTPError
from ..utils import (
    ExtractorError,
    GeoRestrictedError,
    InAdvancePagedList,
    OnDemandPagedList,
    bool_or_none,
    filter_dict,
    float_or_none,
    format_field,
    int_or_none,
    join_nonempty,
    make_archive_id,
    merge_dicts,
    mimetype2ext,
    parse_count,
    parse_qs,
    qualities,
    smuggle_url,
    srt_subtitles_timecode,
    str_or_none,
    traverse_obj,
    try_call,
    unified_timestamp,
    unsmuggle_url,
    url_or_none,
    urlencode_postdata,
    variadic,
)


class BilibiliBaseIE(InfoExtractor):
    _FORMAT_ID_RE = re.compile(r'-(\d+)\.m4s\?')

    def extract_formats(self, play_info):
        format_names = {
            r['quality']: traverse_obj(r, 'new_description', 'display_desc')
            for r in traverse_obj(play_info, ('support_formats', lambda _, v: v['quality']))
        }

        audios = traverse_obj(play_info, ('dash', 'audio', ...))
        flac_audio = traverse_obj(play_info, ('dash', 'flac', 'audio'))
        if flac_audio:
            audios.append(flac_audio)
        formats = [{
            'url': traverse_obj(audio, 'baseUrl', 'base_url', 'url'),
            'ext': mimetype2ext(traverse_obj(audio, 'mimeType', 'mime_type')),
            'acodec': audio.get('codecs'),
            'vcodec': 'none',
            'tbr': float_or_none(audio.get('bandwidth'), scale=1000),
            'filesize': int_or_none(audio.get('size')),
            'format_id': str_or_none(audio.get('id')),
        } for audio in audios]

        formats.extend({
            'url': traverse_obj(video, 'baseUrl', 'base_url', 'url'),
            'ext': mimetype2ext(traverse_obj(video, 'mimeType', 'mime_type')),
            'fps': float_or_none(traverse_obj(video, 'frameRate', 'frame_rate')),
            'width': int_or_none(video.get('width')),
            'height': int_or_none(video.get('height')),
            'vcodec': video.get('codecs'),
            'acodec': 'none' if audios else None,
            'tbr': float_or_none(video.get('bandwidth'), scale=1000),
            'filesize': int_or_none(video.get('size')),
            'quality': int_or_none(video.get('id')),
            'format_id': traverse_obj(
                video, (('baseUrl', 'base_url'), {self._FORMAT_ID_RE.search}, 1),
                ('id', {str_or_none}), get_all=False),
            'format': format_names.get(video.get('id')),
        } for video in traverse_obj(play_info, ('dash', 'video', ...)))

        missing_formats = format_names.keys() - set(traverse_obj(formats, (..., 'quality')))
        if missing_formats:
            self.to_screen(f'Format(s) {", ".join(format_names[i] for i in missing_formats)} are missing; '
                           f'you have to login or become premium member to download them. {self._login_hint()}')

        return formats

    def json2srt(self, json_data):
        srt_data = ''
        for idx, line in enumerate(json_data.get('body') or []):
            srt_data += (f'{idx + 1}\n'
                         f'{srt_subtitles_timecode(line["from"])} --> {srt_subtitles_timecode(line["to"])}\n'
                         f'{line["content"]}\n\n')
        return srt_data

    def _get_subtitles(self, video_id, aid, cid):
        subtitles = {
            'danmaku': [{
                'ext': 'xml',
                'url': f'https://comment.bilibili.com/{cid}.xml',
            }]
        }

        video_info_json = self._download_json(f'https://api.bilibili.com/x/player/v2?aid={aid}&cid={cid}', video_id)
        for s in traverse_obj(video_info_json, ('data', 'subtitle', 'subtitles', ...)):
            subtitles.setdefault(s['lan'], []).append({
                'ext': 'srt',
                'data': self.json2srt(self._download_json(s['subtitle_url'], video_id))
            })
        return subtitles

    def _get_chapters(self, aid, cid):
        chapters = aid and cid and self._download_json(
            'https://api.bilibili.com/x/player/v2', aid, query={'aid': aid, 'cid': cid},
            note='Extracting chapters', fatal=False)
        return traverse_obj(chapters, ('data', 'view_points', ..., {
            'title': 'content',
            'start_time': 'from',
            'end_time': 'to',
        })) or None

    def _get_comments(self, aid):
        for idx in itertools.count(1):
            replies = traverse_obj(
                self._download_json(
                    f'https://api.bilibili.com/x/v2/reply?pn={idx}&oid={aid}&type=1&jsonp=jsonp&sort=2&_=1567227301685',
                    aid, note=f'Extracting comments from page {idx}', fatal=False),
                ('data', 'replies'))
            if not replies:
                return
            for children in map(self._get_all_children, replies):
                yield from children

    def _get_all_children(self, reply):
        yield {
            'author': traverse_obj(reply, ('member', 'uname')),
            'author_id': traverse_obj(reply, ('member', 'mid')),
            'id': reply.get('rpid'),
            'text': traverse_obj(reply, ('content', 'message')),
            'timestamp': reply.get('ctime'),
            'parent': reply.get('parent') or 'root',
        }
        for children in map(self._get_all_children, traverse_obj(reply, ('replies', ...))):
            yield from children

    def _get_episodes_from_season(self, ss_id, url):
        season_info = self._download_json(
            'https://api.bilibili.com/pgc/web/season/section', ss_id,
            note='Downloading season info', query={'season_id': ss_id},
            headers={'Referer': url, **self.geo_verification_headers()})

        for entry in traverse_obj(season_info, (
                'result', 'main_section', 'episodes',
                lambda _, v: url_or_none(v['share_url']) and v['id'])):
            yield self.url_result(entry['share_url'], BiliBiliBangumiIE, f'ep{entry["id"]}')


class BiliBiliIE(BilibiliBaseIE):
    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/(?:video/|festival/\w+\?(?:[^#]*&)?bvid=)[aAbB][vV](?P<id>[^/?#&]+)'

    _TESTS = [{
        'url': 'https://www.bilibili.com/video/BV13x41117TL',
        'info_dict': {
            'id': 'BV13x41117TL',
            'title': '阿滴英文｜英文歌分享#6 "Closer',
            'ext': 'mp4',
            'description': '滴妹今天唱Closer給你聽! 有史以来，被推最多次也是最久的歌曲，其实歌词跟我原本想像差蛮多的，不过还是好听！ 微博@阿滴英文',
            'uploader_id': '65880958',
            'uploader': '阿滴英文',
            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
            'duration': 554.117,
            'tags': list,
            'comment_count': int,
            'upload_date': '20170301',
            'timestamp': 1488353834,
            'like_count': int,
            'view_count': int,
        },
    }, {
        # old av URL version
        'url': 'http://www.bilibili.com/video/av1074402/',
        'info_dict': {
            'thumbnail': r're:^https?://.*\.(jpg|jpeg)$',
            'ext': 'mp4',
            'uploader': '菊子桑',
            'uploader_id': '156160',
            'id': 'BV11x411K7CN',
            'title': '【金坷垃】金泡沫',
            'duration': 308.36,
            'upload_date': '20140420',
            'timestamp': 1397983878,
            'description': 'md5:ce18c2a2d2193f0df2917d270f2e5923',
            'like_count': int,
            'comment_count': int,
            'view_count': int,
            'tags': list,
        },
        'params': {'skip_download': True},
    }, {
        'note': 'Anthology',
        'url': 'https://www.bilibili.com/video/BV1bK411W797',
        'info_dict': {
            'id': 'BV1bK411W797',
            'title': '物语中的人物是如何吐槽自己的OP的'
        },
        'playlist_count': 18,
        'playlist': [{
            'info_dict': {
                'id': 'BV1bK411W797_p1',
                'ext': 'mp4',
                'title': '物语中的人物是如何吐槽自己的OP的 p01 Staple Stable/战场原+羽川',
                'tags': 'count:11',
                'timestamp': 1589601697,
                'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
                'uploader': '打牌还是打桩',
                'uploader_id': '150259984',
                'like_count': int,
                'comment_count': int,
                'upload_date': '20200516',
                'view_count': int,
                'description': 'md5:e3c401cf7bc363118d1783dd74068a68',
                'duration': 90.314,
            }
        }]
    }, {
        'note': 'Specific page of Anthology',
        'url': 'https://www.bilibili.com/video/BV1bK411W797?p=1',
        'info_dict': {
            'id': 'BV1bK411W797_p1',
            'ext': 'mp4',
            'title': '物语中的人物是如何吐槽自己的OP的 p01 Staple Stable/战场原+羽川',
            'tags': 'count:11',
            'timestamp': 1589601697,
            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
            'uploader': '打牌还是打桩',
            'uploader_id': '150259984',
            'like_count': int,
            'comment_count': int,
            'upload_date': '20200516',
            'view_count': int,
            'description': 'md5:e3c401cf7bc363118d1783dd74068a68',
            'duration': 90.314,
        }
    }, {
        'note': 'video has subtitles',
        'url': 'https://www.bilibili.com/video/BV12N4y1M7rh',
        'info_dict': {
            'id': 'BV12N4y1M7rh',
            'ext': 'mp4',
            'title': 'md5:96e8bb42c2b432c0d4ce3434a61479c1',
            'tags': list,
            'description': 'md5:afde2b7ba9025c01d9e3dde10de221e4',
            'duration': 313.557,
            'upload_date': '20220709',
            'uploader': '小夫太渴',
            'timestamp': 1657347907,
            'uploader_id': '1326814124',
            'comment_count': int,
            'view_count': int,
            'like_count': int,
            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
            'subtitles': 'count:2'
        },
        'params': {'listsubtitles': True},
    }, {
        'url': 'https://www.bilibili.com/video/av8903802/',
        'info_dict': {
            'id': 'BV13x41117TL',
            'ext': 'mp4',
            'title': '阿滴英文｜英文歌分享#6 "Closer',
            'upload_date': '20170301',
            'description': 'md5:3b1b9e25b78da4ef87e9b548b88ee76a',
            'timestamp': 1488353834,
            'uploader_id': '65880958',
            'uploader': '阿滴英文',
            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
            'duration': 554.117,
            'tags': list,
            'comment_count': int,
            'view_count': int,
            'like_count': int,
        },
        'params': {
            'skip_download': True,
        },
    }, {
        'note': 'video has chapter',
        'url': 'https://www.bilibili.com/video/BV1vL411G7N7/',
        'info_dict': {
            'id': 'BV1vL411G7N7',
            'ext': 'mp4',
            'title': '如何为你的B站视频添加进度条分段',
            'timestamp': 1634554558,
            'upload_date': '20211018',
            'description': 'md5:a9a3d6702b3a94518d419b2e9c320a6d',
            'tags': list,
            'uploader': '爱喝咖啡的当麻',
            'duration': 669.482,
            'uploader_id': '1680903',
            'chapters': 'count:6',
            'comment_count': int,
            'view_count': int,
            'like_count': int,
            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
        },
        'params': {'skip_download': True},
    }, {
        'note': 'video redirects to festival page',
        'url': 'https://www.bilibili.com/video/BV1wP4y1P72h',
        'info_dict': {
            'id': 'BV1wP4y1P72h',
            'ext': 'mp4',
            'title': '牛虎年相交之际，一首传统民族打击乐《牛斗虎》祝大家新春快乐，虎年大吉！【bilibili音乐虎闹新春】',
            'timestamp': 1643947497,
            'upload_date': '20220204',
            'description': 'md5:8681a0d4d2c06b4ae27e59c8080a7fe6',
            'uploader': '叨叨冯聊音乐',
            'duration': 246.719,
            'uploader_id': '528182630',
            'view_count': int,
            'like_count': int,
            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
        },
        'params': {'skip_download': True},
    }, {
        'note': 'newer festival video',
        'url': 'https://www.bilibili.com/festival/2023honkaiimpact3gala?bvid=BV1ay4y1d77f',
        'info_dict': {
            'id': 'BV1ay4y1d77f',
            'ext': 'mp4',
            'title': '【崩坏3新春剧场】为特别的你送上祝福！',
            'timestamp': 1674273600,
            'upload_date': '20230121',
            'description': 'md5:58af66d15c6a0122dc30c8adfd828dd8',
            'uploader': '果蝇轰',
            'duration': 1111.722,
            'uploader_id': '8469526',
            'view_count': int,
            'like_count': int,
            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
        },
        'params': {'skip_download': True},
    }]

    def _real_extract(self, url):
        video_id = self._match_id(url)
        webpage = self._download_webpage(url, video_id)
        initial_state = self._search_json(r'window\.__INITIAL_STATE__\s*=', webpage, 'initial state', video_id)

        is_festival = 'videoData' not in initial_state
        if is_festival:
            video_data = initial_state['videoInfo']
        else:
            play_info = self._search_json(r'window\.__playinfo__\s*=', webpage, 'play info', video_id)['data']
            video_data = initial_state['videoData']

        video_id, title = video_data['bvid'], video_data.get('title')

        # Bilibili anthologies are similar to playlists but all videos share the same video ID as the anthology itself.
        page_list_json = not is_festival and traverse_obj(
            self._download_json(
                'https://api.bilibili.com/x/player/pagelist', video_id,
                fatal=False, query={'bvid': video_id, 'jsonp': 'jsonp'},
                note='Extracting videos in anthology'),
            'data', expected_type=list) or []
        is_anthology = len(page_list_json) > 1

        part_id = int_or_none(parse_qs(url).get('p', [None])[-1])
        if is_anthology and not part_id and self._yes_playlist(video_id, video_id):
            return self.playlist_from_matches(
                page_list_json, video_id, title, ie=BiliBiliIE,
                getter=lambda entry: f'https://www.bilibili.com/video/{video_id}?p={entry["page"]}')

        if is_anthology:
            part_id = part_id or 1
            title += f' p{part_id:02d} {traverse_obj(page_list_json, (part_id - 1, "part")) or ""}'

        aid = video_data.get('aid')
        old_video_id = format_field(aid, None, f'%s_part{part_id or 1}')

        cid = traverse_obj(video_data, ('pages', part_id - 1, 'cid')) if part_id else video_data.get('cid')

        festival_info = {}
        if is_festival:
            play_info = self._download_json(
                'https://api.bilibili.com/x/player/playurl', video_id,
                query={'bvid': video_id, 'cid': cid, 'fnval': 4048},
                note='Extracting festival video formats')['data']

            festival_info = traverse_obj(initial_state, {
                'uploader': ('videoInfo', 'upName'),
                'uploader_id': ('videoInfo', 'upMid', {str_or_none}),
                'like_count': ('videoStatus', 'like', {int_or_none}),
                'thumbnail': ('sectionEpisodes', lambda _, v: v['bvid'] == video_id, 'cover'),
            }, get_all=False)

        return {
            **traverse_obj(initial_state, {
                'uploader': ('upData', 'name'),
                'uploader_id': ('upData', 'mid', {str_or_none}),
                'like_count': ('videoData', 'stat', 'like', {int_or_none}),
                'tags': ('tags', ..., 'tag_name'),
                'thumbnail': ('videoData', 'pic', {url_or_none}),
            }),
            **festival_info,
            **traverse_obj(video_data, {
                'description': 'desc',
                'timestamp': ('pubdate', {int_or_none}),
                'view_count': (('viewCount', ('stat', 'view')), {int_or_none}),
                'comment_count': ('stat', 'reply', {int_or_none}),
            }, get_all=False),
            'id': f'{video_id}{format_field(part_id, None, "_p%d")}',
            'formats': self.extract_formats(play_info),
            '_old_archive_ids': [make_archive_id(self, old_video_id)] if old_video_id else None,
            'title': title,
            'duration': float_or_none(play_info.get('timelength'), scale=1000),
            'chapters': self._get_chapters(aid, cid),
            'subtitles': self.extract_subtitles(video_id, aid, cid),
            '__post_extractor': self.extract_comments(aid),
            'http_headers': {'Referer': url},
        }


class BiliBiliBangumiIE(BilibiliBaseIE):
    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/bangumi/play/(?P<id>ep\d+)'

    _TESTS = [{
        'url': 'https://www.bilibili.com/bangumi/play/ep267851',
        'info_dict': {
            'id': '267851',
            'ext': 'mp4',
            'series': '鬼灭之刃',
            'series_id': '4358',
            'season': '鬼灭之刃',
            'season_id': '26801',
            'season_number': 1,
            'episode': '残酷',
            'episode_id': '267851',
            'episode_number': 1,
            'title': '1 残酷',
            'duration': 1425.256,
            'timestamp': 1554566400,
            'upload_date': '20190406',
            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$'
        },
        'skip': 'According to the copyright owner\'s request, you may only watch the video after you are premium member.'
    }]

    def _real_extract(self, url):
        video_id = self._match_id(url)
        episode_id = video_id[2:]
        webpage = self._download_webpage(url, video_id)

        if '您所在的地区无法观看本片' in webpage:
            raise GeoRestrictedError('This video is restricted')
        elif '正在观看预览，大会员免费看全片' in webpage:
            self.raise_login_required('This video is for premium members only')

        headers = {'Referer': url, **self.geo_verification_headers()}
        play_info = self._download_json(
            'https://api.bilibili.com/pgc/player/web/v2/playurl', video_id,
            'Extracting episode', query={'fnval': '4048', 'ep_id': episode_id},
            headers=headers)
        premium_only = play_info.get('code') == -10403
        play_info = traverse_obj(play_info, ('result', 'video_info', {dict})) or {}

        formats = self.extract_formats(play_info)
        if not formats and (premium_only or '成为大会员抢先看' in webpage or '开通大会员观看' in webpage):
            self.raise_login_required('This video is for premium members only')

        bangumi_info = self._download_json(
            'https://api.bilibili.com/pgc/view/web/season', video_id, 'Get episode details',
            query={'ep_id': episode_id}, headers=headers)['result']

        episode_number, episode_info = next((
            (idx, ep) for idx, ep in enumerate(traverse_obj(
                bangumi_info, ('episodes', ..., {dict})), 1)
            if str_or_none(ep.get('id')) == episode_id), (1, {}))

        season_id = bangumi_info.get('season_id')
        season_number = season_id and next((
            idx + 1 for idx, e in enumerate(
                traverse_obj(bangumi_info, ('seasons', ...)))
            if e.get('season_id') == season_id
        ), None)

        aid = episode_info.get('aid')

        return {
            'id': video_id,
            'formats': formats,
            **traverse_obj(bangumi_info, {
                'series': ('series', 'series_title', {str}),
                'series_id': ('series', 'series_id', {str_or_none}),
                'thumbnail': ('square_cover', {url_or_none}),
            }),
            'title': join_nonempty('title', 'long_title', delim=' ', from_dict=episode_info),
            'episode': episode_info.get('long_title'),
            'episode_id': episode_id,
            'episode_number': int_or_none(episode_info.get('title')) or episode_number,
            'season_id': str_or_none(season_id),
            'season_number': season_number,
            'timestamp': int_or_none(episode_info.get('pub_time')),
            'duration': float_or_none(play_info.get('timelength'), scale=1000),
            'subtitles': self.extract_subtitles(video_id, aid, episode_info.get('cid')),
            '__post_extractor': self.extract_comments(aid),
            'http_headers': headers,
        }


class BiliBiliBangumiMediaIE(BilibiliBaseIE):
    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/bangumi/media/md(?P<id>\d+)'
    _TESTS = [{
        'url': 'https://www.bilibili.com/bangumi/media/md24097891',
        'info_dict': {
            'id': '24097891',
        },
        'playlist_mincount': 25,
    }]

    def _real_extract(self, url):
        media_id = self._match_id(url)
        webpage = self._download_webpage(url, media_id)
        ss_id = self._search_json(
            r'window\.__INITIAL_STATE__\s*=', webpage, 'initial_state', media_id)['mediaInfo']['season_id']

        return self.playlist_result(self._get_episodes_from_season(ss_id, url), media_id)


class BiliBiliBangumiSeasonIE(BilibiliBaseIE):
    _VALID_URL = r'(?x)https?://(?:www\.)?bilibili\.com/bangumi/play/ss(?P<id>\d+)'
    _TESTS = [{
        'url': 'https://www.bilibili.com/bangumi/play/ss26801',
        'info_dict': {
            'id': '26801'
        },
        'playlist_mincount': 26
    }]

    def _real_extract(self, url):
        ss_id = self._match_id(url)

        return self.playlist_result(self._get_episodes_from_season(ss_id, url), ss_id)


class BilibiliSpaceBaseIE(InfoExtractor):
    def _extract_playlist(self, fetch_page, get_metadata, get_entries):
        first_page = fetch_page(0)
        metadata = get_metadata(first_page)

        paged_list = InAdvancePagedList(
            lambda idx: get_entries(fetch_page(idx) if idx else first_page),
            metadata['page_count'], metadata['page_size'])

        return metadata, paged_list


class BilibiliSpaceVideoIE(BilibiliSpaceBaseIE):
    _VALID_URL = r'https?://space\.bilibili\.com/(?P<id>\d+)(?P<video>/video)?/?(?:[?#]|$)'
    _TESTS = [{
        'url': 'https://space.bilibili.com/3985676/video',
        'info_dict': {
            'id': '3985676',
        },
        'playlist_mincount': 178,
    }, {
        'url': 'https://space.bilibili.com/313580179/video',
        'info_dict': {
            'id': '313580179',
        },
        'playlist_mincount': 92,
    }]

    def _extract_signature(self, playlist_id):
        session_data = self._download_json('https://api.bilibili.com/x/web-interface/nav', playlist_id, fatal=False)

        key_from_url = lambda x: x[x.rfind('/') + 1:].split('.')[0]
        img_key = traverse_obj(
            session_data, ('data', 'wbi_img', 'img_url', {key_from_url})) or '34478ba821254d9d93542680e3b86100'
        sub_key = traverse_obj(
            session_data, ('data', 'wbi_img', 'sub_url', {key_from_url})) or '7e16a90d190a4355a78fd00b32a38de6'

        session_key = img_key + sub_key

        signature_values = []
        for position in (
            46, 47, 18, 2, 53, 8, 23, 32, 15, 50, 10, 31, 58, 3, 45, 35, 27, 43, 5, 49, 33, 9, 42, 19, 29, 28, 14, 39,
            12, 38, 41, 13, 37, 48, 7, 16, 24, 55, 40, 61, 26, 17, 0, 1, 60, 51, 30, 4, 22, 25, 54, 21, 56, 59, 6, 63,
            57, 62, 11, 36, 20, 34, 44, 52
        ):
            char_at_position = try_call(lambda: session_key[position])
            if char_at_position:
                signature_values.append(char_at_position)

        return ''.join(signature_values)[:32]

    def _real_extract(self, url):
        playlist_id, is_video_url = self._match_valid_url(url).group('id', 'video')
        if not is_video_url:
            self.to_screen('A channel URL was given. Only the channel\'s videos will be downloaded. '
                           'To download audios, add a "/audio" to the URL')

        signature = self._extract_signature(playlist_id)

        def fetch_page(page_idx):
            query = {
                'keyword': '',
                'mid': playlist_id,
                'order': 'pubdate',
                'order_avoided': 'true',
                'platform': 'web',
                'pn': page_idx + 1,
                'ps': 30,
                'tid': 0,
                'web_location': 1550101,
                'wts': int(time.time()),
            }
            query['w_rid'] = hashlib.md5(f'{urllib.parse.urlencode(query)}{signature}'.encode()).hexdigest()

            try:
                response = self._download_json('https://api.bilibili.com/x/space/wbi/arc/search',
                                               playlist_id, note=f'Downloading page {page_idx}', query=query)
            except ExtractorError as e:
                if isinstance(e.cause, HTTPError) and e.cause.status == 412:
                    raise ExtractorError(
                        'Request is blocked by server (412), please add cookies, wait and try later.', expected=True)
                raise
            if response['code'] == -401:
                raise ExtractorError(
                    'Request is blocked by server (401), please add cookies, wait and try later.', expected=True)
            return response['data']

        def get_metadata(page_data):
            page_size = page_data['page']['ps']
            entry_count = page_data['page']['count']
            return {
                'page_count': math.ceil(entry_count / page_size),
                'page_size': page_size,
            }

        def get_entries(page_data):
            for entry in traverse_obj(page_data, ('list', 'vlist')) or []:
                yield self.url_result(f'https://www.bilibili.com/video/{entry["bvid"]}', BiliBiliIE, entry['bvid'])

        metadata, paged_list = self._extract_playlist(fetch_page, get_metadata, get_entries)
        return self.playlist_result(paged_list, playlist_id)


class BilibiliSpaceAudioIE(BilibiliSpaceBaseIE):
    _VALID_URL = r'https?://space\.bilibili\.com/(?P<id>\d+)/audio'
    _TESTS = [{
        'url': 'https://space.bilibili.com/313580179/audio',
        'info_dict': {
            'id': '313580179',
        },
        'playlist_mincount': 1,
    }]

    def _real_extract(self, url):
        playlist_id = self._match_id(url)

        def fetch_page(page_idx):
            return self._download_json(
                'https://api.bilibili.com/audio/music-service/web/song/upper', playlist_id,
                note=f'Downloading page {page_idx}',
                query={'uid': playlist_id, 'pn': page_idx + 1, 'ps': 30, 'order': 1, 'jsonp': 'jsonp'})['data']

        def get_metadata(page_data):
            return {
                'page_count': page_data['pageCount'],
                'page_size': page_data['pageSize'],
            }

        def get_entries(page_data):
            for entry in page_data.get('data', []):
                yield self.url_result(f'https://www.bilibili.com/audio/au{entry["id"]}', BilibiliAudioIE, entry['id'])

        metadata, paged_list = self._extract_playlist(fetch_page, get_metadata, get_entries)
        return self.playlist_result(paged_list, playlist_id)


class BilibiliSpaceListBaseIE(BilibiliSpaceBaseIE):
    def _get_entries(self, page_data, bvid_keys, ending_key='bvid'):
        for bvid in traverse_obj(page_data, (*variadic(bvid_keys, (str, bytes, dict, set)), ..., ending_key, {str})):
            yield self.url_result(f'https://www.bilibili.com/video/{bvid}', BiliBiliIE, bvid)

    def _get_uploader(self, uid, playlist_id):
        webpage = self._download_webpage(f'https://space.bilibili.com/{uid}', playlist_id, fatal=False)
        return self._search_regex(r'(?s)<title\b[^>]*>([^<]+)的个人空间-', webpage, 'uploader', fatal=False)

    def _extract_playlist(self, fetch_page, get_metadata, get_entries):
        metadata, page_list = super()._extract_playlist(fetch_page, get_metadata, get_entries)
        metadata.pop('page_count', None)
        metadata.pop('page_size', None)
        return metadata, page_list


class BilibiliCollectionListIE(BilibiliSpaceListBaseIE):
    _VALID_URL = r'https?://space\.bilibili\.com/(?P<mid>\d+)/channel/collectiondetail/?\?sid=(?P<sid>\d+)'
    _TESTS = [{
        'url': 'https://space.bilibili.com/2142762/channel/collectiondetail?sid=57445',
        'info_dict': {
            'id': '2142762_57445',
            'title': '【完结】《底特律 变人》全结局流程解说',
            'description': '',
            'uploader': '老戴在此',
            'uploader_id': '2142762',
            'timestamp': int,
            'upload_date': str,
            'thumbnail': 'https://archive.biliimg.com/bfs/archive/e0e543ae35ad3df863ea7dea526bc32e70f4c091.jpg',
        },
        'playlist_mincount': 31,
    }]

    def _real_extract(self, url):
        mid, sid = self._match_valid_url(url).group('mid', 'sid')
        playlist_id = f'{mid}_{sid}'

        def fetch_page(page_idx):
            return self._download_json(
                'https://api.bilibili.com/x/polymer/space/seasons_archives_list',
                playlist_id, note=f'Downloading page {page_idx}',
                query={'mid': mid, 'season_id': sid, 'page_num': page_idx + 1, 'page_size': 30})['data']

        def get_metadata(page_data):
            page_size = page_data['page']['page_size']
            entry_count = page_data['page']['total']
            return {
                'page_count': math.ceil(entry_count / page_size),
                'page_size': page_size,
                'uploader': self._get_uploader(mid, playlist_id),
                **traverse_obj(page_data, {
                    'title': ('meta', 'name', {str}),
                    'description': ('meta', 'description', {str}),
                    'uploader_id': ('meta', 'mid', {str_or_none}),
                    'timestamp': ('meta', 'ptime', {int_or_none}),
                    'thumbnail': ('meta', 'cover', {url_or_none}),
                })
            }

        def get_entries(page_data):
            return self._get_entries(page_data, 'archives')

        metadata, paged_list = self._extract_playlist(fetch_page, get_metadata, get_entries)
        return self.playlist_result(paged_list, playlist_id, **metadata)


class BilibiliSeriesListIE(BilibiliSpaceListBaseIE):
    _VALID_URL = r'https?://space\.bilibili\.com/(?P<mid>\d+)/channel/seriesdetail/?\?\bsid=(?P<sid>\d+)'
    _TESTS = [{
        'url': 'https://space.bilibili.com/1958703906/channel/seriesdetail?sid=547718&ctype=0',
        'info_dict': {
            'id': '1958703906_547718',
            'title': '直播回放',
            'description': '直播回放',
            'uploader': '靡烟miya',
            'uploader_id': '1958703906',
            'timestamp': 1637985853,
            'upload_date': '20211127',
            'modified_timestamp': int,
            'modified_date': str,
        },
        'playlist_mincount': 513,
    }]

    def _real_extract(self, url):
        mid, sid = self._match_valid_url(url).group('mid', 'sid')
        playlist_id = f'{mid}_{sid}'
        playlist_meta = traverse_obj(self._download_json(
            f'https://api.bilibili.com/x/series/series?series_id={sid}', playlist_id, fatal=False
        ), {
            'title': ('data', 'meta', 'name', {str}),
            'description': ('data', 'meta', 'description', {str}),
            'uploader_id': ('data', 'meta', 'mid', {str_or_none}),
            'timestamp': ('data', 'meta', 'ctime', {int_or_none}),
            'modified_timestamp': ('data', 'meta', 'mtime', {int_or_none}),
        })

        def fetch_page(page_idx):
            return self._download_json(
                'https://api.bilibili.com/x/series/archives',
                playlist_id, note=f'Downloading page {page_idx}',
                query={'mid': mid, 'series_id': sid, 'pn': page_idx + 1, 'ps': 30})['data']

        def get_metadata(page_data):
            page_size = page_data['page']['size']
            entry_count = page_data['page']['total']
            return {
                'page_count': math.ceil(entry_count / page_size),
                'page_size': page_size,
                'uploader': self._get_uploader(mid, playlist_id),
                **playlist_meta
            }

        def get_entries(page_data):
            return self._get_entries(page_data, 'archives')

        metadata, paged_list = self._extract_playlist(fetch_page, get_metadata, get_entries)
        return self.playlist_result(paged_list, playlist_id, **metadata)


class BilibiliFavoritesListIE(BilibiliSpaceListBaseIE):
    _VALID_URL = r'https?://(?:space\.bilibili\.com/\d+/favlist/?\?fid=|(?:www\.)?bilibili\.com/medialist/detail/ml)(?P<id>\d+)'
    _TESTS = [{
        'url': 'https://space.bilibili.com/84912/favlist?fid=1103407912&ftype=create',
        'info_dict': {
            'id': '1103407912',
            'title': '【V2】（旧）',
            'description': '',
            'uploader': '晓月春日',
            'uploader_id': '84912',
            'timestamp': 1604905176,
            'upload_date': '20201109',
            'modified_timestamp': int,
            'modified_date': str,
            'thumbnail': r"re:http://i\d\.hdslb\.com/bfs/archive/14b83c62aa8871b79083df1e9ab4fbc699ad16fe\.jpg",
            'view_count': int,
            'like_count': int,
        },
        'playlist_mincount': 22,
    }, {
        'url': 'https://www.bilibili.com/medialist/detail/ml1103407912',
        'only_matching': True,
    }]

    def _real_extract(self, url):
        fid = self._match_id(url)

        list_info = self._download_json(
            f'https://api.bilibili.com/x/v3/fav/resource/list?media_id={fid}&pn=1&ps=20',
            fid, note='Downloading favlist metadata')
        if list_info['code'] == -403:
            self.raise_login_required(msg='This is a private favorites list. You need to log in as its owner')

        entries = self._get_entries(self._download_json(
            f'https://api.bilibili.com/x/v3/fav/resource/ids?media_id={fid}',
            fid, note='Download favlist entries'), 'data')

        return self.playlist_result(entries, fid, **traverse_obj(list_info, ('data', 'info', {
            'title': ('title', {str}),
            'description': ('intro', {str}),
            'uploader': ('upper', 'name', {str}),
            'uploader_id': ('upper', 'mid', {str_or_none}),
            'timestamp': ('ctime', {int_or_none}),
            'modified_timestamp': ('mtime', {int_or_none}),
            'thumbnail': ('cover', {url_or_none}),
            'view_count': ('cnt_info', 'play', {int_or_none}),
            'like_count': ('cnt_info', 'thumb_up', {int_or_none}),
        })))


class BilibiliWatchlaterIE(BilibiliSpaceListBaseIE):
    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/watchlater/?(?:[?#]|$)'
    _TESTS = [{
        'url': 'https://www.bilibili.com/watchlater/#/list',
        'info_dict': {'id': 'watchlater'},
        'playlist_mincount': 0,
        'skip': 'login required',
    }]

    def _real_extract(self, url):
        list_id = getattr(self._get_cookies(url).get('DedeUserID'), 'value', 'watchlater')
        watchlater_info = self._download_json(
            'https://api.bilibili.com/x/v2/history/toview/web?jsonp=jsonp', list_id)
        if watchlater_info['code'] == -101:
            self.raise_login_required(msg='You need to login to access your watchlater list')
        entries = self._get_entries(watchlater_info, ('data', 'list'))
        return self.playlist_result(entries, id=list_id, title='稍后再看')


class BilibiliPlaylistIE(BilibiliSpaceListBaseIE):
    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/(?:medialist/play|list)/(?P<id>\w+)'
    _TESTS = [{
        'url': 'https://www.bilibili.com/list/1958703906?sid=547718',
        'info_dict': {
            'id': '5_547718',
            'title': '直播回放',
            'uploader': '靡烟miya',
            'uploader_id': '1958703906',
            'timestamp': 1637985853,
            'upload_date': '20211127',
        },
        'playlist_mincount': 513,
    }, {
        'url': 'https://www.bilibili.com/medialist/play/1958703906?business=space_series&business_id=547718&desc=1',
        'info_dict': {
            'id': '5_547718',
        },
        'playlist_mincount': 513,
        'skip': 'redirect url',
    }, {
        'url': 'https://www.bilibili.com/list/ml1103407912',
        'info_dict': {
            'id': '3_1103407912',
            'title': '【V2】（旧）',
            'uploader': '晓月春日',
            'uploader_id': '84912',
            'timestamp': 1604905176,
            'upload_date': '20201109',
            'thumbnail': r"re:http://i\d\.hdslb\.com/bfs/archive/14b83c62aa8871b79083df1e9ab4fbc699ad16fe\.jpg",
        },
        'playlist_mincount': 22,
    }, {
        'url': 'https://www.bilibili.com/medialist/play/ml1103407912',
        'info_dict': {
            'id': '3_1103407912',
        },
        'playlist_mincount': 22,
        'skip': 'redirect url',
    }, {
        'url': 'https://www.bilibili.com/list/watchlater',
        'info_dict': {'id': 'watchlater'},
        'playlist_mincount': 0,
        'skip': 'login required',
    }, {
        'url': 'https://www.bilibili.com/medialist/play/watchlater',
        'info_dict': {'id': 'watchlater'},
        'playlist_mincount': 0,
        'skip': 'login required',
    }]

    def _extract_medialist(self, query, list_id):
        for page_num in itertools.count(1):
            page_data = self._download_json(
                'https://api.bilibili.com/x/v2/medialist/resource/list',
                list_id, query=query, note=f'getting playlist {query["biz_id"]} page {page_num}'
            )['data']
            yield from self._get_entries(page_data, 'media_list', ending_key='bv_id')
            query['oid'] = traverse_obj(page_data, ('media_list', -1, 'id'))
            if not page_data.get('has_more', False):
                break

    def _real_extract(self, url):
        list_id = self._match_id(url)
        webpage = self._download_webpage(url, list_id)
        initial_state = self._search_json(r'window\.__INITIAL_STATE__\s*=', webpage, 'initial state', list_id)
        if traverse_obj(initial_state, ('error', 'code', {int_or_none})) != 200:
            error_code = traverse_obj(initial_state, ('error', 'trueCode', {int_or_none}))
            error_message = traverse_obj(initial_state, ('error', 'message', {str_or_none}))
            if error_code == -400 and list_id == 'watchlater':
                self.raise_login_required('You need to login to access your watchlater playlist')
            elif error_code == -403:
                self.raise_login_required('This is a private playlist. You need to login as its owner')
            elif error_code == 11010:
                raise ExtractorError('Playlist is no longer available', expected=True)
            raise ExtractorError(f'Could not access playlist: {error_code} {error_message}')

        query = {
            'ps': 20,
            'with_current': False,
            **traverse_obj(initial_state, {
                'type': ('playlist', 'type', {int_or_none}),
                'biz_id': ('playlist', 'id', {int_or_none}),
                'tid': ('tid', {int_or_none}),
                'sort_field': ('sortFiled', {int_or_none}),
                'desc': ('desc', {bool_or_none}, {str_or_none}, {str.lower}),
            })
        }
        metadata = {
            'id': f'{query["type"]}_{query["biz_id"]}',
            **traverse_obj(initial_state, ('mediaListInfo', {
                'title': ('title', {str}),
                'uploader': ('upper', 'name', {str}),
                'uploader_id': ('upper', 'mid', {str_or_none}),
                'timestamp': ('ctime', {int_or_none}),
                'thumbnail': ('cover', {url_or_none}),
            })),
        }
        return self.playlist_result(self._extract_medialist(query, list_id), **metadata)


class BilibiliCategoryIE(InfoExtractor):
    IE_NAME = 'Bilibili category extractor'
    _MAX_RESULTS = 1000000
    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/v/[a-zA-Z]+\/[a-zA-Z]+'
    _TESTS = [{
        'url': 'https://www.bilibili.com/v/kichiku/mad',
        'info_dict': {
            'id': 'kichiku: mad',
            'title': 'kichiku: mad'
        },
        'playlist_mincount': 45,
        'params': {
            'playlistend': 45
        }
    }]

    def _fetch_page(self, api_url, num_pages, query, page_num):
        parsed_json = self._download_json(
            api_url, query, query={'Search_key': query, 'pn': page_num},
            note='Extracting results from page %s of %s' % (page_num, num_pages))

        video_list = traverse_obj(parsed_json, ('data', 'archives'), expected_type=list)
        if not video_list:
            raise ExtractorError('Failed to retrieve video list for page %d' % page_num)

        for video in video_list:
            yield self.url_result(
                'https://www.bilibili.com/video/%s' % video['bvid'], 'BiliBili', video['bvid'])

    def _entries(self, category, subcategory, query):
        # map of categories : subcategories : RIDs
        rid_map = {
            'kichiku': {
                'mad': 26,
                'manual_vocaloid': 126,
                'guide': 22,
                'theatre': 216,
                'course': 127
            },
        }

        if category not in rid_map:
            raise ExtractorError(
                f'The category {category} isn\'t supported. Supported categories: {list(rid_map.keys())}')
        if subcategory not in rid_map[category]:
            raise ExtractorError(
                f'The subcategory {subcategory} isn\'t supported for this category. Supported subcategories: {list(rid_map[category].keys())}')
        rid_value = rid_map[category][subcategory]

        api_url = 'https://api.bilibili.com/x/web-interface/newlist?rid=%d&type=1&ps=20&jsonp=jsonp' % rid_value
        page_json = self._download_json(api_url, query, query={'Search_key': query, 'pn': '1'})
        page_data = traverse_obj(page_json, ('data', 'page'), expected_type=dict)
        count, size = int_or_none(page_data.get('count')), int_or_none(page_data.get('size'))
        if count is None or not size:
            raise ExtractorError('Failed to calculate either page count or size')

        num_pages = math.ceil(count / size)

        return OnDemandPagedList(functools.partial(
            self._fetch_page, api_url, num_pages, query), size)

    def _real_extract(self, url):
        category, subcategory = urllib.parse.urlparse(url).path.split('/')[2:4]
        query = '%s: %s' % (category, subcategory)

        return self.playlist_result(self._entries(category, subcategory, query), query, query)


class BiliBiliSearchIE(SearchInfoExtractor):
    IE_DESC = 'Bilibili video search'
    _MAX_RESULTS = 100000
    _SEARCH_KEY = 'bilisearch'

    def _search_results(self, query):
        for page_num in itertools.count(1):
            videos = self._download_json(
                'https://api.bilibili.com/x/web-interface/search/type', query,
                note=f'Extracting results from page {page_num}', query={
                    'Search_key': query,
                    'keyword': query,
                    'page': page_num,
                    'context': '',
                    'duration': 0,
                    'tids_2': '',
                    '__refresh__': 'true',
                    'search_type': 'video',
                    'tids': 0,
                    'highlight': 1,
                })['data'].get('result')
            if not videos:
                break
            for video in videos:
                yield self.url_result(video['arcurl'], 'BiliBili', str(video['aid']))


class BilibiliAudioBaseIE(InfoExtractor):
    def _call_api(self, path, sid, query=None):
        if not query:
            query = {'sid': sid}
        return self._download_json(
            'https://www.bilibili.com/audio/music-service-c/web/' + path,
            sid, query=query)['data']


class BilibiliAudioIE(BilibiliAudioBaseIE):
    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/audio/au(?P<id>\d+)'
    _TEST = {
        'url': 'https://www.bilibili.com/audio/au1003142',
        'md5': 'fec4987014ec94ef9e666d4d158ad03b',
        'info_dict': {
            'id': '1003142',
            'ext': 'm4a',
            'title': '【tsukimi】YELLOW / 神山羊',
            'artist': 'tsukimi',
            'comment_count': int,
            'description': 'YELLOW的mp3版！',
            'duration': 183,
            'subtitles': {
                'origin': [{
                    'ext': 'lrc',
                }],
            },
            'thumbnail': r're:^https?://.+\.jpg',
            'timestamp': 1564836614,
            'upload_date': '20190803',
            'uploader': 'tsukimi-つきみぐー',
            'view_count': int,
        },
    }

    def _real_extract(self, url):
        au_id = self._match_id(url)

        play_data = self._call_api('url', au_id)
        formats = [{
            'url': play_data['cdns'][0],
            'filesize': int_or_none(play_data.get('size')),
            'vcodec': 'none'
        }]

        for a_format in formats:
            a_format.setdefault('http_headers', {}).update({
                'Referer': url,
            })

        song = self._call_api('song/info', au_id)
        title = song['title']
        statistic = song.get('statistic') or {}

        subtitles = None
        lyric = song.get('lyric')
        if lyric:
            subtitles = {
                'origin': [{
                    'url': lyric,
                }]
            }

        return {
            'id': au_id,
            'title': title,
            'formats': formats,
            'artist': song.get('author'),
            'comment_count': int_or_none(statistic.get('comment')),
            'description': song.get('intro'),
            'duration': int_or_none(song.get('duration')),
            'subtitles': subtitles,
            'thumbnail': song.get('cover'),
            'timestamp': int_or_none(song.get('passtime')),
            'uploader': song.get('uname'),
            'view_count': int_or_none(statistic.get('play')),
        }


class BilibiliAudioAlbumIE(BilibiliAudioBaseIE):
    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/audio/am(?P<id>\d+)'
    _TEST = {
        'url': 'https://www.bilibili.com/audio/am10624',
        'info_dict': {
            'id': '10624',
            'title': '每日新曲推荐（每日11:00更新）',
            'description': '每天11:00更新，为你推送最新音乐',
        },
        'playlist_count': 19,
    }

    def _real_extract(self, url):
        am_id = self._match_id(url)

        songs = self._call_api(
            'song/of-menu', am_id, {'sid': am_id, 'pn': 1, 'ps': 100})['data']

        entries = []
        for song in songs:
            sid = str_or_none(song.get('id'))
            if not sid:
                continue
            entries.append(self.url_result(
                'https://www.bilibili.com/audio/au' + sid,
                BilibiliAudioIE.ie_key(), sid))

        if entries:
            album_data = self._call_api('menu/info', am_id) or {}
            album_title = album_data.get('title')
            if album_title:
                for entry in entries:
                    entry['album'] = album_title
                return self.playlist_result(
                    entries, am_id, album_title, album_data.get('intro'))

        return self.playlist_result(entries, am_id)


class BiliBiliPlayerIE(InfoExtractor):
    _VALID_URL = r'https?://player\.bilibili\.com/player\.html\?.*?\baid=(?P<id>\d+)'
    _TEST = {
        'url': 'http://player.bilibili.com/player.html?aid=92494333&cid=157926707&page=1',
        'only_matching': True,
    }

    def _real_extract(self, url):
        video_id = self._match_id(url)
        return self.url_result(
            'http://www.bilibili.tv/video/av%s/' % video_id,
            ie=BiliBiliIE.ie_key(), video_id=video_id)


class BiliIntlBaseIE(InfoExtractor):
    _API_URL = 'https://api.bilibili.tv/intl/gateway'
    _NETRC_MACHINE = 'biliintl'

    def _call_api(self, endpoint, *args, **kwargs):
        json = self._download_json(self._API_URL + endpoint, *args, **kwargs)
        if json.get('code'):
            if json['code'] in (10004004, 10004005, 10023006):
                self.raise_login_required()
            elif json['code'] == 10004001:
                self.raise_geo_restricted()
            else:
                if json.get('message') and str(json['code']) != json['message']:
                    errmsg = f'{kwargs.get("errnote", "Unable to download JSON metadata")}: {self.IE_NAME} said: {json["message"]}'
                else:
                    errmsg = kwargs.get('errnote', 'Unable to download JSON metadata')
                if kwargs.get('fatal'):
                    raise ExtractorError(errmsg)
                else:
                    self.report_warning(errmsg)
        return json.get('data')

    def json2srt(self, json):
        data = '\n\n'.join(
            f'{i + 1}\n{srt_subtitles_timecode(line["from"])} --> {srt_subtitles_timecode(line["to"])}\n{line["content"]}'
            for i, line in enumerate(traverse_obj(json, (
                'body', lambda _, l: l['content'] and l['from'] and l['to']))))
        return data

    def _get_subtitles(self, *, ep_id=None, aid=None):
        sub_json = self._call_api(
            '/web/v2/subtitle', ep_id or aid, fatal=False,
            note='Downloading subtitles list', errnote='Unable to download subtitles list',
            query=filter_dict({
                'platform': 'web',
                's_locale': 'en_US',
                'episode_id': ep_id,
                'aid': aid,
            })) or {}
        subtitles = {}
        for sub in sub_json.get('subtitles') or []:
            sub_url = sub.get('url')
            if not sub_url:
                continue
            sub_data = self._download_json(
                sub_url, ep_id or aid, errnote='Unable to download subtitles', fatal=False,
                note='Downloading subtitles%s' % f' for {sub["lang"]}' if sub.get('lang') else '')
            if not sub_data:
                continue
            subtitles.setdefault(sub.get('lang_key', 'en'), []).append({
                'ext': 'srt',
                'data': self.json2srt(sub_data)
            })
        return subtitles

    def _get_formats(self, *, ep_id=None, aid=None):
        video_json = self._call_api(
            '/web/playurl', ep_id or aid, note='Downloading video formats',
            errnote='Unable to download video formats', query=filter_dict({
                'platform': 'web',
                'ep_id': ep_id,
                'aid': aid,
            }))
        video_json = video_json['playurl']
        formats = []
        for vid in video_json.get('video') or []:
            video_res = vid.get('video_resource') or {}
            video_info = vid.get('stream_info') or {}
            if not video_res.get('url'):
                continue
            formats.append({
                'url': video_res['url'],
                'ext': 'mp4',
                'format_note': video_info.get('desc_words'),
                'width': video_res.get('width'),
                'height': video_res.get('height'),
                'vbr': video_res.get('bandwidth'),
                'acodec': 'none',
                'vcodec': video_res.get('codecs'),
                'filesize': video_res.get('size'),
            })
        for aud in video_json.get('audio_resource') or []:
            if not aud.get('url'):
                continue
            formats.append({
                'url': aud['url'],
                'ext': 'mp4',
                'abr': aud.get('bandwidth'),
                'acodec': aud.get('codecs'),
                'vcodec': 'none',
                'filesize': aud.get('size'),
            })

        return formats

    def _parse_video_metadata(self, video_data):
        return {
            'title': video_data.get('title_display') or video_data.get('title'),
            'thumbnail': video_data.get('cover'),
            'episode_number': int_or_none(self._search_regex(
                r'^E(\d+)(?:$| - )', video_data.get('title_display') or '', 'episode number', default=None)),
        }

    def _perform_login(self, username, password):
        if not Cryptodome.RSA:
            raise ExtractorError('pycryptodomex not found. Please install', expected=True)

        key_data = self._download_json(
            'https://passport.bilibili.tv/x/intl/passport-login/web/key?lang=en-US', None,
            note='Downloading login key', errnote='Unable to download login key')['data']

        public_key = Cryptodome.RSA.importKey(key_data['key'])
        password_hash = Cryptodome.PKCS1_v1_5.new(public_key).encrypt((key_data['hash'] + password).encode('utf-8'))
        login_post = self._download_json(
            'https://passport.bilibili.tv/x/intl/passport-login/web/login/password?lang=en-US', None, data=urlencode_postdata({
                'username': username,
                'password': base64.b64encode(password_hash).decode('ascii'),
                'keep_me': 'true',
                's_locale': 'en_US',
                'isTrusted': 'true'
            }), note='Logging in', errnote='Unable to log in')
        if login_post.get('code'):
            if login_post.get('message'):
                raise ExtractorError(f'Unable to log in: {self.IE_NAME} said: {login_post["message"]}', expected=True)
            else:
                raise ExtractorError('Unable to log in')


class BiliIntlIE(BiliIntlBaseIE):
    _VALID_URL = r'https?://(?:www\.)?bili(?:bili\.tv|intl\.com)/(?:[a-zA-Z]{2}/)?(play/(?P<season_id>\d+)/(?P<ep_id>\d+)|video/(?P<aid>\d+))'
    _TESTS = [{
        # Bstation page
        'url': 'https://www.bilibili.tv/en/play/34613/341736',
        'info_dict': {
            'id': '341736',
            'ext': 'mp4',
            'title': 'E2 - The First Night',
            'thumbnail': r're:^https://pic\.bstarstatic\.com/ogv/.+\.png$',
            'episode_number': 2,
            'upload_date': '20201009',
            'episode': 'Episode 2',
            'timestamp': 1602259500,
            'description': 'md5:297b5a17155eb645e14a14b385ab547e',
            'chapters': [{
                'start_time': 0,
                'end_time': 76.242,
                'title': '<Untitled Chapter 1>'
            }, {
                'start_time': 76.242,
                'end_time': 161.161,
                'title': 'Intro'
            }, {
                'start_time': 1325.742,
                'end_time': 1403.903,
                'title': 'Outro'
            }],
        }
    }, {
        # Non-Bstation page
        'url': 'https://www.bilibili.tv/en/play/1033760/11005006',
        'info_dict': {
            'id': '11005006',
            'ext': 'mp4',
            'title': 'E3 - Who?',
            'thumbnail': r're:^https://pic\.bstarstatic\.com/ogv/.+\.png$',
            'episode_number': 3,
            'description': 'md5:e1a775e71a35c43f141484715470ad09',
            'episode': 'Episode 3',
            'upload_date': '20211219',
            'timestamp': 1639928700,
            'chapters': [{
                'start_time': 0,
                'end_time': 88.0,
                'title': '<Untitled Chapter 1>'
            }, {
                'start_time': 88.0,
                'end_time': 156.0,
                'title': 'Intro'
            }, {
                'start_time': 1173.0,
                'end_time': 1259.535,
                'title': 'Outro'
            }],
        }
    }, {
        # Subtitle with empty content
        'url': 'https://www.bilibili.tv/en/play/1005144/10131790',
        'info_dict': {
            'id': '10131790',
            'ext': 'mp4',
            'title': 'E140 - Two Heartbeats: Kabuto\'s Trap',
            'thumbnail': r're:^https://pic\.bstarstatic\.com/ogv/.+\.png$',
            'episode_number': 140,
        },
        'skip': 'According to the copyright owner\'s request, you may only watch the video after you log in.'
    }, {
        'url': 'https://www.bilibili.tv/en/video/2041863208',
        'info_dict': {
            'id': '2041863208',
            'ext': 'mp4',
            'timestamp': 1670874843,
            'description': 'Scheduled for April 2023.\nStudio: ufotable',
            'thumbnail': r're:https?://pic[-\.]bstarstatic.+/ugc/.+\.jpg$',
            'upload_date': '20221212',
            'title': 'Kimetsu no Yaiba Season 3 Official Trailer - Bstation',
        },
    }, {
        # episode comment extraction
        'url': 'https://www.bilibili.tv/en/play/34580/340317',
        'info_dict': {
            'id': '340317',
            'ext': 'mp4',
            'timestamp': 1604057820,
            'upload_date': '20201030',
            'episode_number': 5,
            'title': 'E5 - My Own Steel',
            'description': 'md5:2b17ab10aebb33e3c2a54da9e8e487e2',
            'thumbnail': r're:https?://pic\.bstarstatic\.com/ogv/.+\.png$',
            'episode': 'Episode 5',
            'comment_count': int,
            'chapters': [{
                'start_time': 0,
                'end_time': 61.0,
                'title': '<Untitled Chapter 1>'
            }, {
                'start_time': 61.0,
                'end_time': 134.0,
                'title': 'Intro'
            }, {
                'start_time': 1290.0,
                'end_time': 1379.0,
                'title': 'Outro'
            }],
        },
        'params': {
            'getcomments': True
        }
    }, {
        # user generated content comment extraction
        'url': 'https://www.bilibili.tv/en/video/2045730385',
        'info_dict': {
            'id': '2045730385',
            'ext': 'mp4',
            'description': 'md5:693b6f3967fb4e7e7764ea817857c33a',
            'timestamp': 1667891924,
            'upload_date': '20221108',
            'title': 'That Time I Got Reincarnated as a Slime: Scarlet Bond - Official Trailer 3| AnimeStan - Bstation',
            'comment_count': int,
            'thumbnail': 'https://pic.bstarstatic.com/ugc/f6c363659efd2eabe5683fbb906b1582.jpg',
        },
        'params': {
            'getcomments': True
        }
    }, {
        # episode id without intro and outro
        'url': 'https://www.bilibili.tv/en/play/1048837/11246489',
        'info_dict': {
            'id': '11246489',
            'ext': 'mp4',
            'title': 'E1 - Operation \'Strix\' <Owl>',
            'description': 'md5:b4434eb1a9a97ad2bccb779514b89f17',
            'timestamp': 1649516400,
            'thumbnail': 'https://pic.bstarstatic.com/ogv/62cb1de23ada17fb70fbe7bdd6ff29c29da02a64.png',
            'episode': 'Episode 1',
            'episode_number': 1,
            'upload_date': '20220409',
        },
    }, {
        'url': 'https://www.biliintl.com/en/play/34613/341736',
        'only_matching': True,
    }, {
        # User-generated content (as opposed to a series licensed from a studio)
        'url': 'https://bilibili.tv/en/video/2019955076',
        'only_matching': True,
    }, {
        # No language in URL
        'url': 'https://www.bilibili.tv/video/2019955076',
        'only_matching': True,
    }, {
        # Uppercase language in URL
        'url': 'https://www.bilibili.tv/EN/video/2019955076',
        'only_matching': True,
    }]

    def _make_url(video_id, series_id=None):
        if series_id:
            return f'https://www.bilibili.tv/en/play/{series_id}/{video_id}'
        return f'https://www.bilibili.tv/en/video/{video_id}'

    def _extract_video_metadata(self, url, video_id, season_id):
        url, smuggled_data = unsmuggle_url(url, {})
        if smuggled_data.get('title'):
            return smuggled_data

        webpage = self._download_webpage(url, video_id)
        # Bstation layout
        initial_data = (
            self._search_json(r'window\.__INITIAL_(?:DATA|STATE)__\s*=', webpage, 'preload state', video_id, default={})
            or self._search_nuxt_data(webpage, video_id, '__initialState', fatal=False, traverse=None))
        video_data = traverse_obj(
            initial_data, ('OgvVideo', 'epDetail'), ('UgcVideo', 'videoData'), ('ugc', 'archive'), expected_type=dict) or {}

        if season_id and not video_data:
            # Non-Bstation layout, read through episode list
            season_json = self._call_api(f'/web/v2/ogv/play/episodes?season_id={season_id}&platform=web', video_id)
            video_data = traverse_obj(season_json, (
                'sections', ..., 'episodes', lambda _, v: str(v['episode_id']) == video_id
            ), expected_type=dict, get_all=False)

        # XXX: webpage metadata may not accurate, it just used to not crash when video_data not found
        return merge_dicts(
            self._parse_video_metadata(video_data), self._search_json_ld(webpage, video_id, fatal=False), {
                'title': self._html_search_meta('og:title', webpage),
                'description': self._html_search_meta('og:description', webpage)
            })

    def _get_comments_reply(self, root_id, next_id=0, display_id=None):
        comment_api_raw_data = self._download_json(
            'https://api.bilibili.tv/reply/web/detail', display_id,
            note=f'Downloading reply comment of {root_id} - {next_id}',
            query={
                'platform': 'web',
                'ps': 20,  # comment's reply per page (default: 3)
                'root': root_id,
                'next': next_id,
            })

        for replies in traverse_obj(comment_api_raw_data, ('data', 'replies', ...)):
            yield {
                'author': traverse_obj(replies, ('member', 'name')),
                'author_id': traverse_obj(replies, ('member', 'mid')),
                'author_thumbnail': traverse_obj(replies, ('member', 'face')),
                'text': traverse_obj(replies, ('content', 'message')),
                'id': replies.get('rpid'),
                'like_count': int_or_none(replies.get('like_count')),
                'parent': replies.get('parent'),
                'timestamp': unified_timestamp(replies.get('ctime_text'))
            }

        if not traverse_obj(comment_api_raw_data, ('data', 'cursor', 'is_end')):
            yield from self._get_comments_reply(
                root_id, comment_api_raw_data['data']['cursor']['next'], display_id)

    def _get_comments(self, video_id, ep_id):
        for i in itertools.count(0):
            comment_api_raw_data = self._download_json(
                'https://api.bilibili.tv/reply/web/root', video_id,
                note=f'Downloading comment page {i + 1}',
                query={
                    'platform': 'web',
                    'pn': i,  # page number
                    'ps': 20,  # comment per page (default: 20)
                    'oid': video_id,
                    'type': 3 if ep_id else 1,  # 1: user generated content, 3: series content
                    'sort_type': 1,  # 1: best, 2: recent
                })

            for replies in traverse_obj(comment_api_raw_data, ('data', 'replies', ...)):
                yield {
                    'author': traverse_obj(replies, ('member', 'name')),
                    'author_id': traverse_obj(replies, ('member', 'mid')),
                    'author_thumbnail': traverse_obj(replies, ('member', 'face')),
                    'text': traverse_obj(replies, ('content', 'message')),
                    'id': replies.get('rpid'),
                    'like_count': int_or_none(replies.get('like_count')),
                    'timestamp': unified_timestamp(replies.get('ctime_text')),
                    'author_is_uploader': bool(traverse_obj(replies, ('member', 'type'))),
                }
                if replies.get('count'):
                    yield from self._get_comments_reply(replies.get('rpid'), display_id=video_id)

            if traverse_obj(comment_api_raw_data, ('data', 'cursor', 'is_end')):
                break

    def _real_extract(self, url):
        season_id, ep_id, aid = self._match_valid_url(url).group('season_id', 'ep_id', 'aid')
        video_id = ep_id or aid
        chapters = None

        if ep_id:
            intro_ending_json = self._call_api(
                f'/web/v2/ogv/play/episode?episode_id={ep_id}&platform=web',
                video_id, fatal=False) or {}
            if intro_ending_json.get('skip'):
                # FIXME: start time and end time seems a bit off a few second even it corrext based on ogv.*.js
                # ref: https://p.bstarstatic.com/fe-static/bstar-web-new/assets/ogv.2b147442.js
                chapters = [{
                    'start_time': float_or_none(traverse_obj(intro_ending_json, ('skip', 'opening_start_time')), 1000),
                    'end_time': float_or_none(traverse_obj(intro_ending_json, ('skip', 'opening_end_time')), 1000),
                    'title': 'Intro'
                }, {
                    'start_time': float_or_none(traverse_obj(intro_ending_json, ('skip', 'ending_start_time')), 1000),
                    'end_time': float_or_none(traverse_obj(intro_ending_json, ('skip', 'ending_end_time')), 1000),
                    'title': 'Outro'
                }]

        return {
            'id': video_id,
            **self._extract_video_metadata(url, video_id, season_id),
            'formats': self._get_formats(ep_id=ep_id, aid=aid),
            'subtitles': self.extract_subtitles(ep_id=ep_id, aid=aid),
            'chapters': chapters,
            '__post_extractor': self.extract_comments(video_id, ep_id)
        }


class BiliIntlSeriesIE(BiliIntlBaseIE):
    IE_NAME = 'biliIntl:series'
    _VALID_URL = r'https?://(?:www\.)?bili(?:bili\.tv|intl\.com)/(?:[a-zA-Z]{2}/)?(?:play|media)/(?P<id>\d+)/?(?:[?#]|$)'
    _TESTS = [{
        'url': 'https://www.bilibili.tv/en/play/34613',
        'playlist_mincount': 15,
        'info_dict': {
            'id': '34613',
            'title': 'TONIKAWA: Over the Moon For You',
            'description': 'md5:297b5a17155eb645e14a14b385ab547e',
            'categories': ['Slice of life', 'Comedy', 'Romance'],
            'thumbnail': r're:^https://pic\.bstarstatic\.com/ogv/.+\.png$',
            'view_count': int,
        },
        'params': {
            'skip_download': True,
        },
    }, {
        'url': 'https://www.bilibili.tv/en/media/1048837',
        'info_dict': {
            'id': '1048837',
            'title': 'SPY×FAMILY',
            'description': 'md5:b4434eb1a9a97ad2bccb779514b89f17',
            'categories': ['Adventure', 'Action', 'Comedy'],
            'thumbnail': r're:^https://pic\.bstarstatic\.com/ogv/.+\.jpg$',
            'view_count': int,
        },
        'playlist_mincount': 25,
    }, {
        'url': 'https://www.biliintl.com/en/play/34613',
        'only_matching': True,
    }, {
        'url': 'https://www.biliintl.com/EN/play/34613',
        'only_matching': True,
    }]

    def _entries(self, series_id):
        series_json = self._call_api(f'/web/v2/ogv/play/episodes?season_id={series_id}&platform=web', series_id)
        for episode in traverse_obj(series_json, ('sections', ..., 'episodes', ...), expected_type=dict):
            episode_id = str(episode['episode_id'])
            yield self.url_result(smuggle_url(
                BiliIntlIE._make_url(episode_id, series_id),
                self._parse_video_metadata(episode)
            ), BiliIntlIE, episode_id)

    def _real_extract(self, url):
        series_id = self._match_id(url)
        series_info = self._call_api(f'/web/v2/ogv/play/season_info?season_id={series_id}&platform=web', series_id).get('season') or {}
        return self.playlist_result(
            self._entries(series_id), series_id, series_info.get('title'), series_info.get('description'),
            categories=traverse_obj(series_info, ('styles', ..., 'title'), expected_type=str_or_none),
            thumbnail=url_or_none(series_info.get('horizontal_cover')), view_count=parse_count(series_info.get('view')))


class BiliLiveIE(InfoExtractor):
    _VALID_URL = r'https?://live\.bilibili\.com/(?:blanc/)?(?P<id>\d+)'

    _TESTS = [{
        'url': 'https://live.bilibili.com/196',
        'info_dict': {
            'id': '33989',
            'description': "周六杂谈回，其他时候随机游戏。 | \n录播：@下播型泛式录播组。 | \n直播通知群（全员禁言）：666906670，902092584，59971⑧481 （功能一样，别多加）",
            'ext': 'flv',
            'title': "太空狼人杀联动，不被爆杀就算赢",
            'thumbnail': "https://i0.hdslb.com/bfs/live/new_room_cover/e607bc1529057ef4b332e1026e62cf46984c314d.jpg",
            'timestamp': 1650802769,
        },
        'skip': 'not live'
    }, {
        'url': 'https://live.bilibili.com/196?broadcast_type=0&is_room_feed=1?spm_id_from=333.999.space_home.strengthen_live_card.click',
        'only_matching': True
    }, {
        'url': 'https://live.bilibili.com/blanc/196',
        'only_matching': True
    }]

    _FORMATS = {
        80: {'format_id': 'low', 'format_note': '流畅'},
        150: {'format_id': 'high_res', 'format_note': '高清'},
        250: {'format_id': 'ultra_high_res', 'format_note': '超清'},
        400: {'format_id': 'blue_ray', 'format_note': '蓝光'},
        10000: {'format_id': 'source', 'format_note': '原画'},
        20000: {'format_id': '4K', 'format_note': '4K'},
        30000: {'format_id': 'dolby', 'format_note': '杜比'},
    }

    _quality = staticmethod(qualities(list(_FORMATS)))

    def _call_api(self, path, room_id, query):
        api_result = self._download_json(f'https://api.live.bilibili.com/{path}', room_id, query=query)
        if api_result.get('code') != 0:
            raise ExtractorError(api_result.get('message') or 'Unable to download JSON metadata')
        return api_result.get('data') or {}

    def _parse_formats(self, qn, fmt):
        for codec in fmt.get('codec') or []:
            if codec.get('current_qn') != qn:
                continue
            for url_info in codec['url_info']:
                yield {
                    'url': f'{url_info["host"]}{codec["base_url"]}{url_info["extra"]}',
                    'ext': fmt.get('format_name'),
                    'vcodec': codec.get('codec_name'),
                    'quality': self._quality(qn),
                    **self._FORMATS[qn],
                }

    def _real_extract(self, url):
        room_id = self._match_id(url)
        room_data = self._call_api('room/v1/Room/get_info', room_id, {'id': room_id})
        if room_data.get('live_status') == 0:
            raise ExtractorError('Streamer is not live', expected=True)

        formats = []
        for qn in self._FORMATS.keys():
            stream_data = self._call_api('xlive/web-room/v2/index/getRoomPlayInfo', room_id, {
                'room_id': room_id,
                'qn': qn,
                'codec': '0,1',
                'format': '0,2',
                'mask': '0',
                'no_playurl': '0',
                'platform': 'web',
                'protocol': '0,1',
            })
            for fmt in traverse_obj(stream_data, ('playurl_info', 'playurl', 'stream', ..., 'format', ...)) or []:
                formats.extend(self._parse_formats(qn, fmt))

        return {
            'id': room_id,
            'title': room_data.get('title'),
            'description': room_data.get('description'),
            'thumbnail': room_data.get('user_cover'),
            'timestamp': stream_data.get('live_time'),
            'formats': formats,
            'is_live': True,
            'http_headers': {
                'Referer': url,
            },
        }
-												[BiliIntl] Add login (#2172)

and misc improvements

Authored by: MinePlayersPE
											
										
										
											2021-12-31 13:09:30 -07:00
+								import base64
-												[bilibili] Add category extractor (#695)

Authored by: animelover1984
											
										
										
											2021-08-20 12:27:40 -06:00
+								import functools
-												[extractor/bilibili:SpaceVideo] Extract signature (#7149)

Authored by: elyse0
Closes #6956, closes #7081
											
										
										
											2023-05-29 09:30:30 -06:00
+								import hashlib
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								import itertools
-												[bilibili] Add category extractor (#695)

Authored by: animelover1984
											
										
										
											2021-08-20 12:27:40 -06:00
+								import math
-												[ie/bilibili] Extract `format_id` (#7555)

Authored by: c-basalt
											
										
										
											2023-09-16 14:53:57 -06:00
+								import re
-												[extractor/bilibili:SpaceVideo] Extract signature (#7149)

Authored by: elyse0
Closes #6956, closes #7081
											
										
										
											2023-05-29 09:30:30 -06:00
+								import time
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								import urllib.parse
-												[bilibili] Add preliminary support (#2174)

The URL http://www.bilibili.tv/video/av636603/index_2.html does not work yet.

											
										
										
											2014-04-21 05:45:27 -06:00
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
+								from .common import InfoExtractor, SearchInfoExtractor
-												[dependencies] Standardize `Cryptodome` imports

											
										
										
											2023-02-06 14:52:29 -07:00
+								from ..dependencies import Cryptodome
-												[compat, networking] Deprecate old functions (#2861)

Authored by: coletdjnz, pukkandan

											
										
										
											2023-07-09 01:53:02 -06:00
+								from ..networking.exceptions import HTTPError
-												[bilibili] Add preliminary support (#2174)

The URL http://www.bilibili.tv/video/av636603/index_2.html does not work yet.

											
										
										
											2014-04-21 05:45:27 -06:00
+								from ..utils import (
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								    ExtractorError,
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								    GeoRestrictedError,
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								    InAdvancePagedList,
 								    OnDemandPagedList,
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								    bool_or_none,
-												[BiliIntl] Support user-generated videos (#3203)

Authored by: wlritchi
											
										
										
											2022-03-27 21:21:42 -06:00
+								    filter_dict,
-												[bilibili] Fix extraction, improve and cleanup

											
										
										
											2016-05-28 11:26:00 -06:00
+								    float_or_none,
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								    format_field,
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								    int_or_none,
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								    join_nonempty,
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								    make_archive_id,
-												[extractor/biliIntl] Add fallback to `video_data` (#5971)

Authored by: HobbyistDev
											
										
										
											2023-01-05 23:22:25 -07:00
+								    merge_dicts,
-												[Bilibili] Add 8k support (#1964)

Closes #1898, #1819
Authored by: u-spec-png
											
										
										
											2022-01-30 11:51:22 -07:00
+								    mimetype2ext,
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								    parse_count,
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								    parse_qs,
-												[BilibiliLive] Add extractor (#3406)

Authored by: HE7086, pukkandan
											
										
										
											2022-05-01 20:09:11 -06:00
+								    qualities,
-												[extractor/biliintl:series] Make partial download of series faster

											
										
										
											2023-01-01 02:09:58 -07:00
+								    smuggle_url,
-												[Bilibili] Add subtitle converter (#1144)

Closes #1015
Based on https://github.com/y2361547758/bcc2ass
Authored by: u-spec-png
											
										
										
											2021-10-04 12:37:05 -06:00
+								    srt_subtitles_timecode,
-												[bilibili] add support audio albums and songs(closes #21094)

											
										
										
											2019-09-22 10:14:18 -06:00
+								    str_or_none,
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								    traverse_obj,
-												[extractor/bilibili:SpaceVideo] Extract signature (#7149)

Authored by: elyse0
Closes #6956, closes #7081
											
										
										
											2023-05-29 09:30:30 -06:00
+								    try_call,
-												[extractor/biliIntl] Add comment extraction  (#6079)

Authored by: HobbyistDev
											
										
										
											2023-04-12 12:21:57 -06:00
+								    unified_timestamp,
-												[extractor/biliintl:series] Make partial download of series faster

											
										
										
											2023-01-01 02:09:58 -07:00
+								    unsmuggle_url,
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								    url_or_none,
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								    urlencode_postdata,
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								    variadic,
-												[bilibili] Add preliminary support (#2174)

The URL http://www.bilibili.tv/video/av636603/index_2.html does not work yet.

											
										
										
											2014-04-21 05:45:27 -06:00
+								)
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								class BilibiliBaseIE(InfoExtractor):
-												[ie/bilibili] Extract `format_id` (#7555)

Authored by: c-basalt
											
										
										
											2023-09-16 14:53:57 -06:00
+								    _FORMAT_ID_RE = re.compile(r'-(\d+)\.m4s\?')
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								    def extract_formats(self, play_info):
 								        format_names = {
 								            r['quality']: traverse_obj(r, 'new_description', 'display_desc')
 								            for r in traverse_obj(play_info, ('support_formats', lambda _, v: v['quality']))
 								        }
 								        audios = traverse_obj(play_info, ('dash', 'audio', ...))
 								        flac_audio = traverse_obj(play_info, ('dash', 'flac', 'audio'))
 								        if flac_audio:
 								            audios.append(flac_audio)
 								        formats = [{
 								            'url': traverse_obj(audio, 'baseUrl', 'base_url', 'url'),
 								            'ext': mimetype2ext(traverse_obj(audio, 'mimeType', 'mime_type')),
 								            'acodec': audio.get('codecs'),
 								            'vcodec': 'none',
 								            'tbr': float_or_none(audio.get('bandwidth'), scale=1000),
-												[ie/bilibili] Extract `format_id` (#7555)

Authored by: c-basalt
											
										
										
											2023-09-16 14:53:57 -06:00
+								            'filesize': int_or_none(audio.get('size')),
 								            'format_id': str_or_none(audio.get('id')),
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        } for audio in audios]
 								        formats.extend({
 								            'url': traverse_obj(video, 'baseUrl', 'base_url', 'url'),
 								            'ext': mimetype2ext(traverse_obj(video, 'mimeType', 'mime_type')),
 								            'fps': float_or_none(traverse_obj(video, 'frameRate', 'frame_rate')),
 								            'width': int_or_none(video.get('width')),
 								            'height': int_or_none(video.get('height')),
 								            'vcodec': video.get('codecs'),
 								            'acodec': 'none' if audios else None,
 								            'tbr': float_or_none(video.get('bandwidth'), scale=1000),
 								            'filesize': int_or_none(video.get('size')),
 								            'quality': int_or_none(video.get('id')),
-												[ie/bilibili] Extract `format_id` (#7555)

Authored by: c-basalt
											
										
										
											2023-09-16 14:53:57 -06:00
+								            'format_id': traverse_obj(
 								                video, (('baseUrl', 'base_url'), {self._FORMAT_ID_RE.search}, 1),
 								                ('id', {str_or_none}), get_all=False),
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'format': format_names.get(video.get('id')),
 								        } for video in traverse_obj(play_info, ('dash', 'video', ...)))
 								        missing_formats = format_names.keys() - set(traverse_obj(formats, (..., 'quality')))
 								        if missing_formats:
 								            self.to_screen(f'Format(s) {", ".join(format_names[i] for i in missing_formats)} are missing; '
-												[cleanup] Misc

Closes #5541

											
										
										
											2022-11-15 17:57:43 -07:00
+								                           f'you have to login or become premium member to download them. {self._login_hint()}')
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
 								        return formats
 								    def json2srt(self, json_data):
 								        srt_data = ''
 								        for idx, line in enumerate(json_data.get('body') or []):
 								            srt_data += (f'{idx + 1}\n'
 								                         f'{srt_subtitles_timecode(line["from"])} --> {srt_subtitles_timecode(line["to"])}\n'
 								                         f'{line["content"]}\n\n')
 								        return srt_data
-												[extractor/bilibili] Fix for downloading wrong subtitles (#6358)

Closes #6357
Authored by: LXYan2333
											
										
										
											2023-03-04 07:44:48 -07:00
+								    def _get_subtitles(self, video_id, aid, cid):
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        subtitles = {
 								            'danmaku': [{
 								                'ext': 'xml',
 								                'url': f'https://comment.bilibili.com/{cid}.xml',
 								            }]
 								        }
-												[extractor/bilibili] Fix for downloading wrong subtitles (#6358)

Closes #6357
Authored by: LXYan2333
											
										
										
											2023-03-04 07:44:48 -07:00
+								        video_info_json = self._download_json(f'https://api.bilibili.com/x/player/v2?aid={aid}&cid={cid}', video_id)
 								        for s in traverse_obj(video_info_json, ('data', 'subtitle', 'subtitles', ...)):
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            subtitles.setdefault(s['lan'], []).append({
 								                'ext': 'srt',
 								                'data': self.json2srt(self._download_json(s['subtitle_url'], video_id))
 								            })
 								        return subtitles
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								    def _get_chapters(self, aid, cid):
 								        chapters = aid and cid and self._download_json(
 								            'https://api.bilibili.com/x/player/v2', aid, query={'aid': aid, 'cid': cid},
 								            note='Extracting chapters', fatal=False)
 								        return traverse_obj(chapters, ('data', 'view_points', ..., {
 								            'title': 'content',
 								            'start_time': 'from',
 								            'end_time': 'to',
 								        })) or None
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								    def _get_comments(self, aid):
 								        for idx in itertools.count(1):
 								            replies = traverse_obj(
 								                self._download_json(
 								                    f'https://api.bilibili.com/x/v2/reply?pn={idx}&oid={aid}&type=1&jsonp=jsonp&sort=2&_=1567227301685',
 								                    aid, note=f'Extracting comments from page {idx}', fatal=False),
 								                ('data', 'replies'))
 								            if not replies:
 								                return
 								            for children in map(self._get_all_children, replies):
 								                yield from children
 								    def _get_all_children(self, reply):
 								        yield {
 								            'author': traverse_obj(reply, ('member', 'uname')),
 								            'author_id': traverse_obj(reply, ('member', 'mid')),
 								            'id': reply.get('rpid'),
 								            'text': traverse_obj(reply, ('content', 'message')),
 								            'timestamp': reply.get('ctime'),
 								            'parent': reply.get('parent') or 'root',
 								        }
 								        for children in map(self._get_all_children, traverse_obj(reply, ('replies', ...))):
 								            yield from children
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								    def _get_episodes_from_season(self, ss_id, url):
 								        season_info = self._download_json(
 								            'https://api.bilibili.com/pgc/web/season/section', ss_id,
 								            note='Downloading season info', query={'season_id': ss_id},
 								            headers={'Referer': url, **self.geo_verification_headers()})
 								        for entry in traverse_obj(season_info, (
 								                'result', 'main_section', 'episodes',
 								                lambda _, v: url_or_none(v['share_url']) and v['id'])):
 								            yield self.url_result(entry['share_url'], BiliBiliBangumiIE, f'ep{entry["id"]}')
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
 								class BiliBiliIE(BilibiliBaseIE):
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/(?:video/|festival/\w+\?(?:[^#]*&)?bvid=)[aAbB][vV](?P<id>[^/?#&]+)'
-												[bilibili] Add preliminary support (#2174)

The URL http://www.bilibili.tv/video/av636603/index_2.html does not work yet.

											
										
										
											2014-04-21 05:45:27 -06:00
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								    _TESTS = [{
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        'url': 'https://www.bilibili.com/video/BV13x41117TL',
 								        'info_dict': {
 								            'id': 'BV13x41117TL',
 								            'title': '阿滴英文｜英文歌分享#6 "Closer',
 								            'ext': 'mp4',
 								            'description': '滴妹今天唱Closer給你聽! 有史以来，被推最多次也是最久的歌曲，其实歌词跟我原本想像差蛮多的，不过还是好听！ 微博@阿滴英文',
 								            'uploader_id': '65880958',
 								            'uploader': '阿滴英文',
 								            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
 								            'duration': 554.117,
 								            'tags': list,
 								            'comment_count': int,
 								            'upload_date': '20170301',
 								            'timestamp': 1488353834,
 								            'like_count': int,
 								            'view_count': int,
 								        },
 								    }, {
 								        # old av URL version
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
+								        'url': 'http://www.bilibili.com/video/av1074402/',
-												[bilibili] Add preliminary support (#2174)

The URL http://www.bilibili.tv/video/av636603/index_2.html does not work yet.

											
										
										
											2014-04-21 05:45:27 -06:00
+								        'info_dict': {
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'thumbnail': r're:^https?://.*\.(jpg|jpeg)$',
-												[Bilibili] Add 8k support (#1964)

Closes #1898, #1819
Authored by: u-spec-png
											
										
										
											2022-01-30 11:51:22 -07:00
+								            'ext': 'mp4',
 								            'uploader': '菊子桑',
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'uploader_id': '156160',
 								            'id': 'BV11x411K7CN',
 								            'title': '【金坷垃】金泡沫',
 								            'duration': 308.36,
-												[Bilibili] Add 8k support (#1964)

Closes #1898, #1819
Authored by: u-spec-png
											
										
										
											2022-01-30 11:51:22 -07:00
+								            'upload_date': '20140420',
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'timestamp': 1397983878,
-												[bilibili] Fix extraction, improve and cleanup

											
										
										
											2016-05-28 11:26:00 -06:00
+								            'description': 'md5:ce18c2a2d2193f0df2917d270f2e5923',
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'like_count': int,
 								            'comment_count': int,
 								            'view_count': int,
 								            'tags': list,
 								        },
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								        'params': {'skip_download': True},
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								    }, {
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        'note': 'Anthology',
 								        'url': 'https://www.bilibili.com/video/BV1bK411W797',
 								        'info_dict': {
 								            'id': 'BV1bK411W797',
 								            'title': '物语中的人物是如何吐槽自己的OP的'
 								        },
 								        'playlist_count': 18,
 								        'playlist': [{
 								            'info_dict': {
 								                'id': 'BV1bK411W797_p1',
 								                'ext': 'mp4',
 								                'title': '物语中的人物是如何吐槽自己的OP的 p01 Staple Stable/战场原+羽川',
 								                'tags': 'count:11',
 								                'timestamp': 1589601697,
 								                'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
 								                'uploader': '打牌还是打桩',
 								                'uploader_id': '150259984',
 								                'like_count': int,
 								                'comment_count': int,
 								                'upload_date': '20200516',
 								                'view_count': int,
 								                'description': 'md5:e3c401cf7bc363118d1783dd74068a68',
 								                'duration': 90.314,
 								            }
 								        }]
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
+								    }, {
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        'note': 'Specific page of Anthology',
 								        'url': 'https://www.bilibili.com/video/BV1bK411W797?p=1',
 								        'info_dict': {
 								            'id': 'BV1bK411W797_p1',
 								            'ext': 'mp4',
 								            'title': '物语中的人物是如何吐槽自己的OP的 p01 Staple Stable/战场原+羽川',
 								            'tags': 'count:11',
 								            'timestamp': 1589601697,
 								            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
 								            'uploader': '打牌还是打桩',
 								            'uploader_id': '150259984',
 								            'like_count': int,
 								            'comment_count': int,
 								            'upload_date': '20200516',
 								            'view_count': int,
 								            'description': 'md5:e3c401cf7bc363118d1783dd74068a68',
 								            'duration': 90.314,
 								        }
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								    }, {
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        'note': 'video has subtitles',
 								        'url': 'https://www.bilibili.com/video/BV12N4y1M7rh',
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								        'info_dict': {
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'id': 'BV12N4y1M7rh',
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								            'ext': 'mp4',
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								            'title': 'md5:96e8bb42c2b432c0d4ce3434a61479c1',
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'tags': list,
 								            'description': 'md5:afde2b7ba9025c01d9e3dde10de221e4',
 								            'duration': 313.557,
 								            'upload_date': '20220709',
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								            'uploader': '小夫太渴',
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'timestamp': 1657347907,
 								            'uploader_id': '1326814124',
 								            'comment_count': int,
 								            'view_count': int,
 								            'like_count': int,
 								            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
 								            'subtitles': 'count:2'
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								        },
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        'params': {'listsubtitles': True},
-												[bilibili] Fix extraction of videos with double quotes in titles

Closes #13387

											
										
										
											2017-06-14 21:19:03 -06:00
+								    }, {
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        'url': 'https://www.bilibili.com/video/av8903802/',
-												[bilibili] Fix extraction of videos with double quotes in titles

Closes #13387

											
										
										
											2017-06-14 21:19:03 -06:00
+								        'info_dict': {
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'id': 'BV13x41117TL',
-												[Bilibili] Add 8k support (#1964)

Closes #1898, #1819
Authored by: u-spec-png
											
										
										
											2022-01-30 11:51:22 -07:00
+								            'ext': 'mp4',
-												[bilibili] Fix extraction of videos with double quotes in titles

Closes #13387

											
										
										
											2017-06-14 21:19:03 -06:00
+								            'title': '阿滴英文｜英文歌分享#6 "Closer',
-												[Bilibili] Add 8k support (#1964)

Closes #1898, #1819
Authored by: u-spec-png
											
										
										
											2022-01-30 11:51:22 -07:00
+								            'upload_date': '20170301',
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								            'description': 'md5:3b1b9e25b78da4ef87e9b548b88ee76a',
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'timestamp': 1488353834,
-												[Bilibili] Add 8k support (#1964)

Closes #1898, #1819
Authored by: u-spec-png
											
										
										
											2022-01-30 11:51:22 -07:00
+								            'uploader_id': '65880958',
 								            'uploader': '阿滴英文',
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
-												[bilibili] Fix extraction of title with quotes (#3350)

Closes #3289
Authored by: dzek69
											
										
										
											2022-04-08 03:21:37 -06:00
+								            'duration': 554.117,
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'tags': list,
 								            'comment_count': int,
 								            'view_count': int,
 								            'like_count': int,
-												[bilibili] Fix extraction of title with quotes (#3350)

Closes #3289
Authored by: dzek69
											
										
										
											2022-04-08 03:21:37 -06:00
+								        },
 								        'params': {
 								            'skip_download': True,
 								        },
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								    }, {
 								        'note': 'video has chapter',
 								        'url': 'https://www.bilibili.com/video/BV1vL411G7N7/',
 								        'info_dict': {
 								            'id': 'BV1vL411G7N7',
 								            'ext': 'mp4',
 								            'title': '如何为你的B站视频添加进度条分段',
 								            'timestamp': 1634554558,
 								            'upload_date': '20211018',
 								            'description': 'md5:a9a3d6702b3a94518d419b2e9c320a6d',
 								            'tags': list,
 								            'uploader': '爱喝咖啡的当麻',
 								            'duration': 669.482,
 								            'uploader_id': '1680903',
 								            'chapters': 'count:6',
 								            'comment_count': int,
 								            'view_count': int,
 								            'like_count': int,
 								            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
 								        },
 								        'params': {'skip_download': True},
-												[extractor/bilibili] Support festival videos (#6547)

Closes #6138
Authored by: qbnu
											
										
										
											2023-04-17 20:37:37 -06:00
+								    }, {
 								        'note': 'video redirects to festival page',
 								        'url': 'https://www.bilibili.com/video/BV1wP4y1P72h',
 								        'info_dict': {
 								            'id': 'BV1wP4y1P72h',
 								            'ext': 'mp4',
 								            'title': '牛虎年相交之际，一首传统民族打击乐《牛斗虎》祝大家新春快乐，虎年大吉！【bilibili音乐虎闹新春】',
 								            'timestamp': 1643947497,
 								            'upload_date': '20220204',
 								            'description': 'md5:8681a0d4d2c06b4ae27e59c8080a7fe6',
 								            'uploader': '叨叨冯聊音乐',
 								            'duration': 246.719,
 								            'uploader_id': '528182630',
 								            'view_count': int,
 								            'like_count': int,
 								            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
 								        },
 								        'params': {'skip_download': True},
 								    }, {
 								        'note': 'newer festival video',
 								        'url': 'https://www.bilibili.com/festival/2023honkaiimpact3gala?bvid=BV1ay4y1d77f',
 								        'info_dict': {
 								            'id': 'BV1ay4y1d77f',
 								            'ext': 'mp4',
 								            'title': '【崩坏3新春剧场】为特别的你送上祝福！',
 								            'timestamp': 1674273600,
 								            'upload_date': '20230121',
 								            'description': 'md5:58af66d15c6a0122dc30c8adfd828dd8',
 								            'uploader': '果蝇轰',
 								            'duration': 1111.722,
 								            'uploader_id': '8469526',
 								            'view_count': int,
 								            'like_count': int,
 								            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$',
 								        },
 								        'params': {'skip_download': True},
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								    }]
-												[bilibili] Add preliminary support (#2174)

The URL http://www.bilibili.tv/video/av636603/index_2.html does not work yet.

											
										
										
											2014-04-21 05:45:27 -06:00
-												[bilibili] add support for specefic page extraction

											
										
										
											2015-10-17 16:12:58 -06:00
+								    def _real_extract(self, url):
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        video_id = self._match_id(url)
-												[bilibili] Fix extraction, improve and cleanup

											
										
										
											2016-05-28 11:26:00 -06:00
+								        webpage = self._download_webpage(url, video_id)
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								        initial_state = self._search_json(r'window\.__INITIAL_STATE__\s*=', webpage, 'initial state', video_id)
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
-												[extractor/bilibili] Support festival videos (#6547)

Closes #6138
Authored by: qbnu
											
										
										
											2023-04-17 20:37:37 -06:00
+								        is_festival = 'videoData' not in initial_state
 								        if is_festival:
 								            video_data = initial_state['videoInfo']
 								        else:
 								            play_info = self._search_json(r'window\.__playinfo__\s*=', webpage, 'play info', video_id)['data']
 								            video_data = initial_state['videoData']
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        video_id, title = video_data['bvid'], video_data.get('title')
-												[bilibili] Fix extraction, improve and cleanup

											
										
										
											2016-05-28 11:26:00 -06:00
-												[bilibili] Add anthology support
Closes: #118

Co-authored by: animelover1984

											
										
										
											2021-03-20 03:07:43 -06:00
+								        # Bilibili anthologies are similar to playlists but all videos share the same video ID as the anthology itself.
-												[extractor/bilibili] Support festival videos (#6547)

Closes #6138
Authored by: qbnu
											
										
										
											2023-04-17 20:37:37 -06:00
+								        page_list_json = not is_festival and traverse_obj(
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            self._download_json(
 								                'https://api.bilibili.com/x/player/pagelist', video_id,
 								                fatal=False, query={'bvid': video_id, 'jsonp': 'jsonp'},
 								                note='Extracting videos in anthology'),
 								            'data', expected_type=list) or []
 								        is_anthology = len(page_list_json) > 1
 								        part_id = int_or_none(parse_qs(url).get('p', [None])[-1])
 								        if is_anthology and not part_id and self._yes_playlist(video_id, video_id):
 								            return self.playlist_from_matches(
 								                page_list_json, video_id, title, ie=BiliBiliIE,
 								                getter=lambda entry: f'https://www.bilibili.com/video/{video_id}?p={entry["page"]}')
-												Update to ytdl-commit-3be0980
https://github.com/ytdl-org/youtube-dl/commit/3be098010f667b14075e3dfad1e74e5e2becc8ea

											
										
										
											2021-03-14 17:22:06 -06:00
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        if is_anthology:
-												[extractor/bilibili] Fix `--no-playlist` for anthology

Closes #5797

											
										
										
											2022-12-29 23:27:33 -07:00
+								            part_id = part_id or 1
 								            title += f' p{part_id:02d} {traverse_obj(page_list_json, (part_id - 1, "part")) or ""}'
-												[Bilibili] Add 8k support (#1964)

Closes #1898, #1819
Authored by: u-spec-png
											
										
										
											2022-01-30 11:51:22 -07:00
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        aid = video_data.get('aid')
 								        old_video_id = format_field(aid, None, f'%s_part{part_id or 1}')
-												[Bilibili] Add 8k support (#1964)

Closes #1898, #1819
Authored by: u-spec-png
											
										
										
											2022-01-30 11:51:22 -07:00
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								        cid = traverse_obj(video_data, ('pages', part_id - 1, 'cid')) if part_id else video_data.get('cid')
-												[extractor/bilibili] Support festival videos (#6547)

Closes #6138
Authored by: qbnu
											
										
										
											2023-04-17 20:37:37 -06:00
+								        festival_info = {}
 								        if is_festival:
 								            play_info = self._download_json(
 								                'https://api.bilibili.com/x/player/playurl', video_id,
 								                query={'bvid': video_id, 'cid': cid, 'fnval': 4048},
 								                note='Extracting festival video formats')['data']
 								            festival_info = traverse_obj(initial_state, {
 								                'uploader': ('videoInfo', 'upName'),
 								                'uploader_id': ('videoInfo', 'upMid', {str_or_none}),
 								                'like_count': ('videoStatus', 'like', {int_or_none}),
 								                'thumbnail': ('sectionEpisodes', lambda _, v: v['bvid'] == video_id, 'cover'),
 								            }, get_all=False)
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        return {
-												[extractor/bilibili] Support festival videos (#6547)

Closes #6138
Authored by: qbnu
											
										
										
											2023-04-17 20:37:37 -06:00
+								            **traverse_obj(initial_state, {
 								                'uploader': ('upData', 'name'),
 								                'uploader_id': ('upData', 'mid', {str_or_none}),
 								                'like_count': ('videoData', 'stat', 'like', {int_or_none}),
 								                'tags': ('tags', ..., 'tag_name'),
 								                'thumbnail': ('videoData', 'pic', {url_or_none}),
 								            }),
 								            **festival_info,
 								            **traverse_obj(video_data, {
 								                'description': 'desc',
 								                'timestamp': ('pubdate', {int_or_none}),
 								                'view_count': (('viewCount', ('stat', 'view')), {int_or_none}),
 								                'comment_count': ('stat', 'reply', {int_or_none}),
 								            }, get_all=False),
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'id': f'{video_id}{format_field(part_id, None, "_p%d")}',
 								            'formats': self.extract_formats(play_info),
 								            '_old_archive_ids': [make_archive_id(self, old_video_id)] if old_video_id else None,
-												[bilibili] fix info extraction

											
										
										
											2015-10-17 10:28:09 -06:00
+								            'title': title,
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								            'duration': float_or_none(play_info.get('timelength'), scale=1000),
 								            'chapters': self._get_chapters(aid, cid),
-												[extractor/bilibili] Fix for downloading wrong subtitles (#6358)

Closes #6357
Authored by: LXYan2333
											
										
										
											2023-03-04 07:44:48 -07:00
+								            'subtitles': self.extract_subtitles(video_id, aid, cid),
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								            '__post_extractor': self.extract_comments(aid),
 								            'http_headers': {'Referer': url},
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
+								        }
-												Extract comments only when needed #95 (Closes #94)


											
										
										
											2021-02-28 07:56:08 -07:00
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								class BiliBiliBangumiIE(BilibiliBaseIE):
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/bangumi/play/(?P<id>ep\d+)'
-												[cleanup] Cleanup bilibili code
Closes #1169
Authored by pukkandan, u-spec-png

											
										
										
											2021-10-08 14:44:23 -06:00
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								    _TESTS = [{
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        'url': 'https://www.bilibili.com/bangumi/play/ep267851',
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        'info_dict': {
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								            'id': '267851',
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'ext': 'mp4',
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								            'series': '鬼灭之刃',
 								            'series_id': '4358',
 								            'season': '鬼灭之刃',
 								            'season_id': '26801',
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'season_number': 1,
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								            'episode': '残酷',
 								            'episode_id': '267851',
 								            'episode_number': 1,
 								            'title': '1 残酷',
 								            'duration': 1425.256,
 								            'timestamp': 1554566400,
 								            'upload_date': '20190406',
 								            'thumbnail': r're:^https?://.*\.(jpg|jpeg|png)$'
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        },
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        'skip': 'According to the copyright owner\'s request, you may only watch the video after you are premium member.'
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								    }]
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								    def _real_extract(self, url):
 								        video_id = self._match_id(url)
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        episode_id = video_id[2:]
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        webpage = self._download_webpage(url, video_id)
-												[cleanup] Cleanup bilibili code
Closes #1169
Authored by pukkandan, u-spec-png

											
										
										
											2021-10-08 14:44:23 -06:00
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        if '您所在的地区无法观看本片' in webpage:
 								            raise GeoRestrictedError('This video is restricted')
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        elif '正在观看预览，大会员免费看全片' in webpage:
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            self.raise_login_required('This video is for premium members only')
-												[bilibili] Fix extraction, improve and cleanup

											
										
										
											2016-05-28 11:26:00 -06:00
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        headers = {'Referer': url, **self.geo_verification_headers()}
 								        play_info = self._download_json(
 								            'https://api.bilibili.com/pgc/player/web/v2/playurl', video_id,
 								            'Extracting episode', query={'fnval': '4048', 'ep_id': episode_id},
 								            headers=headers)
 								        premium_only = play_info.get('code') == -10403
 								        play_info = traverse_obj(play_info, ('result', 'video_info', {dict})) or {}
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        formats = self.extract_formats(play_info)
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        if not formats and (premium_only or '成为大会员抢先看' in webpage or '开通大会员观看' in webpage):
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            self.raise_login_required('This video is for premium members only')
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        bangumi_info = self._download_json(
 								            'https://api.bilibili.com/pgc/view/web/season', video_id, 'Get episode details',
 								            query={'ep_id': episode_id}, headers=headers)['result']
 								        episode_number, episode_info = next((
 								            (idx, ep) for idx, ep in enumerate(traverse_obj(
 								                bangumi_info, ('episodes', ..., {dict})), 1)
 								            if str_or_none(ep.get('id')) == episode_id), (1, {}))
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        season_id = bangumi_info.get('season_id')
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								        season_number = season_id and next((
 								            idx + 1 for idx, e in enumerate(
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								                traverse_obj(bangumi_info, ('seasons', ...)))
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								            if e.get('season_id') == season_id
 								        ), None)
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        aid = episode_info.get('aid')
-												[cleanup] Cleanup bilibili code
Closes #1169
Authored by pukkandan, u-spec-png

											
										
										
											2021-10-08 14:44:23 -06:00
+								        return {
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'id': video_id,
 								            'formats': formats,
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								            **traverse_obj(bangumi_info, {
 								                'series': ('series', 'series_title', {str}),
 								                'series_id': ('series', 'series_id', {str_or_none}),
 								                'thumbnail': ('square_cover', {url_or_none}),
 								            }),
 								            'title': join_nonempty('title', 'long_title', delim=' ', from_dict=episode_info),
 								            'episode': episode_info.get('long_title'),
 								            'episode_id': episode_id,
 								            'episode_number': int_or_none(episode_info.get('title')) or episode_number,
 								            'season_id': str_or_none(season_id),
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								            'season_number': season_number,
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								            'timestamp': int_or_none(episode_info.get('pub_time')),
-												[extractor/bilibili] Add chapters and misc cleanup (#4221)

Authored by: lockmatrix, pukkandan

											
										
										
											2022-10-25 08:39:27 -06:00
+								            'duration': float_or_none(play_info.get('timelength'), scale=1000),
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								            'subtitles': self.extract_subtitles(video_id, aid, episode_info.get('cid')),
 								            '__post_extractor': self.extract_comments(aid),
 								            'http_headers': headers,
-												[cleanup] Cleanup bilibili code
Closes #1169
Authored by pukkandan, u-spec-png

											
										
										
											2021-10-08 14:44:23 -06:00
+								        }
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								class BiliBiliBangumiMediaIE(BilibiliBaseIE):
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/bangumi/media/md(?P<id>\d+)'
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								    _TESTS = [{
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        'url': 'https://www.bilibili.com/bangumi/media/md24097891',
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								        'info_dict': {
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								            'id': '24097891',
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								        },
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        'playlist_mincount': 25,
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
+								    }]
 								    def _real_extract(self, url):
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        media_id = self._match_id(url)
 								        webpage = self._download_webpage(url, media_id)
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        ss_id = self._search_json(
 								            r'window\.__INITIAL_STATE__\s*=', webpage, 'initial_state', media_id)['mediaInfo']['season_id']
 								        return self.playlist_result(self._get_episodes_from_season(ss_id, url), media_id)
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								class BiliBiliBangumiSeasonIE(BilibiliBaseIE):
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								    _VALID_URL = r'(?x)https?://(?:www\.)?bilibili\.com/bangumi/play/ss(?P<id>\d+)'
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								    _TESTS = [{
 								        'url': 'https://www.bilibili.com/bangumi/play/ss26801',
 								        'info_dict': {
 								            'id': '26801'
 								        },
 								        'playlist_mincount': 26
 								    }]
 								    def _real_extract(self, url):
 								        ss_id = self._match_id(url)
-												[bilibili] Support new Bangumi URLs (closes #11845)

To reduce complexity, I don't support old Bangumi URLs directly via
_VALID_URL. Instead, I choose to let it go to generic redirection. An
example can be found in #10190:

http://bangumi.bilibili.com/anime/v/40062

											
										
										
											2017-02-02 06:51:31 -07:00
-												[ie/BiliBiliBangumi] Fix extractors (#7337)

- Overhaul BiliBiliBangumi extractor for the site's new API
- Add BiliBiliBangumiSeason extractor
- Refactor BiliBiliBangumiMedia extractor

Closes #6701, Closes #7400
Authored by: GD-Slime
											
										
										
											2023-07-08 16:26:03 -06:00
+								        return self.playlist_result(self._get_episodes_from_season(ss_id, url), ss_id)
-												[bilibili] add support audio albums and songs(closes #21094)

											
										
										
											2019-09-22 10:14:18 -06:00
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								class BilibiliSpaceBaseIE(InfoExtractor):
 								    def _extract_playlist(self, fetch_page, get_metadata, get_entries):
-												[extractor/BilibiliSpace] Fix extractor, better error message (#5043)

Closes #5038
Authored by: lockmatrix
											
										
										
											2022-10-03 20:59:05 -06:00
+								        first_page = fetch_page(0)
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								        metadata = get_metadata(first_page)
 								        paged_list = InAdvancePagedList(
-												[extractor/BilibiliSpace] Fix extractor, better error message (#5043)

Closes #5038
Authored by: lockmatrix
											
										
										
											2022-10-03 20:59:05 -06:00
+								            lambda idx: get_entries(fetch_page(idx) if idx else first_page),
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								            metadata['page_count'], metadata['page_size'])
 								        return metadata, paged_list
 								class BilibiliSpaceVideoIE(BilibiliSpaceBaseIE):
 								    _VALID_URL = r'https?://space\.bilibili\.com/(?P<id>\d+)(?P<video>/video)?/?(?:[?#]|$)'
-												[BilibiliChannel] Fix pagination
Closes #222

https://github.com/nao20010128nao/ytdl-patched/commit/ccca21d7f57f1330a205f07d369e31883ba006c2
Coauthored by: nao20010128nao, pukkandan

											
										
										
											2021-04-21 16:43:04 -06:00
+								    _TESTS = [{
 								        'url': 'https://space.bilibili.com/3985676/video',
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								        'info_dict': {
 								            'id': '3985676',
 								        },
 								        'playlist_mincount': 178,
-												[extractor/bilibili:SpaceVideo] Extract signature (#7149)

Authored by: elyse0
Closes #6956, closes #7081
											
										
										
											2023-05-29 09:30:30 -06:00
+								    }, {
 								        'url': 'https://space.bilibili.com/313580179/video',
 								        'info_dict': {
 								            'id': '313580179',
 								        },
 								        'playlist_mincount': 92,
-												[BilibiliChannel] Fix pagination
Closes #222

https://github.com/nao20010128nao/ytdl-patched/commit/ccca21d7f57f1330a205f07d369e31883ba006c2
Coauthored by: nao20010128nao, pukkandan

											
										
										
											2021-04-21 16:43:04 -06:00
+								    }]
-												[extractor/bilibili:SpaceVideo] Extract signature (#7149)

Authored by: elyse0
Closes #6956, closes #7081
											
										
										
											2023-05-29 09:30:30 -06:00
+								    def _extract_signature(self, playlist_id):
 								        session_data = self._download_json('https://api.bilibili.com/x/web-interface/nav', playlist_id, fatal=False)
 								        key_from_url = lambda x: x[x.rfind('/') + 1:].split('.')[0]
 								        img_key = traverse_obj(
 								            session_data, ('data', 'wbi_img', 'img_url', {key_from_url})) or '34478ba821254d9d93542680e3b86100'
 								        sub_key = traverse_obj(
 								            session_data, ('data', 'wbi_img', 'sub_url', {key_from_url})) or '7e16a90d190a4355a78fd00b32a38de6'
 								        session_key = img_key + sub_key
 								        signature_values = []
 								        for position in (
 , 47, 18, 2, 53, 8, 23, 32, 15, 50, 10, 31, 58, 3, 45, 35, 27, 43, 5, 49, 33, 9, 42, 19, 29, 28, 14, 39,
 , 38, 41, 13, 37, 48, 7, 16, 24, 55, 40, 61, 26, 17, 0, 1, 60, 51, 30, 4, 22, 25, 54, 21, 56, 59, 6, 63,
 , 62, 11, 36, 20, 34, 44, 52
 								        ):
 								            char_at_position = try_call(lambda: session_key[position])
 								            if char_at_position:
 								                signature_values.append(char_at_position)
 								        return ''.join(signature_values)[:32]
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								    def _real_extract(self, url):
 								        playlist_id, is_video_url = self._match_valid_url(url).group('id', 'video')
 								        if not is_video_url:
 								            self.to_screen('A channel URL was given. Only the channel\'s videos will be downloaded. '
 								                           'To download audios, add a "/audio" to the URL')
-												[extractor/bilibili:SpaceVideo] Extract signature (#7149)

Authored by: elyse0
Closes #6956, closes #7081
											
										
										
											2023-05-29 09:30:30 -06:00
+								        signature = self._extract_signature(playlist_id)
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								        def fetch_page(page_idx):
-												[extractor/bilibili:SpaceVideo] Extract signature (#7149)

Authored by: elyse0
Closes #6956, closes #7081
											
										
										
											2023-05-29 09:30:30 -06:00
+								            query = {
 								                'keyword': '',
 								                'mid': playlist_id,
 								                'order': 'pubdate',
 								                'order_avoided': 'true',
 								                'platform': 'web',
 								                'pn': page_idx + 1,
 								                'ps': 30,
 								                'tid': 0,
 								                'web_location': 1550101,
 								                'wts': int(time.time()),
 								            }
 								            query['w_rid'] = hashlib.md5(f'{urllib.parse.urlencode(query)}{signature}'.encode()).hexdigest()
-												[extractor/BilibiliSpace] Fix extractor, better error message (#5043)

Closes #5038
Authored by: lockmatrix
											
										
										
											2022-10-03 20:59:05 -06:00
+								            try:
-												[extractor/bilibili:SpaceVideo] Extract signature (#7149)

Authored by: elyse0
Closes #6956, closes #7081
											
										
										
											2023-05-29 09:30:30 -06:00
+								                response = self._download_json('https://api.bilibili.com/x/space/wbi/arc/search',
 								                                               playlist_id, note=f'Downloading page {page_idx}', query=query)
-												[extractor/BilibiliSpace] Fix extractor, better error message (#5043)

Closes #5038
Authored by: lockmatrix
											
										
										
											2022-10-03 20:59:05 -06:00
+								            except ExtractorError as e:
-												[compat, networking] Deprecate old functions (#2861)

Authored by: coletdjnz, pukkandan

											
										
										
											2023-07-09 01:53:02 -06:00
+								                if isinstance(e.cause, HTTPError) and e.cause.status == 412:
-												[extractor/BilibiliSpace] Fix extractor, better error message (#5043)

Closes #5038
Authored by: lockmatrix
											
										
										
											2022-10-03 20:59:05 -06:00
+								                    raise ExtractorError(
 								                        'Request is blocked by server (412), please add cookies, wait and try later.', expected=True)
 								                raise
 								            if response['code'] == -401:
 								                raise ExtractorError(
 								                    'Request is blocked by server (401), please add cookies, wait and try later.', expected=True)
 								            return response['data']
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
 								        def get_metadata(page_data):
 								            page_size = page_data['page']['ps']
 								            entry_count = page_data['page']['count']
 								            return {
 								                'page_count': math.ceil(entry_count / page_size),
 								                'page_size': page_size,
 								            }
-												[BilibiliChannel] Fix pagination
Closes #222

https://github.com/nao20010128nao/ytdl-patched/commit/ccca21d7f57f1330a205f07d369e31883ba006c2
Coauthored by: nao20010128nao, pukkandan

											
										
										
											2021-04-21 16:43:04 -06:00
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								        def get_entries(page_data):
 								            for entry in traverse_obj(page_data, ('list', 'vlist')) or []:
 								                yield self.url_result(f'https://www.bilibili.com/video/{entry["bvid"]}', BiliBiliIE, entry['bvid'])
-												[BilibiliChannel] Fix pagination
Closes #222

https://github.com/nao20010128nao/ytdl-patched/commit/ccca21d7f57f1330a205f07d369e31883ba006c2
Coauthored by: nao20010128nao, pukkandan

											
										
										
											2021-04-21 16:43:04 -06:00
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								        metadata, paged_list = self._extract_playlist(fetch_page, get_metadata, get_entries)
 								        return self.playlist_result(paged_list, playlist_id)
-												[BilibiliChannel] Fix pagination
Closes #222

https://github.com/nao20010128nao/ytdl-patched/commit/ccca21d7f57f1330a205f07d369e31883ba006c2
Coauthored by: nao20010128nao, pukkandan

											
										
										
											2021-04-21 16:43:04 -06:00
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								class BilibiliSpaceAudioIE(BilibiliSpaceBaseIE):
 								    _VALID_URL = r'https?://space\.bilibili\.com/(?P<id>\d+)/audio'
 								    _TESTS = [{
-												[extractor/bilibili:SpaceVideo] Extract signature (#7149)

Authored by: elyse0
Closes #6956, closes #7081
											
										
										
											2023-05-29 09:30:30 -06:00
+								        'url': 'https://space.bilibili.com/313580179/audio',
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								        'info_dict': {
-												[extractor/bilibili:SpaceVideo] Extract signature (#7149)

Authored by: elyse0
Closes #6956, closes #7081
											
										
										
											2023-05-29 09:30:30 -06:00
+								            'id': '313580179',
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								        },
 								        'playlist_mincount': 1,
 								    }]
 								    def _real_extract(self, url):
 								        playlist_id = self._match_id(url)
 								        def fetch_page(page_idx):
 								            return self._download_json(
 								                'https://api.bilibili.com/audio/music-service/web/song/upper', playlist_id,
 								                note=f'Downloading page {page_idx}',
-												[extractor/BilibiliSpace] Fix extractor, better error message (#5043)

Closes #5038
Authored by: lockmatrix
											
										
										
											2022-10-03 20:59:05 -06:00
+								                query={'uid': playlist_id, 'pn': page_idx + 1, 'ps': 30, 'order': 1, 'jsonp': 'jsonp'})['data']
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
 								        def get_metadata(page_data):
 								            return {
 								                'page_count': page_data['pageCount'],
 								                'page_size': page_data['pageSize'],
 								            }
 								        def get_entries(page_data):
 								            for entry in page_data.get('data', []):
 								                yield self.url_result(f'https://www.bilibili.com/audio/au{entry["id"]}', BilibiliAudioIE, entry['id'])
 								        metadata, paged_list = self._extract_playlist(fetch_page, get_metadata, get_entries)
 								        return self.playlist_result(paged_list, playlist_id)
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								class BilibiliSpaceListBaseIE(BilibiliSpaceBaseIE):
 								    def _get_entries(self, page_data, bvid_keys, ending_key='bvid'):
 								        for bvid in traverse_obj(page_data, (*variadic(bvid_keys, (str, bytes, dict, set)), ..., ending_key, {str})):
 								            yield self.url_result(f'https://www.bilibili.com/video/{bvid}', BiliBiliIE, bvid)
 								    def _get_uploader(self, uid, playlist_id):
 								        webpage = self._download_webpage(f'https://space.bilibili.com/{uid}', playlist_id, fatal=False)
 								        return self._search_regex(r'(?s)<title\b[^>]*>([^<]+)的个人空间-', webpage, 'uploader', fatal=False)
 								    def _extract_playlist(self, fetch_page, get_metadata, get_entries):
 								        metadata, page_list = super()._extract_playlist(fetch_page, get_metadata, get_entries)
 								        metadata.pop('page_count', None)
 								        metadata.pop('page_size', None)
 								        return metadata, page_list
 								class BilibiliCollectionListIE(BilibiliSpaceListBaseIE):
 								    _VALID_URL = r'https?://space\.bilibili\.com/(?P<mid>\d+)/channel/collectiondetail/?\?sid=(?P<sid>\d+)'
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								    _TESTS = [{
 								        'url': 'https://space.bilibili.com/2142762/channel/collectiondetail?sid=57445',
 								        'info_dict': {
 								            'id': '2142762_57445',
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								            'title': '【完结】《底特律 变人》全结局流程解说',
 								            'description': '',
 								            'uploader': '老戴在此',
 								            'uploader_id': '2142762',
 								            'timestamp': int,
 								            'upload_date': str,
 								            'thumbnail': 'https://archive.biliimg.com/bfs/archive/e0e543ae35ad3df863ea7dea526bc32e70f4c091.jpg',
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								        },
 								        'playlist_mincount': 31,
 								    }]
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
 								    def _real_extract(self, url):
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								        mid, sid = self._match_valid_url(url).group('mid', 'sid')
 								        playlist_id = f'{mid}_{sid}'
 								        def fetch_page(page_idx):
 								            return self._download_json(
 								                'https://api.bilibili.com/x/polymer/space/seasons_archives_list',
 								                playlist_id, note=f'Downloading page {page_idx}',
-												[extractor/BilibiliSpace] Fix extractor, better error message (#5043)

Closes #5038
Authored by: lockmatrix
											
										
										
											2022-10-03 20:59:05 -06:00
+								                query={'mid': mid, 'season_id': sid, 'page_num': page_idx + 1, 'page_size': 30})['data']
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
 								        def get_metadata(page_data):
 								            page_size = page_data['page']['page_size']
 								            entry_count = page_data['page']['total']
 								            return {
 								                'page_count': math.ceil(entry_count / page_size),
 								                'page_size': page_size,
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								                'uploader': self._get_uploader(mid, playlist_id),
 								                **traverse_obj(page_data, {
 								                    'title': ('meta', 'name', {str}),
 								                    'description': ('meta', 'description', {str}),
 								                    'uploader_id': ('meta', 'mid', {str_or_none}),
 								                    'timestamp': ('meta', 'ptime', {int_or_none}),
 								                    'thumbnail': ('meta', 'cover', {url_or_none}),
 								                })
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
+								            }
 								        def get_entries(page_data):
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								            return self._get_entries(page_data, 'archives')
-												[extractor/bilibili] Add space.bilibili extractors (#4468)

Authored by: lockmatrix
											
										
										
											2022-09-16 09:59:02 -06:00
 								        metadata, paged_list = self._extract_playlist(fetch_page, get_metadata, get_entries)
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								        return self.playlist_result(paged_list, playlist_id, **metadata)
 								class BilibiliSeriesListIE(BilibiliSpaceListBaseIE):
 								    _VALID_URL = r'https?://space\.bilibili\.com/(?P<mid>\d+)/channel/seriesdetail/?\?\bsid=(?P<sid>\d+)'
 								    _TESTS = [{
 								        'url': 'https://space.bilibili.com/1958703906/channel/seriesdetail?sid=547718&ctype=0',
 								        'info_dict': {
 								            'id': '1958703906_547718',
 								            'title': '直播回放',
 								            'description': '直播回放',
 								            'uploader': '靡烟miya',
 								            'uploader_id': '1958703906',
 								            'timestamp': 1637985853,
 								            'upload_date': '20211127',
 								            'modified_timestamp': int,
 								            'modified_date': str,
 								        },
 								        'playlist_mincount': 513,
 								    }]
 								    def _real_extract(self, url):
 								        mid, sid = self._match_valid_url(url).group('mid', 'sid')
 								        playlist_id = f'{mid}_{sid}'
 								        playlist_meta = traverse_obj(self._download_json(
 								            f'https://api.bilibili.com/x/series/series?series_id={sid}', playlist_id, fatal=False
 								        ), {
 								            'title': ('data', 'meta', 'name', {str}),
 								            'description': ('data', 'meta', 'description', {str}),
 								            'uploader_id': ('data', 'meta', 'mid', {str_or_none}),
 								            'timestamp': ('data', 'meta', 'ctime', {int_or_none}),
 								            'modified_timestamp': ('data', 'meta', 'mtime', {int_or_none}),
 								        })
 								        def fetch_page(page_idx):
 								            return self._download_json(
 								                'https://api.bilibili.com/x/series/archives',
 								                playlist_id, note=f'Downloading page {page_idx}',
 								                query={'mid': mid, 'series_id': sid, 'pn': page_idx + 1, 'ps': 30})['data']
 								        def get_metadata(page_data):
 								            page_size = page_data['page']['size']
 								            entry_count = page_data['page']['total']
 								            return {
 								                'page_count': math.ceil(entry_count / page_size),
 								                'page_size': page_size,
 								                'uploader': self._get_uploader(mid, playlist_id),
 								                **playlist_meta
 								            }
 								        def get_entries(page_data):
 								            return self._get_entries(page_data, 'archives')
 								        metadata, paged_list = self._extract_playlist(fetch_page, get_metadata, get_entries)
 								        return self.playlist_result(paged_list, playlist_id, **metadata)
 								class BilibiliFavoritesListIE(BilibiliSpaceListBaseIE):
 								    _VALID_URL = r'https?://(?:space\.bilibili\.com/\d+/favlist/?\?fid=|(?:www\.)?bilibili\.com/medialist/detail/ml)(?P<id>\d+)'
 								    _TESTS = [{
 								        'url': 'https://space.bilibili.com/84912/favlist?fid=1103407912&ftype=create',
 								        'info_dict': {
 								            'id': '1103407912',
 								            'title': '【V2】（旧）',
 								            'description': '',
 								            'uploader': '晓月春日',
 								            'uploader_id': '84912',
 								            'timestamp': 1604905176,
 								            'upload_date': '20201109',
 								            'modified_timestamp': int,
 								            'modified_date': str,
 								            'thumbnail': r"re:http://i\d\.hdslb\.com/bfs/archive/14b83c62aa8871b79083df1e9ab4fbc699ad16fe\.jpg",
 								            'view_count': int,
 								            'like_count': int,
 								        },
 								        'playlist_mincount': 22,
 								    }, {
 								        'url': 'https://www.bilibili.com/medialist/detail/ml1103407912',
 								        'only_matching': True,
 								    }]
 								    def _real_extract(self, url):
 								        fid = self._match_id(url)
 								        list_info = self._download_json(
 								            f'https://api.bilibili.com/x/v3/fav/resource/list?media_id={fid}&pn=1&ps=20',
 								            fid, note='Downloading favlist metadata')
 								        if list_info['code'] == -403:
 								            self.raise_login_required(msg='This is a private favorites list. You need to log in as its owner')
 								        entries = self._get_entries(self._download_json(
 								            f'https://api.bilibili.com/x/v3/fav/resource/ids?media_id={fid}',
 								            fid, note='Download favlist entries'), 'data')
 								        return self.playlist_result(entries, fid, **traverse_obj(list_info, ('data', 'info', {
 								            'title': ('title', {str}),
 								            'description': ('intro', {str}),
 								            'uploader': ('upper', 'name', {str}),
 								            'uploader_id': ('upper', 'mid', {str_or_none}),
 								            'timestamp': ('ctime', {int_or_none}),
 								            'modified_timestamp': ('mtime', {int_or_none}),
 								            'thumbnail': ('cover', {url_or_none}),
 								            'view_count': ('cnt_info', 'play', {int_or_none}),
 								            'like_count': ('cnt_info', 'thumb_up', {int_or_none}),
 								        })))
 								class BilibiliWatchlaterIE(BilibiliSpaceListBaseIE):
 								    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/watchlater/?(?:[?#]|$)'
 								    _TESTS = [{
 								        'url': 'https://www.bilibili.com/watchlater/#/list',
 								        'info_dict': {'id': 'watchlater'},
 								        'playlist_mincount': 0,
 								        'skip': 'login required',
 								    }]
 								    def _real_extract(self, url):
 								        list_id = getattr(self._get_cookies(url).get('DedeUserID'), 'value', 'watchlater')
 								        watchlater_info = self._download_json(
 								            'https://api.bilibili.com/x/v2/history/toview/web?jsonp=jsonp', list_id)
 								        if watchlater_info['code'] == -101:
 								            self.raise_login_required(msg='You need to login to access your watchlater list')
 								        entries = self._get_entries(watchlater_info, ('data', 'list'))
 								        return self.playlist_result(entries, id=list_id, title='稍后再看')
 								class BilibiliPlaylistIE(BilibiliSpaceListBaseIE):
 								    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/(?:medialist/play|list)/(?P<id>\w+)'
 								    _TESTS = [{
 								        'url': 'https://www.bilibili.com/list/1958703906?sid=547718',
 								        'info_dict': {
 								            'id': '5_547718',
 								            'title': '直播回放',
 								            'uploader': '靡烟miya',
 								            'uploader_id': '1958703906',
 								            'timestamp': 1637985853,
 								            'upload_date': '20211127',
 								        },
 								        'playlist_mincount': 513,
 								    }, {
 								        'url': 'https://www.bilibili.com/medialist/play/1958703906?business=space_series&business_id=547718&desc=1',
 								        'info_dict': {
 								            'id': '5_547718',
 								        },
 								        'playlist_mincount': 513,
 								        'skip': 'redirect url',
 								    }, {
 								        'url': 'https://www.bilibili.com/list/ml1103407912',
 								        'info_dict': {
 								            'id': '3_1103407912',
 								            'title': '【V2】（旧）',
 								            'uploader': '晓月春日',
 								            'uploader_id': '84912',
 								            'timestamp': 1604905176,
 								            'upload_date': '20201109',
 								            'thumbnail': r"re:http://i\d\.hdslb\.com/bfs/archive/14b83c62aa8871b79083df1e9ab4fbc699ad16fe\.jpg",
 								        },
 								        'playlist_mincount': 22,
 								    }, {
 								        'url': 'https://www.bilibili.com/medialist/play/ml1103407912',
 								        'info_dict': {
 								            'id': '3_1103407912',
 								        },
 								        'playlist_mincount': 22,
 								        'skip': 'redirect url',
 								    }, {
 								        'url': 'https://www.bilibili.com/list/watchlater',
 								        'info_dict': {'id': 'watchlater'},
 								        'playlist_mincount': 0,
 								        'skip': 'login required',
 								    }, {
 								        'url': 'https://www.bilibili.com/medialist/play/watchlater',
 								        'info_dict': {'id': 'watchlater'},
 								        'playlist_mincount': 0,
 								        'skip': 'login required',
 								    }]
 								    def _extract_medialist(self, query, list_id):
 								        for page_num in itertools.count(1):
 								            page_data = self._download_json(
 								                'https://api.bilibili.com/x/v2/medialist/resource/list',
 								                list_id, query=query, note=f'getting playlist {query["biz_id"]} page {page_num}'
 								            )['data']
 								            yield from self._get_entries(page_data, 'media_list', ending_key='bv_id')
 								            query['oid'] = traverse_obj(page_data, ('media_list', -1, 'id'))
 								            if not page_data.get('has_more', False):
 								                break
 								    def _real_extract(self, url):
 								        list_id = self._match_id(url)
 								        webpage = self._download_webpage(url, list_id)
 								        initial_state = self._search_json(r'window\.__INITIAL_STATE__\s*=', webpage, 'initial state', list_id)
 								        if traverse_obj(initial_state, ('error', 'code', {int_or_none})) != 200:
 								            error_code = traverse_obj(initial_state, ('error', 'trueCode', {int_or_none}))
 								            error_message = traverse_obj(initial_state, ('error', 'message', {str_or_none}))
 								            if error_code == -400 and list_id == 'watchlater':
 								                self.raise_login_required('You need to login to access your watchlater playlist')
 								            elif error_code == -403:
 								                self.raise_login_required('This is a private playlist. You need to login as its owner')
 								            elif error_code == 11010:
 								                raise ExtractorError('Playlist is no longer available', expected=True)
 								            raise ExtractorError(f'Could not access playlist: {error_code} {error_message}')
 								        query = {
 								            'ps': 20,
 								            'with_current': False,
 								            **traverse_obj(initial_state, {
 								                'type': ('playlist', 'type', {int_or_none}),
 								                'biz_id': ('playlist', 'id', {int_or_none}),
 								                'tid': ('tid', {int_or_none}),
 								                'sort_field': ('sortFiled', {int_or_none}),
 								                'desc': ('desc', {bool_or_none}, {str_or_none}, {str.lower}),
 								            })
 								        }
 								        metadata = {
 								            'id': f'{query["type"]}_{query["biz_id"]}',
 								            **traverse_obj(initial_state, ('mediaListInfo', {
 								                'title': ('title', {str}),
 								                'uploader': ('upper', 'name', {str}),
 								                'uploader_id': ('upper', 'mid', {str_or_none}),
 								                'timestamp': ('ctime', {int_or_none}),
 								                'thumbnail': ('cover', {url_or_none}),
 								            })),
 								        }
 								        return self.playlist_result(self._extract_medialist(query, list_id), **metadata)
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
-												[bilibili] Add category extractor (#695)

Authored by: animelover1984
											
										
										
											2021-08-20 12:27:40 -06:00
+								class BilibiliCategoryIE(InfoExtractor):
 								    IE_NAME = 'Bilibili category extractor'
 								    _MAX_RESULTS = 1000000
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/v/[a-zA-Z]+\/[a-zA-Z]+'
-												[bilibili] Add category extractor (#695)

Authored by: animelover1984
											
										
										
											2021-08-20 12:27:40 -06:00
+								    _TESTS = [{
 								        'url': 'https://www.bilibili.com/v/kichiku/mad',
 								        'info_dict': {
 								            'id': 'kichiku: mad',
 								            'title': 'kichiku: mad'
 								        },
 								        'playlist_mincount': 45,
 								        'params': {
 								            'playlistend': 45
 								        }
 								    }]
 								    def _fetch_page(self, api_url, num_pages, query, page_num):
 								        parsed_json = self._download_json(
 								            api_url, query, query={'Search_key': query, 'pn': page_num},
 								            note='Extracting results from page %s of %s' % (page_num, num_pages))
-												[Bilibili] Add 8k support (#1964)

Closes #1898, #1819
Authored by: u-spec-png
											
										
										
											2022-01-30 11:51:22 -07:00
+								        video_list = traverse_obj(parsed_json, ('data', 'archives'), expected_type=list)
-												[bilibili] Add category extractor (#695)

Authored by: animelover1984
											
										
										
											2021-08-20 12:27:40 -06:00
+								        if not video_list:
 								            raise ExtractorError('Failed to retrieve video list for page %d' % page_num)
 								        for video in video_list:
 								            yield self.url_result(
 								                'https://www.bilibili.com/video/%s' % video['bvid'], 'BiliBili', video['bvid'])
 								    def _entries(self, category, subcategory, query):
 								        # map of categories : subcategories : RIDs
 								        rid_map = {
 								            'kichiku': {
 								                'mad': 26,
 								                'manual_vocaloid': 126,
 								                'guide': 22,
 								                'theatre': 216,
 								                'course': 127
 								            },
 								        }
 								        if category not in rid_map:
-												[cleanup] Cleanup bilibili code
Closes #1169
Authored by pukkandan, u-spec-png

											
										
										
											2021-10-08 14:44:23 -06:00
+								            raise ExtractorError(
 								                f'The category {category} isn\'t supported. Supported categories: {list(rid_map.keys())}')
-												[bilibili] Add category extractor (#695)

Authored by: animelover1984
											
										
										
											2021-08-20 12:27:40 -06:00
+								        if subcategory not in rid_map[category]:
-												[cleanup] Cleanup bilibili code
Closes #1169
Authored by pukkandan, u-spec-png

											
										
										
											2021-10-08 14:44:23 -06:00
+								            raise ExtractorError(
 								                f'The subcategory {subcategory} isn\'t supported for this category. Supported subcategories: {list(rid_map[category].keys())}')
-												[bilibili] Add category extractor (#695)

Authored by: animelover1984
											
										
										
											2021-08-20 12:27:40 -06:00
+								        rid_value = rid_map[category][subcategory]
 								        api_url = 'https://api.bilibili.com/x/web-interface/newlist?rid=%d&type=1&ps=20&jsonp=jsonp' % rid_value
 								        page_json = self._download_json(api_url, query, query={'Search_key': query, 'pn': '1'})
-												[Bilibili] Add 8k support (#1964)

Closes #1898, #1819
Authored by: u-spec-png
											
										
										
											2022-01-30 11:51:22 -07:00
+								        page_data = traverse_obj(page_json, ('data', 'page'), expected_type=dict)
-												[bilibili] Add category extractor (#695)

Authored by: animelover1984
											
										
										
											2021-08-20 12:27:40 -06:00
+								        count, size = int_or_none(page_data.get('count')), int_or_none(page_data.get('size'))
 								        if count is None or not size:
 								            raise ExtractorError('Failed to calculate either page count or size')
 								        num_pages = math.ceil(count / size)
 								        return OnDemandPagedList(functools.partial(
 								            self._fetch_page, api_url, num_pages, query), size)
 								    def _real_extract(self, url):
-												[extractor/bilibili] Fix BilibiliIE and Bangumi extractors (#4945)

Closes #1878, #4071, #4397
Authored by: lockmatrix, pukkandan 
											
										
										
											2022-10-25 06:58:18 -06:00
+								        category, subcategory = urllib.parse.urlparse(url).path.split('/')[2:4]
-												[bilibili] Add category extractor (#695)

Authored by: animelover1984
											
										
										
											2021-08-20 12:27:40 -06:00
+								        query = '%s: %s' % (category, subcategory)
 								        return self.playlist_result(self._entries(category, subcategory, query), query, query)
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
+								class BiliBiliSearchIE(SearchInfoExtractor):
-												[cleanup] Add keyword automatically to SearchIE descriptions
and some minor cleanup of docs

											
										
										
											2021-10-23 08:29:52 -06:00
+								    IE_DESC = 'Bilibili video search'
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
+								    _MAX_RESULTS = 100000
 								    _SEARCH_KEY = 'bilisearch'
-												[cleanup] Cleanup bilibili code
Closes #1169
Authored by pukkandan, u-spec-png

											
										
										
											2021-10-08 14:44:23 -06:00
+								    def _search_results(self, query):
 								        for page_num in itertools.count(1):
 								            videos = self._download_json(
 								                'https://api.bilibili.com/x/web-interface/search/type', query,
 								                note=f'Extracting results from page {page_num}', query={
 								                    'Search_key': query,
 								                    'keyword': query,
 								                    'page': page_num,
 								                    'context': '',
 								                    'duration': 0,
 								                    'tids_2': '',
 								                    '__refresh__': 'true',
 								                    'search_type': 'video',
 								                    'tids': 0,
 								                    'highlight': 1,
-												[extractor/BiliBiliSearch] Fix infinite loop

Closes #4682

											
										
										
											2022-08-20 17:47:22 -06:00
+								                })['data'].get('result')
 								            if not videos:
 								                break
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
+								            for video in videos:
-												[cleanup] Cleanup bilibili code
Closes #1169
Authored by pukkandan, u-spec-png

											
										
										
											2021-10-08 14:44:23 -06:00
+								                yield self.url_result(video['arcurl'], 'BiliBili', str(video['aid']))
-												#31 Features from animelover1984/youtube-dl

* Add `--get-comments`
* [youtube] Extract comments
* [billibilli] Added BiliBiliSearchIE, BilibiliChannelIE
* [billibilli] Extract comments
* [billibilli] Better video extraction
* Write playlist data to infojson
* [FFmpegMetadata] Embed infojson inside the video
* [EmbedThumbnail] Try embedding in mp4 using ffprobe and `-disposition`
* [EmbedThumbnail] Treat mka like mkv and mov like mp4
* [EmbedThumbnail] Embed in ogg/opus
* [VideoRemuxer] Conditionally remux video
* [VideoRemuxer] Add `-movflags +faststart` when remuxing from mp4
* [ffmpeg] Print entire stderr in verbose when there is error
* [EmbedSubtitle] Warn when embedding ass in mp4
* [avanto] Use NFLTokenGenerator if possible
											
										
										
											2021-01-27 08:02:51 -07:00
-												[bilibili] add support audio albums and songs(closes #21094)

											
										
										
											2019-09-22 10:14:18 -06:00
+								class BilibiliAudioBaseIE(InfoExtractor):
 								    def _call_api(self, path, sid, query=None):
 								        if not query:
 								            query = {'sid': sid}
 								        return self._download_json(
 								            'https://www.bilibili.com/audio/music-service-c/web/' + path,
 								            sid, query=query)['data']
 								class BilibiliAudioIE(BilibiliAudioBaseIE):
 								    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/audio/au(?P<id>\d+)'
 								    _TEST = {
 								        'url': 'https://www.bilibili.com/audio/au1003142',
 								        'md5': 'fec4987014ec94ef9e666d4d158ad03b',
 								        'info_dict': {
 								            'id': '1003142',
 								            'ext': 'm4a',
 								            'title': '【tsukimi】YELLOW / 神山羊',
 								            'artist': 'tsukimi',
 								            'comment_count': int,
 								            'description': 'YELLOW的mp3版！',
 								            'duration': 183,
 								            'subtitles': {
 								                'origin': [{
 								                    'ext': 'lrc',
 								                }],
 								            },
 								            'thumbnail': r're:^https?://.+\.jpg',
 								            'timestamp': 1564836614,
 								            'upload_date': '20190803',
 								            'uploader': 'tsukimi-つきみぐー',
 								            'view_count': int,
 								        },
 								    }
 								    def _real_extract(self, url):
 								        au_id = self._match_id(url)
 								        play_data = self._call_api('url', au_id)
 								        formats = [{
 								            'url': play_data['cdns'][0],
 								            'filesize': int_or_none(play_data.get('size')),
-												Cleanup some code (see desc)

* `--get-comments` doesn't imply `--write-info-json` if `-J`, `-j` or `--print-json` are used
* Don't pass `config_location` to `YoutubeDL` (it is unused)
* [bilibiliaudio] Recognize the file as audio-only
* Update gitignore
* Fix typos

											
										
										
											2021-02-28 08:25:32 -07:00
+								            'vcodec': 'none'
-												[bilibili] add support audio albums and songs(closes #21094)

											
										
										
											2019-09-22 10:14:18 -06:00
+								        }]
-												Update to ytdl-commit-8a158a9

[NHK] Use new API URL
https://github.com/ytdl-org/youtube-dl/commit/6508688e88c83bb811653083db9351702cd39a6a

Closes #2337, Closes #4063

											
										
										
											2022-06-19 22:44:12 -06:00
+								        for a_format in formats:
 								            a_format.setdefault('http_headers', {}).update({
 								                'Referer': url,
 								            })
-												[bilibili] add support audio albums and songs(closes #21094)

											
										
										
											2019-09-22 10:14:18 -06:00
+								        song = self._call_api('song/info', au_id)
 								        title = song['title']
 								        statistic = song.get('statistic') or {}
 								        subtitles = None
 								        lyric = song.get('lyric')
 								        if lyric:
 								            subtitles = {
 								                'origin': [{
 								                    'url': lyric,
 								                }]
 								            }
 								        return {
 								            'id': au_id,
 								            'title': title,
 								            'formats': formats,
 								            'artist': song.get('author'),
 								            'comment_count': int_or_none(statistic.get('comment')),
 								            'description': song.get('intro'),
 								            'duration': int_or_none(song.get('duration')),
 								            'subtitles': subtitles,
 								            'thumbnail': song.get('cover'),
 								            'timestamp': int_or_none(song.get('passtime')),
 								            'uploader': song.get('uname'),
 								            'view_count': int_or_none(statistic.get('play')),
 								        }
 								class BilibiliAudioAlbumIE(BilibiliAudioBaseIE):
 								    _VALID_URL = r'https?://(?:www\.)?bilibili\.com/audio/am(?P<id>\d+)'
 								    _TEST = {
 								        'url': 'https://www.bilibili.com/audio/am10624',
 								        'info_dict': {
 								            'id': '10624',
 								            'title': '每日新曲推荐（每日11:00更新）',
 								            'description': '每天11:00更新，为你推送最新音乐',
 								        },
 								        'playlist_count': 19,
 								    }
 								    def _real_extract(self, url):
 								        am_id = self._match_id(url)
 								        songs = self._call_api(
 								            'song/of-menu', am_id, {'sid': am_id, 'pn': 1, 'ps': 100})['data']
 								        entries = []
 								        for song in songs:
 								            sid = str_or_none(song.get('id'))
 								            if not sid:
 								                continue
 								            entries.append(self.url_result(
 								                'https://www.bilibili.com/audio/au' + sid,
 								                BilibiliAudioIE.ie_key(), sid))
 								        if entries:
 								            album_data = self._call_api('menu/info', am_id) or {}
 								            album_title = album_data.get('title')
 								            if album_title:
 								                for entry in entries:
 								                    entry['album'] = album_title
 								                return self.playlist_result(
 								                    entries, am_id, album_title, album_data.get('intro'))
 								        return self.playlist_result(entries, am_id)
-												[bilibili] Add support for player.bilibili.com (closes #24402)

											
										
										
											2020-03-23 11:24:39 -06:00
 								class BiliBiliPlayerIE(InfoExtractor):
 								    _VALID_URL = r'https?://player\.bilibili\.com/player\.html\?.*?\baid=(?P<id>\d+)'
 								    _TEST = {
 								        'url': 'http://player.bilibili.com/player.html?aid=92494333&cid=157926707&page=1',
 								        'only_matching': True,
 								    }
 								    def _real_extract(self, url):
 								        video_id = self._match_id(url)
 								        return self.url_result(
 								            'http://www.bilibili.tv/video/av%s/' % video_id,
 								            ie=BiliBiliIE.ie_key(), video_id=video_id)
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
 								class BiliIntlBaseIE(InfoExtractor):
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								    _API_URL = 'https://api.bilibili.tv/intl/gateway'
-												[BiliIntl] Add login (#2172)

and misc improvements

Authored by: MinePlayersPE
											
										
										
											2021-12-31 13:09:30 -07:00
+								    _NETRC_MACHINE = 'biliintl'
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								    def _call_api(self, endpoint, *args, **kwargs):
-												[BiliIntl] Add login (#2172)

and misc improvements

Authored by: MinePlayersPE
											
										
										
											2021-12-31 13:09:30 -07:00
+								        json = self._download_json(self._API_URL + endpoint, *args, **kwargs)
 								        if json.get('code'):
 								            if json['code'] in (10004004, 10004005, 10023006):
 								                self.raise_login_required()
 								            elif json['code'] == 10004001:
 								                self.raise_geo_restricted()
 								            else:
 								                if json.get('message') and str(json['code']) != json['message']:
 								                    errmsg = f'{kwargs.get("errnote", "Unable to download JSON metadata")}: {self.IE_NAME} said: {json["message"]}'
 								                else:
 								                    errmsg = kwargs.get('errnote', 'Unable to download JSON metadata')
 								                if kwargs.get('fatal'):
 								                    raise ExtractorError(errmsg)
 								                else:
 								                    self.report_warning(errmsg)
 								        return json.get('data')
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
-												[Bilibili] Add subtitle converter (#1144)

Closes #1015
Based on https://github.com/y2361547758/bcc2ass
Authored by: u-spec-png
											
										
										
											2021-10-04 12:37:05 -06:00
+								    def json2srt(self, json):
 								        data = '\n\n'.join(
 								            f'{i + 1}\n{srt_subtitles_timecode(line["from"])} --> {srt_subtitles_timecode(line["to"])}\n{line["content"]}'
-												[extractor/BiliIntl] Fix subtitle extraction

Closes #3123

Authored by: HobbyistDev

											
										
										
											2022-06-20 02:38:32 -06:00
+								            for i, line in enumerate(traverse_obj(json, (
 								                'body', lambda _, l: l['content'] and l['from'] and l['to']))))
-												[Bilibili] Add subtitle converter (#1144)

Closes #1015
Based on https://github.com/y2361547758/bcc2ass
Authored by: u-spec-png
											
										
										
											2021-10-04 12:37:05 -06:00
+								        return data
-												[BiliIntl] Support user-generated videos (#3203)

Authored by: wlritchi
											
										
										
											2022-03-27 21:21:42 -06:00
+								    def _get_subtitles(self, *, ep_id=None, aid=None):
 								        sub_json = self._call_api(
-												[extractor/BiliIntl] Fix subtitle extraction

Closes #4359
Authored by: MinePlayersPE

											
										
										
											2022-07-17 15:40:52 -06:00
+								            '/web/v2/subtitle', ep_id or aid, fatal=False,
 								            note='Downloading subtitles list', errnote='Unable to download subtitles list',
 								            query=filter_dict({
-												[BiliIntl] Support user-generated videos (#3203)

Authored by: wlritchi
											
										
										
											2022-03-27 21:21:42 -06:00
+								                'platform': 'web',
-												[extractor/BiliIntl] Fix subtitle extraction

Closes #4359
Authored by: MinePlayersPE

											
										
										
											2022-07-17 15:40:52 -06:00
+								                's_locale': 'en_US',
-												[BiliIntl] Support user-generated videos (#3203)

Authored by: wlritchi
											
										
										
											2022-03-27 21:21:42 -06:00
+								                'episode_id': ep_id,
 								                'aid': aid,
-												[extractor/BiliIntl] Fix subtitle extraction

Closes #4359
Authored by: MinePlayersPE

											
										
										
											2022-07-17 15:40:52 -06:00
+								            })) or {}
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								        subtitles = {}
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								        for sub in sub_json.get('subtitles') or []:
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								            sub_url = sub.get('url')
 								            if not sub_url:
 								                continue
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								            sub_data = self._download_json(
-												[BiliIntl] Support user-generated videos (#3203)

Authored by: wlritchi
											
										
										
											2022-03-27 21:21:42 -06:00
+								                sub_url, ep_id or aid, errnote='Unable to download subtitles', fatal=False,
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								                note='Downloading subtitles%s' % f' for {sub["lang"]}' if sub.get('lang') else '')
-												[Bilibili] Add subtitle converter (#1144)

Closes #1015
Based on https://github.com/y2361547758/bcc2ass
Authored by: u-spec-png
											
										
										
											2021-10-04 12:37:05 -06:00
+								            if not sub_data:
 								                continue
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								            subtitles.setdefault(sub.get('lang_key', 'en'), []).append({
-												[Bilibili] Add subtitle converter (#1144)

Closes #1015
Based on https://github.com/y2361547758/bcc2ass
Authored by: u-spec-png
											
										
										
											2021-10-04 12:37:05 -06:00
+								                'ext': 'srt',
 								                'data': self.json2srt(sub_data)
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								            })
 								        return subtitles
-												[BiliIntl] Support user-generated videos (#3203)

Authored by: wlritchi
											
										
										
											2022-03-27 21:21:42 -06:00
+								    def _get_formats(self, *, ep_id=None, aid=None):
 								        video_json = self._call_api(
 								            '/web/playurl', ep_id or aid, note='Downloading video formats',
 								            errnote='Unable to download video formats', query=filter_dict({
 								                'platform': 'web',
 								                'ep_id': ep_id,
 								                'aid': aid,
 								            }))
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								        video_json = video_json['playurl']
 								        formats = []
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								        for vid in video_json.get('video') or []:
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								            video_res = vid.get('video_resource') or {}
 								            video_info = vid.get('stream_info') or {}
 								            if not video_res.get('url'):
 								                continue
 								            formats.append({
 								                'url': video_res['url'],
 								                'ext': 'mp4',
 								                'format_note': video_info.get('desc_words'),
 								                'width': video_res.get('width'),
 								                'height': video_res.get('height'),
 								                'vbr': video_res.get('bandwidth'),
 								                'acodec': 'none',
 								                'vcodec': video_res.get('codecs'),
 								                'filesize': video_res.get('size'),
 								            })
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								        for aud in video_json.get('audio_resource') or []:
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								            if not aud.get('url'):
 								                continue
 								            formats.append({
 								                'url': aud['url'],
 								                'ext': 'mp4',
 								                'abr': aud.get('bandwidth'),
 								                'acodec': aud.get('codecs'),
 								                'vcodec': 'none',
 								                'filesize': aud.get('size'),
 								            })
 								        return formats
-												[extractor/biliintl:series] Make partial download of series faster

											
										
										
											2023-01-01 02:09:58 -07:00
+								    def _parse_video_metadata(self, video_data):
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								        return {
-												[BiliIntl] Support user-generated videos (#3203)

Authored by: wlritchi
											
										
										
											2022-03-27 21:21:42 -06:00
+								            'title': video_data.get('title_display') or video_data.get('title'),
 								            'thumbnail': video_data.get('cover'),
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								            'episode_number': int_or_none(self._search_regex(
-												[BiliIntl] Support user-generated videos (#3203)

Authored by: wlritchi
											
										
										
											2022-03-27 21:21:42 -06:00
+								                r'^E(\d+)(?:$| - )', video_data.get('title_display') or '', 'episode number', default=None)),
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								        }
-												[extractor] Add `_perform_login` function (#2943)

* Adds new functions `_initialize_pre_login` and `_perform_login` as part of the extractor API
* Adds `ie.supports_login` to the public API
											
										
										
											2022-03-18 14:53:33 -06:00
+								    def _perform_login(self, username, password):
-												[dependencies] Simplify `Cryptodome`

Closes #6292, closes #6272, closes #6338

											
										
										
											2023-02-28 10:40:54 -07:00
+								        if not Cryptodome.RSA:
-												[dependencies] Standardize `Cryptodome` imports

											
										
										
											2023-02-06 14:52:29 -07:00
+								            raise ExtractorError('pycryptodomex not found. Please install', expected=True)
-												[BiliIntl] Add login (#2172)

and misc improvements

Authored by: MinePlayersPE
											
										
										
											2021-12-31 13:09:30 -07:00
 								        key_data = self._download_json(
 								            'https://passport.bilibili.tv/x/intl/passport-login/web/key?lang=en-US', None,
 								            note='Downloading login key', errnote='Unable to download login key')['data']
-												[dependencies] Simplify `Cryptodome`

Closes #6292, closes #6272, closes #6338

											
										
										
											2023-02-28 10:40:54 -07:00
+								        public_key = Cryptodome.RSA.importKey(key_data['key'])
 								        password_hash = Cryptodome.PKCS1_v1_5.new(public_key).encrypt((key_data['hash'] + password).encode('utf-8'))
-												[BiliIntl] Add login (#2172)

and misc improvements

Authored by: MinePlayersPE
											
										
										
											2021-12-31 13:09:30 -07:00
+								        login_post = self._download_json(
 								            'https://passport.bilibili.tv/x/intl/passport-login/web/login/password?lang=en-US', None, data=urlencode_postdata({
 								                'username': username,
 								                'password': base64.b64encode(password_hash).decode('ascii'),
 								                'keep_me': 'true',
 								                's_locale': 'en_US',
 								                'isTrusted': 'true'
 								            }), note='Logging in', errnote='Unable to log in')
 								        if login_post.get('code'):
 								            if login_post.get('message'):
 								                raise ExtractorError(f'Unable to log in: {self.IE_NAME} said: {login_post["message"]}', expected=True)
 								            else:
 								                raise ExtractorError('Unable to log in')
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
 								class BiliIntlIE(BiliIntlBaseIE):
-												[extractor/BiliIntl] Support uppercase lang in `_VALID_URL`

Seen in some rare cases
Authored by: coletdjnz

											
										
										
											2022-09-09 16:06:48 -06:00
+								    _VALID_URL = r'https?://(?:www\.)?bili(?:bili\.tv|intl\.com)/(?:[a-zA-Z]{2}/)?(play/(?P<season_id>\d+)/(?P<ep_id>\d+)|video/(?P<aid>\d+))'
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								    _TESTS = [{
-												[BiliIntl] Add login (#2172)

and misc improvements

Authored by: MinePlayersPE
											
										
										
											2021-12-31 13:09:30 -07:00
+								        # Bstation page
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								        'url': 'https://www.bilibili.tv/en/play/34613/341736',
 								        'info_dict': {
 								            'id': '341736',
 								            'ext': 'mp4',
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								            'title': 'E2 - The First Night',
 								            'thumbnail': r're:^https://pic\.bstarstatic\.com/ogv/.+\.png$',
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								            'episode_number': 2,
-												[extractor/biliIntl] Add fallback to `video_data` (#5971)

Authored by: HobbyistDev
											
										
										
											2023-01-05 23:22:25 -07:00
+								            'upload_date': '20201009',
 								            'episode': 'Episode 2',
 								            'timestamp': 1602259500,
 								            'description': 'md5:297b5a17155eb645e14a14b385ab547e',
-												[extractor/biliintl] Add intro and ending chapters (#6018)

Authored by: HobbyistDev
											
										
										
											2023-02-12 00:54:36 -07:00
+								            'chapters': [{
 								                'start_time': 0,
 								                'end_time': 76.242,
 								                'title': '<Untitled Chapter 1>'
 								            }, {
 								                'start_time': 76.242,
 								                'end_time': 161.161,
 								                'title': 'Intro'
 								            }, {
 								                'start_time': 1325.742,
 								                'end_time': 1403.903,
 								                'title': 'Outro'
 								            }],
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								        }
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								    }, {
-												[BiliIntl] Add login (#2172)

and misc improvements

Authored by: MinePlayersPE
											
										
										
											2021-12-31 13:09:30 -07:00
+								        # Non-Bstation page
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								        'url': 'https://www.bilibili.tv/en/play/1033760/11005006',
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								        'info_dict': {
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								            'id': '11005006',
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								            'ext': 'mp4',
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								            'title': 'E3 - Who?',
 								            'thumbnail': r're:^https://pic\.bstarstatic\.com/ogv/.+\.png$',
 								            'episode_number': 3,
-												[extractor/biliIntl] Add fallback to `video_data` (#5971)

Authored by: HobbyistDev
											
										
										
											2023-01-05 23:22:25 -07:00
+								            'description': 'md5:e1a775e71a35c43f141484715470ad09',
 								            'episode': 'Episode 3',
 								            'upload_date': '20211219',
 								            'timestamp': 1639928700,
-												[extractor/biliintl] Add intro and ending chapters (#6018)

Authored by: HobbyistDev
											
										
										
											2023-02-12 00:54:36 -07:00
+								            'chapters': [{
 								                'start_time': 0,
 								                'end_time': 88.0,
 								                'title': '<Untitled Chapter 1>'
 								            }, {
 								                'start_time': 88.0,
 								                'end_time': 156.0,
 								                'title': 'Intro'
 								            }, {
 								                'start_time': 1173.0,
 								                'end_time': 1259.535,
 								                'title': 'Outro'
 								            }],
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								        }
-												[BiliIntl] Add login (#2172)

and misc improvements

Authored by: MinePlayersPE
											
										
										
											2021-12-31 13:09:30 -07:00
+								    }, {
 								        # Subtitle with empty content
 								        'url': 'https://www.bilibili.tv/en/play/1005144/10131790',
 								        'info_dict': {
 								            'id': '10131790',
 								            'ext': 'mp4',
 								            'title': 'E140 - Two Heartbeats: Kabuto\'s Trap',
 								            'thumbnail': r're:^https://pic\.bstarstatic\.com/ogv/.+\.png$',
 								            'episode_number': 140,
 								        },
 								        'skip': 'According to the copyright owner\'s request, you may only watch the video after you log in.'
-												[extractor/biliIntl] Add fallback to `video_data` (#5971)

Authored by: HobbyistDev
											
										
										
											2023-01-05 23:22:25 -07:00
+								    }, {
 								        'url': 'https://www.bilibili.tv/en/video/2041863208',
 								        'info_dict': {
 								            'id': '2041863208',
 								            'ext': 'mp4',
 								            'timestamp': 1670874843,
 								            'description': 'Scheduled for April 2023.\nStudio: ufotable',
 								            'thumbnail': r're:https?://pic[-\.]bstarstatic.+/ugc/.+\.jpg$',
 								            'upload_date': '20221212',
 								            'title': 'Kimetsu no Yaiba Season 3 Official Trailer - Bstation',
-												[extractor/biliIntl] Add comment extraction  (#6079)

Authored by: HobbyistDev
											
										
										
											2023-04-12 12:21:57 -06:00
+								        },
 								    }, {
 								        # episode comment extraction
 								        'url': 'https://www.bilibili.tv/en/play/34580/340317',
 								        'info_dict': {
 								            'id': '340317',
 								            'ext': 'mp4',
 								            'timestamp': 1604057820,
 								            'upload_date': '20201030',
 								            'episode_number': 5,
 								            'title': 'E5 - My Own Steel',
 								            'description': 'md5:2b17ab10aebb33e3c2a54da9e8e487e2',
 								            'thumbnail': r're:https?://pic\.bstarstatic\.com/ogv/.+\.png$',
 								            'episode': 'Episode 5',
 								            'comment_count': int,
 								            'chapters': [{
 								                'start_time': 0,
 								                'end_time': 61.0,
 								                'title': '<Untitled Chapter 1>'
 								            }, {
 								                'start_time': 61.0,
 								                'end_time': 134.0,
 								                'title': 'Intro'
 								            }, {
 								                'start_time': 1290.0,
 								                'end_time': 1379.0,
 								                'title': 'Outro'
 								            }],
 								        },
 								        'params': {
 								            'getcomments': True
 								        }
 								    }, {
 								        # user generated content comment extraction
 								        'url': 'https://www.bilibili.tv/en/video/2045730385',
 								        'info_dict': {
 								            'id': '2045730385',
 								            'ext': 'mp4',
 								            'description': 'md5:693b6f3967fb4e7e7764ea817857c33a',
 								            'timestamp': 1667891924,
 								            'upload_date': '20221108',
 								            'title': 'That Time I Got Reincarnated as a Slime: Scarlet Bond - Official Trailer 3| AnimeStan - Bstation',
 								            'comment_count': int,
 								            'thumbnail': 'https://pic.bstarstatic.com/ugc/f6c363659efd2eabe5683fbb906b1582.jpg',
 								        },
 								        'params': {
 								            'getcomments': True
-												[extractor/biliIntl] Add fallback to `video_data` (#5971)

Authored by: HobbyistDev
											
										
										
											2023-01-05 23:22:25 -07:00
+								        }
-												[extractor/biliintl] Add intro and ending chapters (#6018)

Authored by: HobbyistDev
											
										
										
											2023-02-12 00:54:36 -07:00
+								    }, {
 								        # episode id without intro and outro
 								        'url': 'https://www.bilibili.tv/en/play/1048837/11246489',
 								        'info_dict': {
 								            'id': '11246489',
 								            'ext': 'mp4',
 								            'title': 'E1 - Operation \'Strix\' <Owl>',
 								            'description': 'md5:b4434eb1a9a97ad2bccb779514b89f17',
 								            'timestamp': 1649516400,
 								            'thumbnail': 'https://pic.bstarstatic.com/ogv/62cb1de23ada17fb70fbe7bdd6ff29c29da02a64.png',
 								            'episode': 'Episode 1',
 								            'episode_number': 1,
 								            'upload_date': '20220409',
 								        },
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								    }, {
 								        'url': 'https://www.biliintl.com/en/play/34613/341736',
 								        'only_matching': True,
-												[BiliIntl] Support user-generated videos (#3203)

Authored by: wlritchi
											
										
										
											2022-03-27 21:21:42 -06:00
+								    }, {
 								        # User-generated content (as opposed to a series licensed from a studio)
 								        'url': 'https://bilibili.tv/en/video/2019955076',
 								        'only_matching': True,
 								    }, {
 								        # No language in URL
 								        'url': 'https://www.bilibili.tv/video/2019955076',
 								        'only_matching': True,
-												[extractor/BiliIntl] Support uppercase lang in `_VALID_URL`

Seen in some rare cases
Authored by: coletdjnz

											
										
										
											2022-09-09 16:06:48 -06:00
+								    }, {
 								        # Uppercase language in URL
 								        'url': 'https://www.bilibili.tv/EN/video/2019955076',
 								        'only_matching': True,
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								    }]
-												[extractor/biliintl:series] Make partial download of series faster

											
										
										
											2023-01-01 02:09:58 -07:00
+								    def _make_url(video_id, series_id=None):
 								        if series_id:
 								            return f'https://www.bilibili.tv/en/play/{series_id}/{video_id}'
 								        return f'https://www.bilibili.tv/en/video/{video_id}'
 								    def _extract_video_metadata(self, url, video_id, season_id):
 								        url, smuggled_data = unsmuggle_url(url, {})
 								        if smuggled_data.get('title'):
 								            return smuggled_data
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								        webpage = self._download_webpage(url, video_id)
 								        # Bstation layout
-												[extractor/BiliIntl] Fix metadata extraction

Closes #4116

											
										
										
											2022-06-19 15:33:19 -06:00
+								        initial_data = (
 								            self._search_json(r'window\.__INITIAL_(?:DATA|STATE)__\s*=', webpage, 'preload state', video_id, default={})
 								            or self._search_nuxt_data(webpage, video_id, '__initialState', fatal=False, traverse=None))
 								        video_data = traverse_obj(
-												[extractor/biliIntl] Add fallback to `video_data` (#5971)

Authored by: HobbyistDev
											
										
										
											2023-01-05 23:22:25 -07:00
+								            initial_data, ('OgvVideo', 'epDetail'), ('UgcVideo', 'videoData'), ('ugc', 'archive'), expected_type=dict) or {}
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
-												[BiliIntl] Support user-generated videos (#3203)

Authored by: wlritchi
											
										
										
											2022-03-27 21:21:42 -06:00
+								        if season_id and not video_data:
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								            # Non-Bstation layout, read through episode list
 								            season_json = self._call_api(f'/web/v2/ogv/play/episodes?season_id={season_id}&platform=web', video_id)
-												[extractor/biliintl:series] Make partial download of series faster

											
										
										
											2023-01-01 02:09:58 -07:00
+								            video_data = traverse_obj(season_json, (
 								                'sections', ..., 'episodes', lambda _, v: str(v['episode_id']) == video_id
 								            ), expected_type=dict, get_all=False)
-												[extractor/biliIntl] Add fallback to `video_data` (#5971)

Authored by: HobbyistDev
											
										
										
											2023-01-05 23:22:25 -07:00
+								        # XXX: webpage metadata may not accurate, it just used to not crash when video_data not found
 								        return merge_dicts(
-												[extractor/biliIntl] Add comment extraction  (#6079)

Authored by: HobbyistDev
											
										
										
											2023-04-12 12:21:57 -06:00
+								            self._parse_video_metadata(video_data), self._search_json_ld(webpage, video_id, fatal=False), {
-												[extractor/biliIntl] Add fallback to `video_data` (#5971)

Authored by: HobbyistDev
											
										
										
											2023-01-05 23:22:25 -07:00
+								                'title': self._html_search_meta('og:title', webpage),
 								                'description': self._html_search_meta('og:description', webpage)
 								            })
-												[extractor/biliintl:series] Make partial download of series faster

											
										
										
											2023-01-01 02:09:58 -07:00
-												[extractor/biliIntl] Add comment extraction  (#6079)

Authored by: HobbyistDev
											
										
										
											2023-04-12 12:21:57 -06:00
+								    def _get_comments_reply(self, root_id, next_id=0, display_id=None):
 								        comment_api_raw_data = self._download_json(
 								            'https://api.bilibili.tv/reply/web/detail', display_id,
 								            note=f'Downloading reply comment of {root_id} - {next_id}',
 								            query={
 								                'platform': 'web',
 								                'ps': 20,  # comment's reply per page (default: 3)
 								                'root': root_id,
 								                'next': next_id,
 								            })
 								        for replies in traverse_obj(comment_api_raw_data, ('data', 'replies', ...)):
 								            yield {
 								                'author': traverse_obj(replies, ('member', 'name')),
 								                'author_id': traverse_obj(replies, ('member', 'mid')),
 								                'author_thumbnail': traverse_obj(replies, ('member', 'face')),
 								                'text': traverse_obj(replies, ('content', 'message')),
 								                'id': replies.get('rpid'),
 								                'like_count': int_or_none(replies.get('like_count')),
 								                'parent': replies.get('parent'),
 								                'timestamp': unified_timestamp(replies.get('ctime_text'))
 								            }
 								        if not traverse_obj(comment_api_raw_data, ('data', 'cursor', 'is_end')):
 								            yield from self._get_comments_reply(
 								                root_id, comment_api_raw_data['data']['cursor']['next'], display_id)
 								    def _get_comments(self, video_id, ep_id):
 								        for i in itertools.count(0):
 								            comment_api_raw_data = self._download_json(
 								                'https://api.bilibili.tv/reply/web/root', video_id,
 								                note=f'Downloading comment page {i + 1}',
 								                query={
 								                    'platform': 'web',
 								                    'pn': i,  # page number
 								                    'ps': 20,  # comment per page (default: 20)
 								                    'oid': video_id,
 								                    'type': 3 if ep_id else 1,  # 1: user generated content, 3: series content
 								                    'sort_type': 1,  # 1: best, 2: recent
 								                })
 								            for replies in traverse_obj(comment_api_raw_data, ('data', 'replies', ...)):
 								                yield {
 								                    'author': traverse_obj(replies, ('member', 'name')),
 								                    'author_id': traverse_obj(replies, ('member', 'mid')),
 								                    'author_thumbnail': traverse_obj(replies, ('member', 'face')),
 								                    'text': traverse_obj(replies, ('content', 'message')),
 								                    'id': replies.get('rpid'),
 								                    'like_count': int_or_none(replies.get('like_count')),
 								                    'timestamp': unified_timestamp(replies.get('ctime_text')),
 								                    'author_is_uploader': bool(traverse_obj(replies, ('member', 'type'))),
 								                }
 								                if replies.get('count'):
 								                    yield from self._get_comments_reply(replies.get('rpid'), display_id=video_id)
 								            if traverse_obj(comment_api_raw_data, ('data', 'cursor', 'is_end')):
 								                break
-												[extractor/biliintl:series] Make partial download of series faster

											
										
										
											2023-01-01 02:09:58 -07:00
+								    def _real_extract(self, url):
 								        season_id, ep_id, aid = self._match_valid_url(url).group('season_id', 'ep_id', 'aid')
 								        video_id = ep_id or aid
-												[extractor/biliintl] Add intro and ending chapters (#6018)

Authored by: HobbyistDev
											
										
										
											2023-02-12 00:54:36 -07:00
+								        chapters = None
 								        if ep_id:
 								            intro_ending_json = self._call_api(
 								                f'/web/v2/ogv/play/episode?episode_id={ep_id}&platform=web',
 								                video_id, fatal=False) or {}
 								            if intro_ending_json.get('skip'):
 								                # FIXME: start time and end time seems a bit off a few second even it corrext based on ogv.*.js
 								                # ref: https://p.bstarstatic.com/fe-static/bstar-web-new/assets/ogv.2b147442.js
 								                chapters = [{
 								                    'start_time': float_or_none(traverse_obj(intro_ending_json, ('skip', 'opening_start_time')), 1000),
 								                    'end_time': float_or_none(traverse_obj(intro_ending_json, ('skip', 'opening_end_time')), 1000),
 								                    'title': 'Intro'
 								                }, {
 								                    'start_time': float_or_none(traverse_obj(intro_ending_json, ('skip', 'ending_start_time')), 1000),
 								                    'end_time': float_or_none(traverse_obj(intro_ending_json, ('skip', 'ending_end_time')), 1000),
 								                    'title': 'Outro'
 								                }]
-												[extractor/biliintl:series] Make partial download of series faster

											
										
										
											2023-01-01 02:09:58 -07:00
 								        return {
 								            'id': video_id,
 								            **self._extract_video_metadata(url, video_id, season_id),
 								            'formats': self._get_formats(ep_id=ep_id, aid=aid),
 								            'subtitles': self.extract_subtitles(ep_id=ep_id, aid=aid),
-												[extractor/biliIntl] Add comment extraction  (#6079)

Authored by: HobbyistDev
											
										
										
											2023-04-12 12:21:57 -06:00
+								            'chapters': chapters,
 								            '__post_extractor': self.extract_comments(video_id, ep_id)
-												[extractor/biliintl:series] Make partial download of series faster

											
										
										
											2023-01-01 02:09:58 -07:00
+								        }
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
 								class BiliIntlSeriesIE(BiliIntlBaseIE):
-												[cleanup] Misc

Closes #5576, closes #5887

											
										
										
											2023-01-02 07:09:03 -07:00
+								    IE_NAME = 'biliIntl:series'
-												[extractor/biliintl] Add `/media` to `VALID_URL` (#5939)

Authored by: HobbyistDev
											
										
										
											2023-01-03 10:59:52 -07:00
+								    _VALID_URL = r'https?://(?:www\.)?bili(?:bili\.tv|intl\.com)/(?:[a-zA-Z]{2}/)?(?:play|media)/(?P<id>\d+)/?(?:[?#]|$)'
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								    _TESTS = [{
 								        'url': 'https://www.bilibili.tv/en/play/34613',
 								        'playlist_mincount': 15,
 								        'info_dict': {
 								            'id': '34613',
-												[extractor/biliintl] Add `/media` to `VALID_URL` (#5939)

Authored by: HobbyistDev
											
										
										
											2023-01-03 10:59:52 -07:00
+								            'title': 'TONIKAWA: Over the Moon For You',
 								            'description': 'md5:297b5a17155eb645e14a14b385ab547e',
 								            'categories': ['Slice of life', 'Comedy', 'Romance'],
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								            'thumbnail': r're:^https://pic\.bstarstatic\.com/ogv/.+\.png$',
 								            'view_count': int,
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								        },
 								        'params': {
 								            'skip_download': True,
 								        },
-												[extractor/biliintl] Add `/media` to `VALID_URL` (#5939)

Authored by: HobbyistDev
											
										
										
											2023-01-03 10:59:52 -07:00
+								    }, {
 								        'url': 'https://www.bilibili.tv/en/media/1048837',
 								        'info_dict': {
 								            'id': '1048837',
 								            'title': 'SPY×FAMILY',
 								            'description': 'md5:b4434eb1a9a97ad2bccb779514b89f17',
 								            'categories': ['Adventure', 'Action', 'Comedy'],
 								            'thumbnail': r're:^https://pic\.bstarstatic\.com/ogv/.+\.jpg$',
 								            'view_count': int,
 								        },
 								        'playlist_mincount': 25,
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								    }, {
 								        'url': 'https://www.biliintl.com/en/play/34613',
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								        'only_matching': True,
-												[extractor/BiliIntl] Support uppercase lang in `_VALID_URL`

Seen in some rare cases
Authored by: coletdjnz

											
										
										
											2022-09-09 16:06:48 -06:00
+								    }, {
 								        'url': 'https://www.biliintl.com/EN/play/34613',
 								        'only_matching': True,
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
+								    }]
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								    def _entries(self, series_id):
 								        series_json = self._call_api(f'/web/v2/ogv/play/episodes?season_id={series_id}&platform=web', series_id)
-												[extractor/biliintl:series] Make partial download of series faster

											
										
										
											2023-01-01 02:09:58 -07:00
+								        for episode in traverse_obj(series_json, ('sections', ..., 'episodes', ...), expected_type=dict):
 								            episode_id = str(episode['episode_id'])
 								            yield self.url_result(smuggle_url(
 								                BiliIntlIE._make_url(episode_id, series_id),
 								                self._parse_video_metadata(episode)
 								            ), BiliIntlIE, episode_id)
-												[bilibili]Add BiliIntlIE and BiliIntlSeriesIE (#907)

Closes #611 
Authored by: Ashish0804
											
										
										
											2021-09-11 07:29:48 -06:00
 								    def _real_extract(self, url):
-												[BiliIntl] Fix extractor (#2077)

Closes #1744
Authored by: MinePlayersPE
											
										
										
											2021-12-25 15:41:38 -07:00
+								        series_id = self._match_id(url)
 								        series_info = self._call_api(f'/web/v2/ogv/play/season_info?season_id={series_id}&platform=web', series_id).get('season') or {}
 								        return self.playlist_result(
 								            self._entries(series_id), series_id, series_info.get('title'), series_info.get('description'),
 								            categories=traverse_obj(series_info, ('styles', ..., 'title'), expected_type=str_or_none),
 								            thumbnail=url_or_none(series_info.get('horizontal_cover')), view_count=parse_count(series_info.get('view')))
-												[BilibiliLive] Add extractor (#3406)

Authored by: HE7086, pukkandan
											
										
										
											2022-05-01 20:09:11 -06:00
 								class BiliLiveIE(InfoExtractor):
-												[ie/bilibili] Add support for series, favorites and watch later (#7518)

Closes #6719
Authored by: c-basalt
											
										
										
											2023-09-18 17:02:00 -06:00
+								    _VALID_URL = r'https?://live\.bilibili\.com/(?:blanc/)?(?P<id>\d+)'
-												[BilibiliLive] Add extractor (#3406)

Authored by: HE7086, pukkandan
											
										
										
											2022-05-01 20:09:11 -06:00
 								    _TESTS = [{
 								        'url': 'https://live.bilibili.com/196',
 								        'info_dict': {
 								            'id': '33989',
 								            'description': "周六杂谈回，其他时候随机游戏。 | \n录播：@下播型泛式录播组。 | \n直播通知群（全员禁言）：666906670，902092584，59971⑧481 （功能一样，别多加）",
 								            'ext': 'flv',
 								            'title': "太空狼人杀联动，不被爆杀就算赢",
 								            'thumbnail': "https://i0.hdslb.com/bfs/live/new_room_cover/e607bc1529057ef4b332e1026e62cf46984c314d.jpg",
 								            'timestamp': 1650802769,
 								        },
 								        'skip': 'not live'
 								    }, {
 								        'url': 'https://live.bilibili.com/196?broadcast_type=0&is_room_feed=1?spm_id_from=333.999.space_home.strengthen_live_card.click',
 								        'only_matching': True
-												[extractor/bilibili] Improve `_VALID_URL` (#5820)

Authored by: skbeh
											
										
										
											2022-12-24 03:47:37 -07:00
+								    }, {
 								        'url': 'https://live.bilibili.com/blanc/196',
 								        'only_matching': True
-												[BilibiliLive] Add extractor (#3406)

Authored by: HE7086, pukkandan
											
										
										
											2022-05-01 20:09:11 -06:00
+								    }]
 								    _FORMATS = {
 : {'format_id': 'low', 'format_note': '流畅'},
 : {'format_id': 'high_res', 'format_note': '高清'},
 : {'format_id': 'ultra_high_res', 'format_note': '超清'},
 : {'format_id': 'blue_ray', 'format_note': '蓝光'},
 : {'format_id': 'source', 'format_note': '原画'},
 : {'format_id': '4K', 'format_note': '4K'},
 : {'format_id': 'dolby', 'format_note': '杜比'},
 								    }
 								    _quality = staticmethod(qualities(list(_FORMATS)))
 								    def _call_api(self, path, room_id, query):
 								        api_result = self._download_json(f'https://api.live.bilibili.com/{path}', room_id, query=query)
 								        if api_result.get('code') != 0:
 								            raise ExtractorError(api_result.get('message') or 'Unable to download JSON metadata')
 								        return api_result.get('data') or {}
 								    def _parse_formats(self, qn, fmt):
 								        for codec in fmt.get('codec') or []:
 								            if codec.get('current_qn') != qn:
 								                continue
 								            for url_info in codec['url_info']:
 								                yield {
 								                    'url': f'{url_info["host"]}{codec["base_url"]}{url_info["extra"]}',
 								                    'ext': fmt.get('format_name'),
 								                    'vcodec': codec.get('codec_name'),
 								                    'quality': self._quality(qn),
 								                    **self._FORMATS[qn],
 								                }
 								    def _real_extract(self, url):
 								        room_id = self._match_id(url)
 								        room_data = self._call_api('room/v1/Room/get_info', room_id, {'id': room_id})
 								        if room_data.get('live_status') == 0:
 								            raise ExtractorError('Streamer is not live', expected=True)
 								        formats = []
 								        for qn in self._FORMATS.keys():
 								            stream_data = self._call_api('xlive/web-room/v2/index/getRoomPlayInfo', room_id, {
 								                'room_id': room_id,
 								                'qn': qn,
 								                'codec': '0,1',
 								                'format': '0,2',
 								                'mask': '0',
 								                'no_playurl': '0',
 								                'platform': 'web',
 								                'protocol': '0,1',
 								            })
 								            for fmt in traverse_obj(stream_data, ('playurl_info', 'playurl', 'stream', ..., 'format', ...)) or []:
 								                formats.extend(self._parse_formats(qn, fmt))
 								        return {
 								            'id': room_id,
 								            'title': room_data.get('title'),
 								            'description': room_data.get('description'),
 								            'thumbnail': room_data.get('user_cover'),
 								            'timestamp': stream_data.get('live_time'),
 								            'formats': formats,
-												[extractor/BiliLive] Fix extractor

- Remove unnecessary group in `_VALID_URL`
- This extractor always returns livestreams

											
										
										
											2022-12-29 11:01:22 -07:00
+								            'is_live': True,
-												[BilibiliLive] Add extractor (#3406)

Authored by: HE7086, pukkandan
											
										
										
											2022-05-01 20:09:11 -06:00
+								            'http_headers': {
 								                'Referer': url,
 								            },
 								        }