2013-10-14 05:07:47 -06:00
# -*- coding: utf-8 -*-
2014-11-21 14:02:16 -07:00
from __future__ import unicode_literals
2013-10-14 05:07:47 -06:00
from . common import InfoExtractor
2013-10-14 17:33:20 -06:00
2013-10-14 05:07:47 -06:00
class SztvHuIE ( InfoExtractor ) :
2016-03-21 09:36:32 -06:00
_VALID_URL = r ' https?://(?:(?:www \ .)?sztv \ .hu|www \ .tvszombathely \ .hu)/(?:[^/]+)/.+-(?P<id>[0-9]+) '
2013-10-14 05:07:47 -06:00
_TEST = {
2014-11-21 14:02:16 -07:00
' url ' : ' http://sztv.hu/hirek/cserkeszek-nepszerusitettek-a-kornyezettudatos-eletmodot-a-savaria-teren-20130909 ' ,
' md5 ' : ' a6df607b11fb07d0e9f2ad94613375cb ' ,
' info_dict ' : {
' id ' : ' 20130909 ' ,
' ext ' : ' mp4 ' ,
' title ' : ' Cserkészek népszerűsítették a környezettudatos életmódot a Savaria téren ' ,
' description ' : ' A zöld nap játékos ismeretterjesztő programjait a Magyar Cserkész Szövetség szervezte, akik az ország nyolc városában adják át tudásukat az érdeklődőknek. A PET... ' ,
2013-11-20 01:59:03 -07:00
} ,
2013-10-14 05:07:47 -06:00
}
def _real_extract ( self , url ) :
2014-11-21 14:02:16 -07:00
video_id = self . _match_id ( url )
2013-10-14 17:33:20 -06:00
webpage = self . _download_webpage ( url , video_id )
video_file = self . _search_regex (
r ' file: " ...:(.*?) " , ' , webpage , ' video file ' )
title = self . _html_search_regex (
2013-10-15 00:22:59 -06:00
r ' <meta name= " title " content= " ([^ " ]*?) - [^-]*? - [^-]*? " ' ,
2013-10-14 17:33:20 -06:00
webpage , ' video title ' )
description = self . _html_search_regex (
r ' <meta name= " description " content= " ([^ " ]*) " /> ' ,
webpage , ' video description ' , fatal = False )
2013-10-14 05:07:47 -06:00
thumbnail = self . _og_search_thumbnail ( webpage )
2013-10-14 17:33:20 -06:00
video_url = ' http://media.sztv.hu/vod/ ' + video_file
2013-10-14 05:07:47 -06:00
2013-10-14 17:33:20 -06:00
return {
' id ' : video_id ,
' url ' : video_url ,
' title ' : title ,
' description ' : description ,
' thumbnail ' : thumbnail ,
}