this post was submitted on 10 Oct 2024
10 points (100.0% liked)

Teknologi

198 readers
13 users here now

For debat og nyheder omkring teknologi af alle former.

founded 1 year ago
MODERATORS
 

Hvordan trækker man et link til seneste TV-Avis på DRTV?

you are viewing a single comment's thread
view the rest of the comments
[–] [email protected] 4 points 1 month ago

Nu har jeg lige været inde i inspect element, og kan se at hvert felt med en TV-avis er en class for sig, hvor den nyeste ender med "__episode--active". Kunne man ikke lave et script der tjekker efter denne, måske med følgende fremgangsmåde:

Find klassen "d1-drtv-episode col col-phone-24 col-phablet-12 col-laptop-8 col-desktopWide-6 d1-drtv__episode d1-drtv__episode--active"
Kopier titel fra klassen "d1-drtv-episode-title-and-details__contextual-title"
Kopier dato for udsendelsen fra klassen "d1-drtv-episode-title-and-details__contextual-title-extra-details"
Linket kræver lidt tilpasning, da det ikke umiddelbart fremgår, men i klassen "d1-drtv-episode-title-and-details d1-drtv-episode-description__title-and-details" indgår et link, hvor "episode" skal erstattes med "se" for at komme til videoen. Det burde være muligt at trylle med det
Tjek med det sidst downloadede afsnit, om dato/tid strengen fra "d1-drtv-episode-title-and-details__contextual-title-extra-details" er den samme. Hvis det er tilfældet er der ikke kommet et nyt afsnit, og så skal vi stoppe.
   Ellers kan vi downloade ved hjælp af fx yt-dlp.

Det er så en fremgangsmåde der kræver noget webscraping, så det er ikke sikkert at det altid vil virke. Men jeg tror bestemt at det er muligt at implementere. Jeg gjorde noget lignende da jeg under OL lavede daglige tråde inde på [email protected]. Der webscrapede jeg TV2's tvtid for at finde de relevante programmer for en given dag. Jeg mener at jeg brugte pythonpakken BeutifulSoup, som kan hjælpe med at parse html. Du kan sikkert på ChatGPT til at hjælpe med at skrive scriptet.