I dag besøgte jeg politiken.dk og blev mødt af:
Jeg besluttede mig at undersøge nærmere.
Politikens cookiepolitik gemmer sig i https://cdn.privacy-mgmt.com/consent/tcfv2/privacy-manager/privacy-manager-view?siteId=4366&vendorListId=5eeb8f57b8e05c69980ea9be&consentLanguage=DA.
Det er en json-fil på 3 MB! Jeg skrev et lille Python-program til at tygge den igennem:
import json with open("privacy-manager-view.json", "r", encoding="utf8") as politiken: politiken = json.load(politiken) partners = [] for vendor in politiken['vendors']: name = vendor['name'] url = vendor['policyUrl'] purposes = [] if 'consentCategories' in vendor: for consent in vendor['consentCategories']: if consent['type'] == "IAB_PURPOSE": purposes.append(consent['name']) if 'iabSpecialPurposes' in vendor: for purpose in vendor['iabSpecialPurposes']: purposes.append(purpose) if 'iabFeatures' in vendor: for purpose in vendor['iabFeatures']: purposes.append(purpose) if 'iabSpecialFeatures' in vendor: for purpose in vendor['iabSpecialFeatures']: purposes.append(purpose) partners.append([name, url, purposes]) partners.sort(key=lambda x:x[0].lower()) number_of_partners = len(partners) linklist = "<html lang='da'><body><h1>" linklist += "Her er de " + str(number_of_partners) + " virksomheder, som overvåger dig, hvis du siger ja tak til alle cookies på politiken.dk (d. 11. december 2020)</h1><table>" for partner in partners: try: linklist += "<tr><td><a href='" + partner[1] + "'>" + partner[0] + "</a></td></tr>\n" except: linklist += "<tr><td>" + partner[0] + "</td></tr>\n" linklist += "</table></body></html>" with open("linklist.html", "wt", encoding="utf8") as fout: fout.write(linklist)
Og her er listen: