I dag besøgte jeg politiken.dk og blev mødt af:
Jeg besluttede mig at undersøge nærmere.
Politikens cookiepolitik gemmer sig i https://cdn.privacy-mgmt.com/consent/tcfv2/privacy-manager/privacy-manager-view?siteId=4366&vendorListId=5eeb8f57b8e05c69980ea9be&consentLanguage=DA.
Det er en json-fil på 3 MB! Jeg skrev et lille Python-program til at tygge den igennem:
import json
with open("privacy-manager-view.json", "r", encoding="utf8") as politiken:
politiken = json.load(politiken)
partners = []
for vendor in politiken['vendors']:
name = vendor['name']
url = vendor['policyUrl']
purposes = []
if 'consentCategories' in vendor:
for consent in vendor['consentCategories']:
if consent['type'] == "IAB_PURPOSE":
purposes.append(consent['name'])
if 'iabSpecialPurposes' in vendor:
for purpose in vendor['iabSpecialPurposes']:
purposes.append(purpose)
if 'iabFeatures' in vendor:
for purpose in vendor['iabFeatures']:
purposes.append(purpose)
if 'iabSpecialFeatures' in vendor:
for purpose in vendor['iabSpecialFeatures']:
purposes.append(purpose)
partners.append([name, url, purposes])
partners.sort(key=lambda x:x[0].lower())
number_of_partners = len(partners)
linklist = "<html lang='da'><body><h1>"
linklist += "Her er de " + str(number_of_partners) + " virksomheder, som overvåger dig, hvis du siger ja tak til alle cookies på politiken.dk (d. 11. december 2020)</h1><table>"
for partner in partners:
try:
linklist += "<tr><td><a href='" + partner[1] + "'>" + partner[0] + "</a></td></tr>\n"
except:
linklist += "<tr><td>" + partner[0] + "</td></tr>\n"
linklist += "</table></body></html>"
with open("linklist.html", "wt", encoding="utf8") as fout:
fout.write(linklist)
Og her er listen: