Facebook gaat zijn Facebook Identifiers (FBID) pseudonimiseren tegen scraping

Facebook gaat zijn Facebook Identifiers (FBID) pseudonimiseren tegen scraping

Soms valt Facebook/Meta nieuws ook ergens tussen de mazen, gewoon omdat het een technisch verhaal is, waar de impact niet altijd direct duidelijk is voor iedereen.

Op 8 september lanceerde ze een blogpost op hun newsroom, die me direct deed terugdenken aan een Dailybits blogpost uit 2014 (het scrapen van de FB graph). Altijd raar gevonden, dat er toen niemand van opkeek, maar privacy was toen van minder belang duidelijk… 🤷‍♂️

 

Facebook identifiers?

Elke Facebook account/object heeft een bepaalde interne FBID bij Facebook. Het is gekend, dat Mark Zuckerberg zelf de laagste FBID heeft (FBID 4) en zo heeft iedereen dus een individueel nummer (maar dus ook elke post of video).

Je kan deze ID’s trouwens van andere accounts eenvoudig opzoeken via tooltjes zoals lookup-id.com en daarna de ID testen, door deze achteraan volgende URL te gaan plakken: https://www.facebook.com/profile.php?id=.

Hier voel je hem al komen. Als je een grote marketing database hebt, dan kan je zo je bestaande profielen extra verrijken, door via de gekoppelde FB ID’s extra gegevens te gaan bij elkaar brengen (of deze zelf te gaan scrapen/schrapen op het internet).

Maar ook de link van een FB post was voorzien van een unieke FBID en deze data kan dus perfect bij elkaar gebracht worden in een externe database om zo extra verrijking van bestaande profielen te gaan doen.

Sinds enige tijd ziet het internet overal dat interne FBID’s worden vervangen door PFBID’s.

Ook op Hacker News was er al wat roering over. 

Ik heb even moeten zoeken in mijn archief, maar hier kan ik een mooi voorbeeld geven:

  • FB content link naar een pst van Zuck in 2015: https://www.facebook.com/zuck/posts/10102481809620421
  • FB content link naar een post van Zuck met zijn befaamde Metaverse avatar nu in augustus: https://www.facebook.com/zuck/posts/pfbid022uxPGcWSEu4yU6zBkJDqQoefLPoUnsDpivTFWbhJA6n5WavZvEdbmVQBnJJEWEa5l

De post FBID is dus nu een random hash geworden en kan je nu dus niet meer eenvoudig uniek gaan scrapen.

De opbouw van een PFBID ondergaat zogenaamde hashing met dus de oorspronkelijke FBID en een timestamp. Hierdoor ontstaat een “random” PFBID, die zij steeds nog kunnen terug herleiden.

Belangrijk om te weten is dat hun blogpost gaat over de CONTENT id’s en dus niet de user id’s🤷‍♂️ zelf! Die User id’s zijn juist voor mij de privacy problemen met data brokers. 

 

 

 

Maar Facebook beschermt onze privacy dan toch een beetje?

Zo verkopen ze het inderdaad en jawel het helpt inderdaad al een beetje. Velen onderschatten het probleem van databrokers. Deze verborgen wereld van dataverzamelaars en dataverkopers is minder zichtbaar dan Google en Facebook, maar heeft een even grote impact op onze privacy.

Bekijk zeker eens deze aflevering van John Oliver over locatiegegevens en databrockers.

Maar waarom doet Facebook/Meta dit dan ook nog?

Enter the 1ste party cookieless world

Wie een beetje de marketing evoluties volgt (of mijn presentaties/lessen volgt) weet dat we richting een cookieless wereld gaan, waarbij er minder data over websites heen gedeeld worden en verzameld kunnen worden. Google heeft zijn deadline alvast niet gehaald, maar ooit gaat ook de Google Chrome browser eraan geloven en gaan 3th party cookies daar verdwijnen.

Voor elk bedrijf zal zogenaamde 1ste party data, dan ook van grote waarde worden:

  • Voor een random KMO in Vlaanderen dus een goed CRM opzetten met de gegevens van hun klanten (call me als je hulp nodig hebt).
  • Voor onze mediabedrijven zoals VRT/DPG/Mediahuis dus zoveel mogelijk gegevens van hun kijkers zelf centraal gaan bijeenbrengen (1 login voor al hun platformen, zie je wat er gebeurde afgelopen jaar?) en vermarkten.
  • Voor Facebook is het dus proberen zoveel mogelijk lekken van data naar externe partijen afsluiten, zodat ze zelf alleen die waardevolle data hebben.

 

De browser Firefox is al een tijdje nu tracking parameters uit url’s aan het knippen en doelt hierbij bijvoorbeeld expliciet op die fbclid parameter, die Facebook aan elke externe link gaat toevoegen. Ik ben dus redelijk zeker, dat ze hier ook wel iets op gaan verzinnen als reactie op die Firefox privacy feature. Die PFBID zouden ze alvast ook goed kunnen gaan gebruiken hiervoor… 🧐

 

Is iedereen hier nu blij mee?

Buiten de schimmige databrokers zijn ook de OSINT onderzoekers niet zo blij met deze aanpassing. Dit zijn de personen die via publieke open data factchecks of onderzoeken doen (zoals Bellingcat dus doet). Zij maken juist veel gebruik van de goudmijn van posts en social media data, die we allemaal achterlaten in hun onderzoeken.

Source link

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.