[quote=“alkema_jm, post:235, topic:354”]
Een hoopgevende technologie is er een waar we al massaal gebruik van maken, tot grote frustratie van copyrighthouders: peer-to-peernetwerken. Het enige wat nodig is, is dat er op bepaalde plekken in het netwerk lijsten circuleren van welke film- en muziekbestanden op welke computer staan. Vervolgens kun je daar je media downloaden.
In beeld is dit fout! Je moet alleen de hash code van het product in de “netwerk lijsten” opnemen. Niet waar (op welke pc’s) het staat.[/quote]
Hangt er van af?
Routing and resource discovery
Based on how the nodes are linked to each other within the overlay network, and how resources are indexed and located, we can classify networks as unstructured or structured (or as a hybrid between the two). Hybrid models are a combination of peer-to-peer and client-server models
En toon iets van begrip, aan het woord is een historicus die journalist werd en pas weer later datajournalist.
Oké LinkedIn … En een boek schreef:
Writer De Digitale Schaduw - maart 2009 – maart 2012 (3 jaar 1 maand)|New York/Amsterdam
In De Digitale Schaduw (The Digital Shadow) I state that the current debate on privacy versus security isn’t a very constructive one. What we seem to miss in the privacy debate is information on what is actually being done with our data. In De Digitale Schaduw I show that our data is used to build (risk) profiles that are increasingly influencing our daily lives, without us even knowing about it.
Niet de digitale schaduw die wij er destijds in het oude forum al eens bijgehaald hebben:
Onze digitale schaduw
… dan komen wij op basis van de in kaart gebrachte informatiestromen en de bijbehorende verwerkingen binnen de publieke en de private sector tot de schatting dat de gemiddelde Nederlander staat geregistreerd in tot 250 tot 500 bestanden.
Maar niet alleen zij:
Statusscores
Wat zijn statusscores?
Statusscores zijn scores die het SCP berekent en die aangeven hoe de sociale status van een wijk is, in vergelijking met andere wijken in Nederland. Met de sociale status bedoelen we hier niet het aanzien of de populariteit van een wijk. De sociale status van een wijk is afgeleid van een aantal kenmerken van de mensen die er wonen: hun opleiding, inkomen en positie op de arbeidsmarkt. De meest recente statusscores zijn van 2014.
Voor wie zijn de gegevens bedoeld?
Iedereen die belangstelling voor deze gegevens heeft kan ze downloaden. Het maakt niet uit of dit professionele belangstelling of algemene interesse betreft.
Welke gegevens ontvangt u?
De indicatieve naam van de postcodegebieden is ontleend aan de namen die voorkomen op de digitale postcodekaart van Nederland (http://www.geodan.nl/).
Hoe moeten de scores worden geïnterpreteerd?
Een hoge score geeft aan dat de status in die wijk hoog is, een lage score geeft aan dat de status laag is.
Verantwoording
De basisgegevens zijn afkomstig van EDM BV, een organisatie die onder meer inzicht geeft in het profiel van alle Nederlandse postcodes en huishoudens. Hiervoor wordt gebruik gemaakt van vele publieke en private databronnen. Daarnaast voert EDM BV zelf grootschalig onderzoek uit onder de Nederlandse bevolking.
Voor de statusscores van het Sociaal en Cultureel Planbureau worden de huishoud- en postcodeprofielen door EDM BV opgehoogd naar het niveau van het vierpositie postcodegebied. Zo’n gebied omvat gemiddeld zo’n 1.825 Nederlandse huishoudens.
Een greep uit de onderzoeken die het SCP laat doen waar een en ander op gebaseerd kan zijn:
- Aanbod van arbeid
- Betrokken Woonwijken: op zoek naar factoren van succesvol leefbaarheidsbeleid
- Civil society en vluchtelingen
- Continu Onderzoek Burgerperspectieven
- Countries compared on public performance
- Culturele belangstelling en cultureel draagvlak
- Emancipatie in crisistijd
- Ervaren kwaliteit van leven
- Houding tegenover en ervaringen van lesbische, homoseksuele, biseksuele en transgender personen
- Langdurige armoede
- Nieuwe dataverzameling Tijdsbestedingsonderzoek (TBO)
- Nonrespons bij surveyonderzoek
- Sociale Staat van het Platteland
- Stapelen en switchen in het hoger onderwijs
Doen wat er gezegd wordt, kolom ‘titel’ in De Telefoongids in relatie met het bovengenoemde bestand:

Rangorde volgt voor zover van toepassing het aantal 4-positie postcode gebieden en loopt tot 3541. Ter hoogte van “Ds”, dominee, wordt de spoeling al dunner.
Bij inzoomen op “titels” van de vier miljoen telefoonabonnees die in het telefoonboek vermeld wilden worden, ook “Koning”, alleen haalt die bij lange na niet de hoogst mogelijke statusscore (3,0):

Maar jij raadt het al, of haar van data-entry of de weduwe zelf schrok van een digitale schaduw. Website DTG:
Brouwer-de Koning R Patrijsstraat 42, 3245VL Sommelsdijk
Is ook zo. De spijker op zijn kop slaan:
SELECT firstname, lastname, statusscore14, rangorde14
FROM id_pc4
INNER JOIN Statusscores ON id_pc4.pc4 = Statusscores.[pcnr]
INNER JOIN white_subscriber ON id_pc4.id = white_subscriber.id
ORDER BY rangorde14;
Verschil moet er wezen, DTG heeft zelfs je “M” er afgelaten:

Tweesnijdend zwaard, onscherp linken kan ook ingezet worden om ingevoerde gegevens in databases waar altijd van alles aan mankeert op te schonen:
n-gram similarity comparators
The method proposed here involves the use of an n-gram similarity score, which is often referred to as the Dice coefficient in the information retrieval field.
Zaken en personen kunnen op die manier ondanks spelfouten, afkortingen en in uiteenlopende context weer tot unieke entiteiten herleid worden:
Via n-grams {’ Co’,’orp’,’rpo’,’por’,’ora’,’rat’,’ati’,’tio’,’ion’} kan je dan “IBM Corp.” en “IBM Corporation” wel weer herenigen, iets wat door gewoon sorteren of koppelen in een database niet lukt.
Net zo scharrelen met iemand zijn ‘tokens’:
Fuzzy Match Similarity
Differences between ‘duplicates’ often due to abbreviations or whole word insertions.
John Smith vs John Edward Smith vs John E. Smith
Allow sequences of mis-matched characters (gaps) in the alignment of two strings.
Application: correlate airline passenger data with homeland security data for no-fly lists