Java grafieken voor Opendata

Hoi Weerman,

Drie op de vier Nederlanders heeft geen problemen met delen van persoonlijke data. Zij vinden wel dat bedrijven veel meer profiteren van die gegevens dan zijzelf. Dat concludeert onderzoeksbureau GfK in een donderdag verschenen onderzoek (pdf), dat in opdracht van brancheorganisatie Data Driven Marketing Association (DDMA) is uitgevoerd.

Waarom heb je als gebruiker geen inzicht en controle over welke gegevens er over je verhandeld worden? En waarom zien je er niets van terug in de vorm van een leuk bedrag? Frustraties over de handel in persoonsgegevens vormt de basis van het Amsterdamse bedrijf Dime-data is me.

Persoonlijke data zijn geld waard. Bedrijven gebruiken de gegevens om gericht te adverteren en aanbiedingen te doen. Ze verzamelen de gegevens zelf of kopen ze bij datahandelaren. In Nederland zijn zo’n 180 datahandelaren actief, waarvan Dime er één is.

Eerlijke datahandel. Mooi woord, lijkt mij dat de eerlijkheid vaak vanuit bepaald actor wordt gezien. Bijvoorbeeld dat Balkenende de VOC-mentaliteit roemde. Lijkt mij dat hij de eerlijke handel (vanuit gezichtspunt van de Amsterdamse koopman) daarbij bedoelde.

Facebook scant je post door. Lijkt mij niet de gewenste situatie. Daarom opteer ik naar virtuele laag die je bovenop Facebook, Instagram, Twitter, LinkedIn, etc. positioneert.

De hartelijke groet Jan Marco

####British Journal of Photography, Shooting the Rich:####


A premium casino for high rollers is situated on the 66th floor of the Trump Ocean Club, Panama

Jan Marco, zal ik jou eens alle hoeken van de kamer laten zien?

Dat zijn er vier, 1) staat hierboven, aan te vullen met 2) een beetje couleur locale:

Chapter One

Great Men in Panama have gorgeous black secretaries in prim blue bus-conductress uniforms. They have panelled, steel-lined bulletproof doors of rainforest teak with brass handles you can’t turn because the doors are worked on buzzers from within so that Great Men can’t be kidnapped.

Ramón Rudd’s room was huge and modern and sixteen floors up with tinted windows from floor to ceiling looking onto the bay and a desk the size of a tennis court and Ramón Rudd clinging to the far end of it like a very small rat clinging to a very big raft. He was chubby as well as short, with a dark blue jaw and slicked dark hair with blue-black sideburns and greedy bright eyes. For practice he insisted on speaking English, mainly through the nose.

‘Peppermint?’ Rudd enquired, pushing at a brass tray of wrapped green sweets.

The Tailor of Panama - John le Carré (1996)

  1. Brief aan de Tweede Kamer, “Geachte voorzitter”:

Panama Papers

De Belastingdienst volgt de berichtgeving in de media met grote interesse en kijkt of deze aanknopingspunten biedt voor een Nederlands heffingsbelang. Op basis van berichtgeving in de media zijn de eerste zaken reeds in onderzoek genomen. Daarnaast is de Belastingdienst direct na het op 9 mei beschikbaar worden van de data van het ICIJ aan de slag gegaan met de analyse daarvan.

Omdat geen bronbestanden zijn vrijgegeven en het databestand een vernieuwde versie betreft van een oud bestand (namelijk van het bestand dat ICIJ circa drie jaar geleden over Offshore Leaks online heeft geplaatst) is het duiden van dat databestand niet eenvoudig. Wel ontstaat een eerste beeld bij het bekijken van het databestand met daarin in totaal ruim 200.000 offshore entiteiten.

In het bestand staan ongeveer tweehonderd Nederlandse adressen, circa 50 Nederlandse tussenpersonen, zo’n honderd aan Nederland gekoppelde entiteiten en ruim 250 ‘officers’ met een link met Nederland.

De minister en zijn staatssecretaris, lang niet alles is vrijgegeven:

ICIJ is publishing the information in the public interest

ICIJ is not publishing the totality of the leak, and it is not disclosing raw documents or personal information en masse. The database contains a great deal of information about company owners, proxies and intermediaries in secrecy jurisdictions, but it doesn’t disclose bank accounts, email exchanges and financial transactions contained in the documents.

Hetgeen wel werd vrijgegeven oogt als KvK/Handelsregister-gegevens en de bijbehorende concernrelaties met als bijzonderheid dus dat ze er daar juist niet uitkomen. Nog niet:

Overig

Zoals aan uw Kamer is geschreven in de contourenbrief van 10 februari jongstleden, zal het Nederlands UBO-register UBO-informatie gaan bevatten , kort gezegd, de in het Nederlands Handelsregister opgenomen entiteiten. De Panama Papers lijken tot nu toe vooral betrekking te hebben op vennootschappen en andere entiteiten of constructies, gevestigd in andere jurisdicties. Deze vallen buiten het bereik van het Nederlands UBO-register.

Initiatieven zoals die van de EU-lidstaten om over te gaan tot automatische uitwisseling van UBO-gegevens tussen autoriteiten na een initiatief van het Verenigd Koninkrijk, Frankrijk, Duitsland, Italië en Spanje, zeker als die initiatieven ook buiten de EU op steeds grotere schaal zouden worden geïmplementeerd, zullen maken dat het moeilijker wordt om een andere jurisdictie op te zoeken om buiten het bereik van een UBO-register te blijven.

Ministerie van Financiën - Kabinetsreactie Panama Papers - 18 mei 2016

Wat je vorige maand oorspronkelijk als csv-bestanden kon ophalen was nauwelijks te genieten vanwege de onverzorgde export maar ik zie nu dat je de gegevens ook in het ‘native’ formaat van de door hen gebruikte database kan downloaden.

Net als de andere begunstigde, de Süddeutsche Zeitung, dat Nuix inzette had het ICIJ - International Consortium of Investigative Journalists - ook eigen ideeën over wat nodig zou zijn bij het onderzoek:

What Is Neo4j?

Neo4j is a highly scalable native graph database that leverages data relationships as first-class entities, helping enterprises build intelligent applications to meet today’s evolving data challenges.

  1. Andersom wordt er ook achterdochtig naar dat ICIJ gekeken:

Who is talking?

Who or what is the ICIJ? This is an open question, to which I have yet to see a convincing answer.

The ICIJ is, according to its website “was launched as a project of the Center for Public Integrity” and is now “backed by the Center and its computer-assisted reporting specialists…” whatever that means (reporters with PCs?). It’s not clear if it involves financial support from the CPI.

The ICIJ site lists a number of Foundations as its financial backers. A special mention is made for Australian businessman Graeme Wood, who founded an online travel business recently sold to Expedia. Curiously, according to this release, Wood was elected to the CPI’s board of directors in June 2013, although he is not on the current list of directors on CPI’s site.

The CPI is also, quite ironically, bankrolled by a long list of foundations, trusts and the like.

Qwealth Report - How to Survive the Panama Papers - April 11, 2016

En inderdaad blijkt al snel hoe veel werk het is om van die onderlinge relaties na te vlooien:

  • on July 6, 2014, it was announced that Expedia, Inc had agreed to buy Wotif.com Holdings Ltd, an online travel company that covers the Asia-Pacific region. Wotif’s brands include Wotif.com, lastminute.com.au and travel.com.au

  • Australian businessman Graeme Wood - degene die zijn bedrijf aan Expedia (ooit van Microsoft) verkocht - has pledged $1.5 million to ICIJ over the next three years to bolster its cross-border investigative reporting capacity

  • uit de Offshore Leaks Database komt als je op Expedia zoekt een EXPEDIA PACIFIC LTD.

  • het Handelsregister heeft Expedia.nl B.V. op het adres Herengracht 469 Amsterdam

  • weer in de Offshore Leaks Database zoeken op dat adres geeft twee hits voor bij elkaar een drietal ‘officers’ die in een aantal panden, het “Gouden Bocht Complex”, huizen

En hoewel zij voorkomen in de Panama Papers hebben die zeer waarschijnlijk niets met dat Expedia uit te staan? Dus Jan Marco, hik spik spouw, ik geef de hik aan jou.

[quote=“alkema_jm, post:255, topic:354”]
Drie op de vier Nederlanders heeft geen problemen met delen van persoonlijke data. Dat concludeert onderzoeksbureau GfK in opdracht van brancheorganisatie Data Driven Marketing Association (DDMA).[/quote]

DDMA, die zweren op de website dat het “de consument centraal stelt” en dat lijkt ook wel te kloppen, alleen een beetje anders dan de consument denkt. Hij/zij hangt namelijk met portemonnee en al ondersteboven aan de lopende band bij dat GfK:

GfK Panel Services Benelux

GfK Panel Services Benelux maakt met twee vestigingen deel uit van de beursgenoteerde GfK Group. Met vestigingen in ruim 100 landen is dit wereldwijd één van de grootste marktonderzoeksbureaus.

De klant

GfK Panel Services Benelux levert feitelijke kennis over koop- en consumenten gedrag waar retailers, fabrikanten en brancheorganisaties beslissingen mee kunnen nemen of onderbouwen. Via een online panel, de ConsumerScan, registreert het bureau wekelijks de boodschappen van 6.000 consumenten. Naast de fast moving consumer goods volgt GfK onder andere ook duurzame consumptiegoederen, mode, energie, telecom of mobiliteit.

Dit gebeurt via de ConsumerJury, een online panel van 20.000 leden. Aan het continu-onderzoek wordt ook geregeld ad hoc onderzoek toegevoegd voor een zo scherp mogelijk beeld.

Welke belangen DDMA effectief dient bleek eind vorig jaar toen een Brusselse lobby-organisatie werd doorgelicht waarvan de naam, EPA, European Privacy Association, doet denken aan een organisatie die zich inzet voor privacy rechten:

Data: het nieuwe goud

Dat is de indruk die je krijgt. Eh, alleen uit die debatten die ze organiseren bleek, dat de boodschap een andere was, namelijk je moet niet te ver gaan in het beschermen van die privacy rechten want dat is schadelijk voor de economie. Uiteindelijk is het duidelijk geworden dat ze inderdaad gefinancierd werden door Google, door Yahoo en door Facebook onder andere, in totaal tien internetbedrijven en lobbygroepen.

Uiteindelijk is het duidelijk geworden dat het ging om een mantelorganisatie, betaald door het bedrijfsleven, opgericht ook vanuit een lobby consultancy bedrijf, met het doel om die boodschap van het bedrijfsleven, om die extra kracht te geven en dat was de strategie eigenlijk.

Volgens het VARA-programma Zembla vertegenwoordigt het genoemde EPA onder deze valse vlag ook het Nederlandse DDMA en haar (275) leden:

De DDMA vindt het niet nodig dat mensen van tevoren expliciet toestemming moeten geven voor de opslag van hun persoonsgegevens. Ook pleit de DDMA ervoor dat bedrijven profielen mogen blijven maken van consumenten.

Ben even kwijt wie dat niet zo lang geleden zat aan te raden: als mensen beweren ‘Ik heb niets te verbergen’ onmiddellijk het nummer van hun pinpas vragen ;o)

Dan is daar het rapport “Privacybeleving op het internet in Nederland”:

Samenvatting

Uit het onderzoek blijkt dat de Nederlandse bevolking veel belang hecht aan privacy en de
bescherming van persoonsgegevens: 82,5% van de respondenten vindt dit belangrijk. Er worden
ook concrete acties ondernomen om persoonsgegevens te beschermen, zoals het installeren van
beschermende software (88,5%) of het aanpassen van profielinstellingen (68,4%). Tevens zijn veel
mensen terughoudend in het delen van gegevens als het doel of de noodzaak daarvan niet geheel
duidelijk zijn (respectievelijk 38,6% en 29,5%).

Rijksoverheid | Rapport | PDF document | 52 pagina’s | 469 kB | 01-02-2015

Ter hoogte van “Sociale media zoals Facebook” zit de goegemeente al voor meer dan 70% op de verkeerde kleur:

Persoonsgegevens ruilen voor gratis diensten

Tot slot hebben we de respondenten gevraagd in hoeverre zij bereid zijn om persoonsgegevens te delen in ruil voor gratis diensten. De respondenten is een situatie voorgelegd, waarbij commerciële partijen zoals Hotmail, Apple, Microsoft of Google gratis diensten leveren in ruil voor persoonsgegevens, die ze doorverkopen aan adverteerders om hun advertentieaanbod beter af te stemmen op de gebruiker.

Vertrouwen de onderzoekers niet helemaal:

Het hoge percentage respondenten dat ‘neutraal’ heeft geantwoord, kan er op wijzen dat zij niet goed weten wat zij er van moeten denken of niet goed kunnen inschatten wat de gevolgen zijn van het delen van persoonsgegevens in ruil voor gratis diensten. Het percentage respondenten dat zich er ongemakkelijk bij voelt is echter veel groter (37,7%) dan het percentage dat zich er gemakkelijk bij voelt (17,4%), wat doet vermoeden dat het ongemakkelijke gevoel overheerst – ook onder de neutraal stemmers.

Het TNO zou het TNO niet zijn als zij het daar bij zou laten zitten:

Peer pressure

Hoewel de respondenten hebben aangegeven sociale media minder te vertrouwen en onzeker te zijn over het gebruik van hun persoonsgegevens door derden, maken veel mensen toch gebruik van dergelijke diensten.

Ondanks het weinige vertrouwen, toch gebruik maken van deze diensten hangt naast peer pressure mogelijk ook samen met the fear of missing out: bang zijn om belangrijke gebeurtenissen en ontwikkelingen te missen wanneer zij niet deelnemen aan dezelfde online platformen als vrienden en familie.

Anders opblaasbare klanten? Hoeven ze ons niet lastig te vallen:

Door naar het pashokje:

Daarna weer heel lang wachten voor ze “op mogen”:

Net als bijvoorbeeld ook op Prinsjesdag, genodigden die te stil zitten:

Om die reden echte figuranten ernaast, ziet er wat levendiger uit:

Jan Marco, dan zou marktonderzoek leentjebuur spelen bij de filmindustrie, deze ‘extras’ werden door Inflatable Crowd geleverd voor de productie van een speelfilm:

Salt (2010)

  • IMDB Rating: 6.4/10 from 162,410 votes
  • Release: 2010 / Salt (2010)
  • Genre: Action | Crime | Mystery
  • Director: Phillip Noyce
  • Stars: Angelina Jolie, Liev Schreiber, Chiwetel Ejiofor

Synopsis: Evelyn Salt is a CIA agent and highly respected by all, including her boss, Ted Winter. Out of the blue, a Russian spy walks into their offices and offers a vital piece of information: the President of Russia will be assassinated during his forthcoming visit to New York City to attend the funeral of the recently deceased U.S. Vice President. The name of the assassin: Evelyn Salt. Concerned about the safety of her husband, who she cannot contact, she goes on the run. Winter refuses to accept that she is a mole or a double agent but her actions begin to raise doubts. Just who is Evelyn Salt and what is she planning?

Een ‘bionische’ vrouw met teveel lipstick op, in een onzinnig plot. Van Sony Pictures gejat script bij Wikileaks:

144 INT. CENTRAL CRYPT - DAY                                 144

She FIRES three shots. Splintering three WOOD ENCASEMENTS.
Blowing all the stops in the pipe organs’ WIND-CHESTS.
                                                         CUT TO:

145 INT. ST. BARTHOLOMEW'S CATHEDRAL - DAY                   145

Abruptly, in near-instantaneous succession, each of the
Cathedral's three pipe organs BLAST a sustained moleculerattling
note at full volumetric pressure.

Winter shouting into his radio.

En na afloop laat men zij die meegewerkt hebben gewoon weer leeglopen.

Aan de lijst films te zien is dit wel een aflopende zaak, omdat iedereen nu liever van de digitale trukendoos gebruik wil maken?

Dat laten leeglopen lukt natuurlijk niet met deze keramische dummy’s, ook in een kerk:

Bijschrift, Each of these terra cotta figures bears the likeness of an actual employee of San Francisco’s Internet Archive:

Internet Archive is a non-profit library of millions of free books, movies, software, music, and more.

Technology: We preserve 1 billion Web captures per week! We’ve saved 20 petabytes (that’s 20,000,000,000,000,000 bytes) of data. That takes a lot of servers, bandwidth and power. The cost of storing information in our data centers is a fraction of the cost of Amazon Cloud.

Staff: Most top websites employ huge staffs. We employ 170 people around the world—engineers, archivists, librarians and book scanners. Most of our staff could be making much more at a company driven by profit, but they choose to work for a non-profit powered by a huge mission.

Projects: This year we are building the next-generation Wayback Machine, including for the first time a Wayback Website Search engine.

archive.org

Waar men deze week bijeenkwam:

Decentralized Web Summit — June 8-9, in SF

At the Summit on June 8, the “father of the Internet,” Vint Cerf, will share with us his “Lessons from the Internet,” the things he’s learned in his 40+ years that may help us create a new, more secure, private and robust Web.

Current builders of decentralized technologies will be on hand to share their visions of how we can build a fully decentralized Web. The founders and builders of IPFS, the Dat Project, WebTorrent, Tahoe-LAFS, zcash, Zeronet.io, BitTorrent, Ethereum, BigChainDB, Blockstack, Interledger, Mediachain, MaidSafe, Storj and others will present their technologies and answer questions.

archive.org - Blog - 19-5-2016

Wie er ook was:

The Web’s Creator Looks to Reinvent It

SAN FRANCISCO — Twenty-seven years ago, Tim Berners-Lee created the World Wide Web as a way for scientists to easily find information. It has since become the world’s most powerful medium for knowledge, communications and commerce — but that doesn’t mean Mr. Berners-Lee is happy with all of the consequences.

“It controls what people see, creates mechanisms for how people interact,” he said of the modern day web. “It’s been great, but spying, blocking sites, repurposing people’s content, taking you to the wrong websites — that completely undermines the spirit of helping people create.”

So on Tuesday, Mr. Berners-Lee gathered in San Francisco with other top computer scientists — including Brewster Kahle, head of the nonprofit Internet Archive and an internet activist — to discuss a new phase for the web.

Deze Kahle is degene die de opbrengst van de verkoop van zijn bedrijven in genoemd Internet Archive stak:

Edward Snowden showed we’ve inadvertently built the world’s largest surveillance network with the web

Mr. Kahle’s Internet Archive, which exists on a combination of grants and fees from digitizing books for libraries, operates the Wayback Machine, which serves as a record of discontinued websites or early versions of pages.

The movement to change how the web is built, like a surprising number of technology discussions, has an almost religious dimension.

Some of the participants are extreme privacy advocates who have created methods of building sites that can’t be censored, using cryptography. Mr. Cerf said he was wary of extreme anonymity, but thought the ways that digital currencies permanently record transactions could be used to make the web more accountable.

Still, not all the major players agree on whether the web needs decentralizing.

“The web is already decentralized,” Mr. Berners-Lee said. “The problem is the dominance of one search engine, one big social network, one Twitter for microblogging. We don’t have a technology problem, we have a social problem.”

One that can, perhaps, be solved by more technology.

www.nytimes.com - Technology - 8-6-2016

De beide dagen waren zoals het hoort integraal via YouTube (1, 2) te volgen, een fikse rij sprekers en onderwerpen passeert de revue:

Aangezien op die manier annoteren precies het omgekeerde is van wat ik hier eigenlijk altijd zit te doen, niet knippen en plakken vanaf het web en dat gelinkt met opmerkingen onder elkaar zetten, nee, hun systeem maakt het mogelijk (delen van) webpagina’s ter plekke van commentaar te voorzien en het daar ook met elkaar te delen:

About us

“To enable a conversation over the world’s knowledge.”

We think simple tools can help us all improve the quality of information on the Internet and in the greater world around us.

Our team is building an open platform for discussion on the web. It leverages annotation to enable sentence-level critique or note-taking on top of news, blogs, scientific articles, books, terms of service, ballot initiatives, legislation and more. Everything we build is guided by our principles. In particular that it be free, open, non-profit, neutral and lasting to name a few.

We create software, push for standards, and foster community.

Our efforts are based on the Annotator project, which we are principal contributors to, and annotation standards for digital documents being developed by the W3C Web Annotation Working Group. We are partnering broadly with developers, publishers, academic institutions, researchers, and individuals to develop a platform for the next generation of read-write Web applications.

hypothes.is - About

Dat komt ervan als je afdaalt in de archieven, achter die “Our team”-link kwam ook Jon Udell weer tevoorschijn, de naam van een vaardige publicist die ik nog ken uit de tijd van het tijdschrift “BYTE”:


Ging in 1998 ter ziele:

The Death of BYTE Magazine

The readership of Byte and advertising revenue were declining when McGraw-Hill sold the magazine to CMP Media, a successful publisher of specialized computer magazines in May 1998. The magazine’s editors and writers expected its new owner to revitalize Byte but CMP ceased publication with the July 1998 issue, laid off all the staff and shut down Byte’s rather large product-testing lab.

Tom’s Unofficial BYTE FAQ

Het blad deed op het allerlaatst nog een poging met een ‘Cover Story’, “Reinventing The Web”. Ook toen al :

Weaving a Better Web

The features that made HTML so popular are causing the Web to fall apart. What’s next?
We have a love/hate relationship with HTML.We love its easy learning curve and universality, but we hate its easily broken links and limited formatting. We love its simple and compact syntax, but we hate its rigid formatting and inflexibility.

To keep what we love and jettison what we hate, we’ve scripted it, styled it, tabled it, and framed it. Yet, after more face lifts and tummy tucks than an aging Hollywood star, today’s HTML is still just HTML. The broken links and formatting problems are just warts and cellulite that won’t go away.

Byte Magazine Vol 23 No 3 March 1998

Deze ‘content’ van maart 1998 nu nog kunnen “raadplegen”, dat is te danken aan ‘archivist’ Jason Scott, de middelste “kleipop” op de voorste rij in de foto hierboven van alle medewerkers bij de “Wayback Machine”, The Internet Archive.

Hoi Weerman,

Uit het onderzoek blijkt dat de Nederlandse bevolking veel belang hecht aan privacy en de
bescherming van persoonsgegevens: 82,5% van de respondenten vindt dit belangrijk.

Iedereen hecht veel belang dat dieren lekker kunnen rondhuppelen in de wei.:grinning: Iedereen hecht veel belang aan dat er wereld vrede komt.:slight_smile:

Tevens zijn veel mensen terughoudend in het delen van gegevens als het doel of de noodzaak daarvan niet geheel duidelijk zijn

Ik heb een pc opnieuw geïnstalleerd met win10 en van Google moest ik direct een privacy verklaring goedkeuren van Google. De terughoudenheid heeft bij mij 3 seconden geduurd om toch maar op de “Ja” knop te drukken.

Persoonsgegevens ruilen voor gratis diensten

Tot slot hebben we de respondenten gevraagd in hoeverre zij bereid zijn om persoonsgegevens te delen in ruil voor gratis diensten. De respondenten is een situatie voorgelegd, waarbij commerciële partijen zoals Hotmail, Apple, Microsoft of Google gratis diensten leveren in ruil voor persoonsgegevens, die ze doorverkopen aan adverteerders om hun advertentieaanbod beter af te stemmen op de gebruiker.

Ik denk dat je bij persoonsgegevens/privacy eerst moet afvragen of privacy die je claimt wel van jou is.

De normale burger mag gewoon op de openbare weg worden gefotografeerd. Hij is immers voor anderen ook zichtbaar. Deze foto’s mag je ook (professioneel) publiceren. Denk maar aan de krant. Maar je moet wel oppassen. Want als de persoon herkenbaar is beeld is, dan geldt het “redelijk belang” van die persoon. Dus als die persoon door de publicatie werkelijk benadeeld wordt in zijn persoonlijke sfeer.

Een gewone burger is natuurlijk ook een politieman.:slight_smile:

heb je het recht een politie zijn identificatie te vragen (naam/rang binnen het korps)

Ja, dat “recht” heb je en lijkt mij eigenlijk heel normaal, mits je de algemene burger fatsoensnormen in acht blijft nemen. Dit geld trouwens voor alle personen, zoals de meteropnemer, de collectant, de pakjesbezorger, de trein conducteur enz, enz. , het geld zelfs voor jou zelf ook, de politie agent kan jou ook om een identificatie vragen.

In mijn PersInfoNet gedachte mag je dus een agent (volgens de wettelijke regels) om zijn ID vragen en deze overtypen in een App op je smartphone en daarbij een foto van de agent er bij voegen. Hierna met kunstmatige fotoherkenning Facebook en Linkedin aflopen om match te maken. Omdat iedereen info bij specifieke agent gaat plaatsen kan iedereen agent gaan aanspreken op etnisch profiling of dat vaak ‘klokjes’ verdwijnen indien deze specifieke agent een huiszoeking doet. Indien hij niet goed zijn best doet bijvoorbeeld als je een aangifte doet, dan zou je dat ook moeten kunnen aangeven in de app. Komt deze persoon bij jou, direct checken hoe zijn trackrecord is.
De macht balans wordt met een ‘Peer to Peer appicatie’ weer in evenwicht gebracht. Artsen, notarissen hebben ook ID-plicht, dus zou je zelfde applicatie voor kunnen gebruiken. Lijkt mij handig dat je andere patienten waarschuwt als een arts er een potje van maakt.:slight_smile:

Persoonsgegevens ruilen voor gratis diensten

Als ik kijk naar woekerpolissen dan is afspraak belangrijker dan of het wel of niet goed aanvoelt. Als ik een luchtballon aan iemand ‘verkoop’ met conditie dat hij mij elke maand 10 euro betaalt, dit 30 jaar lang, vindt men dat dit niet goed aanvoelt, echter het is gewoon een deal! DSB is wel failliet gegaan omdat iemand (Lakerman) aangaf dat je alle geld uit het bedrijf moest gaan halen. Ik hoorde dat de mensen met een DSB-leningen gewoon hebben moeten terugbetalen. Wordt als positief resultaat van de boedel gezien.

In Nederland kan je denk ik als volwassene al je persoongegeven/privacy wel verkopen door een contract te ‘tekenen’. Misschien is dat wel punt dat er geen dingen zijn die je niet mag ‘weggeven’. In andere landen wordt dat misschien wel ‘beter’ beschermd. Bijvoorbeeld in Qatar mag je geen seks voor huwelijk hebben en is blijkbaar strafbaar.

Stel dat bij je internet provider X ook een Auping bed kan krijgen en daarbij wordt wel een webcam door de monteur van je internet provider boven het bed geplaatst. Kom op dit idee om dat een jong leuk stel dat naast mij woont van hout pallets een bed wilde gaan maken. Iedereen die beetje kan nadenken weet wat er wel gebeurt als de ip-provider een camera op gaat hangen. College persoonsgegevens gaat dan aangeven dat het niet mag want er is geen nadrukkelijk toestemming voor gegeven. Provider X gaat dan pagina maken waarop je “ja” moet klikken en komt College Persoonsgegevens met de melding/persbericht dat Provider X zich nu pas aan de regels houdt.

Het is m.i. aan IT-ers de uitdaging om iets te maken “tent of kleed” wat boven bed tussen de camera en bed hangt. We zouden ook prijsvraag kunnen uitzetten.:grinning: In IT heeft zo’n kleed het ‘TOR-netwerk’. Heb laatst naar Peter de Vries “internet pester aangepakt” gekeken. Een deskundige en Peter legt uit dat als je IP-adres hebt ook de computer waarvan het bericht/pornafilmpje vanaf is gestuurd hebt. Lijkt mij de laatst link in het TOR-netwerk dat de Exit-node naar de doel server stuurt. Het is denk ik moeilijk cq niet realiseerbaar is om het PC/device te achterhalen waar bericht initieel vanaf is gestuurd.

De hartelijke groet Jan Marco

Jan Marco, is een zeepbel in plaats van een ballon ook goed? Dat was namelijk wat het vette beeldvlak van maximaal 2527 x 1584 pixels hier als blikvanger had gekregen:

<html dir="ltr" lang="en-US">
<head>

  <!--
   ______         __  __       ________       ______        _________       ______     
  /_____/\       /_/\/_/\     /_______/\     /_____/\      /________/\     /_____/\    
  \:::_ \ \      \:\ \:\ \    \::: _  \ \    \:::_ \ \     \__.::.__\/     \:::__\/    
   \:\ \ \ \_     \:\ \:\ \    \::(_)  \ \    \:(_) ) )_      \::\ \          /: /     
    \:\ \ /_ \     \:\ \:\ \    \:: __  \ \    \: __ `\ \      \::\ \        /::/___   
     \:\_-  \ \     \:\_\:\ \    \:.\ \  \ \    \ \ `\ \ \      \::\ \      /_:/____/\ 
      \___|\_\_/     \_____\/     \__\/\__\/     \_\/ \_\/       \__\/      \_______\/
  !-->

<picture>
  <img itemprop="image" srcset="https://qzprod.files.wordpress.com/2016/05/
  may-20-rtx91fg.jpg alt="Vendor blows bubbles to attract customers at a market in
  Srinagar" title="Vendor blows bubbles to attract customers at a market in Srinagar"/>
</picture>

Deze naar hun idee zo toepasselijke foto stond boven dit ‘fintech’-artikel in Quarz:

ETHEREAL ASSETS

The price of Ether, a bitcoin rival, is soaring because of a radical, $150 million experiment

Thousands of people have pumped $150 million into what might be the biggest crowdfunded project in history, something called the Decentralized Autonomous Organization (DAO). Compare this to the $20 million raised by the project with the most funds on Kickstarter, the Pebble Time smartwatch. The strange thing about this crowdfunding is that the DAO doesn’t produce any concrete products or services–not yet, anyway.

The DAO’s big promise is that it’s an entirely new way to manage and allocate capital. More specifically, it’s capital allocation without a fund manager. Think of it as venture-capital firm Andreessen Horowitz, but with Marc Andreessen and Ben Horowitz replaced by the wisdom of the crowd.

That crowd consists of about 11,000 anonymous stakeholders who can vote directly on any major decision to spend the organization’s funds. Companies or individuals who want to tap the funds must submit a proposal. These proposals are published online, and stakeholders ultimately vote on whether to adopt them, allocating a slice of the $150 million, or not. Stakeholders then stand to gain from the profits generated by these proposals, whether in the form of dividends or an increase in value of their tokens.

Quartz - Obsession - Future of Finance - May 20, 2016

Er zat een lek in dat autonome ‘smart contract’:

Miljoenenroof van digitale munt Ether

Er is vrijdag een grote roof geweest van de digitale valuta Ether. Bij een belangrijk project dat met Ether wordt betaald, DAO genoemd, is inmiddels voor bijna 80 miljoen dollar (71 miljoen euro) aan de valuta gestolen. Door een technische truc kan het geld mogelijk nog worden teruggehaald. Ether is een valuta die wordt gebruikt voor toepassingen van zogeheten blockchaintechnologie. De laatste maanden investeren veel banken en technologiebedrijven miljoenen euro’s in de veelbelovende technologie. De koers van Ether daalde na de roof met 27 procent.

NRC - Economie - 18 juni 2016

Als medium willen zij niet achterblijven, bij deze krant gaat men boven de kop voor een “archiefbeeld”, “hacker”, van “2048x1304” - het overbekende aquariumgroen-op-zwarte-letter-en-cijfermeuk-scherm waarvan wij wel weten dat dat nou hun petje te boven gaat:

<head>
	
<!--
 _ __  _ __ ___ 
| '_ \| '__/ __|
| | | | | | (__ 
|_| |_|_|  \___|
                 
NRC zoekt per direct een ervaren backend developer. Meer informatie op
https://github.com/nrcmedia/nrc-zoekt-developer/blob/master/web-developer.md

-->

<meta name="twitter:card" content="summary_large_image">
<meta name="twitter:image:src" content="https://images.nrc.nl/
umUg6X5-3cDx4duZdpP8mQ6hss0=/
1280x/s3/static.nrc.nl/wp-content/uploads/2016/06/hacker-2048x1304.jpg">

Maar waar jij mee kwam was dus heel accuraat, vindt men dat dit niet goed aanvoelt, echter het is gewoon een deal!

Want dat speelt dus vandaag: volgens de organisatie achter Ether kan het bedrag mogelijk wel worden teruggehaald met een technische truc maar op de geëigende plekken gloeit het rood op van de discussies tussen voor en tegenstanders van een dergelijke reparatie:

CRITICAL UPDATE Re: DAO Vulnerability

To be clear, if this happened due to an exploit in the software, then I can accept a hard fork fixing the issue. However, if the DAO team made a mistake in the way they designed their smart contract, as an issue of principle, they should not be “bailed out” by the Ethereum team because they are “to big to fail.” Hard lessons like these teach the cryptocurrency community at large to do their homework and to be excessively (and obsessively) diligent with their security.

I feel sorry for all who have, or would have lost, funds today. However, rollbacks have no place in a decentralized economy UNLESS they are integrated into the system as part of the rules that govern how the system operates from within the internal mechanics of the software or specification. The software, and the way it operates, is the social contract. Not the decisions of a development team to babysit big projects that hold up the economic ecosystem.

blog.ethereum.org - Jun 17th, 2016

“Miljoenenroof van digitale munt Ether”

Vervolg 15:00 uur, iemand heeft als dader een serieuze waarschuwing achtergelaten …

Staat weliswaar volledig in zijn recht maar blijft toch maar anoniem, heeft zijn bericht weer wel met een encryptie-sleutel ondertekend en zal “working with my law firm” eenieder in rechte aanspreken wanneer die hem zijn “reward” zal proberen te onthouden:

===== BEGIN SIGNED MESSAGE =====

An Open Letter

To the DAO and the Ethereum community,

I have carefully examined the code of The DAO and decided to participate after finding the feature where splitting is rewarded with additional ether. I have made use of this feature and have rightfully claimed 3,641,694 ether, and would like to thank the DAO for this reward. It is my understanding that the DAO code contains this feature to promote decentralization and encourage the creation of “child DAOs”.

I am disappointed by those who are characterizing the use of this intentional feature as “theft”. I am making use of this explicitly coded feature as per the smart contract terms and my law firm has advised me that my action is fully compliant with United States criminal and tort law.

Yours truly,

“The Attacker”

===== END SIGNED MESSAGE =====

Message Hash (Keccak): 0xaf9e302a664122389d17ee0fa4394d0c24c33236143c1f26faed97ebbd017d0e

Signature: 0x5f91152a2382b4acfdbfe8ad3c6c8cde45f73f6147d39b072c81637fe81006061603908f692dc15a1b6ead217785cf5e07fb496708d129645f3370a28922136a32

Pastebin - a guest - Jun 18th, 2016

Gaan we weer …

Iets van een jurist, “Exploiting a known vulnerability in ATM card code doesn’t give you the right to take money that isn’t yours from a bank”:

Bullshit!

If you fool an ATM you are hacking or stealing money because you are taking property away which is not yours.

This situation is completely different as it wasn’t a bank or something like this, it isn’t even related to money or property. It was a piece of code and you can do what the code says thats the rule!

A bank never uses “rules” like this. Their rules are pretty strick you give us your money and you can take it back. Here the rule was, you can do what the code says. And the code said you can get all the tokens which are here.

This guy is a joke not a lawyer.

bitcointalk.org - msg15264371

Reddit, “He did nothing wrong. He simply used the code better than others.”:

An Open Letter - From The Hacker

The irony here is impeccable: Ethereum uses smart contract for law but now requires paper law to determine liability. This goes against the core point of Etherum.

Reddit - baronofbitcoin - 4 punten - 36 minuten geleden

Reddit-gebruiker elux, 19.544 linkkarma, 11.197 reactiekarma, in zijn of haar commentaar:

Pfft. The attacker will get his money. Or Ethereum dies.

En een poging om de dader te traceren:

The local time puts him on the east coast of Australia, Brisbane
or Sydney most likely. Except he’s talking about US law.

Steemit - Ethereum - 3 hours agoo

Sidney? Dan weet ik het wel, inwendig ziedend omdat hij de vorige keer zo snel ontmaskerd werd:

Australian Craig Wright claims he is bitcoin founder Satoshi Nakamoto

Wright, 45, is an Australian IT and security consultant, who described himself on a now-deleted LinkedIn page as a “senior management executive information security specialist”.

Until recently he was the director of more than a dozen companies, some involved in cryptocurrency, until he divested himself of 12 of them in the space of a week in July 2015.

Wired and Gizmodo published investigations in December claiming to reveal Wright’s identity based on leaked transcripts, emails and financial records. Wright declined to comment on the stories, which were the subject of scepticism among some of his contemporaries.

The same day his north Sydney home was raided by Australian federal police in connection with a tax investigation, unrelated to bitcoin.

theguardian.com - Technology - Monday 2 May 2016

Hoi Weerman,

The Web’s Creator Looks to Reinvent It
SAN FRANCISCO — Twenty-seven years ago, Tim Berners-Lee created the World Wide Web as a way for scientists to easily find information. It has since become the world’s most powerful medium for knowledge, communications and commerce — but that doesn’t mean Mr. Berners-Lee is happy with all of the consequences.
“It controls what people see, creates mechanisms for how people interact,” he said of the modern day web. “It’s been great, but spying, blocking sites, repurposing people’s content, taking you to the wrong websites — that completely undermines the spirit of helping people create.”

De (bovenstaande) negatieve dingen kan je m.i. met techniek oplossen.

“The web is already decentralized,” Mr. Berners-Lee said. “The problem is the dominance of one search engine, one big social network, one Twitter for microblogging. We don’t have a technology problem, we have a social problem.”. One that can, perhaps, be solved by more technology.

Ik denk dat het een juiste constatering is dat de problemen “the dominance of one search engine” (= Google) en the dominance of “one big social network” (= Facebook) zijn.

Blijkbaar filtert men content door hash codes in database te gebruiken.

Aangezien op die manier annoteren precies het omgekeerde is van wat ik hier eigenlijk altijd zit te doen, niet knippen en plakken vanaf het web en dat gelinkt met opmerkingen onder elkaar zetten, nee, hun systeem maakt het mogelijk (delen van) webpagina’s ter plekke van commentaar te voorzien en het daar ook met elkaar te delen:

Dit is precies wat ik ook graag wil. Gewoon op twitter en facebook virtueel commentaar/posts kunnen zetten zonder dat men het kan traceren van wie het is. Je kan dan helemaal op twitter losgaan in bijvoorbeeld de “Zwartepieten discussie”.

Miljoenenroof van digitale munt Ether
Er is vrijdag een grote roof geweest van de digitale valuta Ether. Bij een belangrijk project dat met Ether wordt betaald, DAO genoemd, is inmiddels voor bijna 80 miljoen dollar (71 miljoen euro) aan de valuta gestolen.

Best wel leuk te lezen hoe men reageert. Veel aangeven dat het niet aan hen ligt.

Er zat een lek in dat autonome ‘smart contract’:

Smart contract zou m.i. ook wel (virtuele) transactie kunnen zijn.

Staat weliswaar volledig in zijn recht maar blijft toch maar anoniem, heeft zijn bericht weer wel met een encryptie-sleutel ondertekend en zal “working with my law firm” eenieder in rechte aanspreken wanneer die hem zijn “reward” zal proberen te onthouden:

Ik denk dat je wel eerlijke transacties moet hebben. N.B. Als ik bij de boer een stalletje met groente zie mag ik producten pakken, maar wordt wel van mij verwacht dat ik het bedrag ‘aftik’ wat ik meeneem. Niet dat ik denk er is toch niemand, dat ik alles gratis mag meenemen. Je kan ook voor kiezen om naar AH te gaan om dezelfde producten te kopen voor veel meer geld en dat dan een cassiere (vaak scholier) je helpt met ‘aftikken’. Bank blockchain is een goedkoop manier om product te verkrijgen (denk aan stalletje bij de boer) als je zwaar gereguleerd wil hebben ga je maar naar de bankier toe. Dezelfde persoon die je in het verleden een woekerpolis in de maag heeft gesplitst.

I am disappointed by those who are characterizing the use of this intentional feature as “theft”. I am making use of this explicitly coded feature as per the smart contract terms and my law firm has advised me that my action is fully compliant with United States criminal and tort law.
Reddit, “He did nothing wrong. He simply used the code better than others.”:
I feel sorry for all who have, or would have lost, funds today. However, rollbacks have no place in a decentralized economy UNLESS they are integrated into the system as part of the rules that govern how the system operates from within the internal mechanics of the software or specification.

Ik denk dat het programma ook een modus zou moeten hebben dat je kan terugrollen naar bepaald point in time. Dit natuurlijk wel bij uitzonderlijke gevallen. Het lijkt mij evident dat alle peers wel in andere mode het programma gaan zetten als een rover met de helft van alle inleg er vandoor wil gaan.

Wat ik al voorspelde gaat apple en google over op het ook kunnen aanbieden van abonnementsvormen aan gebruikers van programma’s.

De hartelijke groet Jan Marco

Jan Marco, hoeveel zoekmachinesites weet jij bij naam te noemen? Je tijd loopt … nu! Jammer. Blijft natuurlijk maar een spelletje.

Niks leukers dan letterlijk tegen een zoekmachine zeggen, “Zoek” - google.com/#q=search

Dan geeft de eerste pagina met zoekresultaten:

Google

About 4,820,000,000 results (0.44 seconds)

Maar jij wil hiernaartoe, wat als Alphabet Corporation Europa zou verlaten, “Glexit” Y/N?

Marktanteile der Suchmaschinen

- Google          90 Prozent
- Yahoo            2,4 Prozent
- Bing             2,2 Prozent
- T-Online         2 Prozent
- Ask.com          0,6 Prozent
- AOL Suche        0,5 Prozent
- Web.de           0,5 Prozent
- MSN Live Search  0,4 Prozent
- GMX              0,2 Prozent
- Search.com       0,1 Prozent
- DMOZ             0,1 Prozent
- Ixquick.com      0,1 Prozent
- Altavista        0,1 Prozent
- Fireball         0,1 Prozent
- Freenet          0,1 Prozent
- Allesklar        0,1 Prozent
- Metager          0,1 Prozent

Der Spiegel - deutschlandweiter Marktanteil, erhoben nach Webbrowser-Angabe, Stand: April 2011

Dan krijg je te maken met een tariefmelding, “Deze zoekopdracht kost 15 ct / min” of je moet het doen met een van de mindere goden?

Dan is er evengoed nog hoop, Do ist der Bahnhof:

DeuSu - Finden

Suche im gesamten Datenbestand: 2.135.581.126 Webseiten

Es wurden insgesamt 13 Ergebnisse gefunden.

https://deusu.de/query?q=Ge+Arie+Temmes

Of anders alles net als Chriet Titulaer maar aan ‘Cortana’ gaan vragen nu Microsoft haar op haar verjaardag in Windows 10 volgende maand ook hier gaat vrijlaten?

Hoi Weernan,

Je mist Ilse in de opsomming.

ilse is de eerste Nederlandse zoekmachine op het internet. De site kwam op 22 februari 1996 online en de naam was oorspronkelijk een acroniem voor InterLink Search Engine. Wikipedia

Ik zoek wel eens met Bing, niet omdat ik dat wil, maar omdat Microsoft mij ´met alle macht´ mij probeert door te routeren naar Bing. Opvallend is de grote dominantie van Google 90%. Wat mij triggert is dat `Freenet 0,1 Prozent´ in opsomming staat. Freenet is soortgelijk aan Gnunet en zal op de aangesloten peers gaan zoeken. Ik denk dat probleem met Freenet en Gnunet is dat er maar weinig clients draaien. Om iets te bouwen wat wel geduchte concurrent van Google zou kunnen worden is om Big Data concept van Splunk te pikken.

Al jouw peers zijn je Facebook vrienden en worden in Spunk schema Sites genoemd.

Elke peer maakt indexen en search head in de informatie. Over al jouw peers `facebook vrienden´ zoek je de informatie uit. Anders geformuleerd elke pc zorgt dat de informatie zoekbaar is geworden op hoger level.

De hartelijke groet Jan Marco

Jajaja, het is trouwens weer man en ik deed “search” bij google.com, heeft dat effect, dat het dan niet gelijk het Nederlandse “Ilse” aan de eerste 10 hits toevoegt.

Jij dacht dat ik me er te makkelijk van af maak?

Niet, voor mijn eerdere bijdrage vanmorgen nog eens langs mijn verzameling links voor “Distributed Search” geweest maar op dat terrein lijken nauwelijks nieuwe ontwikkelingen te bespeuren.

Sowieso moet je allereerst nog steeds langs onderzoeker Jon Kleinberg:

The Small-World Phenomenon and Decentralized Search

The small-world phenomenon – the principle that we are all linked by short chains of acquaintances, or “six degrees of separation” – is a fundamental issue in social networks; it is a basic statement about the abundance of short paths in a graph whose nodes are people, with links joining pairs who know one another.

The ability to construct a searchable network in this way, with long-range links whose probabilities decay with distance, has proved useful in the design of peer-to-peer file-sharing systems on the Internet, where content must be found by nodes consulting one another in a decentralized fashion.

In other words, nodes executing these look-up protocols are behaving very much like participants in the Milgram experiments – a striking illustration of the way in which the computational and social sciences can inform one another, and the way in which mathematical models in the computational world turn into design principles with remarkable ease.

Het ‘proprietary’ Faroo had ik vorig jaar al een keer voorgesteld:

Faroo

Another is Faroo, which has an interesting FAQ that includes this section explaining why even privacy-conscious non-distributed search engines are problematic:

Some search engines promise privacy, and while they look like real search engines, they are just proxies. Their results don’t come from their own index, but from the big incumbents (Google, Bing, Yahoo) instead (the query is forwarded to the incumbent, and the results from incumbent are relayed back to the user).

Unfortunately, unlike YaCy, Faroo is not open source, which means that its code can’t be audited – an essential pre-requisite in the post-Snowden world.

Het genoemde YaCy:

YaCy

Perhaps the best-known is YaCy:

YaCy is a free search engine that anyone can use to build a search portal for their intranet or to help search the public internet. When contributing to the world-wide peer network, the scale of YaCy is limited only by the number of users in the world and can index billions of web pages.

It is fully decentralized, all users of the search engine network are equal, the network does not store user search requests and it is not possible for anyone to censor the content of the shared index. We want to achieve freedom of information through a free, distributed web search which is powered by the world’s users.

The resulting decentralized web search currently has about 1.4 billion documents in its index (and growing – download and install YaCy to help out!) and more than 600 peer operators contribute each month. About 130,000 search queries are performed with this network each day.

Leek even een spannend experiment want gebruik makend van de WebRTC-optie in browsers maar loopt vast op iets met een Chrome-bug:

Discovery of scientific software

TL;DR: I’ve started building a distributed search engine for scholarly literature, which is completely contained within a browser extension: install it from the Chrome Web Store.

Luckily, it’s quite possible to use Scholar Ninja for scientific software discovery. In fact, it’s more than possible — it’s already done.

Before we get ahead of ourselves, let me provide just a bit of necessary backstory: Scholar Ninja indexes every paper you read online and adds paper’s metadata, keywords and URLs to a globally distributed search index, which is based on browsers, WebRTC and magic. Everyone who has the extension installed is a node in a Chord DHT network and is both an indexer and a server of content. Scholar Ninja’s mission in life is to become a complete and completely open search engine for science.

Had je dit wel eens gezien, een uitgestrekte begraafplaats voor overleden P2P zoeksoftware-initiatieven. Waar deze nog bijgezet moet worden, Blippex, ook “using the new WebRTC real-time communications technology” en ook “ex”:

This is the first interesting search engine since Google

One of Blippex’s key selling points is that Kossatz and Baeck are fanatical about privacy. Though Blippex constructs its search results on the basis of data gathered from its users, it does it in a way that’s anonymous and untraceable to any individual Blippex user. This obsession with privacy allows Blippex to rank pages—i.e., decide which pages to show people—with an algorithm that Google can’t match, because if Google gathered the data that Blippex does, users would find it unacceptably creepy.

Hoi Weerman,

Had je dit wel een gezien, een uitgestrekte begraafplaats voor overleden P2P zoeksoftware-initiatieven.

Wist niet van het bestaan van deze lijst. Het is positief dat mensen iets geprobeerd hebben.:slight_smile: Niet alles wordt een succes! Kan ook zijn dat iets wat wel werkte gaande de tijd “oubollig” is geworden. Net als de V&D.

Ik vind plaatje van Splunk wel mooi. Ik ga source code zoeken die in het plaatje past. Ik zie ook wel “distributed search code” die actief Internet afstruint. Ben ik niet kapot van. Wel wil ik graag code hebben die snel alle Facebook vrienden bij bepaald Facebook account oplevert. Eigenlijk maak je de informatie van site (of peer of anders geformuleerd ‘Facebookvriend’) opzoekbaar. Ik denk aan Open-VPN tunnels naar je Facebookvrienden.

Ik weet dat Funda checkt of je probeert hun informatie te kopiëren. Ik denk dat je het beste Chrome in gevisualiseerde omgeving (bijvoorbeeld Downloads – Oracle VM VirtualBox ) kan laten draaien, dus “ad banners” etc gewoon toestaan, net alsof je een normale browser bent. Waarbij je via TOR-netwerk naar de sites toe gaat.

Naast overgaan naar Windows 10 probeer ik ook Visual Studio Community 2015:


Wat ik leuk vind is de nieuwe “Team” en “Analyse” opties. Mijn bedoeling is om opties in Ultimate++ in te bouwen. Dus ik wil van Visual Studio Community 2015 GUI af. Ultimate++ gebruikt wel de Visual Studio compiler, dus de Visual Studio Community software uitrollen met Npackd software.

Iemand heeft iets gemaakt om Fossil in Tortoise framework op hoofdlijnen aan de praat te krijgen.

TortoiseFossil for Fossil SCM
What you’ll find here is a work in progress to have a Tortoise-style tool for Fossil repositories. Currently there is no release just yet, there are no commands implemented as of right now, but file overlays are working great.

Via de windows verkenner kan je files in versiebeheersysteem zetten en er uit halen. Je kan ook zien of file/directory is veranderd ten op zichte van orgineel.
http://www.tortoisefossil.org/index.cgi/doc/tip/misc/screenshot1.png
Versiebeheer wil ik wat prominenter doortrekken. Je kan ook versiebeheer op mails doen. Versiebeheer op je foto’s in Facebook en Instagram uitvoeren. Alle documenten die je met LibreOffice in versiebeheertool opslaan, etc.

De hartelijke groet Jan Marco

Jan Marco, jij vraagt mij wat ik nou het leukste vind. Niet? Ok, maar nu we het er toch over hebben, net als de schrijver en gedragsbioloog en ex-jurkdrager in die Maartens Moestuin-serie, zolang ik maar met af en toe weer een ander hoedje op gewoon in mijn digitale tuintje kan scharrelen vind ik alles best: vandaag internet-snijbiet doen, op zware zeeklei?

Moet ik jou wel eerst even laten vertalen, ziet er wat onwennig uit:

Hi Weatherman,

Did you like this have a seen a vast cemetery for deceased P2P search software initiatives.

Did not know of the existence of this list. It is good that people have tried something. : Slight_smile:Not everything is a success! May also be that something was working depth has become time “corny”. Like the V&D.

Enzovoort:

The cordial greeting Jan Marco

Vergeleken met je oorspronkelijke bijdrage in onze eigen taal levert dit een verbetering op van bijna 10%:

                html   brotli  omvang
jm 29-6-2016    2421    1138    47,0%
idem Engels	2263     852    37,6%

In bytes. Net als zopfli, zoete broodjes, is brotli iets Zwitsers van bladerdeeg:

Introducing Brotli: a new compression algorithm for the internet

At Google, we think that internet users’ time is valuable, and that they shouldn’t have to wait long for a web page to load. Because fast is better than slow, two years ago we published the Zopfli compression algorithm. This received such positive feedback in the industry that it has been integrated into many compression solutions, ranging from PNG optimizers to preprocessing web content.

Based on its use and other modern compression needs, such as web font compression, today we are excited to announce that we have developed and open sourced a new algorithm, the Brotli compression algorithm.

Google - Open Source Blog - Tuesday, September 22, 2015

Daar heb je het, Google heeft je hierboven vertaald en kan jou daarna nog beter samenpersen dan in het Nederlands.

Te danken aan de grove dwarsdoorsnede van webpagina’s die Google uiteraard allemaal langs ziet komen:

Static dictionary

Brotli also features a static dictionary. Unlike most general purpose compression algorithms, Brotli uses a pre-defined 120 kilobyte dictionary. The dictionary contains over 13000 common words, phrases and other substrings derived from a large corpus of text and HTML documents.

It contains 13,504 words or syllables of English, Spanish, Chinese, Hindi, Russian, and Arabic, as well as common phrases used in machine readable languages, particularly HTML and JavaScript. The total size of the static dictionary is 122,784 bytes. The static dictionary is extended by a mechanism of transforms that slightly change the words in the dictionary. A total of 1,633,984 sequences, although not all of them unique, can be constructed by using the 121 transforms.

Static dictionary:

Internet-Draft                   Brotli                         May 2015

The hexadecimal form of the DICT array is the following, where the
length is 122,784 bytes and the zlib CRC-32 of the byte sequence is
0x5136cb04.

  74696d65646f776e6c6966656c6566746261636b636f64656461746173686f77
  6f6e6c7973697465636974796f70656e6a7573746c696b6566726565776f726b
  74657874796561726f766572626f64796c6f7665666f726d626f6f6b706c6179
  6c6976656c696e6568656c70686f6d65736964656d6f7265776f72646c6f6e67
  7468656d7669657766696e64706167656461797366756c6c686561647465726d
  656163686172656166726f6d747275656d61726b61626c6575706f6e68696768
  646174656c616e646e6577736576656e6e65787463617365626f7468706f7374
  757365646d61646568616e6468657265776861746e616d654c696e6b626c6f67
  ...

In leesbare vorm:

  timedownlifeleftbackcodedatashow
  timedownlifeleftbackcodedatashow
  onlysitecityopenjustlikefreework
  textyearoverbodyloveformbookplay
  livelinehelphomesidemorewordlong
  themviewfindpagedaysfullheadterm
  eachareafromtruemarkableuponhigh
  datelandnewsevennextcasebothpost
  usedmadehandherewhatnameLinkblog
  ...

Verder naar beneden in de lijst worden de individuele termen langer en ook samengesteld uit meer dan een woord:

  stated   is only   discussion of
  top"><   search/   middle of the
  racing   tuesday   an individual
  resize   loosely   difficult to 
  --&gt;   Solomon   point of view
  pacity   sexual    homosexuality
  sexual   - <a hr   acceptance of
  bureau   medium"   </span></div>
  .jpg"    DO NOT    manufacturers
  10,000   France,   origin of the
  obtain   with a    commonly used
  titles   war and   importance of
  ...      ...       ...

Het is natuurlijk een statistische selectie maar als je door de lijst loopt slaat je fantasie steeds op hol, niet “god”, wel “goddess”, in welke pagina’s dan?

Het hele idee van een woordenlijst bij compressie gebruiken nog even:

Improving compression with a preset dictionary

For example almost all HTML files start with the string "<!doctype html><html ", however in this string only the second HTML will be replaced with a match, and the rest of the string will remain uncompressed. To solve this problem the deflate dictionary effectively acts as an initial back reference for possible matches.

So if we add the aforementioned string "<!doctype html><html " to the dictionary, the algorithm will be able to match it from the start, improving the compression ratio. And there are many more such strings that are used in any HTML page, which we can put in the dictionary to improve compression ratio.

Hoe het voorstel van Google ontvangen werd - door Google:

The current state of Brotli compression

In late May 2016 Chrome pushed out Chrome 51, unlike many releases of Chrome which are complete non-events, this release has an enormous impact. Google turned on Brotli support – and they promptly backported it into Chrome 50.

Firefox added support for Brotli in September 2015. 8 months later, thanks to Google, Brotli went from a compression format supported in less than 10% of global browsers to nearly 50% global adoption!

En hoe Google’s Brotli-initiatief valt bij Slashdot:

Google Launches Brotli, a New Open Source Compression Algorithm For the Web

  • If they want to make webpages load quicker, remove ads.

  • Stop making my browser run 500 trips to DNS in order to run 500 trips to every ad server in the world.

  • And lossless too? I’d prefer if they lost the ads, then the compression wouldn’t be needed.

  • This is not about speed, this is about GOOGLE’s bandwidth. Because they process so many transactions a second, they see cost savings even for small improvements.

Hoi Weerman,

Based on its use and other modern compression needs, such as web font compression, today we are excited to announce that we have developed and open sourced a new algorithm, the Brotli compression algorithm.

Ik gebruikte altijd Winzip, vaak maakte ik backup van mijn source projectjes met (niet open)rar formaat in WinZip. Ontwikkeling van de proprietary Rar format houdt op en wordt ingehaald door open source varianten. Nu heb ik 7zip.exe geïnstalleerd. N.B. Ik denk dat ik 20 jaar geleden de officiële WinZip applicatie een keer heb gekocht. Zou ik nu nooit meer doen.

And lossless too? I’d prefer if they lost the ads, then the compression wouldn’t be needed.

Nadeel van ad blocker is dat bijvoorbeeld Funda hierna kijkt. Ze denken dat je iemand bent die hun site probeert te kopiëren.

Er zijn ook andere technieken die momenteel gebruikt worden om browsers sneller te maken.

What are protocol buffers?
Protocol buffers are Google’s language-neutral, platform-neutral, extensible mechanism for serializing structured data – think XML, but smaller, faster, and simpler. You define how you want your data to be structured once, then you can use special generated source code to easily write and read your structured data to and from a variety of data streams and using a variety of languages.

Cap’n Proto is an insanely fast data interchange format and capability-based RPC system. Think JSON, except binary. Or thinkProtocol Buffers, except faster. In fact, in benchmarks, Cap’n Proto is INFINITY TIMES faster than Protocol Buffers.

Hier is een diagram van Cap’n Proto

Volgend project is een Distributed Search Engine die ik gevonden heb. Ben nog zoekende naar de beste Distributed Search en Index Engine

  1. Distributed Search Engine with Nanomsg and Bond
    Exploring Microsoft’s open source Bond framework by building a distributed search engine. I’m using bond for serialization/deserialization and nanomsg for communication.

The source for this C++14 project is located at:
The nanomsg library is a simple high-performance implementation of several “scalability protocols”. These scalability protocols are light-weight messaging protocols which can be used to solve a number of very common messaging patterns, such as request/reply, publish/subscribe, surveyor/respondent, and so forth. These protocols can run over a variety of transports such as TCP, UNIX sockets, and even WebSocket.

Bond is a cross-platform framework for working with schematized data. It supports cross-language de/serialization and powerful generic mechanisms for efficiently manipulating data. Bond is broadly used at Microsoft in high scale services.

In de volgende post legt Daniel uit hoe zijn aanpak is.

Naast bovenstaande distributed search project heb ik nog twee andere projecten gevonden

  1. An open source, feature rich search engine dataparksearch.

  2. Xapian is an Open Source Search Engine Library, released under the GPL v2+. It’s written in C++.

De hartelijke groet Jan Marco

Vergeet je ‘Zlib’ niet:

Korte inhoud van het voorafgaande - Foondump is 11 jaar geworden

Ondanks al het geld dat er in hun bedrijf gestoken werd kon De Telefoongids BV een telefoonabonnee niet garanderen dat zijn of haar vermelding in de telefoongids niet onmiddellijk weglekte als die ook in de elektronische gids gepubliceerd werd.

Vervolgens kon dan moeiteloos ook op nummer naar die vermeldingen gezocht worden, hetgeen de uitgevers zelf bij wet niet is toegestaan, althans niet zonder meer.

Door het spoor via de producent van de Telefoongids-cd-roms, C-Content, te volgen kon je later simpelweg ook zo de beveiliging van de elektronische uitgaven van Van Dale Lexicografie passeren.

Tot op de dag van vandaag zijn trefwoordenlijsten, detailgegevens en betekenissen eenvoudig uit de verschillende woordenboeken van Van Dale los te weken.

De gegevens bleken louter zeg-maar “gezipt” op de CD te staan, zoals dit bestand waar de postcode-coördinaten voor de CD-foongids-routekaart door producent C-Content in gezet zijn:

CD-foongids\Data\ahn\ahn.idx
=============================================================================
0000 0000  76 64 6C 6E 76 61 70 69  00 00 00 00 5C EF 12 00  vdlnvapi....\...
0000 0010  01 00 00 00 01 00 00 00  25 00 00 00 7F 1C 23 00  ........%.....#.
0000 0020  1A 5E 3B 00 00 30 2D 00  00 00 80 00 00 8B 2B 00  .^;..0-.......+.
0000 0030  00 00 80 00 00 00 08 78  DA 75 5D 59 B6 65 2B 88  .......x.u]Y.e+.
0000 0040  7C 43 B2 41 D4 F9 4F AC  80 88 F0 EE 93 55 F5 91  |C.A..O......U..
=============================================================================

Hier en in alle andere betrokken databestanden is de combinatie 78 DA - de ‘info-marker’ voor Zlib - gewoon zichtbaar gebleven, daar waar het normaliter gemaskeerd wordt om zomaar kunnen ‘ontzippen’ te voorkomen.

Een compressieprogramma zal altijd naarstig op zoek gaan naar alles wat vaker voorkomt om de grootte van bestanden zo goed mogelijk te kunnen reduceren en dat mechanisme is ook nog eens uiterst fijngeslepen vanwege de ‘performance’, de reden dat de werking van zo’n programma opeens ook heel geschikt blijkt voor de volgende onverwachte toepassing:

Onbevangen op zoek naar structuur

Rudi Cilibrasi werkt bij het Amsterdamse Centrum voor Wiskunde en Informatica, hij en onder anderen zijn collega Paul Vitanyi gebruiken een slimme truc om structuren te zoeken. Ze werken met bekende zip-programma’s. Een zip-programma, zoals bijvoorbeeld Winzip, zoekt naar structuur binnen een file en slaat ze dan kleiner op als een zip-file. Hoe meer structuur er in een file zit, hoe kleiner deze file uiteindelijk zal worden na het gebruiken van een zip-programma.

Cilibrasi laat een zip-programma eerst losse files kleiner maken. Die files kunnen mp3-bestanden van liedjes zijn, stukken tekst en alles wat je verder op je computer als een file op kan slaan. Daarna gebruikt hij hetzelfde zip-programma om combinaties van die files tegelijk te zippen. Als twee files nu veel op elkaar lijken, dan zal het zip-programma de combinatie van die twee erg klein op kunnen slaan. Dus aan de grootte van de zip-files kan je zien hoeveel de files op elkaar lijken.

www.kennislink.nl - Nieuws - dinsdag 8 februari 2005

De methode is gevoelig genoeg om bijvoorbeeld die paar minieme edits in jouw vorige posting te signaleren:

versie1 versie2 0,067437

versie2 versie3 0,035920

versie1 versie3 0,078255

versie3 versie3 0,000000

Die laatste vergelijking dus even als bewijs dat een en ander “geijkt” is.

Bij nagenoeg alle compressie-formaten schijnt dat per definitie niet mogelijk te zijn maar je zou wensen dat je in zips naar bepaalde tekst kon zoeken, dus zonder die eerst voor dat doel tijdelijk uit te pakken.

Bijvoorbeeld het Basisregistratie-bestand met alle adressen en gebouwen van Nederland dat pas nog ter sprake kwam bevat zoals het door het Kadaster geleverd wordt in dit geval voor de maand juni maar liefst 3894 bestanden, 47GB aan XML, gezipt in 10 verzamelbestanden, en die zelf ook weer gezipt tot een uiteindelijke levering van ca. 1,5GB.

De mogelijke reductie is zeker bij XML enorm maar als jij alleen maar op zoek bent naar de gegevens voor jouw eigen woonplaats dan moet je de hele bups eerst helemaal uitpakken en laten doorzoeken om je eigen deelverzameling te kunnen samenstellen.

Precies dat is wat de software van Geon achter de schermen voor je deed. Jammer genoeg is deze BAG Extract Conversie-software (BEC 4.2.0) van de website van dat bedrijf verdwenen.

Had je de laatste versie zuinig bewaard dan komt er na een hele tijd stampen een nieuw geproduceerd index-bestand tussen al die andere daartoe uitgepakte BAG-bestanden te staan, “inspireadressen.zip.idx”:

<?xml version="1.0" standalone="yes"?>
<DocumentElement>
  <INDEX>
    <GEMEENTECODE>0003</GEMEENTECODE>
    <BAGOBJECT>02</BAGOBJECT>
    <COUNT>20</COUNT>
    <BESTAND>D:\BAG\20160608\xml\9999LIG08062016-000001.xml</BESTAND>
  </INDEX>
  <INDEX>
    <GEMEENTECODE>0005</GEMEENTECODE>
    <BAGOBJECT>02</BAGOBJECT>
    <COUNT>22</COUNT>
    <BESTAND>D:\BAG\20160608\xml\9999LIG08062016-000001.xml</BESTAND>
  </INDEX>
  ...

Hoi Weerman,

Je vorige post moet ik nog bestuderen.

Kamp wil handelsregister deels beschikbaar maken als open data

Volledig open wordt het handelsregister niet. Na een onderzoek concludeert Kamp dat alleen geanonimiseerde gegevens uit het handelsregister vrij beschikbaar zullen worden gesteld. Die gegevens kunnen dan worden gebruikt om het volledige Nederlandse bedrijfsleven te analyseren.

Daarnaast wordt het voor ondernemers mogelijk om 25 keer per jaar gratis een uittreksel uit het register aan te vragen.

Zo moet het handelsregister opener worden, zonder dat de Kamer van Koophandel (KvK) te maken krijgt met een financiële klap. Volgens Kamp verdient de organisatie nu zo’n 50 miljoen euro per jaar aan “informatieproducten”, hoofdzakelijk de verkoop van informatie uit het handelsregister. De beleidswijziging zal ervoor zorgen dat de KvK naar schatting 5 miljoen euro minder per jaar zal verdienen.

Innovatie
Kamp zegt met de stap te voldoen aan het kabinetsbeleid dat oproept tot meer transparantie en de beschikbaarheid van open data. Maar critici vinden dat het handelsregister helemaal zou moeten worden opengesteld.

Voormalig GroenLinks-Kamerlid Arjan El Fassed, nu directeur van de Open State Foundation, riep vorig jaar in NRC Handelsblad op tot volledige openbaarmaking van het register.

“Het Handelsregister zou als basisregister authentiek en publiek toegankelijk gemaakt moeten worden”, schreef hij. “Juist het openstellen van de data opent de weg naar innovatie, versterkt de economie en verbetert de handel.”

Maandag zegt El Fassed dat het voorstel van Kamp “een eerste stap” is, maar dat meer moet worden gedaan om de financieringsvorm van het handelsregister aan te passen, zodat meer open data beschikbaar kan worden gemaakt.

De hartelijke groet Jan Marco

Jij dacht, eerst moet-ie dit zien, rode lap, stier, lachen? Ok, biefstuk:

Wel zout, geen peper, dat wordt bitter door de hitte, doe dat na het bakken.
Zuchtje olie, dichtschroeien, beetje temperen en dan pas boter in de pan.

Denk dat Kamp het handelsregister helemaal niet als open data beschikbaar wilde stellen maar er lag een motie van de Tweede Kamer:

Datum 4 juli 2016

Betreft Ontsluiting handelsregister als open data

Geachte Voorzitter,

Op 24 november jl. is de motie Verhoeven (Kamerstuk 32637 nr. 210) aangenomen. In de motie wordt de regering verzocht om 'met een onderzoek te komen om het Handelsregister (HR) te ontsluiten als open data’. Met deze brief informeer ik uw Kamer over de uitvoering van deze motie.

Uitvoering motie

De Kamer van Koophandel (KvK) heeft in december 2015 naar aanleiding van bovenvermelde motie een onderzoek gestart naar mogelijkheden om het HR te ontsluiten als open data (bijlage 1). In april jl. heb ik het Kenniscentrum Open Data van de TU Delft gevraagd om een ‘second opinion’ te geven (bijlage 2). Dit heeft geleid tot enkele aanpassingen in het rapport van de KvK. Beide rapporten zijn recent opgeleverd.

Rijksoverheid - Documenten - Kamerbrief - 04-07-2016

Tussen de regels door valt al te lezen dat de Kamer van Koophandel en Fabrieken daar ook niet zo’n zin in had en ook dat rapport uit Delft gaat van meh, meh:

Delft, 22 juni 2016

Ontsluiten handelsregister met open data nader belicht

Ten geleide

Deze rapportage bevat een reflectie op de conceptrapportage van de Kamer van Koophandel van 2 mei 2016. Een eerdere versie van onderhavige rapportage is op 31 mei besproken met het ministerie van EZ en een vertegenwoordiging van de Kamer van Koophandel.

Mede naar aanleiding daarvan heeft de Kamer van Koophandel de conceptrapportage aangepast om te komen tot een betere rapportage. Dit heeft tot gevolg dat onderhavige rapportage niet meer op alle punten correspondeert met het definitieve rapport van KvK.

Zo heeft KvK op 9 juni ons op de hoogte gebracht van een tweetal nieuwe varianten die zullen worden meegenomen in de rapportage (o.a. ter vervanging van de oude variant 1, waar deze rapportage op reageert).

Rijksoverheid - Documenten - Rapport - 22-06-2016

Bij die club van “voormalig GroenLinks-Kamerlid Arjan El Fassed” en trouwens ook Stef van Grieken die “voor Google.org, de filantropische tak van Google werkt” hebben ze gewobd of zo, daar valt te lezen dat het een heel lange bevalling was, al vanaf januari:

Kamer van Koophandel zelf gevraagd om open data onderzoek te doen

Uit interne mails van de Kamer van Koophandel blijkt dat de Kamer van Koophandel specifiek is gevraagd om zelf onderzoek te doen naar het beschikbaar stellen van het handelsregister als open data. Een rapport getiteld ‘Verkenning naar de mogelijkheden om Handelsregisterinformatie als open data ter beschikking te stellen’ ligt reeds twee maanden bij het Ministerie van Economische Zaken.

www.openstate.eu - News, Politiek en Bestuur - 03/05/2016

Maar je hebt gelijk, smullen. Zag al van alles voorbijkomen in die twee PDF’s, morgen of zo meer daar over?

Jan Marco, jouw schuld, na het eten nog twee rapporten doorwerken …

Ter oriëntatie begint de KvK eerst over de “rijkbijdrage” voor het beheer van het Handelsregister:

Kosten en opbrengsten

De kosten van het Handelsregister bedragen € 102 miljoen per jaar, bestaande uit kosten voor informatieverstrekking van € 24 miljoen en kosten voor registervoering van € 78 miljoen (Jaarrekening 2015). De opbrengsten bestaan uit € 50 miljoen voor informatieverstrekking en € 17 miljoen aan overige opbrengsten (waarvan € 12 miljoen voor inschrijfvergoedingen). De overige kosten worden gedekt door de rijkbijdrage.

Verdeling opbrengsten

De € 50 miljoen aan opbrengsten worden voor 54% gedekt door grote afnemers (waaronder banken, verzekeraars en advocatenkantoren) van Handelsregister informatieproducten. Deze relatief kleine groep gróte afnemers bestaat uit 104 afnemers met meer dan € 25.000,- aan vergoedingen voor handelsregister-informatie in 2015. Dit beperkte aantal grote bedrijven haalt nominaal het grootste voordeel als data gratis worden.

Gaat het dan wel lukken, de kool en de geit sparen:

Tegelijkertijd is in art. 28 Handelsregisterwet 2007 neergelegd dat het de KvK niet is toegestaan gegevens gerangschikt naar natuurlijke personen te verstrekken, behoudens aan enkele in de wet genoemde instanties.

Het wordt niet verenigbaar met de doelen van het Handelsregister geacht wanneer de gegevens beschikbaar worden gesteld in zodanige vorm dat bijvoorbeeld ten aanzien van bepaalde personen kan worden nagegaan bij hoeveel rechtspersonen zij zijn betrokken.

De KvK moet passende technische en organisatorische maatregelen treffen, die tegengaan dat afnemers dergelijke overzichten gerangschikt naar natuurlijke personen alsnog genereren.

De kans is klein:

Wanneer de gegevens uit het Handelsregister ook als open data worden aangeboden, zijn de gegevens zonder enige beperking beschikbaar in een vrij te doorzoeken (bulk-) bestand. De afnemer is onbekend en een verklaring om de gegevens te gebruiken voor een gerechtvaardigd doel ontbreekt daarmee.

Is dit zo’n partij en zou u een tweedehands auto van hem kopen:

Kredietcheck-startup Eccentrade wil met big data KvK en Graydon verslaan

De Amsterdamse startup Eccentrade wil met big data en kunstmatige intelligentie kredietchecks op een slimmere manier doen. Maar de ambitie van het bedrijf reikt verder: inzichtelijk maken hoe duurzaam een onderneming. “Wij geloven in kredietmanagement 2.0.”

Gaat hij dat woord ook in de mond nemen? Ja, “Big data”:

Big data en kunstmatige intelligentie

Eccentrade kan de kredietchecks goedkoop aanbieden, omdat het naar eigen zeggen gebruikmaakt van big data en kunstmatige intelligentie, twee toverbegrippen in de startup-scene. Welke gegevens Eccentrade precies analyseert, wil Witteveen niet zeggen. “Dan geef ik mijn concurrenten te veel informatie.” Hij blijft in algemene termen hangen: internationale handelsdata die openbaar verkrijgbaar zijn.

Zal dit o zo breekbare bouwsel het dan wel houden als het weer vloed wordt:

Bescherming tegen direct marketing: Benader-me-niet registratie

Bij de inwerkingtreding van de Wet bescherming persoonsgegevens in 2000 heeft de KvK een Non Mailing Indicator (NMI) geïntroduceerd. Hiermee kan een ondernemer in het Handelsregister aangeven dat zijn adresgegevens in het Handelsregister niet mogen worden gebruikt om hem post te sturen of aan huis te benaderen voor direct marketing doeleinden.

Weet ik nog, ook toen weer vragen in de kamer. Dat was alleen niet in 2000 maar april 2009:

De Kamer van Koophandel onderzoekt of nieuwe inschrijvers bij inschrijving direct de mogelijkheid kunnen krijgen om adresgegevens voor mailingdoeleinden te blokkeren.

En? Resulteerde onder druk van de goegemeente opeens toch in een “actieve uitvraag”:

Inmiddels heeft één op de drie ondernemingen en rechtspersonen in het Handelsregister een NMI geactiveerd. Als gevolg van de actieve uitvraag bij inschrijving, is het percentage vestigingen waarop een NMI is geactiveerd, vanaf 2009 sterk toegenomen. Inmiddels tot circa 80% per jaar. Hierdoor zal het percentage van 33% op het totaal aantal inschrijvingen (zie bijlage 2) sterk blijven stijgen.

Inschrijvingen met zo’n vinkje kunnen niet meer doorverkocht worden, vandaar dat jarenlange tegenstribbelen:

Bijlage 2: Aantal bedrijven dat aangeeft niet te willen dat hun gegevens door derden voor direct-mailing worden gebruikt (Non-Mailing Indicator)

Rechtsvorm     NMI = Nee   NMI = Ja       Totaal      %
=======================================================
01 Eenmanszaak   598.691    440.445    1.039.136    42%

Men maakt zich zorgen, niet over te derven inkomsten maar over het welbevinden van de bij hen ingeschreven ondernemers:

Afnemers, die van de KvK gegevens afnemen van ondernemingen en rechtspersonen met een geactiveerde NMI, moeten deze NMI respecteren. De KvK maakt hiertoe contractuele afspraken met deze afnemers. Maar in de praktijk werkt dit onvoldoende, omdat ondernemers toch ongevraagd worden benaderd.

Daar kan de KvK vaak niets aan doen, omdat de adresgegevens uit tal van andere (openbare) bronnen afkomstig kunnen zijn.

Daarbij maken de snelle ontwikkelingen op ICT-gebied het steeds eenvoudiger om die bronnen te doorzoeken (‘scrapen’). Vrijwel ieder (nieuw) bedrijf heeft tegenwoordig een website waarop de contactgegevens staan; via zoekmachines kunnen die (in bulk) worden achterhaald.

Komt weer “dit beperkte aantal grote bedrijven met nominaal het grootste voordeel” in beeld:

Door de gegevens uit het Handelsregister op te nemen in een vrij te doorzoeken open data bestand, zullen de klachten van ongewenste acquisitie naar alle waarschijnlijkheid verder toenemen. De KvK kent de gebruiker van de open data bestanden niet en er worden geen contractuele afspraken mee gemaakt.

De KvK kent ze niet, ik ken ze wel. Een op naam gestelde brief komt aan op het bij het HR opgegeven adres:

Een inschrijving die dus wel degelijk van een NMI-vlag voorzien was. Het TU Delft-rapport:

Andere vormen van inbreuk op privacy

De voorgestelde wijze van verstrekking van open data, maakt het in de praktijk wel mogelijk om bij een gegeven huisadres van een woning, alle bijbehorende bedrijven te vinden. Gegeven de Memorie van Toelichting van de Wet bescherming persoonsgegevens is dit een ongewenste inbreuk op het recht van gegevensbescherming.

Dit geldt met name voor eenmanszaken en personenvennootschappen waarbij het huisadres het vestigingsadres is. Echter, op dit moment is het wel mogelijk om de gratis openbare gegevens zodanig systematisch op te vragen (te scrapen) dat er eenvoudig een databank van deze gegevens kan worden aangelegd.24
______________________________________

24 Zie bijvoorbeeld de gegevens die beschikbaar zijn via openkvk.nl.

Door het “zodanig systematisch op te vragen” worden ook nog eens de inschrijvers die zich tot een bepaalde hoogte beschermd wisten - door het laten aanzetten van die fameuze “Non Mailing Indicator” - weer in de openbaarheid teruggeplaatst.

Europa-wijd ook nog eens, zonder dat hen toestemming gevraagd is en op voorspraak van lobby-organisaties als openstate.eu die een flink eind voor een eventueel te wijzigen wet uitlopen.

Hoi Weerman,

Jij dacht, eerst moet-ie dit zien, rode lap, stier, lachen?

Ik had geen tijd. Ben druk bezig met Splunk.
Ik vind wel moeizaam stroperig verhaal van KvK. In mijn beeld moeten ze handelsregister gewoon kosteloos beschikbaar stellen. Hun verdienmodel moet berusten op toegevoegde waarde die zij leveren aan ondernemers. Denk aan coaching, netwerkcontacten, etc.

Arjan El Fassed richtte in blog aan Rutte. Ook zag ik stuk op NRC (online).

De hartelijke groet Jan Marco

Het tegenrapport van TU Delft vindt de voorstellen voor open data die de Kamer van Koophandel zelf doet ook nog te mager, zij zeggen, probeer “open, tenzij”:

Conclusies

Wat zijn mogelijke andere varianten ten opzichte van de reeds geschetste die tegemoet kunnen komen aan de wens tot meer data aanbieden als open data, maar die minder voorwaarden of geringere implicaties kennen?

Allereerst constateren wij dat de geschetste varianten als voorzichtig moeten worden bestempeld. Geen van de varianten voldoet aan het uitgangspunt van de nationale open-data-agenda: alles open… Ten opzichte van de beschikbare open data in de onderzochte buitenlandse cases, wijken de varianten van de KvK af. Het blijft in de meest vergaande variant beperkt tot een beperkte uitbreiding van de gegevens die nu reeds gratis beschikbaar zijn via kvk.nl, persoonsgegevens uitgezonderd.

Het verdient aanbeveling om alternatieven te onderzoeken die meer recht doen aan het principe open, tenzij. Een alternatief kan zijn om te starten met alle gegevens uit het Handelsregister die geen persoonsgegevens zijn. Dit zijn bijvoorbeeld veel gegevens van grotere ondernemingen: dat wil zeggen niet de eenpersoonszaken, de personenvennootschappen, e.d. die goed zijn voor meer dan de helft van de geregistreerde ondernemingen. In een latere fase kunnen daar eventueel andere gegevens aan worden toegevoegd.

Een andere variant doet nog meer recht aan ‘open, tenzij‘. Via kvk.nl kunnen een aantal basisgegevens gratis worden geraadpleegd. Veel andere gegevens kunnen in bulk worden gekocht via toegang via een API of HR dataservices. Een vergaande open variant zou kunnen inhouden dat alle huidige gratis, openbare gegevens open data worden, en de huidige openbare gegevens (waarvoor nu nog wel betaald moet worden) gratis via kvk.nl beschikbaar worden gesteld met de vereiste technische en organisatorische privacywaarborgen.

Tenzij:

In hoeverre zijn de voorwaarden en aannames in het KvK-rapport over open data en handelsregister van KvK reëel?

De voorwaarden in het KvK-rapport op het gebied van gegevensbescherming zijn reëel. Daar waar persoonsgegevens worden verwerkt kan er in principe geen sprake zijn van open data.

Daarnaast dienen er, voor zover er sprake is van persoonsgegevens, zoveel mogelijk technische maatregelen te worden geïmplementeerd ter voorkoming van het systematisch bevragen van kvk.nl.

Vergeleken met de buurlanden:

Het KvK-rapport laat zien dat in het buitenland ook niet alle gegevens uit het handelsregister gratis zijn. Hoe wordt de infrastructuur van het handelsregister elders bekostigd, wat is de omzet van informatie-producten, welke publieke geldstromen zijn, in hoeverre zijn deze registers te vergelijken en wat zijn eventuele leerpunten of voorbeelden uit het buitenland?

Wat betreft de data die beschikbaar is, gaan de open data policy van Companies House, KBO en CVR verder dan de voorgestelde varianten van de KvK. Zo schaart de KvK veel documenten onder de bescherming van persoonsgegevens, namelijk alle documenten die gegevens over natuurlijke personen, eenmanszaken en personenvennootschappen bevatten. Het gaat dan ook over oprichtingsakten, statuten, jaarrekeningen, volmachten e.d.

Deze stukken zijn bij Companies House, KBO en CVR gratis via internet in te zien, inclusief de eventueel daarin opgenomen persoonsgegevens. Wat de juiste toepassing is van de privacy-wetgeving zou nader moeten worden onderzocht

Zover lopen we hier ook nog niet achter:

Wat zijn de positieve en negatieve effecten van de gang van zaken in het buitenland m.b.t. het aanbieden van gegevens uit het handelsregister als open data?

In al de bestudeerde buitenlandse casussen is open data van het handelsregister een nieuw fenomeen. In het Verenigd Koninkrijk is de website bijvoorbeeld voorzien van de aanduiding: ‘BETA This is a trial service — your feedback will help us to improve it’.