Java grafieken voor Opendata

Joh. Kijken wij niet allemaal met vertedering terug:

Google - Onze geschiedenis tot in detail

April 1999 - Yoshka, onze eerste ‘bedrijfshond’, komt naar het werk met onze Senior Vice President of Operations, Urs Hölzle.

En een Leonberger ook nog! Geen idee wat dat is. Je gelooft het niet, Google’s Code of Conduct:

Dog Policy

Google’s affection for our canine friends is an integral facet of our corporate culture. We like cats, but we’re a dog company, so as a general rule we feel cats visiting our offices would be fairly stressed out.

Allemaal wel leuk en aardig maar nu dit. Afkomstig van een gesubsidieerd onderzoeksproject, iTrust.:

Trustworthy Distributed Search and Retrieval over the Internet

Our modern world relies heavily on the ability to publish, search for, and retrieve information over the Internet, which has created a highly distributed information society, distributed in both the sources of information and the uses of information. For reasons of efficiency and scalability, conventional search and retrieval over the Internet employs centralized search engines.

Unfortunately, centralized Internet search engines can be tampered with easily by their administrators to bias the results, concealing or censoring information. The experience of history, and even of today, indicates that we cannot rely on centralized Internet search to remain unbiased forever.

Perhaps, the moment at which we are most dependent on our ability to communicate over the Internet is also the moment at which centralized Internet search is most likely to be compromised. It is important to ensure that a trustworthy distributed search and retrieval system for the Internet is available when it is needed, even though a user normally uses a conventional centralized search engine.

We’re a dog company: communication over the Internet compromised … Onzin? Ha:

Beperking telefoonverkeer op de spitsuren.

Speciaal het geautomatiseerde locale en interlocale telefoonverkeer is op de spitsuren (8.30-12 en 14-17) zoo toegenomen, dat vlotte afwikkeling van “kriegswichtige” gesprekken ernstig wordt belemmerd.

Van Duitsche zijde zal men niet schromen een groot aantal abonné’s van het telefoonverkeer uit te sluiten, indien door medewerkirg van de aangeslotenen zelf de verkeersbelemmering niet verdwijnt.

Derhalve wordt den aangeslotenen in hun eigen belang en dat van den telefoondienst met klem aanbevolen zoo weinig mogelijk automatisch te telefoneeren gedurende de spitsuren en in het algemeen zich te onthouden van het voeren van gesprekken, welke niet dringend noodig zijn.

Nee? De beuk erin:

Telefoonverkeer tijdens de Tweede Wereldoorlog

In maart 1943 besloten de Duitsers dat uitsluitend abonnees een telefoonaansluiting mochten behouden wanneer het toestel “kriegswichtig” was.

Van eind oktober/begin november 1944 tot aan de bevrijding tot aan de bevrijding blokkeerden de Duitsers in het nog bezette noordelijk deel van Nederland de PTT-dienstverbindingen en stelden de sterkstroomvoeding naar vrijwel alle telefooncentrales buiten werking. Slechts de centrales die zij zelf nodig hadden voor hun oorlogsvoering bleven in gebruik. Dat betekende dat er alleen nog maar kon worden gebeld door middel van inductorverbindingen.

Jan Marco, nog even geen idee hoe ik met een “inductor” weer internet kan krijgen maar jij twijfelt ook nog?

[quote=“alkema_jm, post:70, topic:354”]
Misschien handig om de Cdfoon gegevens in een ‘data mining’ applicatie te zetten?[/quote]

Over het dagelijks leven toen:

Handelsvertegenwoordiger, 49 jaar - Amsterdam - 26 October 1944

Ik ben nog even naar kantoor geweest voor niets. Mr Wildervank wilde het zeker
goed maken, want ik kreeg zoowaar 4 rollen closetpapier. We zaten al 2 maanden
zonder. En het telefoonboek wordt steeds dunner.

Dagboekfragmenten 1940-1945

Aan het andere eind der tijden, Teletekst vandaag:

    Eigenaar Ziggo aast op Vodafone
    
    Liberty Global,het moederbedrijf van 
    de kabelmaatschappij Ziggo,onderhandelt
    met het Britse telecombedrijf Vodafone 
    over een fusie.Vodafone bevestigt dat  
    er gesprekken gaande zijn. 
    
    Zo'n fusie zou grote gevolgen hebben   
    voor de Nederlandse telecommarkt.Ziggo 
    heeft na de fusie met UPC 4,5 miljoen  
    klanten.Vodafone heeft vijf miljoen
    klanten.   
    
    Liberty Global en Vodafone zijn twee   
    internationale telecomgiganten met een 
    waarde van 200 miljard dollar.Met Ziggo
    heeft Liberty in Nederland nog geen
    eigen mobiel netwerk.Het bedrijf huurt 
    capaciteit op het netwerk van Vodafone.

Waar het mij om gaat, het heet wel “Liberty Global” maar stel dat ik iets onaardigs zeg over dat paard van Malone, ik bedoel het paard van de vrouw van John Malone, de eigenaar, ik bedoel van UPC en Ziggo, kom ik er daarna dan nog in, ik bedoel bij UPC dan wel Ziggo?

Aanleiding genoeg om de goede raad van de hierboven al aangehaalde onderzoekers maar op te volgen?

Keywords: trustworthy distributed Internet search retrieval

The iTrust system is a novel distributed search and retrieval system that provides access to information over the Internet. The iTrust system involves distribution of metadata and requests, matching of requests and metadata, and retrieval of information corresponding to metadata. iTrust has no centralized mechanisms that can be tampered with easily by a small group of administrators. iTrust is inevitably more costly in bandwidth, processing and storage than a centralized search engine. Individuals who are concerned about a risk of censorship ought to find that cost acceptable.

The iTrust system is deployed on a set of participating nodes in the Internet (also referred to as the membership). iTrust distributes both metadata that describes information, and requests for information, to a random subset of the participating nodes in the Internet. Because the metadata and the requests are distributed to nodes that are chosen at random from among all of the participating nodes, no one node or small group of nodes can suppress or censor information.

Na Napster, Gnutella, Kazaa en dergelijke ontstond een “Varkenscyclus”. Het lijkt wel of iedereen zich toen op het P2P-onderzoek gestort heeft. Zie bijv. deze literatuurlijst van destijds met een kleine 400 verwijzingen naar vijf jaar onderzoek daarvoor:

The pace of research on peer-to-peer (P2P) networking in the last five years warrants a critical survey. P2P has the makings of a disruptive technology – it can aggregate enormous storage and processing resources while minimizing entry and scaling costs.

Dit is dan wat er over je heen komt:

P2P search methods are first couched within an overall P2P taxonomy. P2P indexes for simple key lookup are assessed, including those based on Plaxton trees, rings, tori, butterflies, de Bruijn graphs, and skip graphs. Similarly, P2P indexes for keyword lookup, information retrieval and data management are explored. Finally, early efforts to optimize range, multi-attribute, join, and aggregation queries over P2P indexes are reviewed.

Wat ik daar in ieder geval van meeneem, in al dat fileshare-gedoe moet ook duchtig gezocht kunnen worden; realiseerde ik me niet direct, geldt niet alleen voor P2P-document-zoekmachines.

Zeg maar 10 jaar later de wetenschappers achter iTrust nog eens over waar dit alles goed voor is:

The Broader Impacts

The most significant broader impact of iTrust is societal. The free flow of information is the primary determinant of a free and democratic society. The free flow of information discourages small groups of people from trying to abuse the government, the economy or the environment for their own personal gain. Many research projects provide benefits to individuals, but it is rare for a research project to provide benefits to society as a whole.

More specifically, the benefits of iTrust include the ability to create mobile ad-hoc networks using Wi-Fi Direct, which can be of substantial benefit in less developed countries of the world. Distributed membership algorithms have benefits for many modern networked computer systems. The ability to detect malicious attacks indirectly by statistical inference has substantial benefits for many distributed systems.

In de classificatie die jij voorstelt, “Linkerkant” of “Rechterkant” - vanwege die illustratie bij YaCY neem ik aan - komt iTrust ook rechts te staan al zou je dat niet direct zeggen als je ziet welke software gebruikt wordt:

Web Server Foundation

The basis of the current implementation of iTrust is the Apache Web server compiled with several PHP standard modules and library extensions. The Web server foundation component contains no custom code; all software is used as is, which enables rapid node deployment. iTrust utilizes various standard modules, including the session and logging modules described below.

iTrust also utilizes compiled-in modules, including cURL, SQLite, and the PHP Extension Community Library (PECL) for HTTP, as described below.

Java jar files are used to generate metadata quickly and easily, and to provide the user with many conveniences. Apache’s Tika and Lucene packages are used to generate metadata from resources automatically and efficiently, in the case where the user chooses not to generate metadata manually. The WordNet dictionary is used to provide the user with functions, such as spell checking and synonym suggestions.


[quote="alkema_jm, post:70, topic:354"]Namelijk via de voordeur. Je zorgt ervoor dat je een programmatje maakt waar iedereen hun documenten in kunnen opslaan. Hierop stevig kan aangeven of het privé of dat je vrienden het ook mogen hebben. Je kan ook naar je vrienden gaan om te kijken wat voor mooie documenten ze voor jou hebben bewaard.[/quote]

Wat ik al zei, gesubsidieerd door de Amerikaanse overheid, ze kwamen niet weg met slappe praatjes. So there-you-have-it:

Manuals

Code

JM, laat maar weten als je zover bent, als ik met mijn telefoon bij wijze van test maar eens een verbinding moet proberen te maken.