background preloader

All of our data journalism in one spreadsheet

All of our data journalism in one spreadsheet

Comment les journalistes obtiennent-ils leurs informations? Le journal en ligne Mediapart a joué un rôle central dans l’éclatement de l’affaire Cahuzac, qui a pris une nouvelle ampleur mardi 2 avril après que l’ancien ministre du Budget a reconnu avoir possédé un compte bancaire à l’étranger «depuis une vingtaine d’années». Un rôle que le Premier ministre Jean-Marc Ayrault a lui-même salué. Comment les journalistes obtiennent-ils des informations[1]? Le but de tout journaliste d’investigation au sens large, qu’il s’agisse d’enquêter sur un scandale politico-financier ou sur la vie privée d’une star, est d’obtenir des informations que les personnes concernées veulent garder secrètes. publicité Les sources L’outil de travail le plus important du journaliste à la recherche d’informations est donc ses sources. Accès à l’information Dans le domaine juridique, les journalistes peuvent y demander et obtenir la déclassification d’un document, chose impossible pour un journaliste en France, où même les juges sont souvent déboutés pour de telles demandes.

The Necessity of Data Journalism in the New Digital Community This is the second post in a series from Nicholas White, the co-founder and CEO of The Daily Dot. It used to be, to be a good reporter, all you had to do was get drunk with the right people. Sure, it helped if you could string a few words together, but what was really important was that when news broke, you could get the right person on the phone and get the skinny. Or when something scandalous was going down somewhere, someone would pick up the phone and call you. Increasingly today, in selecting and training reporters, the industry seems to focus on the stringing-words-together part. That’s not how we’re building our newsroom at The Daily Dot. One: Our very first newsroom hire, after our executive editor, was Grant Robertson, who’s not only a reporter and an editor, but also a programmer. We found it necessary to push early in this direction because of our unique coverage area and we’re in the fortunate position of being able to build our newsroom from scratch. How do we report on that?

Float Le datajournalisme: vecteur de sens et de profits Face à l'avalanche d'informations, les techniques de datamining permettent d'extraire du sens de bases de données. La confiance devient la ressource rare, créatrice de valeur. Et les médias peuvent s'en emparer. Ce post reprend les éléments d’une réflexion amorcée avec Mirko Lorenz et Geoff McGhee dans un article intitulé Media Companies Must Become Trusted Data Hubs [en] et présentée à la conférence re:publica XI. Chaque jour, nous produisons deux ou trois exaoctets [en] de données, soit 1 million de téraoctets. Dans le même temps, Facebook et ses 600 millions d’utilisateurs produisent à eux seuls 70 téraoctets, soit à peine 0.007% du total. Si l’on veut synthétiser toute l’information produite en quelque chose de digeste pour l’utilisateur final, il faut résumer par un facteur de 100 milliards. Pour faire sens de cette hyper-abondance de contenus, les professionnels de l’information doivent adopter de nouvelles techniques. Toute information est une donnée Médias liquides

Il était une fois les journalistes sur Twitter… W.I.P. demande à des invités de donner leur point de vue. Ici, Aurélien Viers, rédacteur en chef au NouvelObs.com, explique pourquoi il a envoyé, à ses équipes, un email sur l’utilisation journalistique de Twitter. Twitter et les journalistes? Une belle histoire. En mode passif, le réseau social sert d’outil de veille, d’alertes, et comme agrégateur de flux d’informations. En mode actif, ce couteau suisse peut aussi être utilisé comme moyen de diffusion par le reporter, qui délivre des infos, souvent depuis son smartphone, par tranche de 140 caractères. Enfin, le réseau permet de rechercher des contacts (interlocuteurs, spécialistes, etc.), d’entrer en relation avec eux – comme avec le reste du monde – et d’établir un dialogue en direct entre le journaliste et le public. En bref, Twitter = veille + information + communication + discussion. Comme ils le veulent? On peut être journaliste Web et ne pas s’empêcher de plaisanter de temps en temps.

Scraping for Journalism: A Guide for Collecting Data Photo by Dan Nguyen/ProPublica Our Dollars for Docs news application lets readers search pharmaceutical company payments to doctors. We’ve written a series of how-to guides explaining how we collected the data. Most of the techniques are within the ability of the moderately experienced programmer. The most difficult-to-scrape site was actually a previous Adobe Flash incarnation of Eli Lilly’s disclosure site. Lilly has since released their data in PDF format. These recipes may be most helpful to journalists who are trying to learn programming and already know the basics. If you are a complete novice and have no short-term plan to learn how to code, it may still be worth your time to find out about what it takes to gather data by scraping web sites -- so you know what you’re asking for if you end up hiring someone to do the technical work for you. The tools With the exception of Adobe Acrobat Pro, all of the tools we discuss in these guides are free and open-source. A Guide to the Guides

The iPad business model for news: Strategies publishers must embrace There’s been a lot of hand-wringing in the journosphere about what newspapers ought to be doing vis-a-vis the iPad. If publishers adopt their usual defensive stance and take a slow approach, they’ll miss the iPad boat. Or the iPad rocketship, as the case may be. Kenneth Li of the Financial Times reports that “Newspaper and magazine publishers are stumbling over key issues such as sharing subscription revenues as they consider deals to offer digital versions of their products on Apple’s upcoming iPad digital media device.” In addition to the revenue share, publishers are kvetching about control of information. But Richard Tofel of ProPublica, blogging at The Daily Beast last week, opined that “the iPad could kill newspapers” because (italics added): …online advertising revenue, on a per reader or per impression or any other relevant basis, lags so far behind print revenue that it seems destined to never catch up — never to come even close. Nonetheless, I’ll hazard a prediction.

DATA: Without adding context, a journalist with data can be dangerous If you believe the predictions, 2011 will be the year when journalists have more access to data than ever before. Of course, much of the data will also be accessible to the public in general but I suspect more people will be exposed to data via journalism than will actively seek it themselves. And with that comes a responsibility to make sure that journalists present the full picture with a set of data. In other words, add some context. Paul Bradshaw touched on this when looking at a story in November which ‘revealed’ that Birmingham had more CCTV cameras than any other council area. So the challenge for 2011 isn’t just making use of all the data that’s available, it’s making use of it responsibly, linking data together to come up with a true picture. If journalists don’t do this, then there will be people who do it for them, post publication. Northern Ireland Water has spent £1.1bn on improvements in five years, said Sky News ... But it’s also like comparing apples and pears. Like this:

The Faux-Vintage Photo: Full Essay (Parts I, II and III) I am working on a dissertation about self-documentation and social media and have decided to take on theorizing the rise of faux-vintage photography (e.g., Hipstamatic, Instagram). From May 10-12, 2011, I posted a three part essay. This post combines all three together. Part I: Instagram and HipstamaticPart II: Grasping for AuthenticityPart III: Nostalgia for the Present a recent snowstorm in DC: taken with Instagram and reblogged by NPR on Tumblr Part I: Instagram and Hipstamatic This past winter, during an especially large snowfall, my Facebook and Twitter streams became inundated with grainy photos that shared a similarity beyond depicting massive amounts of snow: many of them appeared to have been taken on cheap Polaroid or perhaps a film cameras 60 years prior. In this essay, I hope to show how faux-vintage photography, while seemingly banal, helps illustrate larger trends about social media in general. What do these apps do? Why Faux-Vintage Now? Is Picture-Quality the Reason?

A special report on managing information: Data, data everywhere WHEN the Sloan Digital Sky Survey started work in 2000, its telescope in New Mexico collected more data in its first few weeks than had been amassed in the entire history of astronomy. Now, a decade later, its archive contains a whopping 140 terabytes of information. A successor, the Large Synoptic Survey Telescope, due to come on stream in Chile in 2016, will acquire that quantity of data every five days. Such astronomical amounts of information can be found closer to Earth too. Wal-Mart, a retail giant, handles more than 1m customer transactions every hour, feeding databases estimated at more than 2.5 petabytes—the equivalent of 167 times the books in America's Library of Congress (see article for an explanation of how data are quantified). All these examples tell the same story: that the world contains an unimaginably vast amount of digital information which is getting ever vaster ever more rapidly. But they are also creating a host of new problems. More of everything Dross into gold

Pourquoi Slate.fr n'a pas de charte pour Twitter et les réseaux sociaux LE DÉBAT (MICROCOSMIQUE) du moment qui agite les rédactions (papier) serait donc de siffler la fin de la récré pour les rédactions sur Twitter (1). Admettons que le proviseur de la presse existe (coucou) et qu’il distribue les bons et les mauvais points. En tant que délégué de ma classe, je vais donc donner mon point de vue, en espérant qu’il intéressera tout autant les lecteurs que le proviseur. Donner des règles figées et écrites n'a pas grand sens pour Slate.fr. publicité Explorer les possibles Nous sommes probablement l’une des rédactions les plus actives en France sur Twitter. Nous réfléchissons parfois aussi à traiter des sujets uniquement via Twitter: est-ce qu’un sujet mérite qu’on en parle, et si oui, comment? Se donner des limites alors que l’on débute tout juste —Slate.fr a deux ans et demi, la moitié de l’âge de Twitter— ne permet pas d'exploiter ce que les réseaux sociaux offrent déjà comme possibilités, et d'explorer ce qu'ils vont offrir dans les mois à venir.

Tim Berners-Lee: “Les gouvernements devraient encourager l’ouverture des données” » De l'ouverture des données publiques à l'avenir du réseau en passant par HTML 5, retour sur ce que devient le web avec l'un de ses principaux inventeurs. A l’occasion d’une conférence annuelle du W3C qui s’est tenue le 2 novembre dernier à Lyon, la rédaction du MagIT a rencontré Tim Berners-Lee, le père du Web et un des patrons du consortium. Au programme, le Web sémantique, l’ouverture des données, HTML 5 et la fondation W3. Tim Berners-Lee livre aussi sa réponse à l’article de Wired (“Le Web est mort. Vive Internet”). Le Web sémantique évolue-t-il au rythme que vous espériez ? Tim Berners-Lee : Je n’avais pas de prévisions à proprement dit. L’approche sémantique émerge également sur le desktop, comme Nepomuk (un projet de desktop sémantique qui fait une première apparition dans Mandriva 2010), peut être plus rapidement sur le Web. Quel est aujourd’hui le niveau de maturité des outils en place ? Toutefois, je pense qu’il existe encore un marché pour des outils plus puissants.

Related: