background preloader

30 Resources to Find the Data You Need

30 Resources to Find the Data You Need
Let's say you have this idea for a visualization or application, or you're just curious about some trend. But you have a problem. You can't find the data, and without the data, you can't even start. Universities Being a graduate student, I always look to the library for books and resources. Data and Story Library - An online library of datafiles and stories that illustrate the use of basic statistics methods, from Carnegie MellonBerkeley Data Lab - Part of the UC Berkeley library system. News Sources I'm sure you've seen a graphic in the paper or I guess more likely, on a news site, and wondered about another aspect of the data. Geographic Data Got some mapping software, but no geographic data? TIGER - From the US Census Bureau, detailed data about roads, railroads, rivers, and zipcodes. Sports America loves its sports, and thus, has decades of sports data. World Government and Politics General Sources Freebase - Free data and a community effort. Get it From an API Scrape the Data

Le database journalism pour nous sauver du « frogboiling » « Dat Ou pourquoi le database journalism s’oppose au journalisme traditionnel Pour ce quatrième post, il me semble plus que temps d’esquisser une définition de mon sujet d’étude : en une phrase, le database journalism, ou journalisme de données, consiste à exploiter des bases de données pour en extraire de l’information compréhensible par tous. Actuellement, les médias traditionnels traitent l’actualité par le récit (stories), ils racontent des histoires. A l’opposé, le database journalism initie un traitement de l’actualité par les données (data). Autrement dit : un dessin vaut mieux qu’un long discours. Pour ceux qui ne verraient pas d’emblée l’attrait des données par rapport aux récits, je vous renvoie au vibrant plaidoyer de Nicolas Vanbremeersch (aka Versac) sur (Pour un journalisme de données). L’homme fait une montée record, et, le lendemain, dans la presse, rien d’autre que du commentaire. Journalisme traditionnel et journalisme de données reposent sur deux modèles opposés.

The end of objectivity – web 2.0 version This week a new nail was driven into the coffin of the notion of journalistic objectivity. The culprit? The Washington Post’s leaked social media policy. The policy is aimed at preserving the appearance of objectivity rather than its actual existence. It focuses on what journalists are perceived to be, rather than what they actually do. And in doing so, it hits upon the very reason why their attempt is doomed from the start: “Our online data trails reflect on our professional reputations and those of The Washington Post. Our behaviour as journalists is now measurable. That pretence has been crumbling for years. Objectivity was always a phantom conjured by publishers to appeal to maximum audiences and advertisers [see comments fleshing out objectivity as method vs style]. “Objectivity is a construct of recent times. It was also born from 19th century beliefs in the scientific method and the search for abstract ‘truth’. Yes, journalists have opinions. Well, hold the front page. Like this:

Vos questions sur le journalisme de données - Atelier des medias Il y a quelques mois, le scandale des notes de frais des députés britanniques révélé par le Daily Telegraph a donné une visibilité particulière à ce que les spécialistes appellent le journalisme de données. Nous allons parler de ces nouvelles techniques journalistiques pour analyser des quantités importantes de données dans l'Atelier des médias cette semaine. Nous verrons également avec nos invités que l'accès aux données publiques reste un combat en France Invités: Vous pouvez adresser vos questions et faire part de vos réflexions dans les commentaires de ce billet. Pour en savoir plus:

367 US Hospitals Now Use Social Media A total of 367 hospitals in the US now use one or more social media tools to reach patients and other stakeholders, according to the most recent analysis from Ed Bennett, a hospital website manager who maintains a site devoted to social media use by hospitals. Bennett's periodically updated tally, which is available in spreadsheet format on his website, shows that this social media use by hospitals and medical centers around the country further breaks down to encompass 186 YouTube channels, 190 Facebook pages, 267 Twitter accounts and 35 blogs. Bennett also reported that the use of YouTube and Twitter has grown dramatically over the past several years, though it has tapered off somewhat in the past few months. Social Media Influences Patients Studies from Manhattan Research found that online search plays a large role in health-information seeking, and that three-fourths of US nurses recommend health-related websites to patients.

Database journalism Take Five Minutes to Watch 100 Years of Visual Effects - visual 7 études de cas en data journalism et visualisation de données « Beaucoup de veille en ce moment, et peu d’écrit. Voici quand même quelques études de cas à vous faire partager. Depuis un an que je piste les exemples de data journalism, je constate que les initiatives françaises sont bien rachitiques et que j’atterris le plus souvent sur des sites anglo-saxons. Avec le, le et le en pionniers du genre. Les études de cas ci-dessous illustrent assez bien l’état du journalisme de données français par rapport à ce qui se fait aux Etats-Unis, en Grande-Bretagne ou même en Espagne. Plusieurs facteurs se combinent pour expliquer ce décalage français : un rapport différent aux données, une histoire journalistique divergente, une culture de la transparence publique antagonique, un appareil législatif singulier et surtout des rédactions appauvries tant en moyens financiers qu’en compétences humaines. Le New York Times : leader américain en matière de data journalism. Un petit mot sur Gapminder. Like this:

Social Network Statistics | Brian Solis - PR 2.0 inShare0 Source: Shutterstock Social Networks are among the most powerful examples of socialized media. As these communities permeate and reshape our lifestyle and how we communicate with one another, we’re involuntarily forcing advertisers and marketers to rapidly evolve how they vie for our attention. Facebook, MySpace, Twitter, Yelp, and other online communities transformed the regimen and practice of marketing “at” people into an opportunity to engage and interact with us – on our terms. But, the people who define each network are reticent to the hollow attempts of faceless friending and in-network marketing. As marketers, it’s your responsibility to peel back the layers of each network to observe and eventually interact with the very people you wish to reach. While nothing beats anthropological fieldwork and observation, let’s take a look at numbers behind the top social networks to get a better picture of network engagement and user demographics. 30-day traffic, (U.S., Worldwide) Age

Data journalism : pourquoi les médias français ne s’y mettent pa Comment expliquer le peu d’empressement des rédactions françaises à s’emparer du journalisme de données ? Plusieurs facteurs se combinent, certains relèvent des rédactions, d’autres de leur environnement Côté rédactions : Des rédactions en manque de moyens financiers… Tout d’abord, côté rédactions traditionnelles, la plupart consacrent très peu de ressources à la R&D, et donc à du journalisme d’expérimentation, comme de la visualisation de données. Quelques exceptions néanmoins : l’ a recruté deux documentalistes pour réfléchir sur la structuration de données (plus d’info sur le blog d’Eric Mettout) ; France 24 mène un gros travail autour du Web sémantique au sein de son Lab (plus d’info sur le blog de Mikiane) … en manque de moyens humains Les rédactions ne sont pas seulement appauvries sur le plan financier, elles manquent aussi de ressources humaines. Actuellement, personne en France n’a réussi à réunir le bon mix de compétences. … en manque de culture web Côté environnement :

Work is not a place, it is something you do inShare0 Online, on virtual places like Yammer, Twitter or LinkedIn, people tend to tell their colleagues and others what they are doing, thinking, liking, reading...and not so often where they are, when they arrived there and when they left. Why? Most people today understand that being physically present at the office is not necessarily the same thing as working or being productive. It has not always been like that. If time spent at the office is a relevant measure or not depends upon the type of work you do. Sooner or later, virtual work will be the norm and a practice that will catch on everywhere. Choosing how long to work and on what schedule has long showed productivity benefits. It is pretty clear that we have to get away from concepts such as face time and office hours. “Don’t tell people how to do things, tell them what to do and let them surprise you with their results” - General George Patton

Nos vies gérées par les données » Article » OWNI, Digital Journa De plus en plus de gens "mesurent leurs vies" et accumulent des données sur leur activités quotidiennes pour la mesurer et donc mieux la maîtriser. Cette vie gouvernée par les données n'est pourtant pas sans poser problème. Nous prenons des décisions avec des informations partielles. Souvent, nous ne savons pas répondre aux questions les plus simples : où étais-je la semaine dernière ? Pour répondre à cela, certains documentent leurs existences pour obtenir des informations précises et concrètes sur leur quotidien, comme c’est le cas de Robin Barooah, un concepteur de logiciel de 38 ans, qui vit à Oakland, Californie. Si vous voulez remplacer les aléas de l’intuition par quelque chose de plus fiable, vous devez d’abord recueillir des données. Ben Lipkowitz documente également sa vie via son agenda électronique. Les journées de Ben Lipkowitz Je me mesure, donc je suis “Ces gens semblent avoir un comportement anormal. Pendant longtemps, le domaine de l’activité humaine a semblé à l’abri.

Digital keys open door to 21st century marketing | Special Repor Who is equipped for 21st century marketing well enough to control how their brand is represented online? Marketing Week and Google held a roundtable discussion with leading marketing experts to uncover how ready the industry is for a digital future. MW: Should digital marketing be treated as a separate subtopic of marketing or is the future about marketing in a digital world? Marc Sands: We’ve thought about this a lot at The Guardian and have been through every model imaginable. MW: Do businesses have to change their structures and the way their companies operate to accommodate digital marketing? The ability to cut across organisational structures and processes in new ways will be an even bigger task for companies over the next decade. MW: Is there a need for better understanding about digital marketing from marketers? I honestly don’t think that marketers have not understood the potential of digital marketing. MW: How can digital marketing be used to successfully engage with customers?

Study: Americans don't want targeted advertising | Blog | E Behavioral targeting has been batted around by privacy advocates and regulators over the last year, but a new study from professors at the University of Pennsylvania and the University of California, Berkeley has found that consumers not only want nothing to do with BT, they aren't interested in its side effect: better targeted ads. The study, which surveyed 1000 Internet users on the phone, reiterated two major points made by privacy advocates — that consumers do not like being tracked online and they are confused about online privacy. Industry groups have argued that BT is the process necessary to serve consumers better and more targeted advertising. But this study found that consumers aren't interested in sacrificing privacy for advertising. For starters, 66% of respondents said they are not interested in tailored ads at all. The survey also demonstrated that American web users are confused about online privacy.

Google Wave 1.0 = RSS, the Sequel. In Other Words, DoA... for No