Géolocalisation et information géographique

Je l’avais promis il y a quelques temps dans un précédent billet, je vais évoquer la géolocalisation sur Wikipédia. Dans un premier temps, il m’apparait important de différencier deux choses : d’une part l’information géographique et d’autre part la géolocalisation.

Information géographique

L’information géographique c’est donner aux lecteurs des informations d’ordre géographique à propos du sujet d’un article. Typiquement pour une ville (ou une montagne, un lac, une église, etc.), l’information géographique va être de dire dans quel pays se trouve cette ville et de lister les subdivisions administratives (région, département, canton, district, etc. ). Toujours dans le cadre de cette transmission d’information géographique on peut aussi donner la latitude et la longitude du lieu en question. Ainsi l’information géographique relative au mont Gerbier de Jonc est qu’il se trouve en France, dans la région Rhône-Alpes, dans le département de l’Ardèche à la latitude de 44° 50′ 40 » nord et la longitude de 4° 13′ 12 » est. Évidement, la latitude et la longitude sont assez peu parlantes en texte brut, mais il s’agit tout de même d’une information géographique. Cette information brute peut être utile aux lecteurs mais aussi pour des extractions de données.

Information géographique relative au mont Gerbiec de Jonc
Information géographique relative au mont Gerbiec de Jonc

L’utilité du couple latitude-longitude est bien-sûr plus grande si cette information géographique est dynamique. Ainsi sur Wikipédia, cette information apparait toujours de façon dynamique. Le lecteur a toujours accès à la lecture de la latitude et de la longitude, mais s’il clique sur ces chiffres il peut faire apparaitre un point sur une carte aux coordonnées spécifiées. Ainsi, par un coup d’œil il contextualise rapidement ce point dans un environnement. D’ailleurs, je ne crois pas me souvenir que sur Wikipédia nous n’ayons jamais  donné la latitude et la longitude qu’en mode brut.

Ce point sur une carte, simple et efficace.
Ce point sur une carte, simple et efficace.

Géolocalisation

On vient naturellement de glisser de la simple information géographique à la géolocalisation. Par la présence de ce dynamisme on vient de positionner le sujet de notre article dans l’espace (ou plutôt le plan, parce qu’on ne gère pas – encore – l’altitude). Comme on vient de le montrer la principale force de la géolocalisation c’est de pouvoir offrir rapidement au lecteur cette position sur une carte.

Néanmoins, ce n’est pas le seul autre point intéressant qu’offre la géolocalisation. Positionner un objet sur une carte, c’est aussi pouvoir positionner cet objet et tous ces semblables sur une même carte. Ainsi, il m’est possible de visualiser sur une carte le mont Gerbier de Jonc en compagnie d’autres sommets du Massif-Central.

Carte dynamique avec les articles de Wikipédia sur des sommets du Massif-Central.
Carte dynamique avec les articles de Wikipédia sur des sommets du Massif-Central.

Ici la géolocalisation de l’ensemble de ces articles permet de les positionner les uns par rapport aux autres. D’en découvrir un proche d’un autre que nous connaissions et ainsi d’aller en lire l’article. Je suis désolé d’avoir utilisé Google Maps pour cette illustration mais j’ai renoncé à Open Street Map après 5 tentatives infructueuses pour charger ma carte. De toutes façons, visuelement je préfère le rendu de GMaps à celui d’OSM. ;-p

Pour aller plus encore dans l’utilité de la géolocalisation, il y a aussi maintenant des applications fonctionnant sur des supers tels smartphone ou tablette qui utilisent votre positionnement géographique pour vous inviter à lire des articles dans votre environnement proche. Ainsi, vous vous promenez dans une ville riche en histoire. Vous vous approchez d’un monument historique votre smartphone peut vous proposer la lecture ou même la synthèse vocale du contenu de l’article relatif au monument se trouvant devant vous. Le partage de la connaissance – un des buts premiers de Wikipédia – est assez palpable ici.

Information géographique et géolocalisation, pas toujours synonymes

De fait, la géolocalisation découle assez naturellement de l’information géographique donnée dans un article. Mais cette dernière n’induit pas toujours une géolocalisation. Exemples …

Le cas des articles concernant des sujets linéaires (cours d’eau, fortifications d’une cité, autoroutes, etc) ne sont pour l’instant pas correctement géolocalisables. Comme on l’a vu précédemment la géolocalisation c’est affecter à l’article un point, c’est-à-dire un infiniment petit. Dans le cas d’un cours d’eau quel point choisir pour géolocaliser l’article ? Il est évident qu’il n’existe aucune réponse. Je vais rester sur ma thématique mont Gerbier de Jonc et prendre exemple sur la Loire. L’article actuel donne deux informations géographiques dynamiques : la source et l’embouchure.

Informations géographiques relatives à la Loire.
Informations géographiques relatives à la Loire.

Il existe quelques variantes pour les cours d’eau à plusieurs sources, sans embouchures etc. On se base sur les points importants du cours d’eau.

Pour la Loire seuls deux positionnements sont possibles
Pour la Loire seuls deux positionnements sont possibles

Sur cette carte dynamique on voit bien le manque d’information entre la source et l’embouchure. En conséquence, l’infobox relative aux cours d’eau n’offre que ces informations géographiques sans faire de géolocalisation. L’article sur la Loire n’est pas géolocalisé, au sens que si vous extrayez les données de Wikipédia par positionnement des articles vous n’aurez pas la Loire. Les infobox sur les cours d’eau sont dénuées du fameux modèle {{coord}} de géolocalisation.

Voilà un exemple bien concret de la différence entre information géographique et géolocalisation. Cet exemple hydrologique est bien entendu extensible aux murs de fortifications (Mur d’Hadrien), aux canaux (Canal du Midi), etc.

Ici on touche à une limitation technique du logiciel sur lequel tourne Wikipédia (MediaWiki). En effet, le jour où MediaWiki acceptera les fichiers de type KML, il sera tout-à-fait possible de géolocaliser l’article relatif au boulevard périphérique de Paris sur l’ensemble de son parcours ou même l’article relatif à Paris sur l’ensemble du territoire occupé par la commune.

Conclusion

Aujourd’hui la géolocalisation c’est offrir une information supplémentaire aux lecteurs et donner à cette information une certaine interactivité. Une interactivité que les encyclopédiques classiques, celles sur papier, ne pouvaient même pas imaginer. C’est aussi là que Wikipédia se différencie de l’idée générale qui est (était ?) associée à encyclopédie.

Actuellement, les besoins des contributeurs sont aux limites de ce que le logiciel MediaWiki permet de faire. Je suis d’un naturel optimiste, je me dis que bientôt on pourra encore aller plus loin.

Liberté de panorama transfrontalière

La liberté de panorama est une exception au droit d’auteur permettant au photographe de publier de la manière qu’il le souhaite une photographie (reproduction en deux dimensions) d’une œuvre architecturale à partir du moment où celle-ci se trouve dans l’espace public. Cette liberté existe en Suisse, mais pas en France.

Sur les projets Wikipédia, le droit affecté à la reproduction d’une œuvre est celui du pays dans lequel se trouve l’œuvre. On affecte donc le droit français à toutes reproductions photographiques de le Tour Eiffel, le droit suisse pour le jet d’eau de Genève, etc. Quel que soit les pays de publication.

Dimanche dernier je me promenais dans le Jura, à la frontière des deux pays cités plus haut. La Cure est un petit village situé sur cette frontière. Ce village, assez banal au demeurant, a donc la particularité d’être traversé par la frontière.

Plaque indiquant la frontière.
Plaque indiquant la frontière.

Dimanche, je me suis arrêté pour faire des photos sur la thématique liberté de panorama. Dans ce village j’ai trouvé un maison traversée elle-même par la frontière.

La maison en question, la buvette à gauche est en France. Le reste est en Suisse.
La maison en question, la buvette à gauche est en France. Le reste est en Suisse.

Que dois-je faire pour publier cette photo ? Appliquer le droit français ? Appliquer le droit suisse ? Appliquer le droit du pays depuis lequel j’ai pris la photo ?J’ai fini par couper la poire en deux, en fait. J’ai appliqué le droit national pour chaque partie du bâtiment en question.

Voilà une version de ma photo respectant correctement le droit d'auteur.
Voilà une version de ma photo respectant correctement le droit d'auteur.

Démonstration ridicule, certes, mais bon j’avais envie de la faire.

Traduction d’articles et sources

Je suis à finir la lecture des Mémoires de guerre de Winston Churchill. J’en lis une traduction française assez récente et annotée. Elle apporte une légère critique et des éclaircies sur certains propos de Churchill. La lecture est passionnante. J’en étais à lire une partie dans laquelle l’auteur évoque un voyage aux États-Unis fin 1942 à bord d’un navire de la Royal-Navy. Comme souvent, j’ai ce réflexe d’aller sur Wikipédia pour en apprendre plus sur un sujet évoqué dans ma lecture. Ici, je souhaitais en apprendre plus sur le navire en question, le HMS Duke of York. Je ne l’ai pas trouvé sur la version francophone de Wikipédia. En revanche, il existait sur l’encyclopédie anglophone ainsi que dans 11 autres versions linguistiques.

Me voilà donc parti pour faire coup double ; m’instruire en lisant cet article en anglais et partager cette connaissance en le rédigeant en Français. Cette traduction d’article d’une Wikipédia à une autre m’a rappelé une vieille discussion que j’avais eu sur Wikipédia au sujet des sources dans le cas des traductions trans-wikipédia. J’ai toujours eu l’envie d’en reparler, l’occasion est aujourd’hui présente. J’ai aussi retrouvé cette discussion datant de début avril 2010.

Je reprends les propos de Moyg lors de cette discussion :

Normalement, Wikipédia n’est pas une source fiable. Tu peux récupérer des infos dans d’autres articles (ça m’arrive aussi de temps en temps), mais pas indiquer Wikipédia comme source.

Pour moi, il soulève un illogisme du fonctionnement de Wikipédia. Je le résumerai par : On traduit continuellement des articles, mais surtout il ne faut pas le dire. Très nombreux sont les contributeurs – je m’inclu parmi eux – qui traduisent un article assez fourni depuis une autre Wikipédia. L’unique source (ou pratiquement la seule) est l’autre article Wikipédia.

Je rebondis sur mon bateau, voici l’article original, voici ma traduction. Je ne me lance pas dans la traduction d’un article sur un sujet dans lequel je n’ai pas un minimum de culture. Ces connaissances de bases permettent d’avoir un esprit critique sur ce qu’on traduit. Cependant, la source réelle de mon travail est bien l’article de la Wikipédia anglophone. Cet article possède de nombreuses références évoquant des ouvrages mis en bibliographie. Le contenu ne semble pas souffrir de désaccord entre rédacteurs. On peut légitimement estimer que celui-ci ne raconte pas trop de bêtises. Je rédige donc l’article. Je ne peux pas mettre les références présentes dans l’article anglophone. Je n’ai pas lu ces ouvrages. S’approprier ces références sans les avoir lu, c’est faire fi des interprétations que le rédacteur de l’article anglophone a pu avoir en lisant ces livres, auxquelles on peut aussi rajouter des possibles problèmes de traduction de ma part. L’appropriation de ces références est assez malhonnête à mon avis.

Je rédige donc cet article, la traduction est – je pense – relativement fidèle à l’article original. Mais les us et coutumes wikipédiens ne souhaitent pas que je l’évoque comme source de la rédaction. Que faire ? Mettre un bandeau indiquant que l’article manque de sources ?

Nos projets poussent les contributeurs à faire de la traduction en piochant ce que nos confrères ont fait dans d’autres langues. On a de très jolis modèles pour bien créditer les auteurs des autres langues, respects du droit d’auteur oblige. On a une machine qui fonctionne bien à ce niveau mais il ne faut surtout pas afficher cet état de fait dans la section source de l’article. Je trouve, pour ma part, cela quelque peu incohérent. Wikipédia est de plus en plus vantée pour la qualité de son contenu, même si très inégale d’un domaine à un autre. Je trouve cela très dogmatique et peu au fait des réalités que de refuser toute mention d’un sourçage d’article par un autre article. A contrario, on voit parfois des articles sourcés par des sources très discutables (blogs éphémères et/ou partisans, journaux généralistes pour des sujets pointus, etc.). À mon avis, on devrait cesser cette position dogmatique  »Wikipédia ne peut pas être une source », mais l’accepter simplement parce qu’elle existe sur nos projets depuis des années. L’accepter permettrait peut-être aussi d’avoir un regard plus critique sur elle.

Ne pas connaitre Wikipédia, c’est une honte !

Plusieurs rencontres m’ont récemment fait penser que, pour beaucoup de personnes, il est devenu inavouable de ne pas connaître Wikipédia. Je vais prendre deux exemples.

Il y a quelques semaines je faisais une conférence à Lausanne pour parler de Wikipédia. Il s’agissait d’expliquer à un public senior comment Wikipédia a été créé, comment ce projet a évolué en 10 ans et comment il fonctionne aujourd’hui. Une journaliste est venue assister à la conférence, le but de sa présence était de parler de l’intérêt des seniors à Wikipédia et au Web, plus que de parler de Wikipédia. Avant que celle-ci ne commence nous avons pris un café et discuté un peu. J’ai commencé à parler de Wikipédia/Wikimedia en expliquant qui y faisait quoi. Réponse rapide : Ah mais je connais Wikipédia. Ok, j’ai cessé mes explications. Elle a finalement aussi assisté à la conférence, et y a visiblement pris beaucoup de notes.

Autre expérience, vendredi dernier j’animais des ateliers informatiques auprès de seniors. L’idée de ces ateliers est de leur donner le maximum d’outils pour mieux se servir de Wikipédia, pour ce qui est de la lecture. On regarde ensemble tout ce qui peut permettre de se faire un jugement sur l’article (sources, historique, bandeau(x), page de discussion, etc.). Les personnes qui viennent sont assez peu à l’aise avec Internet. Elles connaissent leurs limites et sont demandeuses d’aide. En revanche, nous avons un peu plus de mal à toucher du monde pour des ateliers sur comment contribuer à Wikipédia. J’ai le sentiment qu’on a d’une part des personnes qui ne connaissent rien à Internet et n’ont aucun problème à assumer leur limite. De fait, ces personnes sont demandeuses d’aide. D’autre part, on a des habitués d’Internet qui connaissent Internet et Wikipédia et qui ne pensent donc pas qu’une aide pourrait leur être utile.

Ces deux exemples, ainsi que quelques autres expériences, me font dire qu’aujourd’hui Wikipédia est devenu tellement connu qu’il est honteux d’avouer ne pas tout y connaître. Il s’agit du septième site internet le plus consulté au monde, un journaliste se doit de tout y connaître. Un internaute habitué à surfer n’a pas non plus besoin d’aide pour contribuer sur ce site. Je vais tenter de rassurer journalistes et internautes, après plus de six ans d’investissement sur Wikipédia, je n’y connais pas tout. Je doute même que quiconque soit capable de prétendre y connaître tout. Il ne faut donc pas hésiter à reconnaître ses limites.

Wiki loves monuments

Logo Wiki loves monuments.
Logo Wiki loves monuments. Lusitana - CC By SA

Wiki loves monuments, Wiki aime les monuments, est un concours photo dont les sujets sont les biens classés par un pays. Le mot rappelle Wikipédia. En effet, l’initiative est née chez des contributeurs de Wikipédia, plus précisément des contributeurs néerlandais. L’idée de nos amis bataves est simple : pousser les internautes à faire des photos de biens intéressants et les mettre sur Commons, la médiathèque commune à toutes les Wikipédia.

Un peu d’histoire

Du 1er au 30 juin 2009, les néerlandais ont proposé Wiki Loves Art. 45 musées des Pays-Bas ont ouvert leurs portes et ont permis la création de 5413 photographies de divers œuvres. Ces photos sont venues enrichir Wikipédia.

Photo primée lors du concours 2009.
Photo primée lors du concours 2009. mwibawa CC By SA

Du 1er au 20 septembre 2010, Wikimedia Nederland remet le couvert et propose cette fois un concours photo avec comme sujets les 50 000 monuments classés dans leur pays, les Rijksmonumenten. Le concept prend le nom de Wiki loves monuments. Ce sont plus de 12 000 photos qui sont ainsi créées.

Immeuble classé à Amsterdam. Photo gagnante du concours 2010.
Immeuble classé à Amsterdam. Photo gagnante du concours 2010. Rudolphous - CC By SA

Concours européen en 2011

En 2009 et 2010 le concept est resté national, il s’agissait d’une démarche purement néerlandaise. Devant le succès de la chose, Wiki loves monuments s’est internationalisé. Pour l’édition 2011, ce sont donc 18 pays d’Europe qui y participent, chaque pays faisant son propre concours puis un jury européen récompensant les meilleurs photos du continent. Ce concours s’est déroulé du 1er au 30 septembre pour la quasi totalité des pays. Le concours suisse à quant à lui pris place du 1er juillet au 30 septembre.

Au niveau européen c’est un peu plus de 169 000 photos qui ont été réalisées dans le cadre de ce concours. Anecdote amusante, le record affiché dans le Guinness Book pour un tel concours est battu. Sur le site web européen, vous pouvez voir les photos primées dans chaque pays.

En Suisse

Le concours a donc duré trois mois. Nos amis d’outre-jura aiment à nous rappeler que nous sommes lents, nous avons donc pris plus que temps que les autres pour faire les photos. Plus sérieusement, les outils pour le concours étaient en place tôt dans l’année et il y avait le souhait de profiter des beaux jours de juillet et d’août pour faire des photos en montagne. Tous les pays d’Europe n’ont pas forcément des biens classés à plus de 2400 mètres d’altitude.

Le concours suisse a permis la réalisation de 7454 photographies. L’ensemble des biens culturels d’importance nationale des cantons de Zurich et Zoug disposent maintenant d’au moins une photographie pour Wikipédia, pratiquement 90% pour Genève, plus de 80% pour Vaud ou Neuchâtel. Au lancement du concours, la couverture photographique de ces biens suisses étaient de 38%, elle est aujourd’hui de 75%. Un joli travail d’effectué.

Pont sur le Rhône à Saint-Maurice.
Pont sur le Rhône à Saint-Maurice. Ludovic Péron - CC by SA

C’est une grande médiathèque au sujet des biens importants dans l’histoire ou la culture de la Suisse que vous pouvez trouver ici. Et cette médiathèque est sous licences dites libres. Cela permet donc à quiconque de réutiliser ces médias. Ca me rappelle l’époque où l’on achetait les petits cahiers rouges pleins d’images pour coller dans ses exposés pour l’école. Là nous offrons aux jeunes écoliers la possibilité d’illustrer leurs exposés sur la Suisse, mais on le fait gratuitement.

Ce dimanche a lieu, à Berne, la cérémonie de clôture du concours suisse. Nous pourrons y découvrir les photos primées et leurs auteurs. Plus d’informations ici.

Monuments historiques et géolocalisation

Un jour je ferai surement un billet sur le pourquoi de la géolocalisation des articles sur Wikipédia. Il y a beaucoup à en dire. Aujourd’hui parlons particulièrement de celle des monuments historiques situés en France.

Au printemps dernier, avec l’aide de Xic667, il a été codé un bout de code pour générer des catégories d’articles ne possédant pas de géodonnées. Cette fonctionnalité a été mise en place dans les types d’articles (par les infoboxs) pour lesquels une géolocalisation peut paraitre pertinente : typiquement un immeuble, un lac, une montagne, etc. Cette méthode se base sur les infoboxs, elle a donc le défaut d’omettre les articles qui en sont dénués. Mais pour avoir beaucoup parcouru le sujet, il ne doit plus en avoir beaucoup dans ce cas.

Au printemps, nous avons obtenu plusieurs milliers d’articles pour lesquels la géolocalisation était pas ou mal faite, parmi eux plus de 1000 monuments historiques. Je suis même incapable de dire le nombre exact. En effet, pour dresser une liste des seuls monuments historiques non géolocalisés il faut utiliser un outil pour croiser la catégorie des articles pas géolocalisés et celle des articles des monuments historiques. Cet outil cesse son décompte quand la requête dépasse les 1000 réponses. C’est la réponse que nous avions pendant plusieurs mois, alors même que nous localisions des articles régulièrement.

Le 15 août dernier j’avais fait un décompte précis par région française, j’avais abouti à un total de 1151 monuments historiques non localisés. Beaucoup de travail en perspective. Avec l’aide de nombreux contributeurs (Remi, Coyote, Sebleouf, Pleclown, Otourly,etc.), la liste a été réduite, mais aussi augmentée ! Les monuments historiques de l’Ain, de la Haute-Savoie et du Maine-et-Loire ont été créés pendant ce temps soit 800 ou 900 articles en plus.

Ce matin cette liste ne compte plus que 39 articles. Les derniers articles sont les plus durs à géolocaliser. Ce sont ceux pour lesquels plusieurs contributeurs ont déjà fait des recherches mais sans résultat. Je sais que pour certains des emails ont été envoyés aux mairies en question afin d’obtenir un petit peu d’aide. Nous attendons les réponses.

Autre point, si un article ne peut être localisé il est placé dans une catégorie dédiée à cela. Il est très intéressant de noter qu’il y a seulement 3 articles concernant des monuments historiques qui ont été mis là.

Petit bilan, sur environ 8000 monuments historiques situés en France, il y a seulement une petite centaine qui ne sont pas localisés. J’ai quelque peu grossi les 39 + 3, en considérant quelques articles du thème sans infobox. Un joli travail d’effectué. Merci à ceux qui y ont pris part.

Wikimedia CH aide les photographes en Suisse

Wikimedia CH est – comme on dit dans le jargon wikipédien – le chapter suisse de la Wikimedia Foundation. Cette structure soutient et promeut Wikipédia (mais aussi ses projets frères) en Suisse. Une des idées est d’apporter un soutien à la création de contenu lié à la Suisse, chose qu’aucun autre chapter peut faire.

Un des champs de compétences dans lequel Wikimedia CH s’est spécialisé est l’iconographie. L’idée est d’aider à la création ou la libération (en termes de droit d’auteur) de matériaux illustratifs pour Wikipédia mais réalisés en Suisse ou avec une forte connotation suisse.

Plusieurs photographes vivent en Suisse et réalisent des photos pour les projets. Wikimedia CH les aide de différentes manières. Une des difficultés récurrentes rencontrées par ses photographes est d’obtenir une autorisation pour travailler. Aller à Ouchy et faire une belle photo d’un vapeur « Belle Époque » est simple, on ne demande rien à personne et on travaille. En revanche dès que les objets à photographier se trouvent derrière une  porte, il faut demander l’autorisation à la personne qui a les clefs. Et là, pour un photographe wikimédien c’est souvent compliqué.

Depuis quelques temps, Wikimedia CH entretient de bons contacts avec les autorités fédérales suisses. Dans ce cadre, Wikimedia CH a notamment permis que les articles concernant les élus politiques des deux chambres et du gouvernement soient illustrés avec les photos officielles.

Photo officielle du Conseil fédéral 2011.
Photo officielle du Conseil fédéral 2011.

En juin dernier, Frédéric Schütz et moi-même avions une réunion avec des personnes chargées du Web au sein des sept départements fédéraux et de la Chancellerie fédérale. Au cours de cette réunion, j’ai effectivement expliqué la difficulté pour un projet basé sur le bénévolat de pouvoir obtenir des autorisations quand les photographes ne disposent pas de carte de presse. J’ai ironisé sur le fait que nous, sixième site le plus consulté au monde, avions des difficultés nettement supérieures à celles de la rédaction du journal local (si bon soit-il) pour travailler sur l’illustration. L’ironie de la situation a très vite été entendue et comprise par l’assemblée. Nous avons obtenu un accord de principe pour être traités de la même façon que les photographes de presse classiques, en ce qui concerne les lieux où la Confédération a les clefs.

Les congés d’été sont passés par là et on a tardé à mettre cela en œuvre. J’avais communiqué sur le sujet au sein de Wikimedia CH et Rama, un photographe passionné d’informatique et de choses militaires, a sauté sur l’occasion. Après l’email qui va bien, Frédéric Schütz lui a obtenu l’autorisation de faire des photographies de machines de cryptographies utilisées (par le passé) par l’armée suisse. Frédéric et Rama sont donc allés dans le canton de Berne faire ces photos jeudi dernier.

Machine Enigma.
Machine Enigma. Photo : Rama sous CeCILL.

Comme vous pouvez le voir ici, le travail est varié et de qualité. Il y a notamment des photos de la fameuse machine Enigma. Il y a même fort à parier que certaines de ces photos seront primées sur Commons, la médiathèque de Wikipédia.

Wikimedia CH travaille régulièrement sur le sujet. Vous êtes photographes, n’hésitez pas à nous contacter.