En tant que journalistes, nous avons besoins de données exactes, précises et fiables pour documenter nos articles. Il n’existe pas de bases de données ouvertes spécifiquement dédiées au Burundi, d’où notre idée de centraliser ces données, mais aussi d’y ajouter les nôtres, celles que nous récoltons dans notre travail quotidien, que ce soit à des fins d’investigation ou pour des projets de datajournalisme. Nos objectifs ne sont pas que journalistiques. Nous encourageons la réutilisation des données, car elles donnent de l’information sur le Burundi. Brutes, elles sont à traiter en fonction du projet, qu’il émane de citoyens, d’ONG, d’étudiants, de chercheurs ou de décideurs.
Notre portail vous propose différents points d’entrée : une recherche par mot(s) clé(s), un accès direct à tous les jeux de données via l’onglet Data, un accès direct à l’une des huit thèmes centraux via l’onglet ”Thématiques”.
La standardisation est un élément essentiel dès lors que l’objectif est un large partage et une dissémination des données. Cela commence par une sémantique forte, basée sur les standards de l’IPTC, en matière de vocabulaire contrôlé pour les médias. La taxonomie et les définitions proposées sont libres d’utilisation (licence Creative Commons 4.0) : notre projet est ouvert, nous utilisons donc des outils ouverts. Nous avons adapté cela aux usages du portail, dans notre propre taxonomie. Il se trouve en relation avec notre plateforme. Vous pouvez accéder aux jeux de données par ordre alphabétique via l’onglet « Tags ». Vous pouvez consulter l’organisation de ces mots clés sur cette page, développée avec le serveur de vocabulaire open source Tematres. C’est la première couche sémantique forte sur nos jeux de données mais il y en a d’autres (normes Dublin Core et Schema.org).
Nous privilégions des formats ouverts comme le CSV*, ceux-ci devant à la fois être lisible par des humains et par des machines pour encourager toutes les formes de réutilisation. Un Uniform Resource Locator (URI) permet d’attribuer une identification unique aux données. Lorsque cela est possible, nous proposons des données liées (linked data). Notre philosophie est donc celle d’une ouverture la plus totale, en respectant les recommandations du W3C en matière d’open data, organisme de standardisation du web.
*Un fichier CSV s’ouvre sur n’importe quel tableur (Excel, Open Office…)
Les métadonnées sont des méta information qui documentent les jeux de données, des informations sur les informations. Nous avons opté pour l’adoption du standard Dublin Core, qui permet une interopérabilité des métadonnées.
Absolument. Pour plus d’informations à propos des licences d’utilisation, rendez-vous sur cette page.
1) Nous aider dans la collecte de données : si vous disposez de données utiles au portail, n’hésitez pas à nous les faire parvenir. Bien sûr, nous les vérifierons et sommes susceptibles de vous demander plus d’informations à leur propos (nature, provenance…) avant toute publication.
2) Nous aider à compléter les données : un lien figure sur chaque fiche relative à un jeu de données « Signaler un problème avec le jeu de données ». Vous pouvez également nous faire part de vos observations (données partielles,…). Tous les jeux de données fournis sur ce portail sont vérifiés et validés avant leur publication car nous attachons une très grande importante à la qualité des données, dont dépend la qualité de leur réutilisation. C’est pourquoi nous appliquons les standards en vigueur (nomes ISO, standards du W3C…). Mais nous sommes humains et donc faillibles, même si nous mettons tout en œuvre pour proposer un service de la plus grande qualité.
3) Participer : cet espace est le vôtre. N’hésitez pas proposer des jeux de données pour enrichir notre catalogue et/ou nous faire part de vos commentaires.
4) Communiquer sur la réutilisation des données : les développeurs et organisations impliqués dans la réutilisation des données proposées sur ce portail sont invités à communiquer à propos de celle-ci. Nous leur consacrerons une page sur ce portail.
Contactez notre data manager, via cette page.