Common Corpus : un corpus de textes libres de droit pour nourrir les LLM

L’entraînement de grands modèles de langage ou de modèles d’IA générative ne se fait pas sans l’utilisation de corpus de textes ou d’images de taille conséquente. C’est notamment l’objet de l’accord passé récemment entre Le Monde et OpenAI tout comme l’objet de la discorde entre OpenAI et le New York Times : l’accès à des […]

Read More

Parcoursup : cachez ces vulnérabilités que je ne saurais voir !

L’ouverture du code source de Parcoursup est un chemin semé d’embuche. Cet algorithme, qui a succédé à Admission PostBac, est utilisé pour répartir les étudiants entre différentes filières de l’enseignement supérieur. Depuis longtemps, de nombreuses associations et médias cherchent à obtenir le code source de cette application auprès du ministère de l’enseignement supérieur et de […]

Read More

La France n°2 de l’Open Data parmi les Etats de l’OCDE

C’est un nouveau motif de satisfaction pour les acteurs de la politique française d’ouverture des données. En décembre, la France se classait première de l’open data en Europe (élargie à 35 pays) pour la 3e année consécutive. Pour la même année 2023, l’Etat européen se distingue également au sein de l’OURdata (Useful and Re-usable data) […]

Read More

La France championne européenne de l’Open Data pour la 3e année

La France est un pays référence sur le thème du partage des données publiques, l’Open Data. Et elle tient à le faire savoir par l’intermédiaire de la Dinum, la direction interministérielle du numérique. Les résultats sont là en effet. “La France championne d’Europe en open data pour la 3e année consécutive”, rapporte ainsi sur X […]

Read More

Radio France ne veut pas être pillé par l’IA d’OpenAI

Les modèles d’intelligence artificielle de type génératif ont besoin de contenus pour se nourrir. Ceux-ci sont ainsi largement consommés sur le Web public par les concepteurs de ces IA, comme OpenAI, père de GPT et ChatGPT. L’ère de l’abondance pourrait toutefois être derrière eux à présent. Plusieurs grandes plateformes ont récemment adopté des politiques plus […]

Read More

L’Assurance Maladie ouvre en open data de nouveaux jeux de données de santé

Depuis quelques années à présent, la France se classe en première place en Europe sur l’Open Data en raison de son niveau de maturité. Cette position, l’Hexagone la doit notamment au volontarisme de certaines de ses administrations, comme l’Urssaf et l’Assurance Maladie. Cette dernière annonce prolonger sa stratégie d’open data et de datavisualisation développée en […]

Read More

Une fédération pour les professionnels d’OpenStreetMap

  Le logo de la fédération des pros d’OSM. OpenStreetMap (OSM) connaît un nombre croissant d’emplois. C’est ce que souligne l’annonce de la création d’une nouvelle fédération de professionnels, la FPOSM: «Depuis plus de 10 ans, les opportunités commerciales autour du projet OpenStreetMap se multiplient en France. De la mobilité au tourisme, de l’exploitation des […]

Read More

Aaron Swartz: dix ans après sa mort, la mémoire d’un militant du partage des connaissances

“RIP Aaron Swartz”, peinture murale de BAMN à Brooklyn (New York). Photo Almonroth / Wikimedia Commons / CC by-sa Dix ans déjà: le 11 janvier 2013, Aaron Swartz, 26 ans, menacé d’années de prison pour avoir téléchargé illégalement des millions d’articles scientifiques, se suicidait. Dans sa trop courte vie, il a laissé nombre de travaux […]

Read More

GitHub enterre 21 téraoctets de données dédiées à la postérité

Il ne s’agit pas de science-fiction : GitHub a mis la touche finale à son Arctic Code Vault, une boîte en acier de près de 1,5 tonne recouverte de gravures générées par l’intelligence artificielle qui visent à inciter les générations futures à l’explorer. GitHub avait initialement déposé son instantané de 21 téraoctets du 20 février 2020 de tous les dépôts […]

Read More

Data pathologies : De la datavisualisation pour lire les données de santé agrégées

Le 20 juin dernier, l’Assurance Maladie a déployé une plateforme gratuite et accessible à tous pour visualiser les données de dépenses de santé des Français. Diabète, cancer du poumon ou encore maladie de Parkinson, Data pathologies se concentre sur une cinquantaine de pathologies dans sa forme actuelle, sur la base des 1,5 milliard de factures […]

Read More

Le recours à l’open data pour répondre aux objectifs de neutralité carbone dans le secteur de l’énergie

L’impact des activités humaines sur le réchauffement climatique ne fait plus débat. Vagues de chaleur, pluies torrentielles, cyclones, sécheresses, feux, tous ces phénomènes climatiques décuplés en nombre et en puissance sont aujourd’hui imputables aux émissions de CO2, générées par l’industrie, le bâtiment, et à celles du méthane, issues des activités agricoles. Selon le dernier rapport […]

Read More

Une plateforme de données territoriales sous licence libre pour La Rochelle

L’hôtel de ville de La Rochelle. Photo: Chris06 /  Wikimedia Commons / CC by-sa A l’occasion du récent salon B-Boost, autour des logiciels libres et open source, le consortium La Rochelle Territoire Zéro Carbone (LRTZC), réunissant la ville de La Rochelle, sa communauté d’agglomération, Port Atlantique, La Rochelle Université, Pôle Atlantech et 130 partenaires publics […]

Read More

Open Data et Justice : Le Conseil d’Etat et la Cour de cassation sont les premiers de cordée

La stratégie d’open data des décisions de justice passe enfin à l’action. Cinq ans après l’adoption de la loi pour une République numérique, prévoyant la mise à disposition des jugements rendus par la justice française, et six mois après la communication du calendrier prévisionnel, le Conseil d’Etat et la Cour de cassation commencent à ouvrir […]

Read More

Stratégie des données publiques : Les ministères publient leurs plans d’actions

2021 se révèle être un tournant en matière de politique publique de la donnée. La ministre de la Transformation et de la Fonction publiques, Amélie de Montchalin, l’a une nouvelle fois exprimé ce lundi, alors qu’elle venait présenter dans les locaux de l’IGN les 15 feuilles de route ministérielles en matière d’ouverture et de valorisation des […]

Read More

Booster l’économie locale grâce à l’open data

Depuis toujours, open data et tissu local sont liés. Très vite les services publics des territoires ont compris tous les bénéfices qu’ils pouvaient tirer des données issues d’une grande variété de secteurs ; météo, transports, sciences, environnement, finance, culture, etc. Croisées avec d’autres datas et contextualisées, elles fournissent aux collectivités territoriales des informations leur permettant […]

Read More

Vous voulez créer une stratégie de données efficace ? Voici par où commencer

Ceux qui pensent que la réussite d’un chief data officer (CDO) se mesure uniquement à sa capacité à gérer l’information se trompent. Bien que la qualité des données soit un élément clé du rôle, les meilleurs CDO vont de plus en plus au-delà des chiffres et s’engagent auprès de leurs pairs des directions métiers pour […]

Read More

L’IGN confie l’hébergement de ses solutions de cartographie à OVHcloud

L’Institut national de l’information géographique et forestière (IGN) a choisi OVHcloud comme nouvel hébergeur pour ses solutions de cartographie. L’institut se sépare du cloud de l’Etat Oshimae, sur lequel était basée son infrastructure informatique. Le conseil d’administration de l’IGN, réuni vendredi dernier, a opté pour la solution française OVHcloud, face à AWS et Azure de […]

Read More

IGN : Sébastien Soriano aux commandes pour bâtir un contre-modèle aux GAFAM

Pour tenir tête aux GAFAM sur le terrain des données géographiques et des nouvelles technologies, l’IGN s’engage dans une politique d’open data et dans la réalisation de projets nés du collectif. Sébastien Soriano, l’ancien patron de l’Arcep passé du côté des géodatas et des cartes, mène le navire avec pragmatisme et curiosité depuis six mois. […]

Read More

Pour des logiciels «verts»: Microsoft, GitHub et la fondation Linux créent la Green Software Foundation

Image: Pixabay «Avec des data centers qui représentent 1% de la demande mondiale d’électricité, et des projections qui la voient passer à 3-8 % dans la prochaine décennie, il est impératif qu’en tant qu’industrie nous traitions la question», déclarent les promoteurs de la nouvelle-née Green Software Foundation. Elle veut «construire un écosystème de confiance de personnes, […]

Read More

Libre et open source: Open Source Experience, IGN, Smile, Jitsi

Image: MedithIT/CC by publicité Open Source Experience, les 9 et 10 novembre Conçu avec Systematic Paris Region, la première édition d’Open Source Experience est annoncée à Paris, les 9 et 10 novembre 2021 au Palais des Congrès (ouf, enfin en finir avec le tout-virtuel de la pandémie, soufflera-t-on), pour réunir la communauté experte de l’open […]

Read More