Skip to content

Instantly share code, notes, and snippets.

@Guts
Last active September 14, 2020 13:26
Show Gist options
  • Save Guts/a77e9e378b7157f568077ab47937a9d9 to your computer and use it in GitHub Desktop.
Save Guts/a77e9e378b7157f568077ab47937a9d9 to your computer and use it in GitHub Desktop.
Scraper et transformer du HTML en markdown (support article Geotribu)

7 septembre – 19 octobre 2020

Evaluation du partage des Données environnementales sur fond cartographique en Europe.

Un portail en ligne a été créé dans le cadre de la directive INSPIRE pour permettre le partage des données environnementales géolocalisées entre autorités publiques européennes. Cela inclut, par exemple, des normes communes pour la collecte de données sur les eaux souterraines, les réseaux de transport, l’utilisation des sols, ou les températures de l’air…

Cela devrait permettre d’évaluer dans quelle mesure la directive est :
– efficace dans la protection de l’environnement
– pertinente pour ses parties prenantes
– conforme à d’autres législations de l’UE, en particulier la nouvelle initiative d’espace de données Green Deal.

Votre point de vue est demandé!

Cette feuille de route est ouverte aux commentaires pendant 6 semaines. Ces derniers seront pris en compte dans le développement et la mise au point de l’initiative.
La Commission résumera les contributions reçues dans un rapport de synthèse expliquant comment elles sont prises en compte ou pourquoi elles sont écartées.
Les commentaires reçus seront publiés sur le site de l’UE.

Accès à l’enquête depuis le site de l’UE

———————————————————————————————————————————————
14 août – 10 septembre 2020

Le représentant du Point de contact INSPIRE en France consulte la commission RMO.

La stratégie numérique de la Commission européenne publiée en mai vise à « créer un marché unique de la donnée dans lequel les entités publiques et privées pourront pleinement contrôler l’usage de leurs données et où le secteur public pourra avoir accès à un large rassemblement de données de haute qualité ». Ces données seront rassemblées dans des « espaces communs de données » (Data spaces). Les secteurs cités, considérés comme critiques, sont l’énergie et l’environnement, l’industrie, l’agriculture et la santé.

En février, la Commission avait déjà publié sa stratégie sur la donnée et celle sur l’intelligence artificielle. Elles annonçaient un prochain « Data Act », avec une ambition forte au service du Green Deal, de la relance et de la transformation de l’économie. Les espaces communs de données européens sont présentés comme des infrastructures de données « de haute qualité ». La Commission européenne entend tirer enseignement de la mise en œuvre de la directive INSPIRE pour les construire. La refonte d’INSPIRE dont il est question au travers de la feuille de route pour INSPIRE jointe est explicitement destinée à fournir à la future infrastructure européenne de données les moyens techniques de son fonctionnement.

Ce tournant dans la politique européenne aura des conséquences sur l’infrastructure de données géographique française, notamment sur les aspects techniques. Le Point de contact français souhaite donc recueillir l’avis des membres de la commission « règles de mise en oeuvre » du CNIG sur ce projet de la Commission européenne.

Pour avoir accès au document, il faut s’inscrire à la commission RMO dont les membres ont reçu spécifiquementle document
Tout commentaire doit être remonté avant le 10 septembre 2020

———————————————————————————————————————————————
CONSULTATION DU 7 avril

La Commission européenne annonce que, dans le cadre de sa politique de « pacte vert européen», un « espace commun de la donnée » (a Common European Green Deal data space) sera développé. L’initiative « données vertes pour tous » (GreenData4All) sera la contribution de la DG Environnement à la Stratégie européenne de la donnée.
Elle viserait à revoir et possiblement réviser sinon fusionner la directive 2003/4/CE (Aarhus) et la directive INSPIRE.

Programme de travail INSPIRE 2020-2024 :
– D’ici fin 2022, il s’agit d’arriver à une mise en oeuvre commune dans l’Union européenne sur un périmètre, réduit, de données de référence tout en relâchant les contraintes sur les autres.
– Puis pour 2024, il s’agirait de rapprocher les directives Aarhus (sur l’accès à l’information environnementale) et INSPIRE pour 2024.

Le Point de contact INSPIRE a saisi la commission Règles de mise en oeuvre pour consultation. Cette commission est ouverte : si vous souhaitez y participer, merci de vous signaler auprès du secrétariat du CNIG.
Vous trouverez dans le document ci-dessous les 7 questions essentielles auxquelles vous pouvez aider le point de contact à répondre.
La synthèse et les questions qui vont se poser

Répondre si possible avant le 17 avril!
Pour vous faire une meilleure idée, les documents sont accessibles avec autorisation :
Consultation pour la directive INSPIRE v2 : Accès à la page des documents depuis la zone protégée
Sous protection d’un mot de passe à demander par courriel (voir page CONTACTS depuis le bandeau)

———————————————————————————————————————————————

← Geoportail de l’urbanisme : étape de l’été 2020

#! python3
# -- Imports
# Bibliothèque standard
from pathlib import Path
# Packages tiers
import urllib3
from bs4 import BeautifulSoup
from markdownify import markdownify
# -- Variables
in_url = "http://cnig.gouv.fr/?p=23807"
out_filepath = Path("./cnig_23807.md")
# -- Programme principal
# d'abord on télécharge la page
http = urllib3.PoolManager()
page = http.request('GET', in_url)
# on parse le html
soup = BeautifulSoup(page.data, "html.parser")
# on extrait ce qu'il y a dans la classe post-content
post_content = soup.find("div", {"class": "post-content"})
# on transforme en markdown en spécifiant le style de titre avec des '#'
out_md = markdownify(post_content, heading_style="ATX", autolinks=False)
# on écrit notre fichier
with out_filepath.open("w", encoding="UTF8") as fifi:
fifi.write(out_md)
beautifulsoup4==4.9.*
markdownify==0.5.2
urllib3==1.25.*
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment