# Machine de type c3-64 avec 64 Go RAM, VCore 32, 400 Go NVMe, réseau public 4 Gbit/s, réseau privé 4 Gbit/s max
# 1TB de disque dur
# Dsitribution Debian bookworm
# Install Docker
sudo su &&
apt update -y &&
Récupération des données de l'API des athlètes français JO 2024 derrière https://data.equipedefrance.com
Le plus intéressant, ce sont les athlètes qui sont exposés. Il manque quelques coordonnées géographiques (correspondant au lieu de naissance, 29 lors de mes tests). Nous avons dû les déduire en passant les slugs des athlètes car les lieux de naissance sont renseignés dans les pages HTML du type https://www.equipedefrance.com/athlete/guylaine-marchand bien que la géolocalisation du lieu de naissance soit absente.
Il y a eu quelques cas où:
- pas de lieu de naissance dans le fiche HTML
- on a modifié le nom de la région après le lieu de naissance car le géocodeur ne retournait pas l'attendu
- on a récupéré le lieu de naissance "ailleurs" car quelques fiches HTML étaient innaccessibles (erreurs 500) ou sans le lieu de naissance
En réaction à https://x.com/cedcyr/status/1802760216104382955 qui faisait suite à https://x.com/DiscordGauche/status/1802731584564428961
Les valeurs utilisées séparées par des espaces. Le séparateur est le .
.
Récupération des bureaux de vote des circonscriptions de l'étranger
wget https://www.resultats-elections.interieur.gouv.fr/telechargements/LG2024/territoires/territoires.xml
echo '"code_com","lib_com","code_circ","lib_circ"' >| circo_etrangers_zz.csv
xq -r -c '."Election"."EnsembleGeo"."Regions"."Region"[] | select(."CodReg" == "00") | ."Departements"."Departement"[] | select(."CodDpt" == "ZZ") | ."Circonscriptions"."Circonscription"[] | ."CodCirElec" as $codeCir | ."LibCirElec" as $libCirElec | ."Communes"."Commune"[] | [."CodCom", ."LibCom", $codeCir, $libCirElec] | @csv' territoires.xml >> circo_etrangers_zz.csv
CSV et SHP géocodés avec QGIS en utilisant le plugin MMQGIS. Voir le shp dans le zip, le GeoJSON dans dans le dépôt
Recipe
# You need a recent curl version. Hence, my path points to a compiler curl version
# The goal is to manage when new MAJ should be done instead of running full processing for nothing
curl_path=/home/thomasg/curl/bin/curl
mydate=$($curl_path -Ls -o /dev/null --head -w "%header{last-modified}" https://planet.openstreetmap.org/pbf/planet-latest.osm.pbf)
current_date=$(date -d "$mydate" +"%Y-%m-%dT%H:%M:%S%:z")
from owslib.csw import CatalogueServiceWeb | |
url_csw = 'https://www.observatoire-des-territoires.gouv.fr/outils/cartographie-interactive/services/csw/' | |
csw = CatalogueServiceWeb(url_csw) | |
infos = [] | |
csw.getrecords2(startposition=0, maxrecords=20) | |
for rec in csw.records: | |
result = [csw.records[rec].title, csw.records[rec].identifier] |
Ici on prend les données GPKG mais shp et CSV aussi disponibles selon vos préférences
# Infos pompées de https://www.geoportail-urbanisme.gouv.fr/image/Manuel_export_massif.pdf
# Obtenu via discussion https://georezo.net/forum/viewtopic.php?pid=367182#p367182
# Do once (to get ssh key)
timeout 5 ssh -oStrictHostKeyChecking=accept-new -p 2200 [email protected]
# List files
<!DOCTYPE html> | |
<html> | |
<head> | |
<!-- | |
Copyright (c) 2015-2020 Jean-Marc VIGLINO, | |
released under CeCILL-B (french BSD like) licence: http://www.cecill.info/ | |
--> | |
<title>ol-ext: WMS Capabilities control</title> | |
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> |