Skip to content

Instantly share code, notes, and snippets.

@GioBonvi
Last active July 5, 2019 20:34
Show Gist options
  • Save GioBonvi/711109b817222dbfcc6884ba34b498ad to your computer and use it in GitHub Desktop.
Save GioBonvi/711109b817222dbfcc6884ba34b498ad to your computer and use it in GitHub Desktop.
Alcune funzioni che permettono di estrarre dal sito del Politecnico di Milano le aule libere in un certo periodo di tempo (https://www7.ceda.polimi.it/spazi/spazi/controller/RicercaAuleLibere.do?evn_giornaliera=evento).
#!/usr/bin/env python3
# Copyright 2019 Giorgio Bonvicini
# Permission is hereby granted, free of charge, to any person obtaining a copy
# of this software and associated documentation files (the "Software"), to deal
# in the Software without restriction, including without limitation the rights
# to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
# copies of the Software, and to permit persons to whom the Software is
# furnished to do so, subject to the following conditions:
# The above copyright notice and this permission notice shall be included in all
# copies or substantial portions of the Software.
# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
# IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
# FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
# AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
# LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
# OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
# SOFTWARE.
import urllib.request, urllib.parse
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
def genera_url(giorno, mese, anno, location):
"""Genera l'URL della pagina da cui estrarre i dati.
Parameters
----------
giorno : int
Numero del giorno
mese : int
Numero del mese
anno : int
Numero dell'anno
location : str
ID alfanumerico della zona
Returns
-------
str
URL della pagina.
"""
return 'https://www7.ceda.polimi.it/spazi/spazi/controller/OccupazioniGiornoEsatto.do?csic=' + location + '&categoria=tutte&tipologia=tutte&giorno_day=' + str(giorno) + '&giorno_month=' + str(mese) + '&giorno_year=' + str(anno) + '&jaf_giorno_date_format=dd%2FMM%2Fyyyy&evn_visualizza='
def situazione_aule(url):
"""Estrai dalla pagina web i dati sull'occupazione delle aule per una data e
una zona specificata.
Parameters
----------
url : str
URL della pagina da cui estrarre i dati.
Returns
-------
aule
Lista delle aule come dizionari con nome, edificio ed elenco delle
occupazioni come lista di tuple (ora_inizio, ora_fine).
"""
page = urllib.request.urlopen(url)
document = BeautifulSoup(page.read(), features="html.parser")
# Estrai tutte le righe della tabella delle occupazioni.
righe = document.find('td', attrs={'class': 'MatriceOccupazioni'}).findAll('tr')
aule = []
# La prima riga va saltata perché è vuota.
for riga in righe[1:]:
aula = None
# Prima ora dell'orario. Le ore sono espresse come numero decimale (es: 8.25 -> 8:15)
ora = 8
if riga.find('td', attrs={'class': 'innerEdificio'}):
# Riga che contiene il nome dell'edificio
# Estrai nome dell'edificio corrente.
nome_edificio = riga.find('td', attrs={'class': 'innerEdificio'}).text
if riga.has_attr('class') and 'normalRow' in riga['class']:
# Riga che contiene un'aula.
# Estrai tutte le celle dalla riga.
celle = riga.findAll('td')
if celle[1].has_attr('class') and 'dove' in celle[1]['class']:
# Estrai nome dell'aula.
nome_aula = celle[1].text.strip()
# Oggetto "aula": conteine nomi e occupazioni.
aula = {'nome': nome_aula, 'edificio': nome_edificio, 'occupazioni': []}
# Le prime due celle della riga non contengono occupazioni.
celle = celle[2:]
for cella in celle:
# L'attributo "colspan" indica quanti slot da 1/4 d'ora sono occupati.
slot_occupati = int(cella['colspan']) if cella.has_attr('colspan') else 1
ora_fine_occupazione = ora + 0.25 * slot_occupati
# Se lo slot è occupato registralo nelle occupazioni dell'aula.
if cella.has_attr('class') and 'slot' in cella['class']:
aula['occupazioni'].append((ora, ora_fine_occupazione))
# Prosegui lo scorrimento dell'orario.
ora = ora_fine_occupazione
aule.append(aula)
return aule
def aule_libere(situazione, ora_inizio, ora_fine, blacklist):
"""Determina le aule che non sono occupate fra ora_inizio e ora_fine.
Parameters
----------
situazione
Elenco delle aule con occupazioni
ora_inizio : float
Ora a partire dalla quale l'aula deve essere libera.
ora_fine : float
Ora fino alla quale l'aula deve essere libera.
blacklist : list of str
Verranno escluse le aule i cui nomi contengono una di queste parole.
"""
return list(filter(
lambda aula:
all([word not in aula['nome'].lower() for word in blacklist]) and
len(list(filter(lambda occ: not ((occ[0]<=ora_inizio and occ[1]<=ora_inizio) or (occ[0]>=ora_fine and occ[1]>=ora_fine)), aula['occupazioni']))) == 0,
situazione
))
def mostra_occupazioni(situazione):
"""Stampa una descrizione testuale delle occupazioni della giornata."""
for aula in situazione:
print('Aula %s (%s)' % (aula['nome'], aula['edificio']))
if len(aula['occupazioni']) == 0:
print(' LIBERA')
for occ in aula['occupazioni']:
print(' OCCUPATA %s - %s' % (dec_to_hhmm(occ[0]), dec_to_hhmm(occ[1])))
def dec_to_hhmm(dec):
"""Converti un'ora da float a stringa hh:mm"""
return '%s:%s' % (str(int(dec)).zfill(2), str(int((dec-int(dec))*60)).zfill(2))
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment