Skip to content

Instantly share code, notes, and snippets.

@bryanpaget
Last active August 22, 2025 14:29
Show Gist options
  • Select an option

  • Save bryanpaget/8a612e643c3551a738657df40147ba99 to your computer and use it in GitHub Desktop.

Select an option

Save bryanpaget/8a612e643c3551a738657df40147ba99 to your computer and use it in GitHub Desktop.
📢 Aidez-nous à façonner notre environnement de science des données! // Help Shape Our Data Science Environment!

📢 Aidez-nous à façonner notre environnement de science des données!

Chers amis de La` Zone,

Nous optimisons notre environnement Kubeflow pour mieux répondre à vos besoins. Pour créer une configuration de base véritablement utile, nous avons besoin de votre avis sur les packages qui comptent le plus pour votre travail quotidien.

État actuel et changements à venir

Notre environnement inclut déjà des packages statistiques essentiels (tidyverse, pandas, scikit-learn), des outils d'entreprise (ODBC, Kubernetes) et des environnements de développement (VSCode, JupyterLab, RStudio).

Améliorations critiques en cours:

  • Ajout des dépendances système manquantes pour un rendu graphique et un traitement des données appropriés (Cairo, Pango, bibliothèques XML)
  • Installation des packages Python essentiels : fastparquet (gestion des fichiers Parquet), black (formatage de code), pytest (tests)
  • Suppression des packages redondants pour rationaliser l'environnement :
    • Python : dask, h5py, bokeh, altair, cloudpickle et autres
    • R : r-hexbin, r-nycflights13, r-randomforest et autres

C'est ici que vous intervenez

Quel est le package que vous devez toujours installer lorsque vous utilisez The Zone? Veuillez partager :

  1. Vos 5 packages « indispensables »
  2. Les outils spécialisés essentiels à votre travail
  3. Les packages que vous utilisez rarement (aidez-nous à identifier d'autres candidats à la suppression)

Notre objectif

Créer un environnement de base épuré avec 80-90% de ce dont vous avez besoin dès le départ, tout en garantissant :

  • Fiabilité : Tous les graphiques et connexions de données fonctionnent correctement
  • Efficacité : Temps de démarrage plus rapides et taille d'image réduite
  • Flexibilité : Ajouter facilement des outils spécialisés lorsque nécessaire

Vos commentaires façonnent directement notre configuration d'image Docker!

Merci de nous aider à construire de meilleurs outils pour notre travail statistique.

L'équipe de The Zone


📢 Help Shape Our Data Science Environment!

Dear Zone Friends,

We're optimizing our Kubeflow environment to better serve your needs. To create a truly useful base setup, we need your input on which packages matter most for your daily work.

Current State & Upcoming Changes

Our environment already includes core statistical packages (tidyverse, pandas, scikit-learn), enterprise tools (ODBC, Kubernetes), and development environments (VSCode, JupyterLab, RStudio).

Critical improvements underway:

  • Adding missing system dependencies for proper graphics rendering and data handling (Cairo, Pango, XML libraries)
  • Installing essential Python packages: fastparquet (Parquet file handling), black (code formatting), pytest (testing)
  • Removing redundant packages to streamline the environment:
    • Python: dask, h5py, bokeh, altair, cloudpickle, and others
    • R: r-hexbin, r-nycflights13, r-randomforest, and others

Here's Where You Come In

What's the package you always have to install when you use The Zone?

Please share:

  1. Your top 5 "must-have" packages
  2. Specialized tools critical to your work
  3. Packages you rarely use (help us identify more removal candidates)

Our Goal

Create a lean base environment with 80-90% of what you need out-of-the-box, while ensuring:

  • Reliability: All graphics and data connections work properly
  • Efficiency: Faster startup times and smaller image size
  • Flexibility: Easily add specialized tools when needed

Your feedback directly shapes our Docker image configuration!

Thanks for helping build better tools for our statistical work.

The Zone Team

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment