Qu’est-ce qui vous différencie des autres services IT ?
Pour répondre à cette question, le plus simple est de prendre quelques exemples :
- Si le premier objectif des équipes de run est de récolter les données de nos modules, les structurer et les rendre interprétables pour les livrer à nos clients. Notre rôle serait plutôt de prendre du recul afin de comprendre pourquoi (très rarement chez birdz bien évidemment) il arrive que des données soient anormales en analysant des historiques plus étendus par exemple.
- La datascience va souvent essayer de tirer profit des données dites “exogènes” pour expliquer certains phénomènes. Derrière ce terme barbare se cache simplement l’ensemble des données qui ne seraient pas directement issues des capteurs, mais qui peuvent avoir un impact sur eux ou sur le phénomène sur lequel on travaille.
Un exemple simple : Si on essaye de prévoir la consommation d’eau du compteur du Parc de la Tête d’Or, grand parc du 6eme arrondissement de Lyon pour les non-Lyonnais (personne n’est parfait), un data scientist sera tenté d’en savoir plus sur les conditions météos, car en cas de pluie, on aura probablement moins besoin d’arroser, donc moins de consommation d’eau.
La météo est donc une donnée exogène qui nous aide à prédire les consos d’un module eau
CQFD
- Enfin, n’étant pas directement en interface avec des clients, nous pouvons prendre le temps de réfléchir à des sujets d’innovations. Il nous arrive de travailler sur des prototypes de services suite à une expression de besoin de la part d’un client (interne comme externe) ou encore suite à l’expression d’une idée en provenance de l’esprit d’un François ou d’un JB. Une fois ces prototypes réalisés, nous laissons généralement la main à nos chers collègues de l’IT pour intégrer ces nouveaux axes aux applications Birdz (Apps byBirdz, Teleo, …)
Quelles sont les applications possibles de la data science chez Birdz ?
Les principales familles d’application de la data science sont :
- Le clustering est une technique d’apprentissage automatique permettant de regrouper des données (image, séries temporelles, tout autre type de données) par similarité.
Pour illustrer ce principe, nous avons travaillé sur l’identification des emplacements de nos compteurs (dans un garage, dans une salle de bain, dans un coffret, un regard …). Non pas par curiosité malsaine, mais parce que cette information nous aide pour les prévisions de mortalité de nos modules. Nous analysons les données de températures des modules et par clustering, nous les rattachons à un groupe d’emplacement, celui étant le plus proche de leur température.
- Les méthodes de régression permettent quant à elles de prédire des données quantitatives, comme la consommation d’eau par exemple en fonction de variables telles que la saison, la localisation du point de consommation, la météo, ou l’historique de consommation.
Un use case que nous avons traité a été de fournir pour un contrat, le nombre de modules qui arriveront en fin de vie, mensuellement dans les 10 prochaines années. Pour ce faire, nous nous sommes basés sur l’historique de mortalité des modules ainsi que sur des données externes comme la température, la météo ou le milieu d’installation des modules (garage, gaine technique, regard, etc).
- Un autre domaine porté par la datascience est l’analyse d’image. De la reconnaissance d’objets à la classification d’image, le principe est de donner un grand nombre d’exemples d’images représentant une situation/ un objet pour permettre à la machine d’apprendre à reconnaître cette situation automatiquement.
Un exemple concret chez Birdz était par exemple de scanner l’ensemble des photos de poteaux électriques sur lesquels nous installons nos répéteurs, afin d’identifier les poteaux sur lesquels on aurait (par erreur) installer 2 répéteurs qui pourraient se bruiter l’un avec l’autre.
- En dehors des outils de pointe du data scientist présentés ci-dessus, l’analyse descriptive et statistique des données est aussi une partie importante de notre quotidien.
Un domaine d’application sur lequel nous travaillons ces temps-ci est l’analyse des données issues des capteurs LoraWan. En effet, étant donné que nous sommes dépendant d’opérateurs externes (orange, objenious…) sur la gestion du réseau, il est important pour nous de mieux comprendre leur fonctionnement.
Nous monitorons par exemple les performances (radio) de chaque module communiquant pour prévenir des anomalies de pertes de messages
- On est parfois amenés à utiliser des méthodes plus originales comme la simulation de données.
Un cas d’usage que nous avons récemment traité est la modélisation des performances radio de modules, nécessaires pour tenir les KPI d’un contrat donné.
Vous n’êtes pas sans savoir que lorsque nous signons un contrat, nous nous engageons sur une qualité de service et nous nous soumettons à des pénalités en cas de non respect de ces règles !
Pour éviter de se retrouver dans des situations où l’on devrait payer de grosses pénalités, nous dématérialisons la performance à atteindre pour vérifier la faisabilité et aider aux négociations d’avant vente.
What else ?
Nous profitons d’être mis sur le devant de la scène (merci Jimmy & Mel) pour vous tendre une main, ou d’en un premier temps, une oreille. Si vous identifiez un sujet ou que vous avez une idée de projet sur lequel nous pourrions vous apporter notre aide, n’hésitez pas à nous en parler autour d’un café !
Nous sommes toujours curieux de découvrir de nouveaux sujets et comme l’ensemble de la direction scientifique, nous sommes au service des BU pour vous aider au mieux sur la thématique de la data.