Les équipes Kwanzeo interviennent sur toutes les phases des projets décisionnels, Big Data et IA. Nous avons également des collaborateurs et collaboratrices qualifiés dans les technologies citées ci-dessous.
Voici des exemples de missions :
-
Contrôle de la qualité de données et plans d'actions d'amélioration en amont.
-
Cartographie des sources et des données. Hiérarchisation des accès.
-
Conception et modélisation du système d'information décisionnel (Data Warehouse, Data Mart, ODS) ou Big Data dans les solutions de stockage adaptées (SQL Server, Azure data services, Snowflake, Hive, BigQuery, Oracle Database, Cloudera, ...) et la mise en place si nécessaire d'une vision mutidimensionnelle (SSAS / Power BI, Oracle Essbase, ...)
-
Création d'interfaces, de tâches (batchs) d'alimentation de données avec un ETL, intégration de données dans un environnement Big Data, traitement des rejets, mise en place des logs,... avec les solutions SSIS, Azure Data Factory, Talend, Informatica, Pentaho, GeoKettle, Cloud Dataflow, NiFi, Sqoop, HDFS, ...
-
Restitution des données, création de tableaux de bord (Dashboards), mise en place de rapports, ... avec les solutions Power BI, Tableau Software, QlikView, Cognos, SAP BusinessObjects, Knowage, Qlik Sense.
-
Etude de cadrage, choix de la solution et mise en place de Data Lakes et de socles Big Data dans le Cloud.
-
Utilisation des outils Big Data tels que DataBricks dans Azure, ceux fournis par l'Apache Software Foundation - ASF (Hadoop, NiFi ou Kafka pour le traitement des flux de données, Spark et Python API for Spark (PySpark) pour le calcul distribué, Cassandra en tant que base "NoSQL", Oozie pour l'ordonnancement des flux Hadoop, Sqoop, ...) ou d'autres solutions telles que MapReduce (Google) pour les calculs parallèles sur des gros volumes de données, Elasticsearch pour la recherche, Hortonworks, ...
-
Mise en place de plateformes de Machine Learning via l'utilisation des différentes solutions (TensorFlow, Scikit-learn, Keras, Azure Machine Learning).
Utilisation des bibliothèques ou des solutions écrites en Python (Pandas, NumPy, PySpark, ...). Utilisation des langages Python, R, Scala, LaTeX, SQL, Java.