page title icon Data Engineer – Kimba FONDIO

Tout savoir sur le métier de Data Engineer : missions, salaire, compétences et formations

Data Engineer Salaire

Débutant : 38-45k€/an, confirmé : 55-60k€, senior : 70k€+ brut annuel.

Data Engineer Formation

Master en data, école d’ingénieur, certifications cloud ou data, anglais recommandé.

Data Engineer c’est quoi

Le Data Engineer conçoit, développe et gère les pipelines et plateformes de données.

Notes du podcast et liens utiles :

Notre invité : Kimba FONDIO –  Profil LinkedIn

Interview faite par : Bertrand Jonquois –  Profil LinkedIn

La transcription de l’interview de Kimba Fondio, Data Engineer

Bertrand
Merci beaucoup Kimba d’avoir accepté l’invitation du Gagne-Pain. Tu es Data Engineer chez Decilia. On va avoir l’occasion d’expliquer ça dans le détail, mais avant, pourrais-tu te décrire en quelques mots ?

Kimba
Merci Bertrand. Merci pour cette invitation. Je suis Kimba Fondio. J’ai 31 ans. Je suis originaire de la Côte d’Ivoire où j’ai effectué toutes mes études. Concernant mon parcours, il est un peu atypique parce que j’ai commencé par des études en économie où je suis allé jusqu’en maîtrise. Après, ma passion pour l’informatique et l’analyse des données m’a conduit à aller faire un autre master en Data Science, Big Data et Intelligence artificielle à l’Institut national polytechnique Félix Houphouët-Boigny en Côte d’Ivoire.

Bertrand
Kimba, pourrais-tu nous présenter ton parcours professionnel, c’est-à-dire les différentes expériences que tu as eues en entreprise avant celle dans laquelle tu travailles aujourd’hui ?

Kimba
Avant mon entreprise actuelle, j’ai eu l’opportunité de travailler pour différentes entreprises. Ce parcours, il a commencé plutôt en Côte d’Ivoire avec Data 354, qui est un cabinet expert en data, l’un des tout premiers en Afrique de l’Ouest. Après cette expérience, je suis venu ici en France avec RINTIO, qui était un cabinet aussi spécialisé en services numériques, pour à qui j’ai effectué une mission auprès de KPMG. Après cette mission et d’autres missions, j’ai été recruté chez Devoteam comme Data Engineer. Devoteam, qui est l’une des plus grosses ESN en France, présente en Europe, mais également sur d’autres continents.

Bertrand
Ok. Ceux qui sont intéressés par Devoteam, nous avons fait une interview chez eux avec Développeur Mobile. Kimba pourrais-tu nous présenter l’entreprise dans laquelle tu travailles et ton job actuel ?

Kimba
Aujourd’hui, je suis Data Engineer chez Decilia, une société de services numériques spécialisée en data intelligence et en valorisation des données. J’interviens comme Data Engineer. On va accompagner les entreprises pour valoriser leurs données.

Bertrand
Kimba, tu es Data Engineer chez Decilia. Pourrais-tu nous présenter les principales missions de ton métier ?

Kimba
Les principales missions de mon métier : il s’agira d’abord de développer des pipelines, concevoir des architectures de données et d’intégrer des technologies très avancées comme l’IA.

Bertrand
On va revenir sur chacune de ces missions, si tu le veux bien. Développer des pipelines de données comme mission 1, qu’est-ce que ça veut dire ?

Kimba
Le développement des pipelines de données, c’est ce que l’on appelle l’ingénierie des données, le Data Engineering. Il s’agira de développer des flux d’extraction de données, de transformation et de stockage.

Bertrand
D’accord. Donc, ça veut dire que tu vas aller voir beaucoup de données et tu vas essayer de les structurer, qu’elles soient plus faciles à utiliser ?

Kimba
Plus ou moins. C’est-à-dire que dans les entreprises, on a énormément de sources. En conséquence, toutes ces sources-là, l’entreprise a besoin souvent de faire des analyses. Alors, on a besoin de regrouper toutes ces données dans un seul endroit. Pour ça, mon travail va consister à récupérer les données depuis toutes ces différentes sources et origines et les regrouper dans un seul endroit. Les nettoyer et les sécuriser, parce que c’est très important, et les mettre à disposition d’autres métiers comme les Data Analysts, les Data Scientists, etc…

Bertrand
D’accord. Donc, tu vas fournir la donnée pour qu’elle soit facilement utilisable. Le mot pipeline, que tu utilisais, ça ressemble un peu à ce que l’on dit pour le pétrole : on met toutes les données ensemble et on les envoie bien proprement quelque part ?

Kimba
Exactement, le pipeline ici, c’est exactement ça. C’est comme un tuyau que l’on mettrait en place. Puisqu’il y en a différentes étapes, les données qui viennent depuis la source et qui vont couler. Et, au fur et à mesure, on fait des transformations là-dessus. Jusqu’à un gros réservoir où on va les stocker, pour que l’on puisse les utiliser pour pouvoir répondre aux différentes problématiques de l’entreprise.

Bertrand
Ok, c’est extrêmement clair. Tu as dit en Mission 2 : concevoir l’architecture des plateformes de données, qu’est-ce que ça veut dire ?

Kimba
La conception d’architecture de plateformes de données va consister à mettre en place un ensemble d’outils, parce que dans l’entreprise, on a des producteurs de données et des consommateurs. Et tous ces consommateurs, parfois, n’ont pas les compétences techniques pour pouvoir aller chercher les données à la source. Donc, mon travail va consister à mettre une plateforme en place, avec un ensemble d’outils, en fonction des compétences de chaque consommateur de données. Pour qu’ils puissent venir se servir dans ces données et pouvoir répondre à des questions qui se posent.

Bertrand
Ok et en Mission 3, intégrer les technologies avancées. Là, on s’approche de l’IA, si je comprends bien ?

Kimba
C’est bien ça. Parce qu’en réalité, il ne s’agira pas simplement de travailler cette donnée, de la nettoyer, de la stocker. L’objectif, c’est de pouvoir en tirer de la valeur. Et pour tirer de la valeur aujourd’hui, l’une des technologies les plus intéressantes, c’est l’utilisation de l’IA. Donc, je vais aussi accompagner les Data Scientists et les Data Analytics pour déployer des modèles de Machine Learning qui vont pouvoir être utilisés pour enrichir cette donnée. Ça permet aussi à ces consommateurs d’avoir des données enrichies qui vont mieux répondre à des problématiques et les guider dans les prises de décisions.

Bertrand
Kimba, j’ai une question pour bien comprendre. Les données dont tu parles, ça peut être quoi ?

Kimba
Ces données sont très variées, mais en gros, c’est l’ensemble des informations produites par les entreprises. On peut avoir, par exemple, des données financières. Donc, ça peut être des factures, des e-mails. Ça peut être aussi des données qui proviennent des réseaux sociaux. Par exemple, l’entreprise qui a son compte LinkedIn, les commentaires qui y sont. Toutes ces données, qui peuvent être structurées et non structurées, sont utilisées, exploitées et analysées pour aider l’entreprise à planifier sa stratégie.

Bertrand
Kimba, tu as dit que tu travaillais avec beaucoup de métiers dans l’entreprise pour des gens qui vont utiliser ces données. Peux-tu nous expliquer quels types de métiers utilisent ces données ?

Bertrand
Alors, je travaille avec des Data Scientists ou des Data Analysts qui ont besoin de la donnée propre pour pouvoir effectuer les analyses. Et je dois mettre à leur disposition ces données propres. Mais aussi, je travaille avec des DevOps chargés du déploiement de l’infrastructure, de la maintenance de l’infrastructure. Tous les développements que je fais, ces DevOps vont, par exemple, pouvoir déployer et sécuriser ces plateformes de données.

Bertrand
Kimba, peux-tu nous dire pourquoi tu as choisi ce métier de Data Engineer ?

Kimba
Alors, ce choix, il vient plus de ma passion pour l’informatique, que j’ai eu très tôt.

Bertrand
Tout petit Déjà ?

Kimba
Oui, depuis la fin de l’école primaire, déjà, je m’étais intéressé à l’informatique. Donc, je bidouillais des choses. Après, je me suis intéressé au codage, au système, etc. Mais aussi, après le bac, j’ai plutôt effectué des études en économie. Et là aussi, ce passage m’a permis de comprendre l’analyse des données. Et là, ça a vraiment suscité une nouvelle passion pour les chiffres. Et le domaine qui concilie à la fois l’informatique et l’analyse des données, ça va être ce métier de Data Engineer. Il va consister à structurer l’information et à la rendre exploitable et pour qu’elle puisse avoir de l’impact dans la vie de tous les jours.

Bertrand
J’avais noté quand on avait préparé cette interview, « structurer et analyser ». C’est exactement ça ce que tu es en train de dire et c’est ça que tu aimes faire ?

Kimba
C’est ça. J’aime structurer en tout cas l’information et j’aime aussi analyser. La petite anecdote, lorsque j’ai commencé à suivre des cours d’économétrie, dans mon parcours d’économie. En gros, on récupérait des données dans des enquêtes sur le terrain et on faisait des analyses pour pouvoir expliquer des phénomènes. Pour moi, c’était presque de la magie de pouvoir expliquer un phénomène social à partir de données. J’ai vraiment voulu en savoir plus, mais comme j’étais aussi toujours attaché à ma passion en informatique, j’ai dit : Il faut que je trouve un domaine qui va pouvoir concilier les deux.

Bertrand
Mais c’est vrai qu’il y a un côté magique dans les données ?

Kimba
Exactement.

Bertrand
Pourrais-tu nous dire quelles sont les trois principales compétences qu’il faut pour faire ce job de Data Engineer ?

Kimba
Je pense qu’il faut avoir trois compétences clés. La toute première, ça va être des compétences en développement, donc en programmation, en code. Il faut également des compétences en Cloud Computing, tout ce qui est l’informatique dans le nuage. Et aussi, il faut avoir une culture DevOps pour pouvoir faciliter l’industrialisation.

Bertrand
Ok. Alors, si on revient sur la maîtrise du code et des outils que l’on appelle du Big Data, ça veut dire quoi exactement ?

Kimba
Ça va passer par l’apprentissage des langages comme le SQL, qui est un langage destiné à l’interrogation des bases de données. Mais aussi Python, qui est un langage aujourd’hui très utilisé dans la data, qui va nous permettre de pouvoir faire des analyses, de la manipulation des données. Mais également des outils comme Spark (ou Apache Spark), qui est vraiment très orienté Big Data, qui permet de pouvoir traiter de très grandes quantités de données et très rapidement, tout ça en temps réel. Donc, tout ça rassemblé, ça crée le socle de base pour un Data Engineer. Apprendre ces outils et pouvoir répondre aux besoins en entreprise.

Bertrand
Ce sont des outils qui permettent de traiter des millions de lignes de code. On n’est plus du tout dans un fichier Excel ? On est sur des très grosses bases de données ?

Kimba
Oui, là, on est avec de très grosses bases de données, où on va parler des milliards ou des millions de lignes que l’on doit quotidiennement intégrer. Parce que chaque jour, on produit de la donnée. On peut imaginer, par exemple, le cas de Facebook ou de LinkedIn. Où on publie chaque jour des posts. Et il y a des Data Engineers qui sont dans ces entreprises, qui vont par exemple récupérer ces données, les traiter, pour que LinkedIn puisse faire, par des recommandations, vous proposer des postes, etc…

Bertrand
Ok, je comprends bien. La deuxième compétence dont tu as parlé, c’est une expertise Cloud Computing. Qu’est-ce que ça veut dire aujourd’hui le cloud pour cette gestion de données massives ?

Kimba
Le cloud, si on veut traduire littéralement en français, c’est l’informatique dans le nuage. Mais rassurez-vous, ce n’est vraiment pas dans les nuages… C’est le fait de faire de la location de services informatiques via Internet. En gros, au lieu d’acheter des serveurs qui vont coûter des millions, on peut simplement louer ces ressources. De grosses entreprises, par exemple, Google, Amazon ou Microsoft, qui ont énormément de ressources, mettent à la disposition aux entreprises ces ressources-là, sous forme de location via Internet. Et c’est ce qui va constituer le cloud. Aujourd’hui, la plupart des entreprises vont privilégier ce genre de solution parce que ça réduit le coût d’investissement et le « time to market ». Imaginez que pour un projet, si on doit aller acheter des serveurs et faire de gros investissements dès le début. Parfois, on a des idées que l’on veut tester. Donc, préférable d’avoir de la location en payant uniquement ce que l’on consomme.

Bertrand
Et donc, ça veut dire qu’il faut une expertise cloud, il faut connaître les outils qui permettent de gérer le cloud ?

Kimba
Exactement, parce qu’aujourd’hui, il y a énormément de solutions. La plupart des solutions proposées par les Cloud Providers, les fournisseurs de services Cloud, comme Google Cloud Platform (GCP), Azure pour Microsoft et AWS pour Amazon.

Bertrand
Ok. il est important de maitriser cette expertise Cloud. Et la troisième compétence dont tu as parlé, c’est la compétence de DevOps. Ça aussi, ça vaut le coup de nous l’expliquer STP ?

Kimba
En gros, les DevOps vont permettre de faciliter le déploiement, l’industrialisation de tout ce que l’on fait. Imaginez que vous écrivez du code. Ce code, on doit les déployer dans différents environnements. Parce que l’on doit tester d’abord, après, on doit passer en production. Donc, la culture DevOps met à notre disposition un ensemble d’outils, par exemple, le CI/CD, (intégration et déploiement continu) qui vont nous permettre de suivre certaines règles et de faciliter ce déploiement. Ça permet de passer d’un environnement à un autre sans avoir à réécrire du code ou à tout de prendre.

Bertrand
Ok, c’est très clair, merci. Kimba, comme Data Engineer, quelle est la tâche quotidienne qui te plaît le plus et celle qui te plaît le moins ?

Kimba
Dans mes tâches quotidiennes, la tâche qui me plaît le plus, c’est la phase de conception architecturale, donc la phase où on va planifier et comment on va procéder. Et celle que je n’aime pas, mais qui reste quand même assez importante, ça reste la phase de documentation.

Bertrand
Documentation, ça veut dire bien écrire tout ce que l’on a fait, pour que cela soit disponible pour les autres. C’est ça l’idée ?

Kimba
C’est ça. L’idée, c’est d’écrire tout ce que l’on a fait, de documenter son travail pour aider les autres personnes qui doivent travailler dessus, pour que l’on puisse le comprendre, pour que cela perdure. Ce n’est pas la phase la plus intéressante, il y a beaucoup de documentation à faire. Je pense que ne pas être le seul. La plupart des développeurs, ils n’aiment pas cette tâche-là.

Kimba
Alors attention Kimba, QGP, la question Gagne-Pain. Combien ça gagne un Data Engineer ?

Kimba
Un Data Engineer, donc on va dire, à la sortie d’école, ça va dépendre aussi des écoles, il peut toucher entre 38 k euros brut annuel, et 45 k € bruts annuels. Donc, ça va dépendre des écoles, après, lorsque l’on a un peu plus d’expérience, quand on est un peu confirmé, il pourra aller jusqu’à 55k€ ou jusqu’à même 60k€. Lorsque l’on a d’autres compétences, par exemple au niveau de l’architecture, que l’on ajoute, ces montants peuvent monter très haut. Et pour les experts, les seniors, là, c’est plus de 70k€.

Kimba
D’accord, ça peut monter assez vite en fonction de l’expérience et des compétences ?

Kimba
Exactement.

Bertrand
Kimba, pourrais-tu nous parler d’un projet sur lequel tu as particulièrement aimé travailler ?

Kimba
Le projet que j’ai particulièrement aimé, c’est le projet Arsco, donc Analyse des Réseaux sociaux pour la lutte contre le Covid-19. Un projet pour le compte du gouvernement ivoirien, pour lutter contre le Covid. L’idée était de récupérer les réactions des utilisateurs sur les réseaux sociaux en temps réel. Sur des plateformes comme Twitter, Facebook, pour analyser les réactions, avec de l’analyse de sentiments, de l’analyse de thématiques pour que le gouvernement puisse évaluer l’impact des politiques dans la lutte contre le Covid. Par exemple, est-ce qu’il faut confiner ? Est-ce qu’il faut vacciner ? Etc.

Bertrand
Et donc la data avait un impact ?

Kimba
Effectivement, un impact réel et social en plus. Parce que là, on parlait de vie humaine et surtout l’économie en dépendait. Car lorsque l’on confine, ce sont des magasins, des entreprises qui sont fermées. Ce sont des gens qui ne vont pas pouvoir aller travailler et perdent des revenus. Pour pouvoir calibrer tout ça, pour que l’on puisse prendre les mesures adéquates, franchement, je pense que l’impact était vraiment réel.

Bertrand
Excellent, merci c’est très clair. J’ai une question à propos de l’anglais. Est-ce que la maitrise de l’anglais est importante pour le métier de Data Engineer ?

Kimba
Oui, l’anglais est extrêmement important dans ce métier. Parce, peut-être que nos auditeurs l’auront remarqué, il y a énormément de termes qui sont déjà en anglais. Et la plupart des documentations sont rédigées en anglais. Parce que les entreprises de ce domaine comme Google, Microsoft ou Amazon sont toutes américaines. Donc, la plupart des contenus sont en anglais. On en trouve un peu en français, mais il est important de savoir que les meilleurs contenus sont en anglais. Mais il n’y a pas que ça. En tant que Data Engineer, on est souvent amené à travailler dans le contexte international. Et donc là, une fois que l’on est dans le contexte international, la langue la plus utilisée, ça reste l’anglais et ça permet de vraiment faire décoller la carrière au niveau international.

Bertrand
Ok, c’est très clair. Pourrais-tu également nous indiquer quelles sont les bonnes formations pour faire ce métier ?

Kimba
Au niveau des formations, c’est assez varié quand même aujourd’hui. Ce n’était pas le cas il y a quelques années. Aujourd’hui, on va trouver de très bons masters dans les universités publiques. On va trouver des très bons masters qui vont former dans le domaine de l’ingénierie de la data. Mais aussi, on va trouver dans les écoles d’ingénieurs. Là aussi, on trouve des très bonnes formations qui vont même ajouter des couches managériales. Il est important d’avoir une vision business pour avoir de l’impact sur le chiffre d’affaires de l’entreprise.

Bertrand
Merci Kimba. Ensuite, toi, continues-tu à te former ?

Kimba
Oui, évidemment, je continue à me former régulièrement parce que ce domaine évolue très vite. Par exemple, je vais être abonné à des chaînes YouTube, comme Guy in a Cube ou Stephane Maarek, qui font de très belles formations. Aussi, on a beaucoup de ressources chez Microsoft, Google ou Amazon. Donc, je me forme régulièrement avec tout ça.

Bertrand
Est-ce qu’il y a des certifications professionnelles utiles pour ton métier ?

Kimba
Oui, il y a énormément de certifications dans ce domaine. Généralement, chez les fournisseurs de services, comme Microsoft. Mais aussi chez Databricks, qui est une plateforme très importante dans le domaine de Data Engineering, avec la Databricks Academy. Et on trouvera des équivalents chez Google et Amazon.

Bertrand
Est-ce qu’il y a un mode de vie spécifique dans le métier de Data Engineer ? On pose cette question, notamment depuis le COVID, le télétravail, l’organisation de la journée, à quelle heure on démarre. Ce sont des questions pratiques, mais toujours utiles pour ceux qui nous écoutent ?

Kimba
Effectivement, au niveau du temps de travail, ça va être quand même assez classique, comme tout le monde, on va dire 9 à 18 heures. Mais, dans mon métier, je fais beaucoup de télétravail. On travaille habituellement sur des plateformes en ligne. Par conséquent, il est très fréquent que l’on fasse du télétravail.

Bertrand
C’est facile de télétravailler, mais il faut quand même avoir une bonne connexion pour travailler sur le cloud, non ?

Kimba
Effectivement. Aujourd’hui, toutefois, ce n’est plus un problème avec la fibre optique. Mais il est important d’avoir une très bonne connexion parce que l’on a tout de même de grosses plateformes…

Bertrand
Oui, il y a également des grosses bases de données ?

Kimba
Effectivement, on fait beaucoup de télétravail, néanmoins, parfois, en présentiel, car il faut rencontrer des clients pour comprendre leurs besoins, etc.. Donc, il ne faut pas tout le temps rester peut-être derrière son écran chez soi, et parfois, il faut rencontrer aussi des collègues pour échanger, pour discuter…

Bertrand
Tu fais combien de jours de télétravail actuellement ?

Kimba
Moi, je fais trois jours de télétravail par semaine.

Bertrand
Ok, trois jours de télétravail. Et la question qui se pose aussi, c’est souvent Paris-Provence. Les entreprises qui t’embauchent sont généralement basées à Paris ?

Kimba
Oui, dans mon cas, c’est plutôt Paris. En province, on va en trouver aussi. Mais, la plupart du temps, ce métier se fait au siège de la grande entreprise.

Bertrand
Ouais, bien sûr, le siège des grandes entreprises, c’est fréquemment à Paris. Est-ce qu’il y a une différence entre le métier que tu fais et celui que tu imaginais avant de le faire ?

Kimba
Oui, j’ai trouvé une différence parce que quand j’étais encore à l’école, je me disais que dans ce métier de Data Engineer, je passerais peut-être à 80% du temps en train de faire du code. Mais, arrivé en entreprise, on s’aperçoit que la réalité, elle est tout autre. Parce que l’on ne va pas passer son temps qu’à coder. Car il faut échanger aussi avec les gens pour pouvoir comprendre leurs besoins. Il faut planifier, il faut aussi organiser tout ça. Il y a beaucoup de management, finalement, on ne fait pas que du code.

Bertrand
D’accord, ce n’est pas 80% de code comme tu l’imaginais ?

Kimba
Oui, ce n’est pas ça.

Bertrand
Kimba, Quels seraient tes conseils pour ceux qui nous écoutent et qui souhaiteraient se lancer dans le métier ?

Kimba
Mes conseils, c’est d’abord d’apprendre les fondamentaux, c’est-à-dire le code, la programmation. Ensuite, spécialisez-vous dans le Cloud Computing, parce qu’aujourd’hui, c’est extrêmement important dans le métier. Enfin, pensez à l’architecture, car c’est l’évolution naturelle de ce métier.

Bertrand
Ok. Pourrais-tu également nous dire comment tu vois ton métier de Data Engineer dans 10 ans ?

Kimba
Dans 10 ans, je pense que le métier va beaucoup évoluer, notamment avec la montée en puissance de l’intelligence artificielle. Il va falloir s’adapter à cette évolution. Par exemple, aller comprendre de nouveaux concepts qui viennent, comme par exemple, le MLOps, qui va consister à déployer les modèles de Machine Learning, des plateformes de d’IA. En tant que Data Engineer, naturellement, on va évoluer vers ça, plus d’industrialisation et d’automatisation.

Bertrand
Merci beaucoup, Kimba. En conclusion, que souhaiterais-tu ajouter à ceux qui nous écoutent ?

Kimba
Pour tous ceux qui s’intéressent à ce métier, je leur demande de se lancer. Ce métier présente énormément d’opportunités de recrutement et ça paye quand même assez bien par rapport au marché. Donc, n’hésitez pas, lancez-vous. Et surtout, quand vous décidez de vous lancer, pratiquez. Parce qu’il n’y a pas de magie. Donc, pratiquez. Quand on a pratiqué un outil, on peut le maîtriser.

Bertrand
D’accord, mettre les mains dans le code. C’est ça que tu avais dit quand on a préparé l’interview et c’est exactement ce que ça veut dire ?

Kimba
Exactement, mettre les mains dans le code, ne pas hésiter. Et surtout, j’insiste sur cette citation d’un auteur que j’aime bien : n’allons pas là où il y a un chemin, mais allons là où il n’y a pas de chemin pour laisser des traces. Donc, ne pensez pas forcément à avoir des parcours linéaires. Le mien, ne l’était pas. N’hésitez pas et si vous aimez, foncez !

Bertrand
Excellent. Kimba, pour ceux qui ont aimé cet échange et cette discussion avec toi et qui voudraient la prolonger ou de poser des questions, comment ils peuvent faire ?

Kimba
Moi, je suis tout le temps sur LinkedIn, donc ils peuvent me contacter sur mon compte LinkedIn. Cela sera toujours un plaisir d’échanger par rapport à ce métier.

Bertrand
Ok Kimba, merci beaucoup.

Kimba
Merci Bertrand.

Laisser un commentaire