Envie d?un nouveau challenge... CELAD vous attend !
Nous poursuivons notre développement et recherchons actuellement un(e) Ingénieur Data Scientist pour intervenir chez un de nos clients.
Contexte : Intégré(e) à une équipe de R&D spécialisée dans les systèmes de communication sans fil et le traitement du langage naturel, vous aurez pour rôle de collecter et structurer des datasets nécessaires à l?entraînement de grands modèles de langage (LLM), dans le but de modéliser les performances des différentes couches des standards et technologies.
Vos principales missions :
La mission s?articule en trois lots :
· Lot 1 : Collection et Organisation des Documents
- Collecter automatiquement des données issues des standards, des datasheets et des données terrain en utilisant des scripts Python.
· Lot 2 : Packaging et Segmentation des Données
- Préparer et segmenter les données en « input » et « label » en fonction des tâches définies.
· Lot 3 : Structuration des Datasets pour LLM
- Mettre en forme les données dans un dictionnaire Python au format adapté pour l?entraînement du LLM.
Profil candidat:
Votre Profil & l?Environnement technique dans lequel vous évoluerez :
- Formation d?ingénieur avec spécialisation en Data Science
- Maîtrise de Python
- Bonnes connaissances des librairies standards liées au Deep Learning (PyTorch, TensorFlow, etc.) et en gestion des datasets (Pandas, NumPy).
Infos à noter :
- Expérience de 4/5 ans minimum sur un poste similaire
- Possibilité de télétravail (nombre de jours à fixer)
- Type de contrat : Freelance ? Portage Salarial
Go to job list