Resume and JobRESUME AND JOB
Thales logo

STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois

Thales

Software and Technology Jobs

STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois

internshipPosted: Jan 7, 2026

Job Description

JOB DESCRIPTION
Lieu : Palaiseau, France

Construisons ensemble un avenir de confiance

Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l’environnement et plus inclusif. Le Groupe investit près de 4 milliards d’euros par an en Recherche & Développement, notamment dans des domaines clés de l’innovation tels que l’IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays.

Nos engagements, vos avantages

  • Notre savoir-faire technologique

  • Notre attention portée à l’équilibre des collaborateurs

  • Un environnement inclusif et bienveillant

  • Un engagement sociétal et environnemental reconnu (Thales Solidarity, indice CAC 40 ESG…)

Votre quotidien

Thales Research&Technology, notre centre de recherche dans les domaines matériels, et CortAIx Labs, notre centre de recherche en IA et digital ont pour mission de proposer des innovations de ruptures, de maintenir et d’accroitre l’avance technologique et d’en assurer la compétitivité pour le groupe.

En intégrant CortAIx Labs, vous contribuerez au développement d’une solution combinant des approches d’intelligence artificielle et des approches de traitement du signal et de la vision par ordinateur pour la reconnaissance de locuteur et la classification des émotions.

Avec l’essor des modèles multimodaux récents, il devient possible de combiner efficacement des signaux hétérogènes tels que la voix et l’image pour renforcer la robustesse des systèmes d’intelligence artificielle. Les approches unimodales classiques en reconnaissance vocale ou faciale atteignent leurs limites, en particulier dans des environnements bruités.

Vous aurez pour objectif de développer et d’évaluer des méthodes de deep learning multimodales exploitant simultanément l’audio et la vidéo du dataset SpeakingFaces, y compris dans des conditions bruitées. Ces travaux auront des applications directes dans la sécurité biométrique, l’interaction homme–machine et les assistants vocaux intelligents.

Dans ce contexte, vous aurez pour missions :

  • État de l’art des méthodes multimodales audio–vidéo (reconnaissance de locuteur, analyse d’émotions, fusion multimodale) et des approches de robustesse au bruit.

  • Identification des architectures et modèles open-source les plus pertinents pour le dataset SpeakingFaces et notre cas d’usage.

  • Implémentation et adaptation des modèles présélectionnés, avec une attention particulière au prétraitement audio–vidéo et aux techniques de réduction de bruit.

  • Évaluation des performances en conditions normales et bruitées, selon plusieurs métriques (taux de reconnaissance, précision émotionnelle, robustesse).

  • Mise en place d’un démonstrateur

Votre profil

STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois

Vous avez envie de découvrir le domaine de la recherche ?

Vous avez pour ambition de réaliser votre stage au sein de Thales ?

Etudiant en M2, en Ecole d’ingénieur ou formation équivalente, vous avez des connaissances en :

  • Python

  • Intelligence Artificielle ;

  • Traitement du signal ;

  • Vision par Ordinateur

  • Anglais (niveau B2-C1 attendu)

Rigueur, autonomie et goût pour l’expérimentation sont des atouts que l'on vous reconnait ? Alors ce stage est fait pour vous !

Tous nos stages sont conventionnés et soumis à une gratification dont le montant est déterminé selon votre niveau d’études.

Thales, entreprise Handi-Engagée, reconnait tous les talents. La diversité est notre meilleur atout. Postulez et rejoignez nous !

Locations

  • Palaiseau, Essonne, Essonne 91767

Salary

Estimated Salary Rangemedium confidence

1,400 - 1,700 EUR / yearly

Source: ai estimated

* This is an estimated range based on market data and may vary based on experience and qualifications.

Skills Required

  • Pythonintermediate
  • Intelligence Artificielleintermediate
  • Deep Learningintermediate
  • Traitement du signalintermediate
  • Vision par Ordinateurintermediate
  • Reconnaissance vocaleintermediate
  • Analyse facialeintermediate
  • Fusion multimodaleintermediate
  • Réduction de bruitintermediate
  • Évaluation de performancesintermediate
  • Anglais B2-C1intermediate
  • Rigueurintermediate
  • Autonomieintermediate
  • Expérimentationintermediate

Required Qualifications

  • Étudiant en M2 (experience)
  • École d’ingénieur ou formation équivalente (experience)
  • Connaissances en Python (experience)
  • Connaissances en Intelligence Artificielle (experience)
  • Connaissances en Traitement du signal (experience)
  • Connaissances en Vision par Ordinateur (experience)
  • Anglais niveau B2-C1 (experience)

Preferred Qualifications

  • Rigueur (experience)
  • Autonomie (experience)
  • Goût pour l’expérimentation (experience)

Responsibilities

  • État de l’art des méthodes multimodales audio–vidéo (reconnaissance de locuteur, analyse d’émotions, fusion multimodale) et des approches de robustesse au bruit
  • Identification des architectures et modèles open-source les plus pertinents pour le dataset SpeakingFaces
  • Implémentation et adaptation des modèles présélectionnés, avec prétraitement audio–vidéo et réduction de bruit
  • Évaluation des performances en conditions normales et bruitées selon plusieurs métriques
  • Mise en place d’un démonstrateur

Benefits

  • general: Environnement inclusif et bienveillant
  • general: Engagement sociétal et environnemental reconnu (Thales Solidarity, indice CAC 40 ESG)
  • general: Attention à l’équilibre des collaborateurs
  • general: Gratification selon niveau d’études
  • general: Stage conventionné

Target Your Resume for "STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois" , Thales

Get personalized recommendations to optimize your resume specifically for STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois. Takes only 15 seconds!

AI-powered keyword optimization
Skills matching & gap analysis
Experience alignment suggestions

Check Your ATS Score for "STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois" , Thales

Find out how well your resume matches this job's requirements. Get comprehensive analysis including ATS compatibility, keyword matching, skill gaps, and personalized recommendations.

ATS compatibility check
Keyword optimization analysis
Skill matching & gap identification
Format & readability score

Tags & Categories

DefenseAerospaceCybersecurityDefenseAerospaceTechnology

Answer 10 quick questions to check your fit for STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois @ Thales.

Quiz Challenge
10 Questions
~2 Minutes
Instant Score

Related Books and Jobs

No related jobs found at the moment.

Thales logo

STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois

Thales

Software and Technology Jobs

STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois

internshipPosted: Jan 7, 2026

Job Description

JOB DESCRIPTION
Lieu : Palaiseau, France

Construisons ensemble un avenir de confiance

Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l’environnement et plus inclusif. Le Groupe investit près de 4 milliards d’euros par an en Recherche & Développement, notamment dans des domaines clés de l’innovation tels que l’IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays.

Nos engagements, vos avantages

  • Notre savoir-faire technologique

  • Notre attention portée à l’équilibre des collaborateurs

  • Un environnement inclusif et bienveillant

  • Un engagement sociétal et environnemental reconnu (Thales Solidarity, indice CAC 40 ESG…)

Votre quotidien

Thales Research&Technology, notre centre de recherche dans les domaines matériels, et CortAIx Labs, notre centre de recherche en IA et digital ont pour mission de proposer des innovations de ruptures, de maintenir et d’accroitre l’avance technologique et d’en assurer la compétitivité pour le groupe.

En intégrant CortAIx Labs, vous contribuerez au développement d’une solution combinant des approches d’intelligence artificielle et des approches de traitement du signal et de la vision par ordinateur pour la reconnaissance de locuteur et la classification des émotions.

Avec l’essor des modèles multimodaux récents, il devient possible de combiner efficacement des signaux hétérogènes tels que la voix et l’image pour renforcer la robustesse des systèmes d’intelligence artificielle. Les approches unimodales classiques en reconnaissance vocale ou faciale atteignent leurs limites, en particulier dans des environnements bruités.

Vous aurez pour objectif de développer et d’évaluer des méthodes de deep learning multimodales exploitant simultanément l’audio et la vidéo du dataset SpeakingFaces, y compris dans des conditions bruitées. Ces travaux auront des applications directes dans la sécurité biométrique, l’interaction homme–machine et les assistants vocaux intelligents.

Dans ce contexte, vous aurez pour missions :

  • État de l’art des méthodes multimodales audio–vidéo (reconnaissance de locuteur, analyse d’émotions, fusion multimodale) et des approches de robustesse au bruit.

  • Identification des architectures et modèles open-source les plus pertinents pour le dataset SpeakingFaces et notre cas d’usage.

  • Implémentation et adaptation des modèles présélectionnés, avec une attention particulière au prétraitement audio–vidéo et aux techniques de réduction de bruit.

  • Évaluation des performances en conditions normales et bruitées, selon plusieurs métriques (taux de reconnaissance, précision émotionnelle, robustesse).

  • Mise en place d’un démonstrateur

Votre profil

STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois

Vous avez envie de découvrir le domaine de la recherche ?

Vous avez pour ambition de réaliser votre stage au sein de Thales ?

Etudiant en M2, en Ecole d’ingénieur ou formation équivalente, vous avez des connaissances en :

  • Python

  • Intelligence Artificielle ;

  • Traitement du signal ;

  • Vision par Ordinateur

  • Anglais (niveau B2-C1 attendu)

Rigueur, autonomie et goût pour l’expérimentation sont des atouts que l'on vous reconnait ? Alors ce stage est fait pour vous !

Tous nos stages sont conventionnés et soumis à une gratification dont le montant est déterminé selon votre niveau d’études.

Thales, entreprise Handi-Engagée, reconnait tous les talents. La diversité est notre meilleur atout. Postulez et rejoignez nous !

Locations

  • Palaiseau, Essonne, Essonne 91767

Salary

Estimated Salary Rangemedium confidence

1,400 - 1,700 EUR / yearly

Source: ai estimated

* This is an estimated range based on market data and may vary based on experience and qualifications.

Skills Required

  • Pythonintermediate
  • Intelligence Artificielleintermediate
  • Deep Learningintermediate
  • Traitement du signalintermediate
  • Vision par Ordinateurintermediate
  • Reconnaissance vocaleintermediate
  • Analyse facialeintermediate
  • Fusion multimodaleintermediate
  • Réduction de bruitintermediate
  • Évaluation de performancesintermediate
  • Anglais B2-C1intermediate
  • Rigueurintermediate
  • Autonomieintermediate
  • Expérimentationintermediate

Required Qualifications

  • Étudiant en M2 (experience)
  • École d’ingénieur ou formation équivalente (experience)
  • Connaissances en Python (experience)
  • Connaissances en Intelligence Artificielle (experience)
  • Connaissances en Traitement du signal (experience)
  • Connaissances en Vision par Ordinateur (experience)
  • Anglais niveau B2-C1 (experience)

Preferred Qualifications

  • Rigueur (experience)
  • Autonomie (experience)
  • Goût pour l’expérimentation (experience)

Responsibilities

  • État de l’art des méthodes multimodales audio–vidéo (reconnaissance de locuteur, analyse d’émotions, fusion multimodale) et des approches de robustesse au bruit
  • Identification des architectures et modèles open-source les plus pertinents pour le dataset SpeakingFaces
  • Implémentation et adaptation des modèles présélectionnés, avec prétraitement audio–vidéo et réduction de bruit
  • Évaluation des performances en conditions normales et bruitées selon plusieurs métriques
  • Mise en place d’un démonstrateur

Benefits

  • general: Environnement inclusif et bienveillant
  • general: Engagement sociétal et environnemental reconnu (Thales Solidarity, indice CAC 40 ESG)
  • general: Attention à l’équilibre des collaborateurs
  • general: Gratification selon niveau d’études
  • general: Stage conventionné

Target Your Resume for "STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois" , Thales

Get personalized recommendations to optimize your resume specifically for STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois. Takes only 15 seconds!

AI-powered keyword optimization
Skills matching & gap analysis
Experience alignment suggestions

Check Your ATS Score for "STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois" , Thales

Find out how well your resume matches this job's requirements. Get comprehensive analysis including ATS compatibility, keyword matching, skill gaps, and personalized recommendations.

ATS compatibility check
Keyword optimization analysis
Skill matching & gap identification
Format & readability score

Tags & Categories

DefenseAerospaceCybersecurityDefenseAerospaceTechnology

Answer 10 quick questions to check your fit for STAGE – Ingénieur en apprentissage multimodal pour la reconnaissance vocale et l’analyse faciale (H/F) – 6 mois @ Thales.

Quiz Challenge
10 Questions
~2 Minutes
Instant Score

Related Books and Jobs

No related jobs found at the moment.