Aller au contenu
Tech||2 sources

Des chercheurs chinois lancent Habibi, premier modèle d'IA unifiant 20 dialectes arabes

Des chercheurs de l'université Shanghai Jiao Tong ont lancé Habibi, premier modèle TTS open-source unifiant plus de 20 dialectes arabes. Ce système zero-shot clone les voix à partir d'un court audio et pourrait booster l'influence chinoise en IA au Moyen-Orient.
Shanghai Jiao Tong University et son laboratoire X-LANCE, dirigé par Chen Yushen, ont publié Habibi, le premier modèle open-source de synthèse vocale (TTS, text-to-speech) unifiant plus de 20 dialectes arabes dans un cadre d'intelligence artificielle. Ce projet, présenté dans un article paru le mois dernier sur arXiv, marque une avancée pour la région où les dialectes arabes, du maghrébin au levantin, varient fortement, rendant les modèles linguistiques standards inefficaces. Les auteurs affirment qu'aucune recherche antérieure n'avait développé un tel cadre open-source. Cette initiative s'inscrit dans l'expansion chinoise des technologies d'IA au Moyen-Orient, où Pékin renforce ses liens via des initiatives comme la Nouvelle route de la soie numérique. Les dialectes arabes, parlés par plus de 400 millions de personnes, posent des défis aux systèmes TTS en raison de leur diversité phonétique et lexicale, contrairement aux modèles monolingues comme ceux pour l'anglais ou le mandarin. Habibi comble ce vide en permettant une synthèse vocale unifiée, adaptable à des contextes multirégionaux. Le modèle possède une capacité « zero-shot », c'est-à-dire qu'il clone une voix à partir d'un simple extrait audio court, sans entraînement préalable intensif. Cela ouvre des applications en temps réel, comme les assistants vocaux ou les outils d'accessibilité pour les locuteurs arabes. « À notre connaissance, la recherche sur la synthèse vocale arabe dialectale unifiée est absente, sans parler d'un cadre open-source », écrivent les chercheurs dans leur papier Habibi : Laying the Open-Source Foundation of Unified-Dialectal Arabic Speech Synthesis. Les prochaines étapes pourraient inclure des intégrations dans des appareils mobiles ou des services publics au Moyen-Orient, où la demande pour des IA localisées croît rapidement.

2 sources

Article enrichi par l'IA

Cet article a été enrichi avec du contexte additionnel provenant des connaissances de l'IA (historique, comparaisons, données techniques). Les sources éditoriales restent la base factuelle.

Meet Habibi – the Chinese AI uniting 20 Arabic dialects in a Middle East first

Source éditoriale·South China Morning Post·28 févr. 2026

Contexte ajouté : diversité des dialectes arabes, défis TTS multilingues, initiatives chinoises en IA au Moyen-Orient

Contexte IA

Restez informé avec Morni

Créez un compte gratuit pour accéder aux articles complets, aux flux personnalisés et aux résumés générés par IA.