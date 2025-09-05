Des initiatives sont en cours en Afrique du Sud, au Kenya et au Nigeria pour créer plus d’outils d’IA en langues africaines. Des chercheurs ont déjà enregistré plus de 9 000 heures de discours local afin d’élargir l’accès à cette technologie révolutionnaire sur le continent.

Alors que l’utilisation des modèles de langage basés sur l’intelligence artificielle (IA) explose, avec de nombreux sites web alimentés par l’IA intégrés dans la vie quotidienne, certains en Afrique craignent que leurs populations soient exclues des logiciels principalement occidentalisés.

Malgré la richesse linguistique de l’Afrique, où plus d’un quart des langues mondiales seraient présentes selon certaines estimations, cette diversité est encore peu représentée dans le développement de l’IA.

La principale raison ? un manque d’investissement et de données accessibles. La majorité des outils d’IA, comme ChatGPT, sont entraînés sur des textes en anglais ou dans d’autres langues européennes et chinoises, qui disposent d’immenses bases de données en ligne.

Or, de nombreuses langues africaines, principalement orales, ne disposent pas de suffisamment de textes écrits pour alimenter l’apprentissage automatique, ce qui limite leur intégration dans ces technologies. Résultat : des millions de personnes sont laissées de côté.

Une avancée majeure : un jeu de données unique

Les chercheurs ont récemment publié ce qui serait le plus grand ensemble de données linguistiques pour les langues africaines. « Nous pensons en nos langues, rêvons en elles et interprétons le monde à travers elles. Si la technologie ne reflète pas cette réalité, une partie de la population sera laissée pour compte », explique le professeur Vukosi Marivate de l’Université de Pretoria, qui a pris part au projet.

L’initiative « African Next Voices » a rassemblé linguistes et informaticiens pour créer des jeux de données adaptés à l’IA dans 18 langues africaines. Bien que cela ne couvre qu’une fraction des plus de 2 000 langues parlées sur le continent, les participants espèrent étendre cette base dans le futur.

En deux ans, ils ont enregistré 9 000 heures de discours dans des contextes quotidiens liés à l’agriculture, à la santé et à l’éducation, à Kenya, au Nigeria, et en Afrique du Sud. Parmi les langues enregistrées figurent le kikuyu et le dholuo au Kenya, le haoussa et le yoruba au Nigeria, ainsi que l’isiZulu et le tshivenda en Afrique du Sud.

« Il faut une base de départ. C’est ce que fait African Next Voices. Ensuite, d’autres pourront construire dessus et innover », précise le professeur Marivate. La collecte a été rendue possible grâce à une bourse de 2,2 millions de dollars de la Fondation Gates. Les données seront en accès libre pour permettre aux développeurs de créer des outils de traduction, de transcription ou d’interaction en langues africaines.

Des innovations concrètes

Plusieurs exemples illustrent déjà l’impact potentiel de ces technologies. À Rustenburg, en Afrique du Sud, la fermière Kelebogile Mosime utilise une application appelée AI-Farmer. Elle reconnaît plusieurs langues locales, comme le sotho, l’isiZulu et l’afrikaans, pour lui venir en aide dans ses tâches agricoles.

« En tant que cultivatrice débutante, je fais face à beaucoup de défis », explique-t-elle. « Grâce à cette application, je peux poser des questions en Setswana, ma langue maternelle, et obtenir des réponses utiles. C’est précieux pour moi, surtout en zone rurale où l’accès à la technologie est limité. »

Une autre startup sud-africaine, Lelapa AI, conçoit des outils en langues africaines destinés à des banques et des télécoms. Sa PDG, Pelonomi Moiloa, déplore que les options actuelles soient très restreintes. « L’anglais est la langue de l’opportunité. Pour beaucoup, ne pas le parler peut signifier manquer des services essentiels comme la santé, la banque ou l’aide gouvernementale. On veut changer cela », affirme-t-elle.

Selon le professeur Marivate, ces initiatives ne relèvent pas seulement d’un enjeu économique ou pratique, mais touchent aussi à la justice sociale. Sans un effort concerté en faveur des langues locales, certains craignent que des inégalités linguistiques ne s’accentuent, laissant derrière eux une partie importante de la population africaine face aux évolutions numériques.