J'ai créé un logiciel qui facilite l'apprentissage de la lecture en français! :) Votez pour moi dans le cadre de ce concours (http://www.reseauiq.qc.ca/blogue/?p=97) pour m'aider à le rendre disponible à tous!
Plus d'infos:
1) Présentation au jury pour ma maîtrise en génie, ÉTS 2015. Mention d'excellence reçue du jury.
2)Site web du logiciel conçu: http://patricktremblay.ca/sPhone/
3) Titre de mon mémoire: "CONCEPTION ET RÉALISATION D’UN LOGICIEL DE SOUTIEN PHONÉTIQUE AUTOMATISÉ ET DÉGRESSIF POUR LES PERSONNES DYSLEXIQUES, ALLOPHONES OU PRÉSENTANT DES INCAPACITÉS INTELLECTUELLES".
2. Mémoire
CONCEPTION ET RÉALISATION D’UN LOGICIEL DE SOUTIEN PHONÉTIQUE
AUTOMATISÉ ET DÉGRESSIF POUR LES PERSONNES DYSLEXIQUES, ALLOPHONES OU
PRÉSENTANT DES INCAPACITÉS INTELLECTUELLES
2
3. Agenda
Présentations
Contexte et définitions
Objectifs
Méthodologie et démarche empirique
Démarche de conception du logiciel
Résultats
Conclusion
Recommandations
Discussions
3
4. Agenda
Présentations
Contexte et définitions
Objectifs
Méthodologie et démarche empirique
Démarche de conception du logiciel
Résultats
Conclusion
Recommandations
Discussions
4
5. Présentations
Collaboration interdisciplinaire ingénierie-éducation
ÉTS:
Pierre Bourque, Doyen des études
Décanat des études
Université de Montréal:
Jacques Langevin,
M.A. sciences de l’éducation (orthopédagogie) (Montréal)
Doctorat en psychologie (Paris-Vincennes)
Coresponsable du Groupe DÉFI Apprentissage (GDA), Université de Montréal, Faculté des sciences de
l’éducation.
Accessibilité universelle et cognitive:
« Le GDA mène depuis 30 ans des recherches en éducation des élèves qui ont des incapacités intellectuelles »
(GDA, 2015).
Patrick Tremblay
Baccalauréat, génie logiciel (ÉTS, 2006)
Ingénieur chez CAE (2006 à aujourd’hui)
5
6. Agenda
Présentations
Contexte et définitions
Objectifs
Méthodologie et démarche empirique
Démarche de conception du logiciel
Résultats
Conclusion
Recommandations
Discussions
6
7. Contexte
50% de la population canadienne n’atteint pas
le 3e niveau de littératie (Langevin, 2014).
« À leur arrivée au Québec, près de la moitié
(43 %) des immigrants ne connaissent pas un
mot de français. » (Ministre de l'Immigration,
Kathleen Weil, 2015).
7
8. Contexte
En français, l'association des graphèmes aux
phonèmes est complexe et instable,
contrairement à l’italien ou au latin, où les
correspondances entre l’oral et l’écrit sont
biunivoques.
Tout ce qui est écrit ne se prononce pas
toujours. Ex.: « handicap », « faire ».
Les liaisons phonétiques entre les mots,
prononcées à l’oral, ne sont pas écrites. Ex.:
« les amis » vs « lê z’ami ».
8
9. Définitions
Graphème: « la plus petite unité de la chaîne écrite ». (Catach, 2009)
Mot « Pourchasser » : « p, ou, r, ch, a, ss, er »
Est dit complexe s’il est composé de plus d’une lettre (ex. : « eau », « eault »)
Archigraphème : « graphème représentant d’un ensemble de graphèmes correspondant au même
phonème (ex. O pour o, ô, au, eau, etc.). » (Catach, 2009)
Phonème: « la plus petite unité de la chaîne orale, le son. Ex. : s, o, c dans soc », (Catach, 2009)
SPh: soutien phonétique:
Ajout d’archigraphèmes au-dessus des graphèmes complexes
Notation des voyelles et de leur soutien phonétique en rouge
Notation des liaisons phonétiques entre les mots
Estompage des lettres muettes en gris
Dégressif: retrait du soutien phonétique en fonction du progrès du lecteur
9
10. Contexte
À propos de l’instabilité:
En acceptant les erreurs grammaticales,
combien y a-t-il de façons d’assembler
des graphèmes, afin d’entendre le mot
« auto » ?
Présentation du Powerpoint « oto ».
Langevin (2011), Madeleine Fauteux (2003)
10
11. Contexte
Comment réduire la complexité de l’activité de
lecture du français ?
1. Texte simplifié (TS), (Duquette, Rocque, Langevin, &
Beaulieu, à paraître)
2. Ortograf altêrnativ (OA), (Langevin et al., 2009).
3. Soutien phonétique (Sph), (Langevin et al., 2009).
4. Version sonore (VS), (Rocque, Rioux et Langevin, 2012;
Gravel, 2014).
11
12. Contexte
Soutien phonétique (SPh): réduction de
l’instabilité de l’écriture du français.
Conceptrice: Dominique Rolland, enseignante
(France).
Découverte du guide phonétique de Word:
possibilité d’insérer archigraphèmes au-dessus
des graphèmes complexes.
Mme Rolland a observé plusieurs bénéfices chez
ses étudiants.
Mais les coûts (temps) d’utilisation sont élevés.
Graphème sélectionné
Archigraphème à être superposé
12
14. Contexte
Problème: le GDA aimerait produire des manuels
scolaires adaptés avec le Sph, mais le coût est
trop élevé: ~416 heures/manuel
~15 minutes par page (Beaulieu, 2012)
14
15. Agenda
Présentations
Contexte et définitions
Objectifs
Méthodologie et démarche empirique
Démarche de conception du logiciel
Résultats
Conclusion
Recommandations
Discussions
15
16. Objectifs
1. Concevoir et réaliser un logiciel qui ajoute le
soutien phonétique aux documents
francophones, de format Word, avec un taux
d’erreur inférieur à 10%.
2. Rendre l’ajout de soutien phonétique
dégressif et personnalisé pour chaque
apprenant.
16
17. Objectifs – Limites et hypothèses
Limites :
L1 : Le texte est rédigé avec la langue française.
L2 : Le logiciel proposé ajouterait le soutien phonétique aux textes dans le logiciel Word, de
Microsoft, conjointement au système d’exploitation Windows. Les autres systèmes d’exploitation
sont exclus.
L3 : Le texte, candidat au SPh, est préalablement simplifié.
L4 : Le rôle de l’apprenant est de lire le texte produit en extrant par le logiciel, mais il n’est pas
l’utilisateur du logiciel, ni destiné à le configurer.
17
18. Objectifs – Limites et hypothèses
Hypothèses :
H1 : Un logiciel, moteur de génération de soutien phonétique, serait en mesure d’automatiser le
traitement manuel que font les chercheurs du GDA de l’UdM pour ajouter le soutien phonétique et
pour estomper les lettres muettes.
H2 : Le taux d’erreur qu’effectuerait le logiciel, en ajoutant le soutien phonétique, serait inférieur à
10%.
H3 : Le logiciel permettrait de tenir un dossier, pour chaque étudiant, afin d’adapter les règles
appliquées en fonction de ses apprentissages. Il s’agit de l’aspect dégressif de l’ajout du soutien
phonétique.
18
19. Agenda
Présentations
Contexte et définitions
Objectifs
Méthodologie et démarche empirique
Démarche de conception du logiciel
Résultats
Conclusion
Recommandations
Discussions
19
20. Méthodologie et démarche empirique
1. Conception et réalisation du logiciel (Sphone)
Feature-Driven Development; méthodologie « Agile »
2. Optimisation du logiciel
Corpus de 10 textes d’entraînement – tirés du manuel scolaire Signet (3e année)
3. Validation du logiciel : mesure du taux d’erreur
Méthodologie basée sur logiciel et textes, et donc, n’implique pas de sujets humains.
Corpus de 7 textes (Signet, 3e année)
Répartition des erreurs selon 6 catégories:
A. Absence du soutien phonétique
B. Mauvais choix de soutien phonétique
C. Mauvais alignement du soutien phonétique
D. Erreur de marquage (gris estompé) d’une syllabe muette
E. Erreur de marquage (rouge) lorsque le phonème est une voyelle
F. Erreur de marquage de liaison (« z’ », « n’ » ou « t’ »)
20
21. Agenda
Présentations
Contexte et définitions
Objectifs
Méthodologie et démarche empirique
Démarche de conception du logiciel
Résultats
Conclusion
Recommandations
Discussions
21
22. Démarche de conception du logiciel
Étude des caractéristiques et règles
du SPh
1. Graphèmes complexes superposés
par l’archigraphème
correspondant.
Il existe 35 archigraphèmes
Table de transposition
2. Syllabes muettes: estompées en
gris.
3. Voyelles et leur soutien phonétique
marquées en rouge.
4. Liaisons phonétiques marquées
explicitement, car « tout ce qui se
prononce s’écrit » (GDA).
Table de transposition (GDA), version complète à l’annexe III
22
23. Démarche de conception du logiciel
Comment automatiser l’ajout de Sph dans Word ?
Dictionnaire phonétique ? Insuffisant (verbes conjugués,
liaisons phonétiques entre les mots). Disponibilité ? Coûts ?
Idée subséquente: les algorithmes « texte à la parole » grand
public existent déjà. Peut-on en bénéficier ?
Recherche d’un logiciel « texte à la parole »:
Gratuit
Traite la langue française
Offre disponibilité d’un API (Application Programming Interface)
Permet de découper les mots en phonèmes
Traite les liaisons phonétiques entre les mots
Interprète des syllabes muettes
23
24. Démarche de conception du logiciel
Évaluation de moteurs phonétiques (« texte à la parole »)
IBM ViaVoice
Acapela
Nuance
eSpeak
Vocalyze (Collavizza, 2004)
Java
24
25. Démarche de conception du logiciel
Ajout de Soutien phonétique dans Word
Composantes du logiciel:
Module d’extension Word (C++)
Serveur UDP/IP (Java)
Moteur phonétique (Java)
Dossiers des apprenants (C++)
25
26. Démarche de conception du logiciel
Vocalyze
Règles faites en fonction de certains accents régionaux. Corrections ont été nécessaires pour adapter au
Québec.
Exemple : le mot « emprunt » prononcé « emprIN », en France :
Avant: [[ un ]] C -> e~ // accent régional: « in »
Après: [[ un ]] C -> un // accent régional: « un »
26
27. Démarche de conception du logiciel
C++ Serveur UDP/IP
Word
Plug-in
Moteur
phonétique
Serveur UDP/IP: encodage/
décodage et traitement des
requêtes et réponses
phonétiques.
Dossiers des apprenants
27
28. Démarche de conception du logiciel
Laboratoire de conception / réalisation du
logiciel
28
29. Démarche de conception du logiciel
Dégressivité
1. Système de tenue de dossiers des apprenants
Un dossier par apprenant
Choix de conception: coût optimal
Système basé sur une sélection d’archigraphèmes
2. Fonctionnement
Options: affichage de 100%, 50% ou 0% des
éléments de soutien phonétique choisis.
29
30. Démarche de conception du logiciel
Dégressivité
1. Validation
Étant donné que la dégressivité relève de
règles mathématiques, et non pas de règles
phonétiques, la validation est plus simple que
pour l’ajout de soutien phonétique.
2. Vidéo de démonstration
Dégressivité de l’archigraphème « o »:
affichage de 50% des occurrences.
30
31. Agenda
Présentations
Contexte et définitions
Objectifs
Méthodologie et démarche empirique
Démarche de conception du logiciel
Résultats
Conclusion
Recommandations
Discussions
31
32. Résultats
Afin d’éviter un biais dans le décompte des erreurs, les erreurs en double (même règle
impliquée) n’étaient pas incluses dans le total.
Si un texte de validation avait contenu des proportions notablement plus grandes de graphèmes dont la
règle d’interprétation était erronée, alors les résultats auraient été biaisés pour ce texte.
Quelles sont les opérations automatisées comptées ?
1. Ajout et alignement du soutien phonétique au-dessus du texte
2. Changement de couleur en rouge lorsque le phonème est une voyelle
3. Estompage des syllabes muettes en gris
4. Ajout de liaisons (z’, n’, t’)
Catégories d’erreur:
A. Absence du soutien phonétique
B. Mauvais choix de soutien phonétique
C. Mauvais alignement du soutien phonétique
D. Erreur de marquage (gris estompé) d’une syllabe muette
E. Erreur de marquage (rouge) lorsque le phonème est une voyelle
F. Erreur de marquage de liaison (« z’ », « n’ » ou « t’ »)
32
33. Résultats
33
# Nom du document Durée
automatisée
(secondes)
Nb de
mots
Nb d'opérations Nb d'erreurs Taux
d'erreur
1 SPH_2c_A_P1_tdm_p129 1 33 24 0 0,0%
2 SPH_A_P1_T1_p130-131 4 50 101 1 1,0%
3 SPH_A_P1_T2_p132-133 3 57 49 2 4,1%
4 SPH_A_P1_T3_p134 0 26 46 2 4,3%
5 SPH_A_P1_T4_p135-137 6 68 92 1 1,1%
6 SPH_A_P1_T5_p138-139 3 46 56 3 5,4%
7 SPH_A_P1_T6_p140-142 7 71 140 4 5,0%
TOTAUX: 24 secondes 351 mots 508 opérations 13 erreurs 2,56%
Tableau 5 Résultats de la mise à l’essai
34. Résultats
Points forts:
Catégorie C: alignement du soutien phonétique
Raison: fiabilité de la fonction interne du SDK de Word:
PhoneticGuide(Text,Alignment,Raise,Font,…), dans le
module d’extension (plug-in).
Catégorie E: marquage rouge des voyelles et de leur
Sph
Raison: fiabilité de la logique implémentée dans le
module d’extension de Word.
Opportunités d’amélioration:
Catégorie A: soutien phonétique absent
Catégorie B: choix de soutien phonétique erroné
Catégorie D: marquage de syllabes muettes.
Catégorie F: marquage de liaison (« z’ », « n’ » ou
« t’ »)
Valides : « les amis », « les oiseaux »
Sont notamment erronées:
liaison en « t », qui se fait avec une lettre « d »,
dans « grand arbre » ou « quand il »,
la liaison « n’ » dans « un homme » se fait,
même si le « h » est une consonne, et muette
de surcroît.
A. Absence du soutien phonétique
B. Mauvais choix de soutien phonétique
C. Mauvais alignement du soutien phonétique
D. Erreur de marquage (gris estompé) d’une syllabe muette
E. Erreur de marquage (rouge) d’une voyelle
F. Erreur de marquage de liaison (« z’ », « n’ » ou « t’ »)
34
Nb
d’erreurs
35. Résultats
Raisonnement quant aux opportunités d’amélioration du SPhone:
Entraînement du logiciel limité à un corpus de 10 textes du manuel scolaire Signet 3e année.
Ces textes n’avaient évidemment pas interpellé toutes les règles phonétiques, trouvées dans
l’ensemble des 7 textes de validation.
Donc: sans surprise, le modèle des règles du moteur phonétique, laisse place à
l’amélioration.
Fichier texte « règles.txt » pourra être amélioré, avec l’utilisation du logiciel.
« Les règles de prononciation utilisées pour la traduction en phonèmes sont parfois insuffisantes »
(Collavizza, 2006).
Exemple tiré de (Goldman et al., 2001), où “l’analyse syntaxique serait justifiée”:
35
36. Agenda
Présentations
Contexte et définitions
Objectifs
Méthodologie et démarche empirique
Démarche de conception du logiciel
Résultats
Conclusion
Recommandations
Discussions
36
37. Conclusion
Retour sur les objectifs:
1. Concevoir et réaliser un logiciel qui ajoute le
soutien phonétique aux documents
francophones, de format Word, avec un taux
d’erreur inférieur à 10%.
2. Rendre l’ajout de soutien phonétique
dégressif et personnalisé pour chaque
apprenant.
37
38. Conclusion
Retour sur les hypothèses:
• H1 : Un logiciel, moteur de génération de soutien phonétique, serait en mesure
d’automatiser le traitement manuel que font les chercheurs du GDA de l’UdM pour
ajouter le soutien phonétique et pour estomper les lettres muettes.
• Hypothèse retenue.
• H2 : Le taux d’erreur qu’effectuerait le logiciel, en ajoutant le soutien phonétique,
serait inférieur à 10%.
• Hypothèse retenue; taux d’erreur = 2.56%.
• H3 : Le logiciel permettrait de tenir un dossier, pour chaque étudiant, afin
d’adapter les règles appliquées en fonction de ses apprentissages. Il s’agit de
l’aspect dégressif de l’ajout du soutien phonétique.
• Hypothèse retenue.
Importance de cette conclusion pour le domaine:
• L’utilisation d’un logiciel, pour la production de manuels scolaires adaptés avec le
soutien phonétique, peut être envisagée.
38
39. Communication
Projet de rédaction d'un article de
conférence
Collaboration :
Bourque P., Langevin J.
Mónica Villavicencio
Finissante du doctorat ÉTS
Professeur à l’ESPOL (Équateur)
École Polytechnique Supérieure du
Littoral
Est hispanophone; a appris le français
durant ses études au doctorat
En lien avec le sujet du mémoire: catégorie
des personnes allophones
Entame collaboration avec M. Bourque
39
40. Agenda
Présentations
Contexte et définitions
Objectifs
Méthodologie et démarche empirique
Démarche de conception du logiciel
Résultats
Conclusion
Recommandations
Discussions
40
41. Recommandations
L1 : Le modèle phonétique du SPhone est centré sur la langue française. Une
nouvelle recherche pourrait donc viser à adapter le SPhone pour, traiter d’autres
langues comme l’espagnol, l’anglais ou l’italien, entre autres.
L2 : Le logiciel SPhone est limité à ajouter le soutien phonétique aux textes dans le
logiciel Word, de Microsoft, conjointement au système d’exploitation Windows. Une
nouvelle avenue de recherche pourrait avoir pour objectif d’adapter le logiciel pour
d’autres systèmes d’exploitation, comme Android et Mac OS, et des plateformes
mobiles telles que l’iPad, le Samsung Galaxy ou le Microsoft Surface Pro.
L3 : Les textes utilisés pour optimiser et valider le SPhone avaient préalablement été
simplifiés, pour un manuel scolaire de 3e année du primaire. Une nouvelle recherche
pourrait viser à traiter des textes d’un plus grand niveau de complexité, par exemple
pour des étudiants du niveau secondaire.
41
42. Recommandations
Améliorer les règles phonétiques au-delà des
10 textes d’entraînement, avec des textes du
même niveau de complexité.
Aspect dégressif /dossiers des étudiants
Base de données centralisée sur internet
Intégration aux commissions scolaires
42
43. Mot de la fin
Sph: mot de la fin
- Monsieur Anatole France (1844-1924)
Prix Nobel de littérature (1921)
Texte non simplifé
43
44. Mot de la fin
Décompte des opérations automatisées
Une erreur identifiée: ‘om’; règle #12 de la Table de transposition (Langevin et
Rocque, 2011)
Correction simple dans le fichier « règles.txt », en ajoutant:
C [[ om ]] p -> on ## « comprendre » 'om' = 'on‘
Démo avec la correction
44
45. Agenda
Présentations
Contexte et définitions
Objectifs
Méthodologie et démarche empirique
Démarche de conception du logiciel
Résultats
Conclusion
Recommandations
Discussions
45
47. Sources
GDA, 2015. Lettre d’intention. CRSH partenariat, 2016-2023. Version finale du 13 février 2015, Montréal.
Ministre de l'Immigration, Kathleen Weil, 2015, La Presse. 8 février 2015.
http://www.lapresse.ca/actualites/politique/politique-quebecoise/201501/25/01-4838252-immigration-au-quebec-reforme-majeure-a-
venir.php
Viens, J., Langevin, J., Saint-Pierre, M. et Rocque, S. (2012). Pour des technologies accessibles aux élèves handicapés ou en difficulté
d’apprentissage ou d’adaptation. Montréal, Québec : Éditions Nouvelles
Langevin, J., 2009. Recueil de textes Université d’Été Incapacités intellectuelles 2009. Montréal : Université de Montréal, Groupe DÉFI
Apprentissage
Langevin J., 2009. Programme de recherche et innovation 2010-2014, version 2.5. Montréal : Université de Montréal, Groupe DÉFI
Apprentissage
Langevin J., 2014. Une découverte en éducation : les élèves ayant des incapacités intellectuelles. Conférence. Département de
psychopédagogie et d'andragogie, Groupe DÉFI Accessibilité (GDA).
Collavizza H., Stromboni J.P. 2006. « Une synthèse vocale destinée aux déficients visuels ». XXVIèmes Journées d‘Étude sur la Parole,
Dinard.
Catach, Nina. 2009. L'orthographe, 9e édition. Coll. « Que sais-je ? ». France: Presses universitaires de France, 128 p.
Langlois, M.-C., Analphabétisme et littératie au Canada, 2012. Note de la Colline no 2012-46-F. Parlement du Canada.
http://www.parl.gc.ca/Content/LOP/ResearchPublications/2012-46-f.htm
47
48. Sources
Langevin J., Fauteux M., 2003. "Powerpoint 'oto'". Présentation Powerpoint. GDA: Montréal.
Beaulieu, Judith. 2013. « Productivité de manuels scolaires adaptés pour élèves ayant deux années de
retard en lecture ». Thèse de doctorat. Montréal, Université de Montréal, 270 p.
Beaulieu, J. 2012. Témoignage: "Estimation du temps moyen que prend l'ajout de soutien phonétique
dans un document Word". Courrier électronique envoyé à Patrick Tremblay. Judith Beaulieu, 1 p.
Consulté le 5 octobre 2012.
Goldman JP, Gaudinat A, Nerima L, Wehrli, E. 2001. « FipsVox : a French TTS based on a syntactic
parser. ». Conference paper. Cahiers de linguistique française. Journal: 2001, no 23 (234 p.). Unité de
linguistique française: Genève, Suisse.
France, A. 2015. « Anatole France - Quelques citations ». Tiré du web. 19 mars 2015.
http://qqcitations.com/auteur/anatole-france
Photos et images externes: tirées du site www.123rf.com, avec droits d’auteur acquittés.
48
REMARQUE : Vous souhaitez inclure une autre image sur cettediapositive ? Sélectionnezl’image et supprimez-la. Maintenant cliquez sur l’icône Images dans l’espace réservé pour insérer votre propre image.
Méthodologie: Chapitre 2 (p.: 21)
Annexe V (exemple d’un texte d’entraînement)
Cours UdM : « L'intervention éducationnelle et sociale auprès des personnes qui présentent des incapacités intellectuelles »