3.
Conversion
des
sources
1
• Les
documents
originaux
sont
conservés
dans
le
dossier
“_source”
• Tous
les
fichiers
sont
renommés
sans
charactères
spéciaux
• Les
fichiers
Word
sont
conver7s
en
RTF
ou
TXT
• Les
tableaux
de
données
CSV
font
référence
à
des
ids
uniques
de
par7cipants
(qui
seront
ceux
u7lisés
dans
les
verba7ms)
4.
Codage
CAQDAS
(Atlas.7)
2.1
• U7liser
les
noms
normalisés
des
par7cipants
• U7liser
les
familles
de
Codes:
• Par7cipant
• Paraverbal
• Theme
• …
-‐ Ces
familles
deviendront
des
catégories
de
Codes
dans
le
Site
Enquête
-‐ Export
du
projet
en
XML
5.
Codage
TEI
2.2
Search/replace
dans
le
texte
ini7al
pour
ajuster
la
syntaxe
à
Exmaralda/HIAT
:
-‐ Tour
de
paroles
par
passage
à
la
ligne
avec
nom
du
locuteur
-‐ E7enne:
Non,
c’est
•
Impossible
((rire))
!
-‐ Syntaxe
HIAT
du
paraverbal
-‐ Silences
•
••
•••
-‐ Incidents
((rire))
((changement
de
cassece))
((tousse))
Export
en
XML
TEI
avec
TEI
Drop
:
-‐ <u
who="E7enne”><seg
func7on="ucerance"
type="exclama7ve">
-‐ <w>Non</w>
<c>,</c><w>c’est</w><pause
type="short”/>
-‐ <w>impossible</w><incident><desc>rire</desc></incident>
-‐ </seg></u>
6.
Encapsula7on
dans
DDI
2/3
3
Créa7on
du
fichier
Enquête
DDI
dans
un
Publisher
(Colec7ca
?)
Métadonnées
générales
Liens
et
métadonnées
des
fichiers
externes
7. Exemple
:
FrancaisEtPoli7que.xml
Fichiers
ini*aux
Normalisa*on
Struct.
dans
le
site
Example
Fichier
DDI2/3
contenant
les
métadonnées
générales
de
l’Enquête
:
nom,
descrip7on,
date,
auteur
FrancaisEtPoli7que.xml
Import
du
XML
et
chargement
des
fichiers
externes
liés
Données
quan7
d’iden7fica7on
Renom.
colonnes
N°
Orig.
>
id_par7cipant
et
Type
idéol.
Créa7on
des
Groupes,
des
classeur
>
id_type.
Renom.
par7cipants
selon
conven7on.
Par*cipants
et
de
leurs
A:ributs
Export
csv
(quoted,
tab-‐separated)
propriétés
sociog.
enquêtés.xls
propSociographiques.csv
Tableau
4.doc
typesIdeologiquesTableau4.csv
Transcrip7ons
d’entre7ens
avec
Conv.
en
txt
brut
(formatage
minimal).
Renom.
par7cipants
Parsing
des
verba7ms
par
syntaxe
normalisée
selon
conven7on.
Trad.
syntaxe
E.-‐
blabla
>
E7enne:
blabla
puis
Par*cipant
et
créa7on
des
Codes
:
[(w+)]
>
(($1))
et
[silence]
>
••.
Correc7on
fautes
de
frappe.
-‐
Paraverbal
Import
dans
Esmaralda
Par7turEditor.
Export
vers
TEI+HIAT
-‐
Morphosyntaxe
avec
TEIDrop
Indexa7on
entre7en
n°
27
relu
défini7f.doc
entre7en27.xml
entre7en
n°
29
relu
défini7f.doc
entre7en29.xml
Transcrip7ons
de
focus
groups
Renom.
intervenants
et
créa7on
de
Familles
de
Codes
:
Parsing
des
verba7ms
par
codés
avec
CAQDAS
Par7cipant,
Paraverbal,
Theme
Par*cipant
et
créa7on
des
Codes
selon
les
familles
:
codageEntre7en.hpr6
codageEntre7en.xml
-‐
Paraverbal
Transcript
Brussels
Group
3.doc
TranscriptBrussels3.ry
-‐
Thème
libre
Transcript
Brussels
Group
4.doc
TranscriptBrussels4.ry
Indexa7on
Fichiers
Annexes
Conv.
des
fichiers
en
.ry
et
.pdf
Conversion
en
.html
et
.txt
Indexa7on
Descrip7f
enquête
ES
défini7f.doc
descrip7fEnqueteDefini7f.pdf
Document
d'étape
entre7ens.doc
docEtapeEntre7ens.ry
8. 4
Structura7on
d’un
Texte
TEI
Modèle
has…
Example
Group
Acribute
Droite
Libérale,
Divers,
Gauche
AcributeType
Age,
Sexe,
Salaire,
Profession
Acribute
>
AcributeType
23,
45,
Femme,
Homme,
4500€,
Paysan
CodeType
Paraverbal,
Grammar,
Ucerance,
Ponctua7on
Code
>
CodeType
Silence,
Rire,
Hésita7on,
N,
NM,
Exclama7ve,
Declara7ve
Speaker
Group
E7enne,
Par7cipant_28,
Par7cipant_29
Acribute
Interven7on
>
Speaker
Que
pensez
vous
de
lui
?
Je
ne
…
pas
!
Enfin
...
je
crois
…
[0,1,2,3,…]
Sentence
>
Interven7on
Je
ne
le
connais
pas
!,
Enfin
•••
je
crois
((rire))
[0,1,2,3,…]
Code
Word
>
Sentence
Je,
ne,
le,
connais,
pas,
Enfin,
Silence,
je,
crois,
Rire
[0,1,2,3,…]
Code