Synaeresis
  Una herramienta colaborativa para la recopilación y
   análisis de registros fonéticos geo-referenciados


             Javier De La Rosa     Esperanza Ruiz-Peña     Roberto Ulloa
                jdelaro@uwo.ca         mruizpen@uwo.ca       rulloa@uwo.ca




                      SP 9785 – Seminario de Estudios Transatlánticos
                             The University of Western Ontario
                                  Ontario, Canada, 2011

Synaeresis
2 | Internal use only
Synaeresis
Introducción
     ● Tomás Navarro Tomás



     ● ALPI: Atlas Lingüístico de
       la Península Ibérica



     ● Datos Abiertos: OpenData




2 | Internal use only
Synaeresis
Problema

                        ● Datos dispersos


                        ● No son compatibles


                        ● No son públicos


                        ● No se pueden consultar




2 | Internal use only
Synaeresis
Objetivo Inicial



       Implementar una interfaz web de consulta para el ALPI con
               despliegue de la información geográfica




2 | Internal use only
Synaeresis
Objetivo Inicial



       Implementar una interfaz web de consulta para el ALPI con
               despliegue de la información geográfica




2 | Internal use only
Synaeresis
Objetivo



          Implementar una herramienta de uso público para la
       recopilación y consulta de registros lingüísticos de distintos
              hablantes provenientes de diversos estudios.




2 | Internal use only
Synaeresis
Justificación
     ● Estudiar factores externos:
        ○ Lenguas en contacto
        ○ Correlación con otras capas
        ○ Zona geográfica
        ○ Migraciones



                            ● Reciclar investigaciones
                               ○ Estudios diferentes
                               ○ Comparaciones de trabajos
                                 similares
                               ○ Comparaciones temporales
                               ○ Visualizaciones en mapas

Synaeresis
Componentes




2 | Internal use only
Synaeresis
Generación de mapas lingüísticos




2 | Internal use only
Synaeresis
Introducción de símbolos fonéticos (IPA)




2 | Internal use only
Synaeresis
Expresiones Regulares


                          ● Ejemplo: xx/xx/2006
                               [0-9][0-9]/[0-9][0-9]/2006



       ● En lingüística: Palabras que empiecen con /ʧr/, tengan al
         menos 5 caracteres y terminen con sé
                  ^ʧr(.*){5,}sé




2 | Internal use only
Synaeresis
Algoritmos de similaridad fonética
        ● Soundex, NYSIIS, Methaphone, Double
          Methaphone, Methaphone 3©, Caverphone



        ● Inicialmente para corrección ortográfica



        ● Ejemplo:
                 ■ programming = PRKMR
                 ■ programmer = PRKMR


2 | Internal use only
Synaeresis
Algoritmo de Transcripción (ES)
        ● Perkins:

                ○ Traduce de alfabeto en español a alfabeto IPA y
                  RFE.


                ○ Obviamente es una aproximación pero facilita la
                  entrada


                ○ Se pueden hacer algunas aproximaciones



2 | Internal use only
Synaeresis
Casos de estudio
        ● Lenición de /l/ por /ɾ/:

                ○ Estudio de los carnavales de Cádiz


        ● Diccionario de la Real Academia de la Lengua

                ○ Geoposicionamiento de los regionalismos

                ○ Transcripciones fonéticas aproximadas y
                  automáticas



2 | Internal use only
Synaeresis
Demo




2 | Internal use only
Synaeresis
Conclusiones

        ● Herramienta para facilitar el estudio de producciones
          fonéticas (por ejemplo el ALPI).



        ● Accesibilidad de los datos en colaboración



        ● Estándares lingüísticos: IPA, SAMPA, RFE.



2 | Internal use only
Synaeresis
Gracias!




2 | Internal use only
Synaeresis

Synaeres

  • 1.
    Synaeresis Unaherramienta colaborativa para la recopilación y análisis de registros fonéticos geo-referenciados Javier De La Rosa Esperanza Ruiz-Peña Roberto Ulloa jdelaro@uwo.ca mruizpen@uwo.ca rulloa@uwo.ca SP 9785 – Seminario de Estudios Transatlánticos The University of Western Ontario Ontario, Canada, 2011 Synaeresis
  • 2.
    2 | Internaluse only Synaeresis
  • 3.
    Introducción ● Tomás Navarro Tomás ● ALPI: Atlas Lingüístico de la Península Ibérica ● Datos Abiertos: OpenData 2 | Internal use only Synaeresis
  • 4.
    Problema ● Datos dispersos ● No son compatibles ● No son públicos ● No se pueden consultar 2 | Internal use only Synaeresis
  • 5.
    Objetivo Inicial Implementar una interfaz web de consulta para el ALPI con despliegue de la información geográfica 2 | Internal use only Synaeresis
  • 6.
    Objetivo Inicial Implementar una interfaz web de consulta para el ALPI con despliegue de la información geográfica 2 | Internal use only Synaeresis
  • 7.
    Objetivo Implementar una herramienta de uso público para la recopilación y consulta de registros lingüísticos de distintos hablantes provenientes de diversos estudios. 2 | Internal use only Synaeresis
  • 8.
    Justificación ● Estudiar factores externos: ○ Lenguas en contacto ○ Correlación con otras capas ○ Zona geográfica ○ Migraciones ● Reciclar investigaciones ○ Estudios diferentes ○ Comparaciones de trabajos similares ○ Comparaciones temporales ○ Visualizaciones en mapas Synaeresis
  • 9.
    Componentes 2 | Internaluse only Synaeresis
  • 10.
    Generación de mapaslingüísticos 2 | Internal use only Synaeresis
  • 11.
    Introducción de símbolosfonéticos (IPA) 2 | Internal use only Synaeresis
  • 12.
    Expresiones Regulares ● Ejemplo: xx/xx/2006 [0-9][0-9]/[0-9][0-9]/2006 ● En lingüística: Palabras que empiecen con /ʧr/, tengan al menos 5 caracteres y terminen con sé ^ʧr(.*){5,}sé 2 | Internal use only Synaeresis
  • 13.
    Algoritmos de similaridadfonética ● Soundex, NYSIIS, Methaphone, Double Methaphone, Methaphone 3©, Caverphone ● Inicialmente para corrección ortográfica ● Ejemplo: ■ programming = PRKMR ■ programmer = PRKMR 2 | Internal use only Synaeresis
  • 14.
    Algoritmo de Transcripción(ES) ● Perkins: ○ Traduce de alfabeto en español a alfabeto IPA y RFE. ○ Obviamente es una aproximación pero facilita la entrada ○ Se pueden hacer algunas aproximaciones 2 | Internal use only Synaeresis
  • 15.
    Casos de estudio ● Lenición de /l/ por /ɾ/: ○ Estudio de los carnavales de Cádiz ● Diccionario de la Real Academia de la Lengua ○ Geoposicionamiento de los regionalismos ○ Transcripciones fonéticas aproximadas y automáticas 2 | Internal use only Synaeresis
  • 16.
    Demo 2 | Internaluse only Synaeresis
  • 17.
    Conclusiones ● Herramienta para facilitar el estudio de producciones fonéticas (por ejemplo el ALPI). ● Accesibilidad de los datos en colaboración ● Estándares lingüísticos: IPA, SAMPA, RFE. 2 | Internal use only Synaeresis
  • 18.
    Gracias! 2 | Internaluse only Synaeresis