Gira Speaker Latam - IA y Accesibilidad con Pronunciation Assessment.pptx

•Descargar como PPTX, PDF•

0 recomendaciones•5 vistas

Luis775803

Gira Speaker Latam - IA y Accesibilidad con Pronunciation Assessment

Tecnología

• Luis Beltrán
• Microsoft MVP (IA, Developer Technologies, Azure)
• Investigador en Tomás Bata University in Zlín
• Docente en Tecnológico Nacional de México en
Celaya
@darkicebeam
luis@luisbeltran.mx
luisbeltran.mx

¿Cómo resolver ambos
problemas por medio de
Inteligencia Artificial?

Demo #1 Probando
Pronunciation Assessment

Desarrollando una app con
Pronunciation Assessment SDK

https://docs.microsoft.com/en-us/azure/cognitive-services/speech-
service/how-to-pronunciation-assessment?pivots=programming-language-
csharp

Puede obtener puntajes de evaluación de pronunciación para:
• Texto completo
• Palabras
• Grupos de sílabas
• Fonemas en formato
SAPI o IPA

Demo #2 Pronunciation
Assessment en una aplicación
móvil

https://github.com/icebeam7/FluentSpeaker

• Pronunciation Assessment funciona mejor con una entrada de audio de mayor
calidad. Recomendamos una calidad de entrada de 16 kHz o superior.
• La calidad de Pronunciation Assessment también se ve afectada por la distancia
del orador del micrófono. Las grabaciones deben hacerse con el altavoz cerca del
micrófono, y no a través de una conexión remota.
• Pronunciation Assessment no admite un escenario de evaluación lingüística
mixta.
• Pronunciation Assessment admite el idioma en-US y otros idiomas en versión
preliminar.

• Pronunciation Assessment no admite un escenario de evaluación de varios
hablantes. El audio debe incluir solo un orador para cada evaluación.
• Pronunciation Assessment compara el audio enviado con hablantes
nativos en condiciones generales. El hablante debe mantener una
velocidad y un volumen de habla normales, y evitar gritar o levantar la
voz.
• Pronunciation Assessment funciona mejor en un entorno con poco ruido
de fondo. Los modelos actuales de voz a texto se adaptan al ruido en
condiciones generales.

• Antes de usar Pronunciation Assessment en sus aplicaciones, considere si
este producto funciona bien en su escenario. Recopile datos de la vida real
del escenario de destino, pruebe el rendimiento de la evaluación de
pronunciación y asegúrese de que la evaluación de voz a texto y
pronunciación pueda ofrecer la precisión que necesita.
• Seleccione los umbrales adecuados según el escenario de destino.
Pronunciation Assessment proporciona puntajes de precisión en diferentes
niveles y es posible que deba considerar el umbral empleado en el uso real.
Por ejemplo, el método de calificación para el aprendizaje de los niños
podría no ser tan estricto como el del aprendizaje de adultos.

Demos:
https://github.com/Azure-Samples/Cognitive-Speech-
TTS/tree/master/PronunciationAssessment/BrowserJS
Documentación:
https://docs.microsoft.com/en-us/azure/cognitive-services/speech-
service/how-to-pronunciation-assessment
Códigos de Ejemplo:
https://github.com/Azure-Samples/Cognitive-Speech-
TTS/tree/master/PronunciationAssessment

Más contenido relacionado

Similar a Gira Speaker Latam - IA y Accesibilidad con Pronunciation Assessment.pptx

Dokeos (1)Luis de Jesús García Gómez

Los C++programacionuce

Los C++Samuell Gallo

Presentacion Modeloole15

Tercera instancia examen oralDirección General de Escuelas Mendoza

Cómo GPT-3 puede ayudar a los analistas digitalesNatzir Turrado

UNACH - INNOVATECH Empoderando con Immersive Reader.pptxLuis Beltran

Microsoft PowerPoint 2013Julissacamposrivera

UNTELS - Empoderando a personas de todas las habilidades con Immersive Reader...Luis Beltran

PRESENTACION METODOLOGIA SMART PRESENCIAL.pdfNELSONESTIDDURANESQU

Propuestas con tablet ccte-paysandúctepay

Valores y prácticas XPDomingo Gallardo

Pauta de evaluación Vdeo currículum.docxClaudiaAndreaOrellan5

Mejores formas de aprender a programarEduardo Enriquez

BDD para la mejora de la calidad softwareEnrique Sánchez-Bayuela

Meetup NahualUY - Explorando el Testing ExploratorioLisandra Armas

Interactive training materialsSantia Velazquez

Secuencia DidáCtica De Comunidades De AprendizajeSistematizacion De la Enseñanza

Valoración software educativo AdelaMario VelaBon

Tecleras en educaciónsparky32

Similar a Gira Speaker Latam - IA y Accesibilidad con Pronunciation Assessment.pptx (20)

Dokeos (1)

Los C++

Presentacion Modelo

Tercera instancia examen oral

Cómo GPT-3 puede ayudar a los analistas digitales

UNACH - INNOVATECH Empoderando con Immersive Reader.pptx

Microsoft PowerPoint 2013

UNTELS - Empoderando a personas de todas las habilidades con Immersive Reader...

PRESENTACION METODOLOGIA SMART PRESENCIAL.pdf

Propuestas con tablet ccte-paysandú

Valores y prácticas XP

Pauta de evaluación Vdeo currículum.docx

Mejores formas de aprender a programar

BDD para la mejora de la calidad software

Meetup NahualUY - Explorando el Testing Exploratorio

Interactive training materials

Secuencia DidáCtica De Comunidades De Aprendizaje

Valoración software educativo Adela

Tecleras en educación

Más de Luis775803

TalentLand - Entendiendo tus documentos con Azure Form Recognizer.pptxLuis775803

IA Conversacional con Power Virtual Agents.pptxLuis775803

STEMWeek - Entendiendo tus documentos con Azure Form Recognizer.pptxLuis775803

Student Summit - Conoce más sobre mi carrera en IA y Datos.pptxLuis775803

Build After Party Bolivia - Hugging Face on Azure.pptxLuis775803

Microsoft Reactor - Creando un modelo de Regresión con Azure Machine Learnin...Luis775803

Introduction to .NET MAUI.pdfLuis775803

SISWeek Creando un sistema de reconocimiento facial con Face API.pptxLuis775803

Azure Guatemala.pptxLuis775803

Conoce las novedades de .NET MAUI en .NET 7.pptxLuis775803

GAIB Philippines - Tailoring OpenAI’s GPT-3 to suit your specific needs.pptxLuis775803

Power BI Summit 2023 - Embedding PowerBI reports in .NET MAUI mobile apps.pptxLuis775803

Towards Responsible AI - Global AI Student Conference 2022.pptxLuis775803

Mes de Datos Ciencia de Datos a otro nivel con Azure Machine Learning.pptxLuis775803

GAIB Germany - Tailoring OpenAI’s GPT-3 to suit your specific needs.pptxLuis775803

Platzi Azure.pptxLuis775803

GAIB Latam - Tailoring OpenAI’s GPT-3 to suit your specific needs.pptxLuis775803

Virtual Azure Community Day - Workloads de búsqueda full-text Azure Search.pptxLuis775803

Towards Responsible AI - KC.pptxLuis775803

Global Azure 2022 en Español - Clasificacion de imagenes con Azure Machine L...Luis775803

Más de Luis775803 (20)

TalentLand - Entendiendo tus documentos con Azure Form Recognizer.pptx

IA Conversacional con Power Virtual Agents.pptx

STEMWeek - Entendiendo tus documentos con Azure Form Recognizer.pptx

Student Summit - Conoce más sobre mi carrera en IA y Datos.pptx

Build After Party Bolivia - Hugging Face on Azure.pptx

Microsoft Reactor - Creando un modelo de Regresión con Azure Machine Learnin...

Introduction to .NET MAUI.pdf

SISWeek Creando un sistema de reconocimiento facial con Face API.pptx

Azure Guatemala.pptx

Conoce las novedades de .NET MAUI en .NET 7.pptx

GAIB Philippines - Tailoring OpenAI’s GPT-3 to suit your specific needs.pptx

Power BI Summit 2023 - Embedding PowerBI reports in .NET MAUI mobile apps.pptx

Towards Responsible AI - Global AI Student Conference 2022.pptx

Mes de Datos Ciencia de Datos a otro nivel con Azure Machine Learning.pptx

GAIB Germany - Tailoring OpenAI’s GPT-3 to suit your specific needs.pptx

Platzi Azure.pptx

GAIB Latam - Tailoring OpenAI’s GPT-3 to suit your specific needs.pptx

Virtual Azure Community Day - Workloads de búsqueda full-text Azure Search.pptx

Towards Responsible AI - KC.pptx

Global Azure 2022 en Español - Clasificacion de imagenes con Azure Machine L...

Último

Avances tecnológicos del siglo XXI 10-07 eyvanamcerpam

Innovaciones tecnologicas en el siglo 21mariacbr99

How to use Redis with MuleSoft. A quick start presentation.FlorenciaCattelani

Buenos_Aires_Meetup_Redis_20240430_.pptxFederico Castellari

EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxMiguelAtencio10

EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxJorgeParada26

PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxAlan779941

redes informaticas en una oficina administrativanicho110

pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz

Avances tecnológicos del siglo XXI y ejemplos de estossgonzalezp1

Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...JohnRamos830530

investigación de los Avances tecnológicos del siglo XXIhmpuellon

Gira Speaker Latam - IA y Accesibilidad con Pronunciation Assessment.pptx

1. #GIRASPEAKERLATAM2022

3. • Luis Beltrán • Microsoft MVP (IA, Developer Technologies, Azure) • Investigador en Tomás Bata University in Zlín • Docente en Tecnológico Nacional de México en Celaya @darkicebeam luis@luisbeltran.mx luisbeltran.mx

5. Comencemos con un par de historias

10.

11.

12.

13.

14.

15.

16.

17. ¿Cómo resolver ambos problemas por medio de Inteligencia Artificial?

18.

19.

20.

21.

22.

23.

24.

25.

26.

27. Aspectos Técnicos

28.

29.

30.

31.

32.

33.

34.

35.

36.

37.

38.

39.

40.

41.

42.

43.

44.

45.

46.

47. Demo #1 Probando Pronunciation Assessment

48. speech.microsoft.com/portal

49.

50.

51. Desarrollando una app con Pronunciation Assessment SDK

52. https://docs.microsoft.com/en-us/azure/cognitive-services/speech- service/how-to-pronunciation-assessment?pivots=programming-language- csharp

53.

54. Puede obtener puntajes de evaluación de pronunciación para: • Texto completo • Palabras • Grupos de sílabas • Fonemas en formato SAPI o IPA

55.

56.

57.

58.

59.

60.

61.

62.

63.

64.

65. Demo #2 Pronunciation Assessment en una aplicación móvil

66. https://github.com/icebeam7/FluentSpeaker

67. Casos de éxito

68. Pearson’s Longman English learning app

69.

70.

71.

72.

73.

74.

75. BYJU’s English App

76.

77. Reading Progress en Microsoft Teams

78.

79. Limitaciones

80. • Pronunciation Assessment funciona mejor con una entrada de audio de mayor calidad. Recomendamos una calidad de entrada de 16 kHz o superior. • La calidad de Pronunciation Assessment también se ve afectada por la distancia del orador del micrófono. Las grabaciones deben hacerse con el altavoz cerca del micrófono, y no a través de una conexión remota. • Pronunciation Assessment no admite un escenario de evaluación lingüística mixta. • Pronunciation Assessment admite el idioma en-US y otros idiomas en versión preliminar.

81. • Pronunciation Assessment no admite un escenario de evaluación de varios hablantes. El audio debe incluir solo un orador para cada evaluación. • Pronunciation Assessment compara el audio enviado con hablantes nativos en condiciones generales. El hablante debe mantener una velocidad y un volumen de habla normales, y evitar gritar o levantar la voz. • Pronunciation Assessment funciona mejor en un entorno con poco ruido de fondo. Los modelos actuales de voz a texto se adaptan al ruido en condiciones generales.

82. • Antes de usar Pronunciation Assessment en sus aplicaciones, considere si este producto funciona bien en su escenario. Recopile datos de la vida real del escenario de destino, pruebe el rendimiento de la evaluación de pronunciación y asegúrese de que la evaluación de voz a texto y pronunciación pueda ofrecer la precisión que necesita. • Seleccione los umbrales adecuados según el escenario de destino. Pronunciation Assessment proporciona puntajes de precisión en diferentes niveles y es posible que deba considerar el umbral empleado en el uso real. Por ejemplo, el método de calificación para el aprendizaje de los niños podría no ser tan estricto como el del aprendizaje de adultos.

83. Para aprender más

84. Demos: https://github.com/Azure-Samples/Cognitive-Speech- TTS/tree/master/PronunciationAssessment/BrowserJS Documentación: https://docs.microsoft.com/en-us/azure/cognitive-services/speech- service/how-to-pronunciation-assessment Códigos de Ejemplo: https://github.com/Azure-Samples/Cognitive-Speech- TTS/tree/master/PronunciationAssessment

85. Preguntas ?

86. #GIRASPEAKERLATAM2022 Muchas Gracias

Notas del editor

Practicar la pronunciación y obtener retroalimentación oportuna son esenciales para mejorar las habilidades lingüísticas. La evaluación es impulsada convencionalmente por maestros experimentados, lo que normalmente lleva mucho tiempo y grandes esfuerzos, y esto hace que la evaluación de alta calidad sea costosa para los estudiantes. En esta sesión veremos cómo podemos hacer uso de la inteligencia artificial para crear una solución tecnológica de apoyo a los estudiantes en el aprendizaje de otra lengua de forma práctica y con retroalimentación objetiva en tiempo real.
Para los estudiantes de idiomas, practicar la pronunciación y obtener comentarios oportunos son esenciales para mejorar las habilidades lingüísticas. La evaluación es impulsada convencionalmente por maestros experimentados, lo que normalmente lleva mucho tiempo y grandes esfuerzos, lo que hace que la evaluación de alta calidad sea costosa para los estudiantes.
Pronunciation Assessment, una novedosa capacidad de habla impulsada por IA, es capaz de hacer que la evaluación del lenguaje sea más atractiva y accesible para los estudiantes de todos los orígenes.
Pronunciation Assessment, una característica de Speech en Azure Cognitive Services, proporciona comentarios subjetivos y objetivos a los estudiantes de idiomas con tecnología asistida por computadora.
Con Pronunciation Assessment, los estudiantes de idiomas pueden practicar, obtener retroalimentación instantánea y mejorar su pronunciación. Los proveedores de soluciones de aprendizaje en línea o los educadores pueden usar la capacidad de evaluar la pronunciación de múltiples hablantes en tiempo real. Pronunciation Assessment proporciona varios resultados de evaluación en diferentes granularidades, desde fonemas individuales hasta la entrada de texto completa. A nivel de fonema, proporciona puntajes de precisión de cada fonema, ayudando a los estudiantes a comprender mejor los detalles de pronunciación de su discurso. A nivel de palabra, puede detectar automáticamente errores y proporcionar una puntuación de precisión simultáneamente, lo que proporciona información más detallada sobre la omisión, la repetición, las inserciones y la pronunciación incorrecta en el discurso dado. A nivel de texto completo, ofrece puntajes adicionales de fluidez e integridad: la fluidez indica qué tan cerca coincide el discurso con el uso de un hablante nativo de pausas silenciosas entre palabras, y la integridad indica cuántas palabras se pronuncian en el discurso a la entrada de texto de referencia.
A continuación, se proporciona una puntuación general agregada de Precisión, Fluidez e Integridad para indicar la calidad general de pronunciación del discurso dado. Con estas características, los alumnos pueden conocer fácilmente la debilidad de su habla y mejorar con los objetivos objetivo.
Puede obtener puntajes de evaluación de pronunciación para: Texto completo Palabras Grupos de sílabas Fonemas en formato SAPI o IPA
Utilizando Pronunciation Assessment, la aplicación Longman English Plus de Pearson permite tanto a los estudiantes como a los profesores mejorar la productividad en el aprendizaje de idiomas, con una función de prueba de pronunciación personalizada para estudiantes de diferentes niveles. Como empresa de educación líder en el mundo, Pearson permite a decenas de millones de estudiantes cada año maximizar su éxito. Las capacidades clave de voz de Microsoft Azure utilizadas en Longman English Plus son: Pronunciation Assessment, procesamiento de lenguaje natural y Neural Text-to-Speech.
BYJU'S elige el servicio Speech en Azure para compilar la aplicación de idioma inglés (ELA) para sus geografías de destino donde el inglés se usa como idioma secundario y se considera una habilidad esencial para adquirir. La aplicación combina lo mejor de la pedagogía utilizando tecnología del habla de vanguardia para ayudar a los niños a dominar el lenguaje con facilidad en un entorno de aprendizaje sin juicios. Con una interfaz que prioriza la conversación, esta aplicación permite a los estudiantes aprender y practicar inglés mientras trabajan en sus habilidades lingüísticas de una manera divertida, atractiva y efectiva.
…BYJU'S está utilizando las capacidades de evaluación de voz a texto y pronunciación para garantizar que los niños dominen el inglés con facilidad, para practicar el habla y recibir comentarios sobre la pronunciación con fonema, pronunciación a nivel de palabra y oración y puntajes de fluidez. ELA de BYJU evalúa la pronunciación de los estudiantes a través de juegos de habla, identifica áreas de mejora y proporciona lecciones personalizadas y adaptables para ayudar a los estudiantes a mejorar en sus áreas débiles.
La detección y diagnóstico de pronunciación errónea (MDD) es la técnica central empleada en la Pronunciation Assessment, que califica la precisión de la pronunciación a nivel de palabra, que proporciona un juicio sobre los errores y contribuye a la evaluación general. Para proporcionar resultados precisos y consistentes, Pronunciation Assessment emplea las últimas redes neuronales potentes para el modelado, explotando la información desde una granularidad de senona más baja hasta una granularidad de palabras más alta con el uso de arquitectura jerárquica. Este diseño permite a Pronunciation Assessment explotar al máximo la información detallada de pronunciación de patrones pequeños, lo que hace que la detección de pronunciación incorrecta sea más precisa y robusta. Con más de 100,000 horas de datos de entrenamiento sobre diferentes acentos, regiones y edades, Pronunciation Assessment también puede manejar diferentes escenarios con varios usuarios, por ejemplo, desde niños hasta adultos, desde hablantes no nativos hasta hablantes nativos, y proporcionar un rendimiento de evaluación confiable y consistente.
Teams Reading Progress utiliza la evaluación de pronunciación para ayudar a los estudiantes a mejorar la fluidez de lectura, después de que la pandemia afectara negativamente la capacidad de lectura de los estudiantes. Se puede usar dentro y fuera del aula para ahorrar tiempo a los maestros y mejorar los resultados de aprendizaje para los estudiantes.
El rendimiento de Pronunciation Assessment depende de la precisión de la transcripción de voz a texto de Azure Cognitive Services con el uso de una transcripción enviada como referencia y el acuerdo entre evaluadores entre el sistema y los jueces humanos. Las siguientes secciones están diseñadas para ayudarle a comprender los conceptos clave sobre la precisión que se aplican al uso de la evaluación de la pronunciación.
Pronunciation Assessment funciona mejor en un entorno con poco ruido de fondo. Los modelos actuales de voz a texto se adaptan al ruido en condiciones generales. Los entornos ruidosos o varias personas que hablan al mismo tiempo pueden conducir a una menor confianza en la evaluación. Para manejar mejor los casos difíciles, puede sugerir que el hablante repita una pronunciación si puntúa por debajo de un cierto umbral.
Considere la posibilidad de establecer un umbral de detección de pronunciación incorrecta más alto para el aprendizaje de adultos. https://docs.microsoft.com/en-us/legal/cognitive-services/speech-service/pronunciation-assessment/characteristics-and-limitations-pronunciation-assessment

Gira Speaker Latam - IA y Accesibilidad con Pronunciation Assessment.pptx

Recomendados

Recomendados

Más contenido relacionado

Similar a Gira Speaker Latam - IA y Accesibilidad con Pronunciation Assessment.pptx

Similar a Gira Speaker Latam - IA y Accesibilidad con Pronunciation Assessment.pptx (20)

Más de Luis775803

Más de Luis775803 (20)

Último

Último (12)

Gira Speaker Latam - IA y Accesibilidad con Pronunciation Assessment.pptx

Notas del editor