3. Luis Beltrán
• Investigador en Tomas Bata
University in Zlín, República
Checa.
• Docente en Tecnológico
Nacional de México en
Celaya, Mexico.
• Xamarin, Azure e
Inteligencia Artificial
@darkicebea
m
luis@luisbeltran.mx
luisbeltran.mx
4. Azure Cognitive Services
Percepción Comprensión
Visión Voz Lenguaje Decisión
Computer Vision
Face API
Custom Vision
Text-to-Speech
Speech-to-Text
Speech Translator
Speaker Recognition
Language Understanding
Translator
Text Analytics
QnA Maker
Anomaly Detector
Content Moderator
Personalizer
microsoft.com/cognitive
5. Crea un recurso en el Portal de Azure
Tienes 2 opciones:
- Cognitive Services (incluye el soporte a otros servicios cognitivos con la misma llave y endpoint)
- Speech (una llave y endpoint de uso exclusivo para servicios de voz)
6. Crea el recurso de tu elección
Copia los siguientes datos:
- Llave 1
- Ubicación
- Endpoint
7. Speech (Servicios de Voz)
Speech to Text /
Text to Speech
Convierta voz a texto y viceversa,
comprendiendo la intención del
mensaje en tiempo real
Speaker Recognition
Déle a su aplicación la
capacidad de saber quién está
hablando
Speech Translator
Integra traducción de voz en
tiempo real en tus
aplicaciones
8. Speech To Text
Convierte secuencias (y archivos) de audio a
texto que tus aplicaciones, herramientas o
dispositivos pueden consumir o mostrar.
• Conversaciones entre dispositivos
• Transcripción de conversaciones por
lotes y en tiempo real
• Modelos personalizados de voz
adaptables al estilo de vocabulario y de
la conversación
• Soporta 101 lenguajes / versions
localizadas
• (Preview) Detección continua del idioma
• Evaluación de la pronunciación
9. Speech Studio
Prueba los servicios de Speech de una
manera ágil, sencilla y divertida.
Adapta a tus necesidades.
Conoce las capacidades del servicio.
https://speech.microsoft.com/portal/
14. Text to Speech
Convierte el texto de entrada en voz
sintetizada similar a la humana mediante
el Lenguaje de marcado de síntesis de voz
(SSML).
Elige entre más de 250 voces estándar y
neurales disponibles en más de 70 idiomas o
versiones localizadas.
20. Integrando servicios de voz en tus apps
• Speech Cognitive Services expone dos modalidades para
integrar los servicios de voz en tus aplicaciones:
• REST API
• SDK
21. Speech REST API
• Envía peticiones HTTP a los
diferentes métodos
expuestos por el API
• Respuestas en formato JSON
• “Modo avanzado”
22. Speech SDK
Disponible en varios lenguajes:
- C#
- C++
- Go
- Java
- Node.js
- Python
“Modo fácil”
28. Una variedad de aplicaciones
Visión Voz Lenguaje
Procesamiento de Lenguaje Natural
Intent: PlayCall
Conocimiento
Aquí están los mejores resultados:
The purpose of Customer Life-cycle Management (CLM)
is to maximize both customer retention and .... Predictive
trend analysis provides business visibility.
Oct 28, 2015 – Here are FIVE key trends in 2014 that
would help marketers in rolling ... Of late, marketers are
looking at customer lifecycle management (CLM)
Jan 5, 2016 – The top 10 customer service trends for
2016 that .... North American Consumer
Búsqueda
Aquí está lo que encontré
It also investigates the top three expected
Fraud Detection and Prevention programs, in
terms of demand in key markets…
First, let’s point out that there is not one
absolute answer—there are “pros” and “cons” to
each. Those who favor in-house…
Michael heads fraud prevention tool. Online
and mobile shopping are expected to continue
growing apace…