SlideShare una empresa de Scribd logo
1 de 23
@darkicebeam
Agenda
 Servicios Cognitivos
 Voz
 Speaker Recognition
 Speaker Verification
 Speaker Identification
 Soporte: Idiomas, Regiones, SDKs
 Demo
 Recomendaciones
 Casos de Uso
 Limitaciones
 ¡Aplica!
Servicios Cognitivos
Servicios Cognitivos
Servicios de Voz (Speech)
Speaker Recognition
Speaker Recognition en Azure Cognitive Services
Speaker Verification
Frases de Speaker Verification (dependiente
de texto) en inglés
I am going to make him an offer he cannot refuse.
Houston we have had a problem.
My voice is my passport verify me.
Apple juice tastes funny after toothpaste.
You can get in without your password.
You can activate security system now.
My voice is stronger than passwords.
My password is not your business.
My name is unknown to you.
Be yourself everyone else is already taken"
Speaker Identification
Datos procesados por Speaker Recognition
• Audio de inscripción
• Firma de voz de inscripción
• Firma de frase
• Audio de reconocimiento
Seguridad y Privacidad de Datos en Speaker
Recognition
• Los datos de Speaker Recognition se almacenan en un sistema
seguro.
• El audio de voz para la inscripción solo se utiliza cuando se actualiza
el algoritmo.
Seguridad y Privacidad de Datos en Speaker
Recognition
• El servicio no conserva la grabación de voz ni las funciones de voz
extraídas.
• Tú controlas cuánto tiempo deben conservarse los datos.
• Debes asegurarte de haber recibido los permisos adecuados de los
usuarios para utilizar Speaker Recognition.
Idiomas soportados
Regiones de Azure soportadas
Lenguajes de programación / tecnologías
soportadas
• C#
• C++
• Java
• JavaScript
• Python
• Objective-C
• REST API
Demo
Recomendaciones
• Comprender lo que puede hacer el
servicio de Speaker Recognition
• Respetar el derecho a la privacidad de
una persona
• Revisar los términos legales de uso
• Generar confianza con las partes
interesadas afectadas
• Obtener retroalimentación (comentarios)
de los clientes
• Capacitar y apoyar a los usuarios finales
Casos de Uso
• Personalización de dispositivos multiusuario
• Verificación del cliente en centro de atención al usuario
• Registro de pacientes basado en la voz
• Transcripción de la reunión
Limitaciones
• Formatos de audio compatibles: Mono 16 bits, WAV codificado en PCM de
16 kHz.
• Puede inscribirse una persona con hasta 300 segundos de audio (Speaker
Verification independiente del texto / Speaker Identification).
• Las API de Speaker Recognition no almacenan identificadores junto con las
firmas de voz.
• Speaker Recognition no puede reconocer a más de una persona en una
sola entrada de voz.
• Speaker Recognition no está diseñado para diferenciar una voz sintetizada
o grabaciones de una voz de un speaker humano en vivo.
• La API de Speaker Identification solo puede tomar hasta 50 candidatos para
comparar la entrada de voz en una llamada a la API.
¡Aplica!
• IA Responsable:
Microsoft limita el acceso al servicio de Speaker Recognition.
• Puede solicitar acceso a través del formulario de Acceso Limitado de
Azure Cognitive Services Speaker Recognition:
https://aka.ms/azure-speaker-recognition
Q & A
¡Gracias por tu atención!
Luis Beltrán
Tomás Bata University in Zlín
Tecnológico Nacional de México en Celaya
About Me:
https://about.me/luis-beltran

Más contenido relacionado

La actualidad más candente

Microsoft Cognitive services
Microsoft Cognitive servicesMicrosoft Cognitive services
Microsoft Cognitive servicesHernan Guzman
 
Inteligencia Artificial con Azure.pptx
Inteligencia Artificial con Azure.pptxInteligencia Artificial con Azure.pptx
Inteligencia Artificial con Azure.pptxLuis Beltran
 
Global AI on Tour - Desarrollando un bot de WhatsApp serverless.pptx
Global AI on Tour - Desarrollando un bot de WhatsApp serverless.pptxGlobal AI on Tour - Desarrollando un bot de WhatsApp serverless.pptx
Global AI on Tour - Desarrollando un bot de WhatsApp serverless.pptxLuis Beltran
 
Azure Personalizer - Global AI Night Latam Template.pptx
Azure Personalizer - Global AI Night Latam Template.pptxAzure Personalizer - Global AI Night Latam Template.pptx
Azure Personalizer - Global AI Night Latam Template.pptxLuis Beltran
 
WarmiInTech Personalizer.pptx
WarmiInTech Personalizer.pptxWarmiInTech Personalizer.pptx
WarmiInTech Personalizer.pptxLuis Beltran
 
Programa tu Pandemia 2 Azure Video Indexer.pptx
Programa tu Pandemia 2 Azure Video Indexer.pptxPrograma tu Pandemia 2 Azure Video Indexer.pptx
Programa tu Pandemia 2 Azure Video Indexer.pptxicebeam7
 
Inteligencia artificial in house con servicios cognitivos y docker
Inteligencia artificial in house con servicios cognitivos y dockerInteligencia artificial in house con servicios cognitivos y docker
Inteligencia artificial in house con servicios cognitivos y dockerLuis Beltran
 
TERASOFT Preparandote para la vida profesional.pptx
TERASOFT Preparandote para la vida profesional.pptxTERASOFT Preparandote para la vida profesional.pptx
TERASOFT Preparandote para la vida profesional.pptxLuis Beltran
 
Intro a AI con Microsoft.pptx
Intro a AI con Microsoft.pptxIntro a AI con Microsoft.pptx
Intro a AI con Microsoft.pptxLuis Beltran
 

La actualidad más candente (9)

Microsoft Cognitive services
Microsoft Cognitive servicesMicrosoft Cognitive services
Microsoft Cognitive services
 
Inteligencia Artificial con Azure.pptx
Inteligencia Artificial con Azure.pptxInteligencia Artificial con Azure.pptx
Inteligencia Artificial con Azure.pptx
 
Global AI on Tour - Desarrollando un bot de WhatsApp serverless.pptx
Global AI on Tour - Desarrollando un bot de WhatsApp serverless.pptxGlobal AI on Tour - Desarrollando un bot de WhatsApp serverless.pptx
Global AI on Tour - Desarrollando un bot de WhatsApp serverless.pptx
 
Azure Personalizer - Global AI Night Latam Template.pptx
Azure Personalizer - Global AI Night Latam Template.pptxAzure Personalizer - Global AI Night Latam Template.pptx
Azure Personalizer - Global AI Night Latam Template.pptx
 
WarmiInTech Personalizer.pptx
WarmiInTech Personalizer.pptxWarmiInTech Personalizer.pptx
WarmiInTech Personalizer.pptx
 
Programa tu Pandemia 2 Azure Video Indexer.pptx
Programa tu Pandemia 2 Azure Video Indexer.pptxPrograma tu Pandemia 2 Azure Video Indexer.pptx
Programa tu Pandemia 2 Azure Video Indexer.pptx
 
Inteligencia artificial in house con servicios cognitivos y docker
Inteligencia artificial in house con servicios cognitivos y dockerInteligencia artificial in house con servicios cognitivos y docker
Inteligencia artificial in house con servicios cognitivos y docker
 
TERASOFT Preparandote para la vida profesional.pptx
TERASOFT Preparandote para la vida profesional.pptxTERASOFT Preparandote para la vida profesional.pptx
TERASOFT Preparandote para la vida profesional.pptx
 
Intro a AI con Microsoft.pptx
Intro a AI con Microsoft.pptxIntro a AI con Microsoft.pptx
Intro a AI con Microsoft.pptx
 

Similar a ACW - Azure Speaker Recognition Biometria de Voz.pptx

04 GlobalAI Speaker Latam Biometria de voz Reconocimiento por voz en nuestr...
04 GlobalAI Speaker Latam  Biometria de voz  Reconocimiento por voz en nuestr...04 GlobalAI Speaker Latam  Biometria de voz  Reconocimiento por voz en nuestr...
04 GlobalAI Speaker Latam Biometria de voz Reconocimiento por voz en nuestr...icebeam7
 
Sistema multifuncional de grabación digital de voz y sesiones de pantalla
Sistema multifuncional de grabación digital de voz y sesiones de pantallaSistema multifuncional de grabación digital de voz y sesiones de pantalla
Sistema multifuncional de grabación digital de voz y sesiones de pantallaComunycarse
 
Azure Video Analyzer - Guadalajara Connect.pptx
Azure Video Analyzer - Guadalajara Connect.pptxAzure Video Analyzer - Guadalajara Connect.pptx
Azure Video Analyzer - Guadalajara Connect.pptxLuis Beltran
 
Curso autenticacion robusta
Curso autenticacion robustaCurso autenticacion robusta
Curso autenticacion robustaCein
 
3. certificados y pki
3. certificados y pki3. certificados y pki
3. certificados y pki1 2d
 
Seguridad de usuario en el acceso a internet 1
Seguridad de usuario en el acceso a internet 1Seguridad de usuario en el acceso a internet 1
Seguridad de usuario en el acceso a internet 1Cein
 
Auronix desayuno-distribuible
Auronix desayuno-distribuibleAuronix desayuno-distribuible
Auronix desayuno-distribuibleMartha Cepeda
 
Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...
Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...
Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...VOIP2DAY
 
Retos adm electr_y_voto_electronico
Retos adm electr_y_voto_electronicoRetos adm electr_y_voto_electronico
Retos adm electr_y_voto_electronicodomingosuarez
 
Escuchando la voz del cliente con Speech Analytics
Escuchando la voz del cliente con Speech AnalyticsEscuchando la voz del cliente con Speech Analytics
Escuchando la voz del cliente con Speech AnalyticsMundo Contact
 
Aplicaciones Real-Time con SignalR
Aplicaciones Real-Time con SignalRAplicaciones Real-Time con SignalR
Aplicaciones Real-Time con SignalRRodolfo Finochietti
 
WarmiInTech Speech Cognitive Service.pptx
WarmiInTech Speech Cognitive Service.pptxWarmiInTech Speech Cognitive Service.pptx
WarmiInTech Speech Cognitive Service.pptxLuis Beltran
 
SISTEMA_DE_INTERCONEXION_DE_JUICIOS_ORAL.pdf
SISTEMA_DE_INTERCONEXION_DE_JUICIOS_ORAL.pdfSISTEMA_DE_INTERCONEXION_DE_JUICIOS_ORAL.pdf
SISTEMA_DE_INTERCONEXION_DE_JUICIOS_ORAL.pdfssuser2e9e09
 

Similar a ACW - Azure Speaker Recognition Biometria de Voz.pptx (20)

04 GlobalAI Speaker Latam Biometria de voz Reconocimiento por voz en nuestr...
04 GlobalAI Speaker Latam  Biometria de voz  Reconocimiento por voz en nuestr...04 GlobalAI Speaker Latam  Biometria de voz  Reconocimiento por voz en nuestr...
04 GlobalAI Speaker Latam Biometria de voz Reconocimiento por voz en nuestr...
 
Sistema multifuncional de grabación digital de voz y sesiones de pantalla
Sistema multifuncional de grabación digital de voz y sesiones de pantallaSistema multifuncional de grabación digital de voz y sesiones de pantalla
Sistema multifuncional de grabación digital de voz y sesiones de pantalla
 
Voip2day Verbio 201511
Voip2day Verbio 201511Voip2day Verbio 201511
Voip2day Verbio 201511
 
Azure Video Analyzer - Guadalajara Connect.pptx
Azure Video Analyzer - Guadalajara Connect.pptxAzure Video Analyzer - Guadalajara Connect.pptx
Azure Video Analyzer - Guadalajara Connect.pptx
 
Curso autenticacion robusta
Curso autenticacion robustaCurso autenticacion robusta
Curso autenticacion robusta
 
Foros de voz
Foros de vozForos de voz
Foros de voz
 
Voip2day video conferencia grado militar usando software libre
Voip2day   video conferencia grado militar usando software libreVoip2day   video conferencia grado militar usando software libre
Voip2day video conferencia grado militar usando software libre
 
3. certificados y pki
3. certificados y pki3. certificados y pki
3. certificados y pki
 
Seguridad de usuario en el acceso a internet 1
Seguridad de usuario en el acceso a internet 1Seguridad de usuario en el acceso a internet 1
Seguridad de usuario en el acceso a internet 1
 
Auronix desayuno-distribuible
Auronix desayuno-distribuibleAuronix desayuno-distribuible
Auronix desayuno-distribuible
 
Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...
Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...
Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...
 
Retos adm electr_y_voto_electronico
Retos adm electr_y_voto_electronicoRetos adm electr_y_voto_electronico
Retos adm electr_y_voto_electronico
 
Audicity.pptx
Audicity.pptxAudicity.pptx
Audicity.pptx
 
Escuchando la voz del cliente con Speech Analytics
Escuchando la voz del cliente con Speech AnalyticsEscuchando la voz del cliente con Speech Analytics
Escuchando la voz del cliente con Speech Analytics
 
Aplicaciones Real-Time con SignalR
Aplicaciones Real-Time con SignalRAplicaciones Real-Time con SignalR
Aplicaciones Real-Time con SignalR
 
WarmiInTech Speech Cognitive Service.pptx
WarmiInTech Speech Cognitive Service.pptxWarmiInTech Speech Cognitive Service.pptx
WarmiInTech Speech Cognitive Service.pptx
 
Hasp Prospecto General
Hasp Prospecto GeneralHasp Prospecto General
Hasp Prospecto General
 
SlingSecure Cifrado de voz movil Esponal
SlingSecure Cifrado de voz movil EsponalSlingSecure Cifrado de voz movil Esponal
SlingSecure Cifrado de voz movil Esponal
 
SISTEMA_DE_INTERCONEXION_DE_JUICIOS_ORAL.pdf
SISTEMA_DE_INTERCONEXION_DE_JUICIOS_ORAL.pdfSISTEMA_DE_INTERCONEXION_DE_JUICIOS_ORAL.pdf
SISTEMA_DE_INTERCONEXION_DE_JUICIOS_ORAL.pdf
 
Foros de voz
Foros de vozForos de voz
Foros de voz
 

Más de Luis Beltran

AI for Accessibility.pptx
AI for Accessibility.pptxAI for Accessibility.pptx
AI for Accessibility.pptxLuis Beltran
 
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptxNET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptxLuis Beltran
 
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptxLuis Beltran
 
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...Luis Beltran
 
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdfCEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdfLuis Beltran
 
Computo en la Nube con Azure - AI Gaming Panama.pptx
Computo en la Nube con Azure - AI Gaming Panama.pptxComputo en la Nube con Azure - AI Gaming Panama.pptx
Computo en la Nube con Azure - AI Gaming Panama.pptxLuis Beltran
 
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptxLuis Beltran
 
UNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxUNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxLuis Beltran
 
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...Luis Beltran
 
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptxLatino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptxLuis Beltran
 
NOVA - Enriquecimiento de IA con Azure Cognitive Search.pptx
NOVA - Enriquecimiento de IA con Azure Cognitive Search.pptxNOVA - Enriquecimiento de IA con Azure Cognitive Search.pptx
NOVA - Enriquecimiento de IA con Azure Cognitive Search.pptxLuis Beltran
 
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...Luis Beltran
 
ATG Puebla - El cementerio de Microsoft.pptx
ATG Puebla - El cementerio de Microsoft.pptxATG Puebla - El cementerio de Microsoft.pptx
ATG Puebla - El cementerio de Microsoft.pptxLuis Beltran
 
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...Luis Beltran
 
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...Luis Beltran
 
Real NET Docs Show - Serverless Machine Learning v3.pptx
Real NET Docs Show - Serverless Machine Learning v3.pptxReal NET Docs Show - Serverless Machine Learning v3.pptx
Real NET Docs Show - Serverless Machine Learning v3.pptxLuis Beltran
 
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptxSesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptxLuis Beltran
 
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...Luis Beltran
 
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptx
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptxLatam Space Week - Clasificación de rocas espaciales por medio de IA.pptx
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptxLuis Beltran
 
GAIBT Pune - Future of AI.pptx
GAIBT Pune - Future of AI.pptxGAIBT Pune - Future of AI.pptx
GAIBT Pune - Future of AI.pptxLuis Beltran
 

Más de Luis Beltran (20)

AI for Accessibility.pptx
AI for Accessibility.pptxAI for Accessibility.pptx
AI for Accessibility.pptx
 
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptxNET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx
 
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx
 
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...
 
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdfCEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
 
Computo en la Nube con Azure - AI Gaming Panama.pptx
Computo en la Nube con Azure - AI Gaming Panama.pptxComputo en la Nube con Azure - AI Gaming Panama.pptx
Computo en la Nube con Azure - AI Gaming Panama.pptx
 
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx
 
UNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxUNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptx
 
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...
 
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptxLatino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx
 
NOVA - Enriquecimiento de IA con Azure Cognitive Search.pptx
NOVA - Enriquecimiento de IA con Azure Cognitive Search.pptxNOVA - Enriquecimiento de IA con Azure Cognitive Search.pptx
NOVA - Enriquecimiento de IA con Azure Cognitive Search.pptx
 
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...
 
ATG Puebla - El cementerio de Microsoft.pptx
ATG Puebla - El cementerio de Microsoft.pptxATG Puebla - El cementerio de Microsoft.pptx
ATG Puebla - El cementerio de Microsoft.pptx
 
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...
 
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...
 
Real NET Docs Show - Serverless Machine Learning v3.pptx
Real NET Docs Show - Serverless Machine Learning v3.pptxReal NET Docs Show - Serverless Machine Learning v3.pptx
Real NET Docs Show - Serverless Machine Learning v3.pptx
 
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptxSesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx
 
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...
 
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptx
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptxLatam Space Week - Clasificación de rocas espaciales por medio de IA.pptx
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptx
 
GAIBT Pune - Future of AI.pptx
GAIBT Pune - Future of AI.pptxGAIBT Pune - Future of AI.pptx
GAIBT Pune - Future of AI.pptx
 

Último

Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativaAdrianaMartnez618894
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofJuancarlosHuertasNio1
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELmaryfer27m
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptMiguelAtencio10
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
R1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaR1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaarkananubis
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90
 

Último (20)

Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativa
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sof
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFEL
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.ppt
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
R1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaR1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en mina
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptx
 

ACW - Azure Speaker Recognition Biometria de Voz.pptx

  • 2. Agenda  Servicios Cognitivos  Voz  Speaker Recognition  Speaker Verification  Speaker Identification  Soporte: Idiomas, Regiones, SDKs  Demo  Recomendaciones  Casos de Uso  Limitaciones  ¡Aplica!
  • 5. Servicios de Voz (Speech)
  • 7. Speaker Recognition en Azure Cognitive Services
  • 9. Frases de Speaker Verification (dependiente de texto) en inglés I am going to make him an offer he cannot refuse. Houston we have had a problem. My voice is my passport verify me. Apple juice tastes funny after toothpaste. You can get in without your password. You can activate security system now. My voice is stronger than passwords. My password is not your business. My name is unknown to you. Be yourself everyone else is already taken"
  • 11. Datos procesados por Speaker Recognition • Audio de inscripción • Firma de voz de inscripción • Firma de frase • Audio de reconocimiento
  • 12. Seguridad y Privacidad de Datos en Speaker Recognition • Los datos de Speaker Recognition se almacenan en un sistema seguro. • El audio de voz para la inscripción solo se utiliza cuando se actualiza el algoritmo.
  • 13. Seguridad y Privacidad de Datos en Speaker Recognition • El servicio no conserva la grabación de voz ni las funciones de voz extraídas. • Tú controlas cuánto tiempo deben conservarse los datos. • Debes asegurarte de haber recibido los permisos adecuados de los usuarios para utilizar Speaker Recognition.
  • 15. Regiones de Azure soportadas
  • 16. Lenguajes de programación / tecnologías soportadas • C# • C++ • Java • JavaScript • Python • Objective-C • REST API
  • 17. Demo
  • 18. Recomendaciones • Comprender lo que puede hacer el servicio de Speaker Recognition • Respetar el derecho a la privacidad de una persona • Revisar los términos legales de uso • Generar confianza con las partes interesadas afectadas • Obtener retroalimentación (comentarios) de los clientes • Capacitar y apoyar a los usuarios finales
  • 19. Casos de Uso • Personalización de dispositivos multiusuario • Verificación del cliente en centro de atención al usuario • Registro de pacientes basado en la voz • Transcripción de la reunión
  • 20. Limitaciones • Formatos de audio compatibles: Mono 16 bits, WAV codificado en PCM de 16 kHz. • Puede inscribirse una persona con hasta 300 segundos de audio (Speaker Verification independiente del texto / Speaker Identification). • Las API de Speaker Recognition no almacenan identificadores junto con las firmas de voz. • Speaker Recognition no puede reconocer a más de una persona en una sola entrada de voz. • Speaker Recognition no está diseñado para diferenciar una voz sintetizada o grabaciones de una voz de un speaker humano en vivo. • La API de Speaker Identification solo puede tomar hasta 50 candidatos para comparar la entrada de voz en una llamada a la API.
  • 21. ¡Aplica! • IA Responsable: Microsoft limita el acceso al servicio de Speaker Recognition. • Puede solicitar acceso a través del formulario de Acceso Limitado de Azure Cognitive Services Speaker Recognition: https://aka.ms/azure-speaker-recognition
  • 22. Q & A
  • 23. ¡Gracias por tu atención! Luis Beltrán Tomás Bata University in Zlín Tecnológico Nacional de México en Celaya About Me: https://about.me/luis-beltran

Notas del editor

  1. La voz humana tiene características únicas que pueden asociarse con un individuo. Speaker Recognition es un servicio de IA que puede reconocer a las personas comparando las características de voz únicas del habla entrante con las firmas de voz registradas.
  2. Estas son las API, SDK y servicios disponibles que tienen como objetivo ayudar a los desarrolladores a crear aplicaciones inteligentes sin el uso de "inteligencia artificial directa" y sin la necesidad de habilidades y conocimientos de ciencia de datos. Azure Cognitive Services permite a los desarrolladores agregar fácilmente características cognitivas a sus aplicaciones.   Azure Cognitive Services permite que las aplicaciones vean, escuchen, hablen, comprendan e incluso comiencen a razonar. La oferta de Azure Cognitive Services se puede dividir en cuatro pilares principales: visión, voz, lenguaje y decisión.
  3. Tenemos Speech o Voz. Es un conjunto de servicios que le permiten convertir voz a texto y texto a voz que suena natural.   Además, la capacidad de traducción de voz le permite realizar traducciones de voz en tiempo real, fácilmente integradas a través del servicio.    Finalmente, tenemos el servicio de Speaker Recognition.
  4. Speaker Recognition puede ayudar a determinar quién está hablando en un mensaje de audio. Las capacidades de Speaker Recognition se proporcionan a través de dos API: verificación e identificación del speaker por sus características de voz únicas utilizando biometría de voz. Proporciona datos de entrenamiento de audio para un solo speaker, lo que crea un perfil de inscripción o una firma basada en las características únicas de la voz de la persona que está hablando. Más tarde, puede cotejar muestras de voz de audio con este perfil para verificar que quien habla es la misma persona (proceso conocido como Speaker Verification) o cotejar muestras de voz de audio con un grupo de perfiles inscritos para ver si coincide con alguno(un proceso conocido como Speaker Identification). Entonces, en resumen, ¿cuál es la diferencia entre Identificación y Verificación? La identificación es el proceso de detectar qué miembro de un grupo de speakers está hablando. La verificación es el acto de confirmar que un speaker coincide con una voz conocida o inscrita. Analicemos estos dos procesos en detalle.
  5. Speaker Verification compara las características de voz de un individuo con la firma de voz registrada o inscrita de la identidad que dice ser. Por ejemplo, puede usarlo para la verificación de la identidad del cliente en centros de llamadas o acceso a instalaciones sin contacto. ¿Cómo funciona? Speaker Recognition puede ser dependiente del texto o independiente del texto: La verificación dependiente del texto significa que los speakers deben elegir la misma frase a modo de contraseña para usarla durante las fases de inscripción y verificación.  La verificación independiente del texto requiere una muestra de voz más larga que debe comenzar con una frase de activación particular para la inscripción, pero se puede hablar cualquier cosa, incluso durante el reconocimiento. Para la verificación dependiente del texto, la voz de la persona se inscribe diciendo una frase de contraseña de un conjunto de frases predefinidas. Las características de voz se extraen de la grabación de audio para formar una firma de voz única, mientras que la frase de contraseña elegida también se reconoce. Juntos, la firma de voz y la frase de contraseña se utilizan para Speaker Verification. En la fase de verificación, el ID asociado con el individuo a verificar se envía a la API. El servicio extrae las funciones de voz y la frase de contraseña de la grabación de voz de entrada. Luego compara las características de voz y la frase de contraseña con el perfil de inscripción del speaker correspondiente. La respuesta devuelve "Aceptar" o "Rechazar" con una puntuación de similitud que oscila entre 0 y 1. La respuesta "Aceptar" o "Rechazar" es un resultado que combina tanto el resultado de Speaker Verification como el resultado del reconocimiento de voz, mientras que la puntuación de similitud solo mide la similitud de la voz. Devolvemos "Aceptar" cuando el resultado del reconocimiento de voz coincide con la frase de inscripción y la puntuación de similitud de voz es mayor o igual a 0,5. Sin embargo, el resultado debe determinarse en función del escenario y otros factores de verificación que se están utilizando. Le recomendamos que experimente con sus propios datos y determine su umbral para anular la respuesta "Aceptar" o "Rechazar", según corresponda. La verificación independiente del texto no tiene restricciones sobre lo que la persona dice durante la inscripción, además de la frase de activación inicial para activar la inscripción. No tiene ninguna restricción en la muestra de audio que se debe verificar, ya que solo extrae las características de voz para obtener similitud. Las API no están destinadas a determinar si el audio es de una persona en vivo o una imitación / grabación de un speaker inscrito.
  6. En la versión actual de la API de Speaker Verification dependiente del texto, proporcionamos 10 frases en inglés para que los hablantes elijan. Las API no están destinadas a determinar si el audio es de una persona en vivo o una imitación o una grabación de una persona inscrita. La generación de frases aleatorias para que la persona las lea se considera efectiva para evitar el ataque de repetición.
  7. Speaker Identification se utiliza para determinar la identidad de un speaker desconocido dentro de un grupo de hablantes inscritos. Speaker Identification le permite atribuir una voz a un hablante individual y desbloquear el valor de escenarios con varios speakers, como: Soluciones de soporte para la productividad de reuniones remotas Cree personalización de dispositivos multiusuario ¿Cómo funciona? La inscripción para Speaker Identification es independiente del texto, lo que significa que no hay restricciones sobre lo que la persona dice en el audio, además de la frase de activación inicial para activar la inscripción. De manera similar a Speaker Verification, la voz se graba en la fase de inscripción y las características de voz se extraen para formar una firma de voz única. En la fase de identificación, la muestra de voz de entrada se compara con una lista especificada de voces inscritas (hasta 50 en cada solicitud). La respuesta incluyó una identificación identificada y cinco identificaciones mejor clasificadas con puntuaciones de similitud que van de 0 a 1. La identificación identificada se determina en función de la puntuación de similitud del speaker mejor emparejado. Si ninguno de los speakers candidatos devuelve una puntuación de similitud mayor o igual que 0,5, la respuesta devuelve una cadena de cero para representar "no se encuentra ninguna coincidencia".
  8. Speaker Recognition procesa los siguientes tipos de datos: Audio de inscripción: antes de la inscripción, los clientes solicitan un GUID aleatorio del servicio. Durante la fase de inscripción, los clientes envían la entrada de audio de un speaker y el GUID para generar una firma de voz y una coincidencia de firma de frase de contraseña. Firma de voz inscrita: Este es el vector numérico que representa las características de voz de un speaker individual, extraído de grabaciones de audio. Firma de frase de contraseña: Esta es una frase predefinida, por ejemplo, 'Mi voz es mi perfil'. Durante la inscripción de una persona, el audio de inscripción se procesará a través del servicio de reconocimiento de voz de Azure para confirmar que el texto de ese audio coincide con la frase de contraseña requerida. Audio de reconocimiento: El cliente envía la entrada de audio junto con los GUID relevantes que se procesarán al servicio de Speaker Recognition y las firmas de voz se procesan para determinar si el audio coincide con las firmas de voz de los speaker inscritos. Si se utiliza Speaker Verification dependiente del texto, la firma de la frase de contraseña también se transcribe mediante el reconocimiento de voz para determinar si hay una coincidencia de frase de contraseña. Como cliente, puede administrar y eliminar todos los datos almacenados asociados con cualquier GUID individual o todos los GUID, como el audio de inscripción, la firma de voz inscrita y la firma de frase de contraseña, pero sin audio de reconocimiento. No hay controles de cliente para este tipo de datos.
  9. En pocas palabras: el audio de inscripción se almacena en el servicio hasta que se elimina el perfil de voz. Las muestras de audio de reconocimiento no se conservan ni almacenan. Los datos de inscripción de personas se almacenan en un sistema seguro, incluido el audio de voz para la inscripción y las funciones de firma de voz. El audio de voz para la inscripción solo se usa cuando se actualiza el algoritmo y las características deben extraerse nuevamente.
  10. El servicio no conserva la grabación de voz ni las funciones de voz extraídas. Usted controla cuánto tiempo deben conservarse los datos. Debe asegurarse de haber recibido los permisos adecuados de los usuarios para speaker recognition.
  11. El reconocimiento de hablantes es en su mayoría agnóstico del idioma. Construimos un modelo universal para el reconocimiento de hablantes independiente del texto mediante la combinación de varias fuentes de datos de múltiples idiomas. Hemos ajustado y evaluado el modelo en los idiomas y configuraciones regionales que aparecen en la siguiente tabla.
  12. Available regions for Speaker Recognition are the following:
  13. Microsoft quiere ayudarle a desarrollar e implementar de forma responsable soluciones que utilicen el servicio de Speaker Recognition. Se adopta un enfoque basado en principios para defender la agencia personal y la dignidad al considerar la equidad, confiabilidad y seguridad de los sistemas de IA, la privacidad y la seguridad, la inclusión, la transparencia y la responsabilidad humana. Estas consideraciones reflejan el compromiso de Microsoft con el desarrollo de IA responsable. Las siguientes actividades le ayudan a prepararse para el éxito: Comprenda lo que puede hacer: evalúe completamente las capacidades de cualquier sistema de IA que esté utilizando para comprender sus capacidades y limitaciones. Comprenda cómo se desempeñará en su escenario particular probándolo con condiciones de la vida real y diversos datos de usuario que reflejen su contexto, incluidas las consideraciones de equidad. Respetar el derecho a la privacidad de un individuo: Solo recopile datos biométricos e información de individuos para fines legales y justificables. Obtenga un consentimiento significativo para su recopilación y usos previstos. No comparta datos sin el consentimiento explícito de las partes interesadas afectadas y los propietarios de los datos, y minimice los datos que comparte. Proporcionar un mecanismo que permita a las partes interesadas afectadas y a los propietarios de datos darse de baja del reconocimiento de speakers y eliminar sus datos en cualquier momento. Implemente una estrategia y un plan de retención de datos que solo conserve los datos de inscripción de los usuarios durante el tiempo que sea necesario para proporcionar los servicios. Elimine los datos del usuario después de algún período de tiempo, como la terminación del usuario o un período especificado de inactividad. Revisión legal: Obtenga asesoramiento legal adecuado para revisar su solución biométrica, especialmente si la utilizará en aplicaciones sensibles o de alto riesgo. En algunas jurisdicciones, existen requisitos legales específicos que rigen la recopilación, el uso, el almacenamiento y la seguridad de los datos biométricos. Usted es responsable del cumplimiento de todas las leyes y normativas aplicables que se aplican a la implementación de la solución. Generar confianza con las partes interesadas afectadas: Comunicar los beneficios esperados y los riesgos potenciales a las partes interesadas afectadas. Ayude a las personas a comprender por qué se necesitan los datos y cómo el uso de los datos conducirá a su beneficio. Describir el manejo de datos de una manera comprensible. Bucle de comentarios de los clientes: proporcione un canal de comentarios que permita a los usuarios y a las personas informar de problemas con el servicio después de que se haya implementado. Este mecanismo también debería permitir la retroalimentación sobre la equidad. Supervise y mejore el producto o la función impulsado por IA de forma continua. Prepárese para implementar cualquier retroalimentación y sugerencia de mejora. Establecer canales para recopilar preguntas e inquietudes de las partes interesadas afectadas (personas que podrían verse afectadas directa o indirectamente por el sistema, incluidos empleados, speakers y el público en general). Los posibles canales de comentarios incluyen características integradas en las experiencias de la aplicación o una dirección de correo electrónico fácil de recordar para obtener comentarios. Capacitar y apoyar a los usuarios finales: es posible que las personas que usan la salida de su solución, o que deciden si la salida es correcta, no tengan experiencia colaborando con sistemas de IA. Esto puede dar lugar a juicios desiguales o a la introducción de sesgos injustos. Puede empoderar a estos usuarios evaluando dónde pueden ocurrir discrepancias y proporcionando capacitación y soporte continuo.
  14. Verificación de la identidad del cliente: el centro de llamadas o los sistemas interactivos de respuesta de voz pueden usar Speaker Verification como una medida de seguridad adicional, cuando se combina con un número de teléfono, PIN u otro tipo de datos de autenticación. Esto ayuda a verificar la identidad de un cliente cuando solicita acceso a la información o para realizar transacciones. Speaker Identification para reuniones: La API de Speaker Identification se puede utilizar para identificar a personas individuales como parte de la transcripción de reuniones. En la transcripción del audio de una reunión, el discurso se puede atribuir al speaker o "invitado" correcto si no se encuentra ninguna coincidencia. En este escenario, el audio de entrada debe estar separado por speaker antes de usar la API de Speaker Identification. Personalización de dispositivos inteligentes: los dispositivos de interacción habilitados para voz, como vehículos inteligentes o speakers inteligentes, pueden usar el Speaker Recognition para proporcionar contenido personalizado. Por ejemplo, puede reproducir películas o música en respuesta a comandos de voz mediante la API de Speaker Verification independiente del texto. Autenticación multifactor: Un sistema de autenticación multifactor puede usar la voz como un factor para mejorar la seguridad. Por ejemplo, podría aprobar o denegar el acceso de los empleados a las instalaciones seguras mediante el servicio Azure Face y la API de Speaker Verification dependiente del texto.
  15. 3. Las API de Speaker Recognition no almacenan identificadores principales junto con firmas de voz o audio de un speaker enviado al servicio para su inscripción o reconocimiento. Microsoft asocia estos datos con GUID aleatorios. Depende de usted administrar la asignación de identidad de usuario entre estos GUID y sus usuarios. Usted es responsable de garantizar que estos datos se almacenen y administren de forma segura. 4. El servicio está destinado a tomar la entrada de voz de una persona y compararla con una o más firmas de voz. 5. Considere cuidadosamente los escenarios con riesgo de suplantación de identidad. Speaker Recognition no debe usarse como el único factor para autenticar a un usuario en aplicaciones donde la seguridad es el objetivo, como el acceso a la información financiera o la seguridad física.
  16. Como parte del compromiso de Microsoft con la IA responsable, están diseñando y lanzando Speaker Recognition con la intención de proteger los derechos de las personas y la sociedad, fomentar la interacción transparente entre humanos y computadoras y contrarrestar la proliferación de deepfakes dañinos y contenido engañoso. Por esta razón, el acceso y el uso del servicio speaker Recognition de Microsoft están limitados a través de un proceso de solicitud del cliente. Speaker Recognition requiere registro y Microsoft puede limitar el acceso en función de ciertos criterios de elegibilidad. Los clientes que deseen utilizar este servicio deben enviar un formulario de admisión. Microsoft puede requerir que los clientes vuelvan a verificar esta información periódicamente.