ACW - Azure Speaker Recognition Biometria de Voz.pptx

•Descargar como PPTX, PDF•

0 recomendaciones•334 vistas

Luis Beltran

Slides of my presentation about Voice Biometry using Azure Speaker Recognition capabilities at Azure Cloud Week event

Tecnología

Agenda
 Servicios Cognitivos
 Voz
 Speaker Recognition
 Speaker Verification
 Speaker Identification
 Soporte: Idiomas, Regiones, SDKs
 Demo
 Recomendaciones
 Casos de Uso
 Limitaciones
 ¡Aplica!

Speaker Recognition en Azure Cognitive Services

Frases de Speaker Verification (dependiente
de texto) en inglés
I am going to make him an offer he cannot refuse.
Houston we have had a problem.
My voice is my passport verify me.
Apple juice tastes funny after toothpaste.
You can get in without your password.
You can activate security system now.
My voice is stronger than passwords.
My password is not your business.
My name is unknown to you.
Be yourself everyone else is already taken"

Datos procesados por Speaker Recognition
• Audio de inscripción
• Firma de voz de inscripción
• Firma de frase
• Audio de reconocimiento

Seguridad y Privacidad de Datos en Speaker
Recognition
• Los datos de Speaker Recognition se almacenan en un sistema
seguro.
• El audio de voz para la inscripción solo se utiliza cuando se actualiza
el algoritmo.

Seguridad y Privacidad de Datos en Speaker
Recognition
• El servicio no conserva la grabación de voz ni las funciones de voz
extraídas.
• Tú controlas cuánto tiempo deben conservarse los datos.
• Debes asegurarte de haber recibido los permisos adecuados de los
usuarios para utilizar Speaker Recognition.

Lenguajes de programación / tecnologías
soportadas
• C#
• C++
• Java
• JavaScript
• Python
• Objective-C
• REST API

Recomendaciones
• Comprender lo que puede hacer el
servicio de Speaker Recognition
• Respetar el derecho a la privacidad de
una persona
• Revisar los términos legales de uso
• Generar confianza con las partes
interesadas afectadas
• Obtener retroalimentación (comentarios)
de los clientes
• Capacitar y apoyar a los usuarios finales

Casos de Uso
• Personalización de dispositivos multiusuario
• Verificación del cliente en centro de atención al usuario
• Registro de pacientes basado en la voz
• Transcripción de la reunión

Limitaciones
• Formatos de audio compatibles: Mono 16 bits, WAV codificado en PCM de
16 kHz.
• Puede inscribirse una persona con hasta 300 segundos de audio (Speaker
Verification independiente del texto / Speaker Identification).
• Las API de Speaker Recognition no almacenan identificadores junto con las
firmas de voz.
• Speaker Recognition no puede reconocer a más de una persona en una
sola entrada de voz.
• Speaker Recognition no está diseñado para diferenciar una voz sintetizada
o grabaciones de una voz de un speaker humano en vivo.
• La API de Speaker Identification solo puede tomar hasta 50 candidatos para
comparar la entrada de voz en una llamada a la API.

¡Aplica!
• IA Responsable:
Microsoft limita el acceso al servicio de Speaker Recognition.
• Puede solicitar acceso a través del formulario de Acceso Limitado de
Azure Cognitive Services Speaker Recognition:
https://aka.ms/azure-speaker-recognition

¡Gracias por tu atención!
Luis Beltrán
Tomás Bata University in Zlín
Tecnológico Nacional de México en Celaya
About Me:
https://about.me/luis-beltran

Más contenido relacionado

La actualidad más candente

Microsoft Cognitive servicesHernan Guzman

Inteligencia Artificial con Azure.pptxLuis Beltran

Global AI on Tour - Desarrollando un bot de WhatsApp serverless.pptxLuis Beltran

Azure Personalizer - Global AI Night Latam Template.pptxLuis Beltran

WarmiInTech Personalizer.pptxLuis Beltran

Programa tu Pandemia 2 Azure Video Indexer.pptxicebeam7

Inteligencia artificial in house con servicios cognitivos y dockerLuis Beltran

TERASOFT Preparandote para la vida profesional.pptxLuis Beltran

Intro a AI con Microsoft.pptxLuis Beltran

La actualidad más candente (9)

Microsoft Cognitive services

Inteligencia Artificial con Azure.pptx

Global AI on Tour - Desarrollando un bot de WhatsApp serverless.pptx

Azure Personalizer - Global AI Night Latam Template.pptx

WarmiInTech Personalizer.pptx

Programa tu Pandemia 2 Azure Video Indexer.pptx

Inteligencia artificial in house con servicios cognitivos y docker

TERASOFT Preparandote para la vida profesional.pptx

Intro a AI con Microsoft.pptx

Similar a ACW - Azure Speaker Recognition Biometria de Voz.pptx

04 GlobalAI Speaker Latam Biometria de voz Reconocimiento por voz en nuestr...icebeam7

Sistema multifuncional de grabación digital de voz y sesiones de pantallaComunycarse

Voip2day Verbio 201511Pablo Gil Robiou

Azure Video Analyzer - Guadalajara Connect.pptxLuis Beltran

Curso autenticacion robustaCein

Foros de vozMariajose Bayas

Voip2day video conferencia grado militar usando software libreINTELIX INGENIERIA - Rosario Argentina

3. certificados y pki1 2d

Seguridad de usuario en el acceso a internet 1Cein

Auronix desayuno-distribuibleMartha Cepeda

Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...VOIP2DAY

Retos adm electr_y_voto_electronicodomingosuarez

Audicity.pptxDanielFelipePrietoRu

Escuchando la voz del cliente con Speech AnalyticsMundo Contact

Aplicaciones Real-Time con SignalRRodolfo Finochietti

WarmiInTech Speech Cognitive Service.pptxLuis Beltran

Hasp Prospecto GeneralEdison L. Coronel Romero

SlingSecure Cifrado de voz movil EsponalSlingSecure Mobile Encryption

SISTEMA_DE_INTERCONEXION_DE_JUICIOS_ORAL.pdfssuser2e9e09

Foros de vozMariajose Bayas

Similar a ACW - Azure Speaker Recognition Biometria de Voz.pptx (20)

04 GlobalAI Speaker Latam Biometria de voz Reconocimiento por voz en nuestr...

Sistema multifuncional de grabación digital de voz y sesiones de pantalla

Voip2day Verbio 201511

Azure Video Analyzer - Guadalajara Connect.pptx

Curso autenticacion robusta

Foros de voz

Voip2day video conferencia grado militar usando software libre

3. certificados y pki

Seguridad de usuario en el acceso a internet 1

Auronix desayuno-distribuible

Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...

Retos adm electr_y_voto_electronico

Audicity.pptx

Escuchando la voz del cliente con Speech Analytics

Aplicaciones Real-Time con SignalR

WarmiInTech Speech Cognitive Service.pptx

Hasp Prospecto General

SlingSecure Cifrado de voz movil Esponal

SISTEMA_DE_INTERCONEXION_DE_JUICIOS_ORAL.pdf

Foros de voz

Más de Luis Beltran

AI for Accessibility.pptxLuis Beltran

NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptxLuis Beltran

03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptxLuis Beltran

BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...Luis Beltran

CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdfLuis Beltran

Computo en la Nube con Azure - AI Gaming Panama.pptxLuis Beltran

5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptxLuis Beltran

UNICABA - Azure Machine Learning.pptxLuis Beltran

Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...Luis Beltran

Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptxLuis Beltran

NOVA - Enriquecimiento de IA con Azure Cognitive Search.pptxLuis Beltran

Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...Luis Beltran

ATG Puebla - El cementerio de Microsoft.pptxLuis Beltran

Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...Luis Beltran

Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...Luis Beltran

Real NET Docs Show - Serverless Machine Learning v3.pptxLuis Beltran

Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptxLuis Beltran

XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...Luis Beltran

Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptxLuis Beltran

GAIBT Pune - Future of AI.pptxLuis Beltran

Más de Luis Beltran (20)

AI for Accessibility.pptx

NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx

03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx

BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...

CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf

Computo en la Nube con Azure - AI Gaming Panama.pptx

5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx

UNICABA - Azure Machine Learning.pptx

Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...

Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx

NOVA - Enriquecimiento de IA con Azure Cognitive Search.pptx

Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...

ATG Puebla - El cementerio de Microsoft.pptx

Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...

Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...

Real NET Docs Show - Serverless Machine Learning v3.pptx

Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx

XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...

Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptx

GAIBT Pune - Future of AI.pptx

Último

Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640

Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho

International Women's Day Sucre 2024 (IWD)GDGSucre

La era de la educación digital y sus desafiosFundación YOD YOD

KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD

El uso de las TIC's en la vida cotidiana.241514949

definicion segun autores de matemáticas educativaAdrianaMartnez618894

Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11

Plan de aula informatica segundo periodo.docxpabonheidy28

Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos

ejercicios pseint para aprogramacion sofJuancarlosHuertasNio1

ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2

Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg

trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill

PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770

El uso delas tic en la vida cotidiana MFELmaryfer27m

dokumen.tips_36274588-sistema-heui-eui.pptMiguelAtencio10

Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology

R1600G CAT Variables de cargadores en minaarkananubis

tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90

ACW - Azure Speaker Recognition Biometria de Voz.pptx

1. @darkicebeam

2. Agenda  Servicios Cognitivos  Voz  Speaker Recognition  Speaker Verification  Speaker Identification  Soporte: Idiomas, Regiones, SDKs  Demo  Recomendaciones  Casos de Uso  Limitaciones  ¡Aplica!

3. Servicios Cognitivos

4. Servicios Cognitivos

5. Servicios de Voz (Speech)

6. Speaker Recognition

7. Speaker Recognition en Azure Cognitive Services

8. Speaker Verification

9. Frases de Speaker Verification (dependiente de texto) en inglés I am going to make him an offer he cannot refuse. Houston we have had a problem. My voice is my passport verify me. Apple juice tastes funny after toothpaste. You can get in without your password. You can activate security system now. My voice is stronger than passwords. My password is not your business. My name is unknown to you. Be yourself everyone else is already taken"

10. Speaker Identification

11. Datos procesados por Speaker Recognition • Audio de inscripción • Firma de voz de inscripción • Firma de frase • Audio de reconocimiento

12. Seguridad y Privacidad de Datos en Speaker Recognition • Los datos de Speaker Recognition se almacenan en un sistema seguro. • El audio de voz para la inscripción solo se utiliza cuando se actualiza el algoritmo.

13. Seguridad y Privacidad de Datos en Speaker Recognition • El servicio no conserva la grabación de voz ni las funciones de voz extraídas. • Tú controlas cuánto tiempo deben conservarse los datos. • Debes asegurarte de haber recibido los permisos adecuados de los usuarios para utilizar Speaker Recognition.

14. Idiomas soportados

15. Regiones de Azure soportadas

16. Lenguajes de programación / tecnologías soportadas • C# • C++ • Java • JavaScript • Python • Objective-C • REST API

17. Demo

18. Recomendaciones • Comprender lo que puede hacer el servicio de Speaker Recognition • Respetar el derecho a la privacidad de una persona • Revisar los términos legales de uso • Generar confianza con las partes interesadas afectadas • Obtener retroalimentación (comentarios) de los clientes • Capacitar y apoyar a los usuarios finales

19. Casos de Uso • Personalización de dispositivos multiusuario • Verificación del cliente en centro de atención al usuario • Registro de pacientes basado en la voz • Transcripción de la reunión

20. Limitaciones • Formatos de audio compatibles: Mono 16 bits, WAV codificado en PCM de 16 kHz. • Puede inscribirse una persona con hasta 300 segundos de audio (Speaker Verification independiente del texto / Speaker Identification). • Las API de Speaker Recognition no almacenan identificadores junto con las firmas de voz. • Speaker Recognition no puede reconocer a más de una persona en una sola entrada de voz. • Speaker Recognition no está diseñado para diferenciar una voz sintetizada o grabaciones de una voz de un speaker humano en vivo. • La API de Speaker Identification solo puede tomar hasta 50 candidatos para comparar la entrada de voz en una llamada a la API.

21. ¡Aplica! • IA Responsable: Microsoft limita el acceso al servicio de Speaker Recognition. • Puede solicitar acceso a través del formulario de Acceso Limitado de Azure Cognitive Services Speaker Recognition: https://aka.ms/azure-speaker-recognition

22. Q & A

23. ¡Gracias por tu atención! Luis Beltrán Tomás Bata University in Zlín Tecnológico Nacional de México en Celaya About Me: https://about.me/luis-beltran

Notas del editor

La voz humana tiene características únicas que pueden asociarse con un individuo. Speaker Recognition es un servicio de IA que puede reconocer a las personas comparando las características de voz únicas del habla entrante con las firmas de voz registradas.
Estas son las API, SDK y servicios disponibles que tienen como objetivo ayudar a los desarrolladores a crear aplicaciones inteligentes sin el uso de "inteligencia artificial directa" y sin la necesidad de habilidades y conocimientos de ciencia de datos. Azure Cognitive Services permite a los desarrolladores agregar fácilmente características cognitivas a sus aplicaciones. Azure Cognitive Services permite que las aplicaciones vean, escuchen, hablen, comprendan e incluso comiencen a razonar. La oferta de Azure Cognitive Services se puede dividir en cuatro pilares principales: visión, voz, lenguaje y decisión.
Tenemos Speech o Voz. Es un conjunto de servicios que le permiten convertir voz a texto y texto a voz que suena natural. Además, la capacidad de traducción de voz le permite realizar traducciones de voz en tiempo real, fácilmente integradas a través del servicio. Finalmente, tenemos el servicio de Speaker Recognition.
Speaker Recognition puede ayudar a determinar quién está hablando en un mensaje de audio. Las capacidades de Speaker Recognition se proporcionan a través de dos API: verificación e identificación del speaker por sus características de voz únicas utilizando biometría de voz. Proporciona datos de entrenamiento de audio para un solo speaker, lo que crea un perfil de inscripción o una firma basada en las características únicas de la voz de la persona que está hablando. Más tarde, puede cotejar muestras de voz de audio con este perfil para verificar que quien habla es la misma persona (proceso conocido como Speaker Verification) o cotejar muestras de voz de audio con un grupo de perfiles inscritos para ver si coincide con alguno(un proceso conocido como Speaker Identification). Entonces, en resumen, ¿cuál es la diferencia entre Identificación y Verificación? La identificación es el proceso de detectar qué miembro de un grupo de speakers está hablando. La verificación es el acto de confirmar que un speaker coincide con una voz conocida o inscrita. Analicemos estos dos procesos en detalle.
Speaker Verification compara las características de voz de un individuo con la firma de voz registrada o inscrita de la identidad que dice ser. Por ejemplo, puede usarlo para la verificación de la identidad del cliente en centros de llamadas o acceso a instalaciones sin contacto. ¿Cómo funciona?Speaker Recognition puede ser dependiente del texto o independiente del texto: La verificación dependiente del texto significa que los speakers deben elegir la misma frase a modo de contraseña para usarla durante las fases de inscripción y verificación. La verificación independiente del texto requiere una muestra de voz más larga que debe comenzar con una frase de activación particular para la inscripción, pero se puede hablar cualquier cosa, incluso durante el reconocimiento. Para la verificación dependiente del texto, la voz de la persona se inscribe diciendo una frase de contraseña de un conjunto de frases predefinidas. Las características de voz se extraen de la grabación de audio para formar una firma de voz única, mientras que la frase de contraseña elegida también se reconoce. Juntos, la firma de voz y la frase de contraseña se utilizan para Speaker Verification. En la fase de verificación, el ID asociado con el individuo a verificar se envía a la API. El servicio extrae las funciones de voz y la frase de contraseña de la grabación de voz de entrada. Luego compara las características de voz y la frase de contraseña con el perfil de inscripción del speaker correspondiente. La respuesta devuelve "Aceptar" o "Rechazar" con una puntuación de similitud que oscila entre 0 y 1. La respuesta "Aceptar" o "Rechazar" es un resultado que combina tanto el resultado de Speaker Verification como el resultado del reconocimiento de voz, mientras que la puntuación de similitud solo mide la similitud de la voz. Devolvemos "Aceptar" cuando el resultado del reconocimiento de voz coincide con la frase de inscripción y la puntuación de similitud de voz es mayor o igual a 0,5. Sin embargo, el resultado debe determinarse en función del escenario y otros factores de verificación que se están utilizando. Le recomendamos que experimente con sus propios datos y determine su umbral para anular la respuesta "Aceptar" o "Rechazar", según corresponda. La verificación independiente del texto no tiene restricciones sobre lo que la persona dice durante la inscripción, además de la frase de activación inicial para activar la inscripción. No tiene ninguna restricción en la muestra de audio que se debe verificar, ya que solo extrae las características de voz para obtener similitud. Las API no están destinadas a determinar si el audio es de una persona en vivo o una imitación / grabación de un speaker inscrito.
En la versión actual de la API de Speaker Verification dependiente del texto, proporcionamos 10 frases en inglés para que los hablantes elijan. Las API no están destinadas a determinar si el audio es de una persona en vivo o una imitación o una grabación de una persona inscrita. La generación de frases aleatorias para que la persona las lea se considera efectiva para evitar el ataque de repetición.
Speaker Identification se utiliza para determinar la identidad de un speaker desconocido dentro de un grupo de hablantes inscritos. Speaker Identification le permite atribuir una voz a un hablante individual y desbloquear el valor de escenarios con varios speakers, como: Soluciones de soporte para la productividad de reuniones remotas Cree personalización de dispositivos multiusuario ¿Cómo funciona? La inscripción para Speaker Identification es independiente del texto, lo que significa que no hay restricciones sobre lo que la persona dice en el audio, además de la frase de activación inicial para activar la inscripción. De manera similar a Speaker Verification, la voz se graba en la fase de inscripción y las características de voz se extraen para formar una firma de voz única. En la fase de identificación, la muestra de voz de entrada se compara con una lista especificada de voces inscritas (hasta 50 en cada solicitud). La respuesta incluyó una identificación identificada y cinco identificaciones mejor clasificadas con puntuaciones de similitud que van de 0 a 1. La identificación identificada se determina en función de la puntuación de similitud del speaker mejor emparejado. Si ninguno de los speakers candidatos devuelve una puntuación de similitud mayor o igual que 0,5, la respuesta devuelve una cadena de cero para representar "no se encuentra ninguna coincidencia".
Speaker Recognition procesa los siguientes tipos de datos: Audio de inscripción: antes de la inscripción, los clientes solicitan un GUID aleatorio del servicio. Durante la fase de inscripción, los clientes envían la entrada de audio de un speaker y el GUID para generar una firma de voz y una coincidencia de firma de frase de contraseña. Firma de voz inscrita: Este es el vector numérico que representa las características de voz de un speaker individual, extraído de grabaciones de audio. Firma de frase de contraseña: Esta es una frase predefinida, por ejemplo, 'Mi voz es mi perfil'. Durante la inscripción de una persona, el audio de inscripción se procesará a través del servicio de reconocimiento de voz de Azure para confirmar que el texto de ese audio coincide con la frase de contraseña requerida. Audio de reconocimiento: El cliente envía la entrada de audio junto con los GUID relevantes que se procesarán al servicio de Speaker Recognition y las firmas de voz se procesan para determinar si el audio coincide con las firmas de voz de los speaker inscritos. Si se utiliza Speaker Verification dependiente del texto, la firma de la frase de contraseña también se transcribe mediante el reconocimiento de voz para determinar si hay una coincidencia de frase de contraseña. Como cliente, puede administrar y eliminar todos los datos almacenados asociados con cualquier GUID individual o todos los GUID, como el audio de inscripción, la firma de voz inscrita y la firma de frase de contraseña, pero sin audio de reconocimiento. No hay controles de cliente para este tipo de datos.
En pocas palabras: el audio de inscripción se almacena en el servicio hasta que se elimina el perfil de voz. Las muestras de audio de reconocimiento no se conservan ni almacenan. Los datos de inscripción de personas se almacenan en un sistema seguro, incluido el audio de voz para la inscripción y las funciones de firma de voz. El audio de voz para la inscripción solo se usa cuando se actualiza el algoritmo y las características deben extraerse nuevamente.
El servicio no conserva la grabación de voz ni las funciones de voz extraídas. Usted controla cuánto tiempo deben conservarse los datos. Debe asegurarse de haber recibido los permisos adecuados de los usuarios para speaker recognition.
El reconocimiento de hablantes es en su mayoría agnóstico del idioma. Construimos un modelo universal para el reconocimiento de hablantes independiente del texto mediante la combinación de varias fuentes de datos de múltiples idiomas. Hemos ajustado y evaluado el modelo en los idiomas y configuraciones regionales que aparecen en la siguiente tabla.
Available regions for Speaker Recognition are the following:
Microsoft quiere ayudarle a desarrollar e implementar de forma responsable soluciones que utilicen el servicio de Speaker Recognition. Se adopta un enfoque basado en principios para defender la agencia personal y la dignidad al considerar la equidad, confiabilidad y seguridad de los sistemas de IA, la privacidad y la seguridad, la inclusión, la transparencia y la responsabilidad humana. Estas consideraciones reflejan el compromiso de Microsoft con el desarrollo de IA responsable. Las siguientes actividades le ayudan a prepararse para el éxito: Comprenda lo que puede hacer: evalúe completamente las capacidades de cualquier sistema de IA que esté utilizando para comprender sus capacidades y limitaciones. Comprenda cómo se desempeñará en su escenario particular probándolo con condiciones de la vida real y diversos datos de usuario que reflejen su contexto, incluidas las consideraciones de equidad. Respetar el derecho a la privacidad de un individuo: Solo recopile datos biométricos e información de individuos para fines legales y justificables. Obtenga un consentimiento significativo para su recopilación y usos previstos. No comparta datos sin el consentimiento explícito de las partes interesadas afectadas y los propietarios de los datos, y minimice los datos que comparte. Proporcionar un mecanismo que permita a las partes interesadas afectadas y a los propietarios de datos darse de baja del reconocimiento de speakers y eliminar sus datos en cualquier momento. Implemente una estrategia y un plan de retención de datos que solo conserve los datos de inscripción de los usuarios durante el tiempo que sea necesario para proporcionar los servicios. Elimine los datos del usuario después de algún período de tiempo, como la terminación del usuario o un período especificado de inactividad. Revisión legal: Obtenga asesoramiento legal adecuado para revisar su solución biométrica, especialmente si la utilizará en aplicaciones sensibles o de alto riesgo. En algunas jurisdicciones, existen requisitos legales específicos que rigen la recopilación, el uso, el almacenamiento y la seguridad de los datos biométricos. Usted es responsable del cumplimiento de todas las leyes y normativas aplicables que se aplican a la implementación de la solución. Generar confianza con las partes interesadas afectadas: Comunicar los beneficios esperados y los riesgos potenciales a las partes interesadas afectadas. Ayude a las personas a comprender por qué se necesitan los datos y cómo el uso de los datos conducirá a su beneficio. Describir el manejo de datos de una manera comprensible. Bucle de comentarios de los clientes: proporcione un canal de comentarios que permita a los usuarios y a las personas informar de problemas con el servicio después de que se haya implementado. Este mecanismo también debería permitir la retroalimentación sobre la equidad. Supervise y mejore el producto o la función impulsado por IA de forma continua. Prepárese para implementar cualquier retroalimentación y sugerencia de mejora. Establecer canales para recopilar preguntas e inquietudes de las partes interesadas afectadas (personas que podrían verse afectadas directa o indirectamente por el sistema, incluidos empleados, speakers y el público en general). Los posibles canales de comentarios incluyen características integradas en las experiencias de la aplicación o una dirección de correo electrónico fácil de recordar para obtener comentarios. Capacitar y apoyar a los usuarios finales: es posible que las personas que usan la salida de su solución, o que deciden si la salida es correcta, no tengan experiencia colaborando con sistemas de IA. Esto puede dar lugar a juicios desiguales o a la introducción de sesgos injustos. Puede empoderar a estos usuarios evaluando dónde pueden ocurrir discrepancias y proporcionando capacitación y soporte continuo.
Verificación de la identidad del cliente: el centro de llamadas o los sistemas interactivos de respuesta de voz pueden usar Speaker Verification como una medida de seguridad adicional, cuando se combina con un número de teléfono, PIN u otro tipo de datos de autenticación. Esto ayuda a verificar la identidad de un cliente cuando solicita acceso a la información o para realizar transacciones. Speaker Identification para reuniones: La API de Speaker Identification se puede utilizar para identificar a personas individuales como parte de la transcripción de reuniones. En la transcripción del audio de una reunión, el discurso se puede atribuir al speaker o "invitado" correcto si no se encuentra ninguna coincidencia. En este escenario, el audio de entrada debe estar separado por speaker antes de usar la API de Speaker Identification. Personalización de dispositivos inteligentes: los dispositivos de interacción habilitados para voz, como vehículos inteligentes o speakers inteligentes, pueden usar el Speaker Recognition para proporcionar contenido personalizado. Por ejemplo, puede reproducir películas o música en respuesta a comandos de voz mediante la API de Speaker Verification independiente del texto. Autenticación multifactor: Un sistema de autenticación multifactor puede usar la voz como un factor para mejorar la seguridad. Por ejemplo, podría aprobar o denegar el acceso de los empleados a las instalaciones seguras mediante el servicio Azure Face y la API de Speaker Verification dependiente del texto.
3. Las API de Speaker Recognition no almacenan identificadores principales junto con firmas de voz o audio de un speaker enviado al servicio para su inscripción o reconocimiento. Microsoft asocia estos datos con GUID aleatorios. Depende de usted administrar la asignación de identidad de usuario entre estos GUID y sus usuarios. Usted es responsable de garantizar que estos datos se almacenen y administren de forma segura. 4. El servicio está destinado a tomar la entrada de voz de una persona y compararla con una o más firmas de voz. 5. Considere cuidadosamente los escenarios con riesgo de suplantación de identidad. Speaker Recognition no debe usarse como el único factor para autenticar a un usuario en aplicaciones donde la seguridad es el objetivo, como el acceso a la información financiera o la seguridad física.
Como parte del compromiso de Microsoft con la IA responsable, están diseñando y lanzando Speaker Recognition con la intención de proteger los derechos de las personas y la sociedad, fomentar la interacción transparente entre humanos y computadoras y contrarrestar la proliferación de deepfakes dañinos y contenido engañoso. Por esta razón, el acceso y el uso del servicio speaker Recognition de Microsoft están limitados a través de un proceso de solicitud del cliente. Speaker Recognition requiere registro y Microsoft puede limitar el acceso en función de ciertos criterios de elegibilidad. Los clientes que deseen utilizar este servicio deben enviar un formulario de admisión. Microsoft puede requerir que los clientes vuelvan a verificar esta información periódicamente.

ACW - Azure Speaker Recognition Biometria de Voz.pptx

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (9)

Similar a ACW - Azure Speaker Recognition Biometria de Voz.pptx

Similar a ACW - Azure Speaker Recognition Biometria de Voz.pptx (20)

Más de Luis Beltran

Más de Luis Beltran (20)

Último

Último (20)

ACW - Azure Speaker Recognition Biometria de Voz.pptx

Notas del editor