SlideShare una empresa de Scribd logo
1 de 21
-Los léxicos de alta calidad permiten que nosotros analicemos la lengua en la escala y a través
de una amplia variedad de señales. Por ejemplo, investigadores a menudo usan LIWC (Conde
de la Palabra y la Pregunta lingüístico) para analizar puestos de medios sociales, contando
palabras en categorías léxicas como tristeza, salud y emoción positiva.
- LIWC muchas ventajas: es rápido, fácil a hacer de intérprete, y extensivamente validado. Los
investigadores pueden inspeccionar fácilmente y modificar los términos en sus categorías —
listas de palabras que, por ejemplo, están relacionada
“grito” y “guerra” a la cólera de emoción. Pero como otro léxicos populares, LIWC es pequeño:
tiene sólo 40 actuales y las categorías emocionales, muchas de las cuales contienen menos de
100 palabras. Adelante, muchas categorías potencialmente útiles como violencia o los medios
sociales no existen en léxicos corrientes, requiriendo cura.tion ad hoc y validación de nuevo
patrón oro listas de palabras. Otras categorías se pueden beneficiar de actualizar con términos
modernos como “PayPal” por el dinero o “selfie” durante ocio.
Es un instrumento de análisis del texto que permite que usuarios construyan y valide
nuevas categorías a petición usando a unos cuantos sembrando condiciones. También
cubre un juego amplio, pre validado de 200 emocionales y categorías actuales.
• Un enfoque a generación y convalidación de clasificación de la palabra diccionarios
usando una combinación de aprendizaje profundo y micro tarea crowdsourcing.
• Los resultados que sugieren Empath pueden generar categorías sumamente similar a
categorías que se han templado la mano y psico métricamente validado por gente
(promedio Pearson correlación de 0.906), hasta sin un filtro de la muchedumbre (0.90).
APLICACIONES DE EMPATH
La exploración del engaño dataset
 Dirigimos el juego lleno de Empath de categorías sobre el verídico y revisiones
engañosas y estadística agregada producida para cada uno.
 La utilización de medios normalizados de la categoría cuenta a cada uno grupo,
entonces calculamos proporciones de probabilidades y p-valores para el categorías
con la mayor probabilidad para aparecer en revisiones engañosas y verídicas.
Todos los resultados que relatamos son significativos después de Bonferroni corrección
Empath: una vida el léxico extrajo del texto moderno en la red. Empath permite investigar para
generar y validar nuevas categorías léxicas a petición, usando una combinación de aprendizaje
profundo y crowdsourcing. Por ejemplo, la utilización de la semilla llama “el gorjeo” y
“Facebook”, podemos generar y validar una categoría para medios sociales.
Empath también analiza el texto a través de 200 incorporados, categorías pre validadas
dibujadas de conocimiento existente las bases y la literatura sobre emociones humanas, como:
 abandono (privan, respuesta negativa)
 gobierno (embajada, demócrata)
 fuerza (resistente, poderoso)
 tecnología (iPad, androide)
Empath combina técnicas de la PNL modernas con las ventajas de léxicos hechos a mano sus
categorías son listas de palabras transparentes, fácilmente ampliadas y rápido.
Y como LIWC (pero a diferencia de otro aprendizaje de la máquina modelos), los contenido de Empath son validados por la gente.
Mientras Empath presenta un enfoque que se puede entrenar en cualquier recopilación del
texto, en este periódico usamos 1.8 mil millones de palabras de la moderna ficción aficionada.
Lengua espacial en mentiras
Mientras el estudio original proporcionó algunas pruebas estos mentirosos usan la lengua
menos espacialmente descriptivas, no era capaz de probar la teoría directamente. Usando
Empath, podemos generar un nuevo juego que el humano validó en términos que capturan esta
idea, creando una nueva categoría espacial.
Así, decimos a Empath sembrar la categoría con los términos “grande”, “pequeño”, y “circular”.
Empath entonces descubre una serie de términos relacionados y usa el muchedumbre para
validarlos.
produciendo el racimo: circular, pequeño, grande, grande, enorme, gigantesco, diminuto, rectangular, rectángulo,
masivo, gigantesco, enorme, más bien pequeño, doblado, medio, oval, puesto la talla, talla, miniatura, círculo,
colosal, centro, triangular, forma, cuadrada, redonda, formada, decorativa.
Ejemplo :Entendimiento de lengua en revisiones de la
película
 ¿De qué disfrutan las clases de películas revisores? Lo que las palabras hacen ¿los revisores
usan para la alabanza o los dejan por los suelos? En nuestro segundo ejemplo, mostramos cómo
Empath nos puede ayudar a descubrir tendencias en un dataset de revisiones de la película
coleccionadas por Pang. Este dataset contiene revisiones de la película de 2000, divididas
regularmente a través del positivo y sentimiento negativo.
Empath analiza el texto a través de cientos de temas y emociones.
Como LIWC y otros instrumentos basados en el diccionario, cuenta la categoría términos en un
documento del texto. Sin embargo, Empath cubre al juego más amplio de categorías que otros
instrumentos y los usuarios pueden generar y valide nuevas categorías con unas palabras de la
semilla.
El diseño de las categorías conducidas por los datos de Empath
Analizando datos textuales, los investigadores colectivamente toman parte con muchas categorías
lingüísticas posibles. Por ejemplo, social los científicos estudian las redes de conversaciones que
rodean depresión en Gorjeo [38], psicólogos el papel de auto presentación en comunidades de
datación en línea , o digital humanistas el papel de feminidad en literatura griega.
 Empath pretende hacer posible todos estos análisis (y más) a través de su 200 humano validó
categorías, que temas de la tapa como violencia, depresión o feminidad. Donde ¿los nombres
de estas categorías vienen de? Adoptamos a enfoque conducido por los datos usando la base
de conocimiento de ConceptNet
 Las relaciones de dependencia en ConceptNet proporcionan a la jerarquía de la información y
hechos que sirven de una fuente de categoría nombres y palabras de la semilla para Empath
(p.ej., la guerra es una forma del conflicto, la marcha es una forma de ejercicio). Preferimos
este enfoque a uno puramente manual ya que puede escalar potencialmente a miles de otras
nuevas categorías.
 Por ejemplo, cuando un investigador proporciona “camisa” y “sombrero” como palabras de la
semilla, ConceptNet nos dice que las camisas y los sombreros son artículos de ropa. De este
modo, Empath puede crear y validar una ropa categoría, usando “camisa” y “sombrero” como
palabras de la semilla: blazer, chaleco, suéter, sin mangas, blusa, tela escocesa, medias,
camiseta, uso, chaqueta, buttondown, longsleeve, falda, camiseta, buttonup, de manga larga,
hoody, tanktop, polainas.
Expresamente, para generar los nombres de la categoría de Empath y semilla términos,
seleccionamos 200 relaciones de dependencia comunes en ConceptNet, acondicionado en 10,000
palabras comunes en nuestra recopilación. Entonces a mano refinamos esta lista, eliminando
redundante o categorías escasas. Para algunas categorías añadimos la semilla adicional llama para
representar mejor el concepto, resultando en un juego final de dos a cinco términos de la semilla
para cada categoría.
nos reunimos evalúan correlaciones de Pearson contra LIWC para soldado y EmoLex (dos humano
existente léxicos validados). Encontramos una correlación de la prueba patrón de 0.876 entre
soldado y LIWC sobre emoción positiva, negativa emoción, religión, trabajo, y logro y una
correlación de 0.899 entre EmoLex y LIWC sobre emoción positiva, emoción negativa, cólera y
tristeza. Mientras EmoLex y el soldado comúnmente se considera como patrones oro, guardan
correlación imperfectamente con LIWC. Tomamos esto como pruebas esto los léxicos del patrón
oro pueden discrepar: si Empath se acerca su actuación contra LIWC, está de acuerdo con LIWC
también ya que otros diccionarios con cuidado validados están de acuerdo con LIWC.
CONCLUSIÓN
Empath pretende combinar técnicas de la PNL modernas con el transparencia de diccionarios
como LIWC. En hacer tan, provee tanto formas más amplias como más profundas de análisis
del texto que instrumentos existentes. En la anchura, Empath ofrece cientos del predefinido
las lentillas a través de las cuales los investigadores pueden analizar el texto. En profundidad,
sus categorías definidas por los usuarios proporcionan un medio flexible por qué
investigadores pueden preguntar a preguntas concretas de la esfera. Éstos las preguntas
cambian alguna vez, como es nuestro uso de la lengua. Empath es un léxico vivo – capaz de
mantenerse al corriente de cada uno.
Empath
Empath
Empath
Empath
Empath
Empath
Empath
Empath
Empath
Empath

Más contenido relacionado

Similar a Empath

Unidad III exposicion
Unidad III exposicionUnidad III exposicion
Unidad III exposicionVictor Manu-l
 
Poggi analytics - tm - 1b
Poggi   analytics - tm - 1bPoggi   analytics - tm - 1b
Poggi analytics - tm - 1bGaston Liberman
 
LR01_LecturaCritica.pdf
LR01_LecturaCritica.pdfLR01_LecturaCritica.pdf
LR01_LecturaCritica.pdfSORYTAVALENCIA
 
Quin robyn imagen y representacion
Quin robyn imagen y representacionQuin robyn imagen y representacion
Quin robyn imagen y representacionCynthia Comunica
 
Quin robyn imagen y representacion
Quin robyn imagen y representacionQuin robyn imagen y representacion
Quin robyn imagen y representacionCynthia Comunica
 
Para enviar. clasificación jerárquica HABILIDADES DEL PENSAMIENTO
Para enviar. clasificación jerárquica HABILIDADES DEL PENSAMIENTO Para enviar. clasificación jerárquica HABILIDADES DEL PENSAMIENTO
Para enviar. clasificación jerárquica HABILIDADES DEL PENSAMIENTO NGARZABAL
 
Tecnicas de redaccion
Tecnicas de redaccionTecnicas de redaccion
Tecnicas de redaccionYaneth Vargas
 
Ejemplo de trabajo sobre un título prescrito
Ejemplo de trabajo sobre un título prescritoEjemplo de trabajo sobre un título prescrito
Ejemplo de trabajo sobre un título prescritowikiwilliams
 
4. formulación de hipótesis
4. formulación de hipótesis4. formulación de hipótesis
4. formulación de hipótesisDavid baena casas
 
Analogias verbales metodos solucion
Analogias verbales   metodos solucionAnalogias verbales   metodos solucion
Analogias verbales metodos solucionNoni Gus
 
Módulo 1 - LECTURA PARA LA COTIDIANIDAD
Módulo 1 - LECTURA PARA LA COTIDIANIDADMódulo 1 - LECTURA PARA LA COTIDIANIDAD
Módulo 1 - LECTURA PARA LA COTIDIANIDADEliana otero
 
Evaluación rasgos lingüísticos 2015
Evaluación rasgos lingüísticos 2015Evaluación rasgos lingüísticos 2015
Evaluación rasgos lingüísticos 2015CeFIAME
 

Similar a Empath (20)

Unidad III exposicion
Unidad III exposicionUnidad III exposicion
Unidad III exposicion
 
Poggi analytics - tm - 1b
Poggi   analytics - tm - 1bPoggi   analytics - tm - 1b
Poggi analytics - tm - 1b
 
Semana 08
Semana 08Semana 08
Semana 08
 
LR01_LecturaCritica.pdf
LR01_LecturaCritica.pdfLR01_LecturaCritica.pdf
LR01_LecturaCritica.pdf
 
ComunicaciòN Productiva
ComunicaciòN ProductivaComunicaciòN Productiva
ComunicaciòN Productiva
 
La teoría del lenguaje
La teoría del lenguajeLa teoría del lenguaje
La teoría del lenguaje
 
Universo del significado
Universo del significadoUniverso del significado
Universo del significado
 
Ensayando
EnsayandoEnsayando
Ensayando
 
Ensayando
EnsayandoEnsayando
Ensayando
 
Quin robyn imagen y representacion
Quin robyn imagen y representacionQuin robyn imagen y representacion
Quin robyn imagen y representacion
 
Quin robyn imagen y representacion
Quin robyn imagen y representacionQuin robyn imagen y representacion
Quin robyn imagen y representacion
 
Para enviar. clasificación jerárquica HABILIDADES DEL PENSAMIENTO
Para enviar. clasificación jerárquica HABILIDADES DEL PENSAMIENTO Para enviar. clasificación jerárquica HABILIDADES DEL PENSAMIENTO
Para enviar. clasificación jerárquica HABILIDADES DEL PENSAMIENTO
 
Tecnicas de redaccion
Tecnicas de redaccionTecnicas de redaccion
Tecnicas de redaccion
 
Ejemplo de trabajo sobre un título prescrito
Ejemplo de trabajo sobre un título prescritoEjemplo de trabajo sobre un título prescrito
Ejemplo de trabajo sobre un título prescrito
 
4. formulación de hipótesis
4. formulación de hipótesis4. formulación de hipótesis
4. formulación de hipótesis
 
clase lógica.pdf
clase lógica.pdfclase lógica.pdf
clase lógica.pdf
 
La hipotesis
La hipotesisLa hipotesis
La hipotesis
 
Analogias verbales metodos solucion
Analogias verbales   metodos solucionAnalogias verbales   metodos solucion
Analogias verbales metodos solucion
 
Módulo 1 - LECTURA PARA LA COTIDIANIDAD
Módulo 1 - LECTURA PARA LA COTIDIANIDADMódulo 1 - LECTURA PARA LA COTIDIANIDAD
Módulo 1 - LECTURA PARA LA COTIDIANIDAD
 
Evaluación rasgos lingüísticos 2015
Evaluación rasgos lingüísticos 2015Evaluación rasgos lingüísticos 2015
Evaluación rasgos lingüísticos 2015
 

Último

SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdfValeriaCorrea29
 
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptAlberto Rubio
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxFernando Solis
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfMercedes Gonzalez
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOluismii249
 
PIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesPIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesYanirisBarcelDelaHoz
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSSEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSYadi Campos
 
Infografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdfInfografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdfAlfaresbilingual
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxiemerc2024
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.docRodneyFrankCUADROSMI
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docxEliaHernndez7
 

Último (20)

SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdf
 
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
PIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesPIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonables
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSSEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
Infografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdfInfografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdf
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 

Empath

  • 1.
  • 2.
  • 3. -Los léxicos de alta calidad permiten que nosotros analicemos la lengua en la escala y a través de una amplia variedad de señales. Por ejemplo, investigadores a menudo usan LIWC (Conde de la Palabra y la Pregunta lingüístico) para analizar puestos de medios sociales, contando palabras en categorías léxicas como tristeza, salud y emoción positiva. - LIWC muchas ventajas: es rápido, fácil a hacer de intérprete, y extensivamente validado. Los investigadores pueden inspeccionar fácilmente y modificar los términos en sus categorías — listas de palabras que, por ejemplo, están relacionada “grito” y “guerra” a la cólera de emoción. Pero como otro léxicos populares, LIWC es pequeño: tiene sólo 40 actuales y las categorías emocionales, muchas de las cuales contienen menos de 100 palabras. Adelante, muchas categorías potencialmente útiles como violencia o los medios sociales no existen en léxicos corrientes, requiriendo cura.tion ad hoc y validación de nuevo patrón oro listas de palabras. Otras categorías se pueden beneficiar de actualizar con términos modernos como “PayPal” por el dinero o “selfie” durante ocio.
  • 4. Es un instrumento de análisis del texto que permite que usuarios construyan y valide nuevas categorías a petición usando a unos cuantos sembrando condiciones. También cubre un juego amplio, pre validado de 200 emocionales y categorías actuales. • Un enfoque a generación y convalidación de clasificación de la palabra diccionarios usando una combinación de aprendizaje profundo y micro tarea crowdsourcing. • Los resultados que sugieren Empath pueden generar categorías sumamente similar a categorías que se han templado la mano y psico métricamente validado por gente (promedio Pearson correlación de 0.906), hasta sin un filtro de la muchedumbre (0.90).
  • 5. APLICACIONES DE EMPATH La exploración del engaño dataset  Dirigimos el juego lleno de Empath de categorías sobre el verídico y revisiones engañosas y estadística agregada producida para cada uno.  La utilización de medios normalizados de la categoría cuenta a cada uno grupo, entonces calculamos proporciones de probabilidades y p-valores para el categorías con la mayor probabilidad para aparecer en revisiones engañosas y verídicas. Todos los resultados que relatamos son significativos después de Bonferroni corrección
  • 6. Empath: una vida el léxico extrajo del texto moderno en la red. Empath permite investigar para generar y validar nuevas categorías léxicas a petición, usando una combinación de aprendizaje profundo y crowdsourcing. Por ejemplo, la utilización de la semilla llama “el gorjeo” y “Facebook”, podemos generar y validar una categoría para medios sociales. Empath también analiza el texto a través de 200 incorporados, categorías pre validadas dibujadas de conocimiento existente las bases y la literatura sobre emociones humanas, como:  abandono (privan, respuesta negativa)  gobierno (embajada, demócrata)  fuerza (resistente, poderoso)  tecnología (iPad, androide) Empath combina técnicas de la PNL modernas con las ventajas de léxicos hechos a mano sus categorías son listas de palabras transparentes, fácilmente ampliadas y rápido. Y como LIWC (pero a diferencia de otro aprendizaje de la máquina modelos), los contenido de Empath son validados por la gente.
  • 7. Mientras Empath presenta un enfoque que se puede entrenar en cualquier recopilación del texto, en este periódico usamos 1.8 mil millones de palabras de la moderna ficción aficionada. Lengua espacial en mentiras Mientras el estudio original proporcionó algunas pruebas estos mentirosos usan la lengua menos espacialmente descriptivas, no era capaz de probar la teoría directamente. Usando Empath, podemos generar un nuevo juego que el humano validó en términos que capturan esta idea, creando una nueva categoría espacial. Así, decimos a Empath sembrar la categoría con los términos “grande”, “pequeño”, y “circular”. Empath entonces descubre una serie de términos relacionados y usa el muchedumbre para validarlos. produciendo el racimo: circular, pequeño, grande, grande, enorme, gigantesco, diminuto, rectangular, rectángulo, masivo, gigantesco, enorme, más bien pequeño, doblado, medio, oval, puesto la talla, talla, miniatura, círculo, colosal, centro, triangular, forma, cuadrada, redonda, formada, decorativa.
  • 8. Ejemplo :Entendimiento de lengua en revisiones de la película  ¿De qué disfrutan las clases de películas revisores? Lo que las palabras hacen ¿los revisores usan para la alabanza o los dejan por los suelos? En nuestro segundo ejemplo, mostramos cómo Empath nos puede ayudar a descubrir tendencias en un dataset de revisiones de la película coleccionadas por Pang. Este dataset contiene revisiones de la película de 2000, divididas regularmente a través del positivo y sentimiento negativo. Empath analiza el texto a través de cientos de temas y emociones. Como LIWC y otros instrumentos basados en el diccionario, cuenta la categoría términos en un documento del texto. Sin embargo, Empath cubre al juego más amplio de categorías que otros instrumentos y los usuarios pueden generar y valide nuevas categorías con unas palabras de la semilla. El diseño de las categorías conducidas por los datos de Empath Analizando datos textuales, los investigadores colectivamente toman parte con muchas categorías lingüísticas posibles. Por ejemplo, social los científicos estudian las redes de conversaciones que rodean depresión en Gorjeo [38], psicólogos el papel de auto presentación en comunidades de datación en línea , o digital humanistas el papel de feminidad en literatura griega.
  • 9.  Empath pretende hacer posible todos estos análisis (y más) a través de su 200 humano validó categorías, que temas de la tapa como violencia, depresión o feminidad. Donde ¿los nombres de estas categorías vienen de? Adoptamos a enfoque conducido por los datos usando la base de conocimiento de ConceptNet  Las relaciones de dependencia en ConceptNet proporcionan a la jerarquía de la información y hechos que sirven de una fuente de categoría nombres y palabras de la semilla para Empath (p.ej., la guerra es una forma del conflicto, la marcha es una forma de ejercicio). Preferimos este enfoque a uno puramente manual ya que puede escalar potencialmente a miles de otras nuevas categorías.  Por ejemplo, cuando un investigador proporciona “camisa” y “sombrero” como palabras de la semilla, ConceptNet nos dice que las camisas y los sombreros son artículos de ropa. De este modo, Empath puede crear y validar una ropa categoría, usando “camisa” y “sombrero” como palabras de la semilla: blazer, chaleco, suéter, sin mangas, blusa, tela escocesa, medias, camiseta, uso, chaqueta, buttondown, longsleeve, falda, camiseta, buttonup, de manga larga, hoody, tanktop, polainas.
  • 10. Expresamente, para generar los nombres de la categoría de Empath y semilla términos, seleccionamos 200 relaciones de dependencia comunes en ConceptNet, acondicionado en 10,000 palabras comunes en nuestra recopilación. Entonces a mano refinamos esta lista, eliminando redundante o categorías escasas. Para algunas categorías añadimos la semilla adicional llama para representar mejor el concepto, resultando en un juego final de dos a cinco términos de la semilla para cada categoría. nos reunimos evalúan correlaciones de Pearson contra LIWC para soldado y EmoLex (dos humano existente léxicos validados). Encontramos una correlación de la prueba patrón de 0.876 entre soldado y LIWC sobre emoción positiva, negativa emoción, religión, trabajo, y logro y una correlación de 0.899 entre EmoLex y LIWC sobre emoción positiva, emoción negativa, cólera y tristeza. Mientras EmoLex y el soldado comúnmente se considera como patrones oro, guardan correlación imperfectamente con LIWC. Tomamos esto como pruebas esto los léxicos del patrón oro pueden discrepar: si Empath se acerca su actuación contra LIWC, está de acuerdo con LIWC también ya que otros diccionarios con cuidado validados están de acuerdo con LIWC.
  • 11. CONCLUSIÓN Empath pretende combinar técnicas de la PNL modernas con el transparencia de diccionarios como LIWC. En hacer tan, provee tanto formas más amplias como más profundas de análisis del texto que instrumentos existentes. En la anchura, Empath ofrece cientos del predefinido las lentillas a través de las cuales los investigadores pueden analizar el texto. En profundidad, sus categorías definidas por los usuarios proporcionan un medio flexible por qué investigadores pueden preguntar a preguntas concretas de la esfera. Éstos las preguntas cambian alguna vez, como es nuestro uso de la lengua. Empath es un léxico vivo – capaz de mantenerse al corriente de cada uno.