1. Inteligencia artificial.
Retos y oportunidades en
la justicia.
Daniel Miranda
Consultoría en Inteligencia Artificial
Superior Tribunal de Justicia - STJ
2. Avances tecnológicos
Primeras imágenes de agujeros negros
Primera foto de un agujero
negro (2017-2019)
8 observatorios en 4
continentes
55 millones de años luz
12. Inteligencia artificial en la actualidad
¿Quienes son esas personas?
https://thispersondoesnotexist.com/
13. Inteligencia artificial en la actualidad
Large Language Models (LLM)
1. Redes neuronales entrenadas en vastos conjuntos
de datos (billones de palabras) e idiomas
2. Miles de millones o incluso billones de parámetros
entrenables
3. Habilidad para abstraer conocimientos
4. Alta capacidad para comprender el lenguaje
humano.
5. Desafíos éticos, sesgos y alucinaciones
6. Innumerables oportunidades de uso en el mundo
legal
21. Poder judicial en Brasil
● 27 tribunales estatales
● 6 tribunales federales
● BRL 104 mil millones en
gastos
22. Poder judicial en Brasil
14.800 unidades judiciales de primera instancia
12,367 jueces en unidades estatales
1.900 jueces en unidades federales
425 mil trabajadores
23. Legislación brasileña
● Constitución (segunda más grande del mundo)
● Más de 34,000 leyes y decretos federales
● Aproximadamente 1,600 nuevas regulaciones federales por
año
24. Poder judicial en Brasil
2021 - Casos nuevos y archivados
27,7 millones de nuevos procesos.
26,9 millones de procesos archivados
25. Poder judicial en Brasil
2021 - Casos pendientes de sentencia
pendientes
30. STJ
Antes de la digitalización de procesos
● Tiempo medio de tramitación de un proceso físico: 10 años
● Espacio físico
● Acceso al proceso solo por una persona
● Riesgo de pérdida de documentos o de todo el proceso
● El proceso tarda alrededor de 5 a 8 meses para salir del Tribunal
de origen y ser distribuido a un ministro del STJ
31. ● Envío de casos de 31 tribunales de
origen al STJ por correo (aviones y
camiones)
33. STJ
Digitalización de procesos
● Inicio y término en 2009
● 270.000 procesos digitalizados
● 1200 procesos digitalizados
por día
● 450 personas contratadas (250
con discapacidad auditiva)
● Tiempo medio de tramitación
de un proceso electrónico: 3,4
años
● Implementación paralela del
expediente judicial electrónico
35. STJ
Expediente judicial electrónico
● 7,5 millones de procesos en la base de datos
● 83 metadatos solo en la tabla de procesos
● 200 millones de documentos
● 219 tipos de documentos
● 4 mil usuarios activos solo en el STJ
● Migración del antiguo sistema (Delphi) a la nueva plataforma (WEB)
36. STJ
Estadísticas - Procesos Distribuidos
● 431 mil procesos distribuidos en 2022
● 13.060 casos por ministro
37. STJ
Estadísticas - casos juzgados
● 442 mil casos juzgados en 2022
● 588 mil decisiones en total
● 2,53% más casos juzgados que
distribuidos en 2022
40. STJ
Inteligencia Artificial - Desafíos / OCR
1. Procesos recibidos en numerosos formatos y de diferentes
fuentes
2. 145 millones de páginas escaneadas anualmente
3. Imágenes dentro del PDF
4. Documentos torcidos, con tachaduras, firmas, etc...
5. Acceso a texto de documentos de alta calidad
42. STJ
Asesoría en Inteligencia Artificial - AIA
● Establecimiento de la Asesoría en
Inteligencia Artificial en 2018
● Área enfocada a la investigación y
desarrollo de soluciones de IA
● Equipo separado del área de
Tecnologías de la Información
● 9 servidores de forma exclusiva
44. STJ
Inteligencia artificial
● Principal modelo de IA utilizado en el STJ
● Permite el análisis de similitud entre documentos
● Lanzado en 2018, el primer proyecto 100% basado en
IA en la justicia brasileña
● Compartido con más de 30 tribunales brasileños
● Bibliotecas y herramientas de código abierto
45. STJ
Inteligencia artificial
● Modelo de IA entrenado para permitir el análisis de
similitud entre documentos
● Formados a partir de la “lectura” de 330.000 sentencias
del STJ
● Cada documento fue "leído" 1.000 veces por la máquina
para identificar la relación de las palabras con sus
contextos.
● Proyecto ejecutado por dos personas y creado a partir de
la tesis de maestría de un servidor.
46. STJ
Inteligencia artificial
● Cada documento se transforma en un vector de 300
dimensiones.
● Con el modelo entrenado, puede inferir el vector de
cualquier documento nuevo.
● Más de 17 millones de documentos vectorizados.
● Aprendizaje no supervisado: resultados rápidos sin
necesidad de etiquetar ejemplos. [0.153473; 0,52354; 0,52354;
0,743582453; 0,22343; 0,464563;
.... 0.0002342; 0.22345]
54. STJ - Athos
monitoreo automático
Inclusión de nuevos procesos en grupos ya existentes,
de forma automática, a partir del análisis de similitud.
Documento 1
Documento 2
Documento 3
Documento 4
Documento 5
57. STJ
Corpus927 - Objetivos
● Reunir las decisiones vinculantes, enunciados y orientaciones
a los que se refiere el artículo 927 del nuevo Código de
Proceso Civil.
● Reduzca el tiempo necesario para encontrar ubicaciones
relevantes.
● Agrupa decisiones similares e indica la jurisprudencia
dominante.
● Permitir el acceso/consulta sin necesidad de registro.
60. STJ
Corpus927 - Desafíos
APLICA LA NORMA DEL ARTÍCULO 174,
CAPUT, DEL CTN
HIPÓTESIS PREVISTA EN EL
ARTÍCULO 1.022 DE LA NCPC
PRESCRIPCIÓN INTERCORRIENTE
DEL ARTÍCULO 40 DE LA LEY
6.830/80.
art. 25 de la LEF con el art. 234 del
CPC/73 y art. 269 del CPC/15)
Código de Procedimiento Civil
de 2015, a través del artículo
1.021, párrafo 1
procedimiento previsto en el
art. 7, 8, 25 y 40 de la Ley nº
6.830/1980 y 10 del CPC
69. STJ
Identificación de los documentos del
proceso judicial
● Identificar el inicio y el final de cada documento de proceso
● Comprender cuándo una página es interna o de continuación
● Uso de técnicas de visión artificial
● La indexación se realiza clasificando el texto de los documentos.
70. STJ
Identificación de los documentos del expediente
judicial
Página actual
Página anterior
Próxima página
¿La página actual es el inicio o continuación
de un documento?
71. STJ
Admisibilidad cotejada
Extraer, de la decisión de admisibilidad del tribunal de origen, los fundamentos
utilizados para no admitir el Recurso Especial
Tribunal de origen Abogado
Sentencia Recurso Especial (REsp)
decisión de admisibilidad Agravo em Recurso Especial (AResp)
(Fundamentos de inadmisibilidad) (Rebatimento)
STJ
73. STJ
Admisibilidad cotejada
1. Alto costo para etiquetar cada ejemplo.
2. El equipo legal, en su rutina de trabajo, ya señalaba las páginas con los obstáculos
encontrados.
3. Cambio de dirección en el proyecto para utilizar la clasificación de textos en
detrimento del reconocimiento de entidades nombradas, aprovechando las etiquetas
ya existentes en la base de datos.
4. Alta precisión utilizando modelos de lenguaje más pequeños (BERT).
5. Facilita la identificación de documentos etiquetados incorrectamente (Top Losses).
75. STJ
Desafíos - Acceso al texto de
los documentos
● Suele ser el mayor desafío para los tribunales.
● Normalmente implica el uso de herramientas de OCR (Tesseract,
EasyOCR, etc.)
● Eliminación de encabezados y pies de página cuando sea posible
(reducir el contexto).
● Eliminación de citas a otros procesos, normas y jurisprudencia.
76. STJ
Desafíos - Entrenamiento
● Es muy difícil encontrar personas calificadas, incluso entre quienes ya trabajan
con Tecnologías de la Información.
● Entorno en constante evolución y actualización, con nuevas técnicas y algoritmos
apareciendo todo el tiempo
● Es necesario un buen conocimiento de estadística, matemáticas, desarrollo de
sistemas y ciencia de datos.
● Para los modelos y algoritmos más recientes, todavía hay poca documentación
disponible.
77. STJ
Desafíos - Cuestiones éticas
● Imprescindible cuidar los datos utilizados en la formación para evitar sesgos y
prejuicios
● Anonimización de datos personales, incluidos los nombres de las partes, la raza
y el género
● Regulación gubernamental
● Potencial para acabar con muchos puestos de trabajo
● Según Gartner, los chatbots serán el principal canal de comunicación para el
25% de las empresas en 2027
78. STJ
Desafíos - Costo
Alto costo para entrenar
modelos de lenguaje grande
(una GPU A100 de 80 GB
cuesta 15 000 USD)
79. STJ
Costo - Chat GPT
● Aproximadamente 1,8 billones de parámetros
● Fue entrenado con 13 billones de palabras (tokens)
● Se utilizaron aproximadamente 25 000 GPU Nvidia A100
● 90 a 100 días para completar el entrenamiento
● Costo estimado: $ 63 millones
Escribe un poema corto, en español,
sobre IA y Justicia
82. Oportunidades -
Automatización del
inicio de procesos
● Extraer, del texto de los documentos del proceso, todas las
partes, abogados, clase, sujetos y demás información
relevante para el registro y distribución de la acción.
● En el STJ, aproximadamente 100 personas realizan este
trabajo diariamente.
● Propenso a errores e incompletitud, especialmente en
procesos muy grandes.
83. Oportunidades -
modelo lingüístico STJ
● Utilizar un LLM de "código abierto" para realizar un ajuste fino y generar un modelo
de lenguaje entrenado en documentos jurídicos producidos en el STJ.
● Mayor capacidad para comprender los términos utilizados en los documentos
judiciales.
85. Oportunidades -
modelo lingüístico STJ
● Más de 1,1 terabytes de RAM en GPU para
entrenamiento
● Aproximadamente 15 GPUs A100 de 80 GB
● ¡El mejor modelo con parámetros 7B está en la
posición 174!
86. STJ
Oportunidades - Asistente legal
El contenido de este párrafo está en
desacuerdo con la redacción del
sumario 830 del STJ.
87. STJ
Resolución de casos más simple
● Gran potencial para el uso del modelo lingüístico
formado específicamente para la Corte
● limitado por el contexto
● El modelo GPT4 más grande acepta hasta 32k tokens
como contexto (aprox. 40 paginas)
● Hay herramientas, como Claude.ai, que ya aceptan
100.000 tokens.
● Estudios recientes abordan la posibilidad de modelos
con millones o incluso miles de millones de tokens por
solicitud
● Posibles problemas éticos involucrados (Es posible
que las personas no quieran ser juzgadas por una IA)