INTELIGENCIA ARTIFICIAL PRÁCTICA

ADQUISICIÓN Y USO DE DATOS LEGALES

Cita: RC D 3168/2020. Publicado en agosto 2020 por Rubinzal Culzoni.

Autor: Tomás Sande

Sumario:

I. Digitalización. II.Datos Legales III. Bases de Datos y Limpieza. IV. Machine Learning V. Legal Development. VI. Viabilidad.

I. DIGITALIZACIÓN

Buscando recabar información sobre cómo distintas organizaciones alrededor del mundo logran transformaciones digitales efectivas, consideré adecuado obtener el testimonio directo de varios CTOs (Chief Technical Officer).

De las distintas respuestas surgieron varias cuestiones como la cultura, la aceptación al cambio, barreras de acceso, etc.

Según el director tecnológico de una compañía australiana, su capacidad digital es posible gracias a la armonía de tres factores clave: una administración despiadada de datos, las integraciones de plataformas de gestión optimizadas y el mejoramiento de las capacidades digitales de la fuerza laboral.[1]

Clarificando, la administración de datos implica que seamos capaces de gestionar la información que generamos o, cuánto mínimo, la tengamos presente.

Respecto a las plataformas de integración, son las herramientas que utilizamos para nuclear nuestros distintos servicios y procesos digitales, poniéndolos al alcance de los usuarios (sean internos o externos a la organización).

La tercera cuestión es obvia, de nada serviría administrar nuestros datos e integrarlos a plataformas de uso y gestión si los operarios no están capacitados para utilizarlas.

Si consideramos que las 2 tecnologías más influyentes de la actualidad resultan ser la inteligencia artificial y la arquitectura blockchain, sería lógico tratar de entender cómo es posible integrar alguna de estas a nuestro esquema de servicios.

II. DATOS LEGALES

La inteligencia artificial depende del uso de datos para generar conclusiones informativas.

En la utilización de modelos de IA, es necesario poseer datos para que, según los parámetros estipulados, se encuentre en estos la información relevante y se la comunique a los interesados.[2]

Lo esencial entonces no es concentrarnos en mejorar los algoritmos matemáticos, sino en generar una base de datos con capacidad suficiente para alimentar nuestras herramientas de inteligencia.[3]

Esto no es algo solamente dirigido a las grandes firmas; todas tienen datos legales, pero pocas son las que realmente los operacionalizan.

En nuestras demandas, resoluciones, documentos, facturas y semejantes hay una gran cantidad de información que no está siendo extraída.

Sabemos los abogados de nuestra capacidad para procesar información automáticamente (nombres, abreviaciones, normas, referencias, citas) al leer un texto.

Ahora, en este proceso dejamos de lado una gran cantidad de información que no se almacena en nuestro cerebro, sino que se lee y se descarta hasta encontrar lo que se busca.

Pero, si tuviésemos que buscar algo que ya leímos, probablemente debamos revisar casi todo de nuevo por qué no teníamos en mente necesitar ese dato puntual.

Imaginemos un paralegal que entrega un reporte luego de revisar decenas de documentos y, por las conclusiones de este, le dicen que debe ahora buscar otra cosa en el mismo cuerpo de textos.

Seguramente el seppuku le parezca una buena alternativa.[4]

III. BASES DE DATOS Y LIMPIEZA

Lo que se pretende mostrar es que almacenar nuestros datos en una base digital puede ser tedioso, pero evita a nuestros cerebros tener la necesidad de imitar a Funes y su memoria hiper privilegiada.[5]

Nuestros despachos deberían tener los documentos agrupados en un repositorio único o centralizado y subdividido.

Posteriormente, deberíamos extraer el texto y acondicionarlo para trabajar con modelos de análisis de datos.[6]

Si todos nuestros PDF están almacenados en una base correctamente segmentada, podemos utilizar sistemas de OCR (optical character recognition) para extraer el texto contenido en estos.[7]

Aplicando esta técnica de computer vision, el texto de los documentos pasa a digitalizarse.[8]

Este proceso extrae los datos y los deja en un formato lo más cómodo posible para la computadora (Python es un lenguaje muy utilizado para tareas de data cleaning, extraction y semejantes).

Con esto tendríamos cubiertos nuestros requisitos de Data Mining, siendo este el proceso de extraer y disponibilizar la información útil de nuestro dataset (compendio de datos) en condiciones útiles para herramientas de procesamiento de datos.

El texto extraído no queda en el aire, se lo almacena en un espacio designado del proceso para trabajarlo con los sistemas de procesamiento.

Los datos no serán una tabla de excel, sino mayoritariamente cuerpos de texto libre, conocidos como datos no estructurados o datos no tabulares (dado que no se encuentran en tablas).

La tarea de adquisición de datos no parece muy compleja en nuestro campo; nos sobran textos y nos sobran escáneres. La parte de OCR requiere un poco más de iniciativa.

IV. MACHINE LEARNING

Como se mencionase en otra oportunidad, los sistemas de NLP, o procesamiento natural de lenguaje, son aquellos que nos permiten trabajar el texto extraído.

Pero, más importante aún, los sistemas de Machine Learning en general son esenciales para alcanzar prácticas de utilidad en el campo de la inteligencia artificial.

Los sistemas de Machine Learning tienen la habilidad de aprender tareas determinadas a través de algoritmos computacionales.[9]

Para esto necesitan datos (fotos, documentos, textos, números, valores) que posibilitan el reconocimiento de imágenes (perro, gato), padrones (correlaciones, grupos), tendencias y modelamiento predictivo (predictive analytics), entre otras.[10]

Lo que se busca generalmente es obtener conclusiones novedosas de alto grado de valor para mejorar la toma de decisiones.

La aplicación de técnicas de NLP o semejantes consisten en hacer que la máquina almacene la información relevante y aprenda a designar qué es lo relevante en el texto.

Esto es posible en tanto se enseña al sistema a derivar el significado del lenguaje humano, lo que no significa que los conceptos representados por esta se presenten en una imaginación artificial-subjetiva.[11]

A fin de cuentas, todo se termina reduciendo a código binario en el corazón de la máquina (machine code).

Un caso práctico es el análisis de sentimiento, analizando la computadora las palabras utilizadas en un cuerpo de texto y asignando un valor en la escala de lo positivo, neutral o negativo.[12]

Compiladas muchas conclusiones individuales (ej. 300 positivos, 5 neutrales, 50 negativos), se emite un ponderado de cual es la predominancia y distribución de las palabras; se determina si la opinión es positiva o negativa con respecto al objeto/persona estudiado.

Si quisiéramos saber el sentimiento de quienes escriben miles de textos (tweets) en relación a, por ejemplo, el Presidente (twittero), el sistema tomaría miles o millones de cuerpos de texto corto, emitirá un criterio sobre cada tweet positivo o negativo y pasaría a ponderar, en la balanza general, el sentimiento hacia el objeto de estudio.

V. LEGAL DEVELOPMENT

Entendidas las cuestiones anteriores quedaría determinar qué necesita un despacho para incorporar estas tecnologías.

Por una parte, herramientas como Signatura, DocuSign y semejantes brindan prestaciones de digitalización que a muchos despachos pueden serles útiles.

Pero para trascender el mero uso de herramientas prefabricadas, hay que entender en qué ámbitos la tecnología legal puede ser implementada para generar desarrollos propios a un costo no excluyente.

Automatizaciones. Fuera de lo que es machine learning, lenguajes de programación como Python permiten generar automatizaciones robóticas de procesos (RPA o Robotic Process Automation), en un entorno digital.[13]

Esto implica generar un trabajador digital que realice tareas generalmente asignadas a un humano, aquellas con bajo componente crítico o analítico.

La configuración de RPAs es simple, poco invasiva y generalmente segura, teniendo un bajo costo de desarrollo inicial y un bajo, pero permanente, costo de mantenimiento y optimización.

Si una firma descarga documentos, contratos, reportes, análisis, regulaciones, u otra información de sitios o bases de datos de manera permanente, las automatizaciones suelen ahorrar las horas hombre de estar cliqueando items en una pantalla en procesos semi mecanizados.

Vale aclarar que estas herramientas generalmente no integran componentes de inteligencia artificial.

Navegación Documental. Si tuviésemos que generar una rápida búsqueda de cientos de documentos y quisiéramos tener un pantallazo rápido, podríamos procesar el texto de los documentos y subdividirlo por tema.

Otra posibilidad sería indexar los documentos según fuero, jueces, cliente, empresa, etc., para generar visualizaciones informativas de documentos relevantes con facilidad.

En este caso, el análisis de datos está orientado a potenciar el output o productividad del despacho legal, agilizando el proceso de navegación documental.

Procesos Internos. Otro enfoque sería optimizar los costos, proyecciones financieras o procesos internos para solidificar el modelo de negocios.

Ponderando los diferentes datos sobre ingresos y costos se generan proyecciones financieras con altos grados de certeza sin requerir de un equipo técnico, tan sólo el uso adecuado de metodologías tecnológicas (con una cantidad suficiente de datos).

Analizar dónde están los cuellos de botella en la firma y detectar riesgos en el análisis de estado o reportes de análisis permite tener una base objetiva sobre la cual afinar nuestro criterio de toma de decisiones.

En el caso de una firma pequeña, con un desarrollador y un coordinador de proyecto es posible generar sistemas internos en base a tecnologías open source.

También es posible solicitar los servicios de firmas especializadas que lentamente se acoplan al campo legal, dedicadas especialmente a legal operations o legal technologies.[14]

Las firmas de legal operations utilizan metodologías destinadas a identificar los flujos operacionales de los departamentos y firmas legales para potenciarlos

Las firmas de legal technologies comprenden los procesos para llevarlos a un plano digital y luego optimizarlos con nuevas metodologías y tecnologías.

Predictive Legal Analytics & Legal Reasoning. Con capacidades de desarrollo suficientes es posible lograr avances como Predictive Legal Analytics.

Esto es el análisis de información legal junto con técnicas de Machine Learning, además de métodos estadísticos suficientes, para proyectar aproximaciones sobre potenciales resultados y detectar índices de riesgo o conflicto.[15]

Estas herramientas permiten simular resultados de conflictos, litigios e incluso los riesgos asociados a cláusulas contractuales específicas.

El uso de modelos estadísticos relevantes y la selección de datos adecuados es fundamental para llevar a tales niveles de refinamiento.

Otra posibilidad es lograr un desarrollo continuo hasta lograr sistemas propios de Razonamiento Legal Automatizado (Automated Legal Reasoning o Expert Systems).

Estos sistemas de inteligencia artificial requieren de una cantidad de datos considerable dado que automatizan el proceso de toma de decisión humana al modelar procesos de decisión legal en una estructura comprensible para la máquina.

Si tuviésemos cientos de casos de defensa al consumidor, modelar sistemas de inteligencia sobre estos permitiría detectar los patrones y tendencias que facilitan los datos clave para tomar decisiones en cada caso concreto.

Los humanos debemos diseñar el pensamiento de la máquina y darle el panorama general de acción, además de evaluar con criterio si los estándares de calidad pretendidos se mantienen a lo largo del tiempo.[16]

Esto es agilizar procesos, no reemplazarlos.

VI. VIABILIDAD

Habiendo visto que el uso de IA contempla la posibilidad de que sistemas computacionales complementen las tareas del humano, hay que destacar la incremental capacidad de estos sistemas de adoptar cada vez mayores niveles de conocimiento y trabajo no rutinario.[17]

Lo fundamental es entender que quienes comiencen a adoptar estas tecnologías con mayor antelación serán también los más beneficiados; este es el retorno pretendido por los early adopters.[18]

Es clave recordar que las firmas convencionales pueden comenzar a hacer uso de las nuevas tecnologías con el asesoramiento adecuado o con la incorporación de recursos propios.

No hace falta proyectar una base de millones de resoluciones judiciales para obtener valor de estos sistemas, siendo que podemos mejorar nuestras tareas administrativas, de costeo, pricing etc.

Algo de considerable valor es la posibilidad de complementar las tareas legales con sistemas de decisión independientes.

Sintéticamente, estas tecnologías nos ayudan a mejorar nuestra estructura interna, ampliar nuestra cartera de servicios y optimizar nuestros procesos comerciales.

El objetivo colectivo de la profesión legal debe ser alivianar la dificultad de transicionar nuestros modelos de comienzos del siglo pasado hacia las nuevas corrientes digitales.

Bibliografia:

[1] Cita original en Katz David, Sande Tomas, Data Driven, Inteligencia en Datos, Medium Independent Publication, disponible en https://medium.com/@tomassande/data-driven-inteligencia-en-datos-201e4b26e6e8 (consultado 11/09/20): “I increasingly believe that successful digital transformations are less based on technology, as technology will come and go over the next 5–10 years. I do believe that successful digital transformations are based upon three things: 1. Ruthless management of data, 2. A superior integration platform 3. Digital capability uplift of our workforce.”

[2] Sieca Steven S., The Data Science Design Manual, Texts in Computer Science, Springer, Nueva York NY, 2017, Pág. 15.

[3] Banko Michelle, Brill Eric, Scaling to Very Very Large Corpora for Natural Language Disambiguation, Microsoft Research, Proceedings of ACL 2001, January, https://www.microsoft.com/en-us/research/publication/scaling-to-very-very-large-corpora-for-natural-language-disambiguation/ (consultado 11/09/20).

[4] Andrew Rankin, Seppuku: A History of Samurai Suicide, Kodansha International, Bunkyo TYO, 2001, Pág. 40.

[5] Borges Jorge Luis, Funes el memorioso, Obras Completas, Emecé, 1976, Buenos Aires CABA, Pág. 485.

[6] Aggarwal Charu C., Data Mining: The Textbook, Springer, Nueva York NY, 2015, Pág. 2

[7] Simon M., Lindsay A. F., Sosa L., Lola v. Skadden and the Automation of the Legal Profession, Yale Journal Legal & Tech, New Haven CT, 2018, Pág. 253.

[8] Sande Tomas, Derecho Digital: innovación legal e inteligencia artificial, Rubinzal Culzoni Editores - Portal Digital, Buenos Aires CABA, 2020, Pág. 3.

[9] Surden Harry, Machine Learning and Law, Washington Law Review, Washington DC, 2014, Pág. 88.

[10] Oquab M., Bottou L., et. al., Learning and Transferring Mid-Level Image Representations using Convolutional Neural Networks, IEEE Conference on Computer Vision and Pattern Recognition, Columbus OH, 2014, Pág. 2.

[11] McCarthy John, What is Artificial Intelligence?, Computer Science Department at Stanford University - Publications, Stanford CA, 2007, Pág. 11.

[12] Maas A. L., Daly R. E., et. al., Learning Word Vectors for Sentiment Analysis, 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, Proceedings of the Conference, Portland OR, 2011, Pág. 20.

[13] Enríquez J. G., Jiménez-Ramírez A., Domínguez-Mayo F. J., García-García J. A., Robotic Process Automation: A Scientific and Industrial Systematic Mapping Study, in IEEE Access, vol. 8, Pág. 39115.

[14] Armour John, Sako Mari, AI-Enabled Business Models in Legal Services: From Traditional Law Firms to Next-Generation Law Companies?, Law & Society: The Legal Profession eJournal, Oxford OXON, 2019, Pág. 4.

[15] Bues Micha-Manuel, Matthaei Emilio, LegalTech on the Rise: Technology Changes Legal Work Behaviours, But Does Not Replace Its Profession, Liquid Legal, Springer, Nueva York NY, 2017, Pág. 100.

[16] Davenport Thomas H., Kirby Julia, Only Humans Need Apply: Winners and Losers in the Age of Smart Machines, Harper Business, New York NY, 2016, Pág. 304.

[17] Armour John, Sako Mari, op. cit., Pág. 2.

[18] Hornik Robert, Some Reflections on Diffusion Theory and the Role of Everett Rogers, Vol. 9, Journal of Health Communication: International Perspectives, Filadelfia PA, 2004, Pág. 144.