FISL18: Dados abertos tornam Judiciário mais eficiente

Foto: Alexandre Kupac

Julio Trecenti se define como um faxineiro de dados. Diretor da Associação Brasileira de Jurimetria (ABJ) e doutorando em estatística, ele tem como missão difundir por aí o conceito de jurimetria. Em uma definição simples, ela é a estatística aplicada ao direito. Mas, claro, há muito mais a se falar sobre essa ciência fundamental em um mundo no qual a análise de dados se tornou um dos insumos mais importantes em diferentes áreas — entre elas, a elaboração de políticas públicas.

“Os dados são a base para fazer diagnósticos, e eles criam estratégias para enfrentar problemas. Por isso, usamos ferramentas da estatística para trabalhar com com decisões e cenários de incerteza”, afirmou. A ABJ trabalha com a ciência de dados utilizando o seguinte fluxo: primeiramente, baixa-se os dados (pode ser de Excel, SQL ou outra fonte); depois, os dados são organizados, arrumados; em seguida há um ciclo de aprendizado que passa por transformar dados, trabalhar a visualização com gráficos e tabelas e fazer a modelagem; quando esse ciclo acaba, vai-se para o último passo, a comunicação dos resultados.

Aplicando isso especificamente ao direito, o que a ABJ faz é acessar o site de um tribunal e baixar os dados — a maioria dos tribunais não têm API –, para em seguida arrumar as informações, o que significa um grande desafio. Se você quiser encontrar um dado tagueado, a missão é simples. Mas, se quiser analisar um dado em uma sentença, terá que contar com o Text2Mindmap, por exemplo. “A partir de uma base qualificada, montamos uma ferramenta para fazer análise estatística, para fazer algo novo ou desenvolver política pública”, explicou.

Em um dos estudos realizados para o Ministério de Justiça em parceria com a ONG Sou da Paz, a ABJ analisou os gargalos dos processos de homicídio para saber em que aspectos eles poderiam melhorar e quais as principais dificuldades. Entre os resultados, esteve a comparação dos tempos dos processos eletrônicos e físicos. Em uma das fases do processo, nos físicos, a mediana era de três anos, enquanto nos eletrônicos passava para um ano. “O processo de homicídio é enorme, desde o crime até o cumprimento da pena. Tanto que muitos dados não eram possíveis de estimar, pois não havia casos finalizados suficientes para a análise”, contou.

Em outra pesquisa, com a corregedoria de São Paulo, descobriram que havia uma discrepância de 65% na taxa de decisões de uma câmara criminal para outra. Estranhando o número alto demais, apresentaram esses dados a um promotor público e descobriram que o dado estava correto.

Apesar de, teoricamente não existir um viés específico atribuído a cada câmara, o promotor explicou que sim, os magistrados se reuniam nelas por ideologia ou afinidade acadêmica — por isso, a taxa de unanimidade ficava em torno de 91% nas câmaras. Então, na prática, quando se entra com um recurso na segunda instância, dependendo do caso, resta torcer para cair na “câmara certa” — a isso se chama de insegurança jurídica. “E é isso que a jurimetria faz: escancara esses dados para as pessoas”, disse Trecenti.

Desafios e soluções possíveis

Há dois desafios principais na jurimetria. O primeiro deles é a padronização: as informações entre os tribunais não obedecem a uma mesma lógica, apesar da existência das tabelas processuais unificadas. Por exemplo: existe uma resolução do Conselho Nacional de Justiça (CNJ) que determina tipos específicos de processo, mas eles possuem ramificações. Muitas vezes, os processos são classificados apenas na opção genérica, sem especificação, o que pode alterar a análise. O segundo desafio é o acesso. A maioria dos tribunais não disponibiliza APIs dos dados e, às vezes, coloca um impedimento a mais: os captchas. Para driblá-los, a ABJ construiu um pacote em R, disponível em github.com/decryptr.

Trecenti apresenta propostas possíveis para driblar esses desafios. A primeira é a solução apresentada pelo CNJ com a criação do Selo Justiça em Números, uma premiação para os tribunais que apresentarem seus números cumprindo certos padrões de dados, conforme o modelo nacional de interoperabilidade. Uma vez obtendo os dados de forma razoável, o CNJ poderia disponibilizar os dados em API, organizando-os em três blocos: informações básicas (quem está julgando, onde o processo está e a que se refere); informações das partes; e movimentações (todos os eventos que acontecem no process). “Essas informações seriam boas, mas não suficientes para tudo que queremos analisar”, disse Trecenti.

Vamos, então, à segunda proposta, que Trecenti classifica como necessária: uma listagem de processos a partir de escopos, que poderiam usar CKAN, por exemplo. Na terceira proposta, classificada como “desejo” pelo especialista, haveria informações de input (fatos, pedidos e argumentações dos processos) e output (resultados, entradas de recursos, votos). “Mas isso exigiria uma reclassificação, a utilização de modelos estatísticos supervisionados. E gostaríamos de fazer isso por meio de um modelo que fizesse essa classificação automaticamente”, afirmou.

A quarta proposta seria um cenário ideal, porém um pouco distante, a que Trecenti chama de “futurismo”: haver uma base de dados em grafos, um formato Wiki para a listagem de processos e a padronização das partes. A quinta solução, enquadrada na mesma classificação, seria a integração, especialmente entre ministério público, sistemas de soluções alternativas de conflitos, defensoria pública e as polícias Civil e Militar.

“O maior problema dos tribunais não é falta de interesse nem capacidade técnica, mas sim o fato de que são muitas cabeças que devem ser colocadas em conjunto para pensar em uma estratégia única”, avaliou Trecenti. Entre os impasses, está a determinação de quais informações devem, de fato, ser públicas.

Para quem se interessa pelo tema, a ABJ disponibiliza códigos e projetos no GitHub:

github.com/abjur (projetos)
/decryptr (sobre captchas)
/courtsbr (“robô de tribunal”)
/cursor (ensino de programação em R)

abj.org.br
curso-r.com