Автоматизация судебных решений — идея почти такая же старая, как мир. Подходы к применению технологий искусственного интеллекта (ИИ) для юридических решений обсуждались еще в 1980-х, когда цвели классические концепции экспертных систем, а оригинальный Star Trek выглядел почти свежо. В силу разных причин, применение ИИ для автоматизации именно принятия судебных решений — продвинулось с тех пор менее существенно, чем, к примеру, корпоративные и медицинские системы поддержки принятия решений.

Где мы были все это время

Автоматизация для юристов 30 лет шла по пути развития систем поиска информации. Последние, все улучшаясь, плавно трансформируются в системы поддержки принятия решений. Тому не в последнюю очередь способствует информационная перегрузка. С 1990-х юристы получали все более совершенные механизмы индексации, все более рафинированное фильтрование. В итоге, юристы, постоянно имеющие дело с базами законодательства, уже слабо мыслят работу без тривиальной функции “вывести все судебные решения, ссылающиеся на этот пункт закона”.

Что делать, если пользователь не юрист (или юрист, но не специалист в вопросе), и в качестве вводных есть только описание ситуации словами, а пункт закона неизвестен? Можно разобраться мозгами вручную, в конце концов найти пункт закона — но потратить все более ценное время. Итак, что делать? Свободно-текстовый поиск с ранжированием по релевантности достиг высот, но зачастую не обеспечивает важного для юристов требования — полноты возврата (recall) всех, или хотя бы 99%, релевантных решений. Системы же исчерпывающего поиска релевантных судебных решений, что опираются на категоризацию решений по формальным метаданным и тематическому классификатору — по скромному мнению автора, постепенно упираются в потолок собственного развития.

Где мы сейчас

То, что за последние 30 лет люди не делегировали принятие судебных решений роботам, еще не означает, что следующие 30 лет пройдут так же безалаберно. Наш мир, есть некоторые основания полагать, ждут большие изменения в ближайшие годы. Вернемся же немного к истокам, посмотрим, не настало ли время революционно пересмотреть подходы к судопроизводству.

Украина для описанных задач подходит как идеальная площадка, которую и расчищать всего-ничего осталось: разваленное государство, полное отсутствие тормозящих традиций правовой культуры, плюс вопиющий уровень выхолощенной бюрократии, требующий содержания обществом армии полуюристов-полуклерков для выполнения на 90% вполне автоматизируемых задач. Но при этом подарок судьбы — готовый открытый реестр судебных решений с миллионами документов и много образованных талантливых программистов.

8018

Хотим ли мы убить всех юристов?

Конечно, “роботизация” судебных решений поднимает очень много этических, ценностных, философских вопросов. И мы к ним еще вернемся. Юристы как явление, в общем, никуда не денутся — просто наиболее квалифицированные из них становятся менеджерами информационных систем. Кому интересно — читайте “The End of Lawyers?” авторства Richard Susskind и помните, что и этой книге уже больше пяти лет. Главное вот что: юриспруденция, как и ИТ, дают механизмы регулирования поведения людей. Их соотношение исторически меняется. Стоит лишь понимать, что этические, ценностные и философские вопросы — нужно воспринимать как задачи, а не проблемы. И еще очень важно — любить людей. Или хотя бы хорошо знать математику.

Вернемся к нашим судьям

Автор обладает довольно скромными познаниями об искусственном интеллекте и с радостью выслушает конструктивную критику насчет неточностей в терминологии, однако уровень данного текста не претендует на большее, чем заимствовать теорию ИИ из учебников. Давайте для старта рассмотрим наиболее применимые к автоматизации судебных решений концепции ИИ таким образом: есть символьный подход, в частности, системы, основанные на знаниях (knowledge-based), и есть океан машинного обучения с нейронными сетями. Нейронные сети мы пока оставим в стороне, чтобы не делать революцию в революции — по той причине, что если мы хотим роботизировать судопроизводство, нам критически важна прозрачность, тотальная хотя бы для начала, для легитимности решений в глазах homo sapiens. Knowledge-based системы могут быть, применительно к автоматизации юридических решений, rule-based и case-based. Rule-based системы требуют от нас исчерпывающе перевести законодательство на язык машинной логики, тем самым вбрасывая на вентилятор веер непоняток с легитимностью и спорными интерпретациями. А вот на case-based подходе давайте остановимся детальнее.

Нам нужна не розовая мечта

Нам нужна работающая система в обозримой перспективе — а в Украине есть готовая открытая база с миллионами кейсов. И разные хакатонские идеи, что бы с этой базой такого замутить, уже не первый год витают в воздухе, и известные гранды рынка правовых баз данных все ищут неосвоенных количеств. А самое время для качественного прыжка.

Как это выглядит в теории

В основе любой knowledge-based системы, в т.ч. и case-based reasoner-а, две подсистемы: база знаний и машина вывода (inference ENGINE). Источник для базы знаний нашей системы известен и непререкаем: Единый государственный реестр судебных решений. Технические моменты получения из него решений пока опустим. Для наличия работающей базы знаний не хватает более существенного элемента — семантической разметки в тексте решений.

Канон построения case-based системы по учебнику гласит: кейсы в базе знаний должны быть размечены для понимания их машиной вывода. Разметку эту осуществляет (и это крайне важно) человек-эксперт. Прежде всего, должен существовать некий протокол разметки. Информационные стандарты в коррумпированном государстве Украина – это грусть и печаль. Судебные решения загружаются в реестр конвертером rtf в html, с разметкой разве что формальных метаданных (и то не всегда корректно), и с некоторых пор гиперссылками на пункты законов (также не всегда корректными) в базе одного из грандов коммерческого рынка (на основаниях, окутанных туманом). Итак, нам придется протокол семантической разметки придумать и реализовать. Наш проект становится фундаментально улетным в плане человеко-часов, но при этом инфраструктурным — поскольку стандарт разметки нет никакого смысла делать проприетарным. Следовательно, наша долгосрочная стратегия — создавать не только продукт, но также продвигать под него открытые стандарты публикации вообще всех государственных документов и создавать экосистему автоматизации самых разных юридических и околоюридических решений.

Движок системы, машина вывода — согласно канону из учебника, ищет в размеченных кейсах сходства и различия. Задача предельно ясна — движок надо написать. Что в нем должно быть с открытым/закрытым кодом — детали обсуждаются. Use case для прототипа: на условный запрос машина должна выдавать: “вот резолютивная часть реального судебного решения, которое, согласно вашему описанию ситуации, является № 1 по релевантности”.

Мы одни такие умные?

Нет, но у нас подходящая страна в подходящий исторический момент. Идеям уже десятилетия, и совсем на месте развитие темы в мире не стоит. Однако, в силу наличия в мире пока что национальных юрисдикций, подобные проекты не могут сразу ориентироваться на глобальный рынок. Зато они могут ориентироваться изначально на правовую специфику стран, способных предложить старому миру новую модель развития с чистого листа. Поэтому и есть смысл, в силу исторических событий, сегодня говорить об Украине.

Зачем оно вообще надо

Для эффективного старта case-based системы нам нужен большой массив однотипных кейсов. Где их взять? Есть, к примеру, одна тема для B2C-сегмента: нарушения правил дорожного движения. Тут сразу заложено искривление, ибо не все релевантные кейсы в принципе рассматриваются судом и попадают в общедоступный реестр. К тому же, если говорить о B2C-применении, пожалуй, эффективнее будут простые мобильные приложения на тему общения с инспектором. Смотрим на B2B-темы, и тут уже сходу останавливаемся на налоговых спорах.

Налоговое законодательство в Украине — одно из самых сложных и объемных, но в то же время почти досконально структурировано и по своей сути имманентно математично. Начинать строить систему автоматизированного принятия решений на основе массива налоговых кейсов — видится одним из самых перспективных путей.

Говоря о сферах применения с прицелом на ближайшее десятилетие, стоит заметить, что наша система должна также обеспечивать data mining для целей борьбы с коррупцией в судах. Исходя из того, что машина вывода в принципе ищет по массиву кейсов сходства и различия, можно ставить вопрос об автоматизированном выявлении коррумпированных решений. Допустим, если в 9 кейсах из 10 совпадают предпосылка 1, предпосылка 2 … предпосылка 18, и резолютивные части решений тоже в общем сходны, а в 10-м решении, при условно тех же вводных, вывод почему-то радикально отличается — вот и поиск потенциально коррумпированных кейсов. Уголовный процесс дальше ведут люди. Остановимся пока на этом 🙂

Ценность этих идей зависит лишь от того, как они будут реализованы.

Автор: Александр Харченко — LL.M. Law & IT (Stockholms Universitet),
управляющий партнер Юридической студии Александра Харченко.