Что такое Ring и что случилось?

Ring — американская компания, которая производит несколько продуктов, среди которых — умные дверные звонки. В них встроена камера, которая может транслировать видео на смартфон пользователя. Для того, чтобы улучшить возможности своих устройств, команда Ring использовала эти видео для обучения нейронных сетей: камеры могли бы, например, отличить человека от собаки, прохожего от автомобиля в движении.

Этим занялась украинская команда Ring — Ring Ukraine. В 2016 году в Киеве был открыт R&D-центр компании, одна из задач которого — как раз обучение нейронных сетей.

По данным американских СМИ, сотрудники Ring Ukraine имели доступ ко всем пользовательским видео, так как те передавались в незашифрованном виде, и могли использовать их не по назначению: например, загрузить себе.

Откуда данные?

Источники The Information и The Intercept разнятся. Как пишет Vector, первым обративший внимание на публикацию The Information в Украине, издание заявило об опросе 24 нынешних и бывших сотрудников Ring. Сколько именно ответило на запросы издания и подтвердили ли все 24 человека заявления издания — не сообщается. Судя по материалу The Intercept, источниками стало два бывших сотрудника компании.

По данным источников AIN.UA, одного из тех сотрудников, кто давал комментарий The Information, уволили из компании после полугода работы. Он занимал достаточно высокую должность, но после нескольких случаев обмана, компания с ним попрощалась. В результате, он обратился к прессе, оставшись негативно настроенным по отношению к компании. Схожая версия есть и у издания Mind, по словам источников которого, бывший сотрудник Ring Ukraine шантажировал компанию и не получив должного, обратился в прессу.

Так был доступ к видео или нет?

В Ring отметили, что все данные на самом деле шифруются и свободного доступа к видео нет. От остальных комментариев в компании удержались. Украинский офис Ring Ukraine ссылается на заявление американской пресс-службы.

Редакции AIN.UA удалось поговорить с двумя бывшими сотрудниками Ring Ukraine и узнать, как происходила работа с видео.

Константин Бохан, бывший директор по рисерчу Ring. Работал с апреля по ноябрь 2017 года. По его словам, видео хранилось на серверах Amazon.

«У каждого американца-клиента Ring есть доступ к своему видео через веб-интерфейс. И там он мог отмечать, что может делиться этим видео. Далее это видео переносилось в другую папку — опять же, на серверах Amazon. Уже оттуда материалы брались для тренинга нейронок. Весь backend Ring размещен на серверах Amazon. Соответственно, все работы, которые ведутся в Украине, также ведутся на этих серверах».

Работа операторов, которые тренировали нейронную сеть, заключалась в том, чтобы обозначать объекты на видео: лицо, машину, движущийся объект и так далее. В украинском офисе работали операторы со специальной видеосистемой, у которой был доступ к той папке на серверах. Эта система транслировала видео, которое разрешено для разметки, оператору на экран. Оператор указывал, что он видел — и все это опять отправлялось на сервера Amazon.

Изображение: The Intercept.

Соответственно, материалы клиентов не хранились физически в офисе Ring. Это огромные объемы данных — компании пришлось бы себе покупать здесь дата-центр, чтобы хранить их и обрабатывать. А значит, ответственность за защиту этих данных несет Amazon. Ring покупал сервисы Amazon как для хранения данных, так и его обработки. Все процедуры обработки запускались в США на серверах последней.

Чтобы получить доступ к этим видео, устройство сотрудников специальным способом конфигурировалось. Обязательно по требованию офиса включалось шифрование всех дисков.

Еще один сотрудник Ring Ukraine, пожелавший дать анонимный комментарий, проработал в компании на должности разработчика с июня 2017 по август 2018. Он также отрицает обвинения, выдвинутые в американской прессе.

По его словам, операторы, которые просматривали видео, не могли их скачать или отправить кому-либо. Конкретный компьютер мог получить только определенный список доступных для обработки видео и помимо прямых задач ничего с этим видео сделать не мог.

«Мы делали приложение для операторов. Как оно работает. Чтобы проверить, насколько ИИ правильно определяет какое-то действие, ему дается тот список кадров для разбора, что и оператору. Человек знает где какое действие и для того, чтобы проверить насколько правильно учится ИИ, ему дается список без разметки, а потом сверяется. На сравнении делается выборка и мы понимаем, насколько точен ИИ или нет, а также что нужно сделать, чтобы она работала точнее.

Оператор, который работал через приложение, не знает, откуда ему пришли материалы, от кого они и так далее. Более того, он не может его себе сохранить. У него одна обычная задача — разметить на нем человека», — добавил собеседник издания.

Редакции AIN.UA не удалось получить сведения, соблюдались ли все эти процедуры в компаниях Ring и Ring Ukraine с самого начала.

Нормально ли учить AI два года?

В ходе подготовки материала редакция AIN.UA столкнулась с другим вопросом пользователей: как так получилось, что нейронную сеть команда Ring учит уже два года. Неужели это занимает так много времени? Это точно обучение AI или компания просто экономит деньги или у нее просто нет технологии?

Как сообщили редакции AIN.UA несколько людей, которые занимаются развитием собственных проектов с нейронными сетями, учить сеть можно сколько угодно долго. И чем лучше удастся ее обучить, тем лучше она будет работать. Более того, это действительно непростая задача.

Один из источников издания, пожелавший остаться неназванным, сообщил, что у Ring, скорее всего, весьма непростая задача по обучению сети. Например, если перед домом упало дерево, нужно научить сеть, что это не человек прошел, а именно упало дерево. Или проехала машина. Или пробежал кот. А если не кот, то собака: и каждое животное нужно отличить от другого.

«Людям, которые не понимают процесс обучения нейронной сети трудно понять, что это за процесс. Ведь на ее работоспособность влияет любой фактор: как повесили звонок Ring, под каким углом, идет ли на улице дождь, снег или светит солнце. А еще нужно понимать, что вот есть человек, а вот человек с собакой, а вот человек, возле которого пролетела птица. А это человек в капюшоне или у него прическа такая?. Все это требует времени и нужно понимать, что чем больше данных дать нейросети, тем лучше она будет работать», — отметил источник AIN.UA.

Александр Арапов, VP ENGINEering компании 3DLook, в комментарии AIN.UA подтвердил, что обучение нейросети на видеопотоках — в любом случае занимает много времени.

«Есть мануальный фактор подготовки данных: чем больше данных, тем больше требуется ручного труда или автоматизации процесса, а автоматизация — это разработка, что также равно время. После подготовки данных, есть этап обучения и там все зависит от ресурсов. Судя по тому, что компанию Ring купил Amazon — с ресурсами проблем нет. Но так как они работают именно с видео, обучать нейросетку на видеопотоках вне зависимости от цели — все равно занимает время. Плюс при наличии разных целей и разных данных — всегда возникает необходимость: доучить, переобучить, оптимизировать сеть, перенести на устройство. Из всего этого и вытекает 2 года», — отметил Арапов.

В итоге, добавил Александр, именно обучение нейросети на огромном количестве данных с последующей реализацией в продуктах позволит Ring отличаться от конкурентов, которые не смогли дать своим нейросетям большого объема информации.

Просмотренные редакцией AIN.UA пользовательские соглашения указывают, что владельцы дверных звонков Ring давали право на использование их видео.

Над материалом работали сотрудники AIN.UA: Дмитрий Демченко, Илья Кабачинский, Илья Бошняков