Хотя в прошлом году Google заявила о намерении отказаться от практики сканирования пользовательских писем, компания предоставляет такую возможность для сторонних разработчиков, пишет издание The Wall Street Journal. Девелоперы пользуются доступом, чтобы обучить нейронные сети, а иногда и сотрудников, читать и правильно интерпретировать электронную переписку. 

К примеру, Return Path Inc. собирает данные в маркетинговых целях, пользуясь доступом ко «Входящим» двух миллионов людей, использующих приложение из партнерской сети компании, насчитывающей 163 позиции. Обычно анализ содержимого проводят автоматизированные компьютерные системы, сканируя около 100 000 млн писем в день. Но в прошлом году сотрудникам пришлось прочесть около 8000 писем, чтобы правильно обучить софт. Об инциденте сообщили анонимные источники.

Как пишет The Verge, чтобы получить доступ к содержимому писем, приложения должны получить согласие пользователей. Однако оно недостаточно хорошо проясняет, что пользоваться им будут не только компьютеры, но и люди.

В Google сообщают, что каждый разработчик проходит процедуру согласования, прежде чем получать такую функциональность. Проверка устанавливает, корректно ли компания представлена внутри программы, сообщает ли в политике приватности о сканировании писем, релевантно ли это для ее деятельности. В Google также рассказали о том, что ряду разработчиков ответили отказом — но точное количество таких случаев или названия приложений неизвестны.

Помимо этого, компания сообщила в комментарии, что сотрудники Google тоже могут читать письма — «в исключительных случаях, когда вы просите нас об этом и даете согласие, или когда это необходимо из-за вопросов безопасности, вроде изучения бага или инцидента». Другие почтовые сервисы ведут аналогичную политику, поэтому проблема не замыкается на Google.

Тед Лодер, бывший CTO компании eDataSource Inc. рассказал, что чтение писем — «обычная практика» среди компаний, собирающих подобные данные. По его словам, инженеры в eDataSource Inc. регулярно пользовались возможностью изучать сообщения при создании и улучшении алгоритмов. 

WSJ приводит инфографику с разбором того, как можно проанализировать разные строки переписки.

  • Отправитель — отправителям присваивают репутационные рейтинги на основе того, с какой вероятностью получали читают их сообщения;
  • Получатель — имена и адреса, которые заменяются в итоговом алгоритме кодами, объединяются с демографической информацией вроде возраста и места проживания;
  • Тема — можно протестировать несколько вариантов темы, чтобы посмотреть, какая заработает больше всего кликов;
  • Дата — отслеживание того, когда люди открывают письмо, помогает найти лучшее время для их отправки;
  • Содержимое — приложение парсят, чтобы обучить алгоритмы распознавать «натуральный» язык;
  • Подписи — имена, номера и адреса сканируют, чтобы добавить в базы данных;
  • Данные из электронных чеков — сведения о покупках собирают, чтобы установить тренды в отношении средних цен и наиболее продающихся продуктов.

Хотя пока доказательств о нецеловом использовании собранной информации нет, журналисты обеспокоены.

Ситуация напоминает условия, которые спровоцировали скандал вокруг Facebook и Cambridge Analytica. То, что было общепринятой практикой в течение нескольких лет — позволять сторонним разработчикам получать доступ к данным Facebook — в один момент использовалось не по назначению и оказалось под давлением государства и общественности после публичного разглашения.

При этом, у Gmail сегодня более 1,4 млрд пользователей — две трети всех мировых пользователей электронной почты зарегистрированы именно в этом сервисе. Между 2010 и 2016 годами компания получила в США три иска о нарушении федерального закона в отношении прослушивания, но не проиграла ни одного дела.

Чтобы посмотреть, какие приложения могут использовать данные вашего Google-аккаунта, перейдите по этой ссылке.