Александрийская библиотека 2.0: Как копирайт похоронил крупнейший архив оцифрованных книг Google Books

6595
1

Google — не только передовой поисковик, главный рекламный реселлер интернета или составная часть холдинга Alphabet. Это компания, созданная идеалистами и мечтателями. Однажды они захотели оцифровать каждую книгу на планете, потратили на это $400 млн и бросили дело. О том, почему самый амбициозный эксперимент в истории книгоиздания разбился о бюрократические препятствия рассказал журналист The Atlantic Джеймс Сомерс.

Проект Google Ocean должен был подарить посетителям публичных библиотек доступ к любой книге мира через специальные компьютеры. Его реализация позволила бы делать аннотации, цитировать и выделять важные моменты из всего массива литературы, когда-либо изданной человечеством. И отправлять кому-то небольшие выдержки, просто поделившись короткой ссылкой. Книги стали бы похожи на веб-страницы, доступные и открытые. К 2011 году концепция универсальной библиотеки почти стала реальностью.

Но что-то пошло не так — 22 марта 2011 года юридическое соглашение о создании подобной структуры было признано недействительным из-за нарушения федерального законодательства США. Однако, в отличие от смерти Александрийской библиотеки, которая стала первой попыткой человечества собрать вместе накопленные знания, у такого решения нашлись сторонники — они утверждали, что предотвратили катастрофу.

Проект Google Ocean стартовал в 2002 году, когда поисковой гигант был на взлете. Сооснователь компании Ларри Пейдж и топ-менеджер Марисса Майер сидели в кабинете и решили подсчитать, сколько времени уйдет на сканирование 300-страничной книги. Пейджу было интересно, как долго будут сканировать 100 млн томов, поэтому он начал с первого попавшегося. Дело заняло 40 минут.

Его всегда интересовала возможность оцифровать книги. Еще в 1996 году, будучи студентом и занимаясь созданием механизма индексации, положившего начало Google, он задумывался о подобном. Оцифровка литературы позволила бы составить карту цитирований, выделить наиболее популярные книги и улучшить поиск. Но книги продолжали жить на бумаге, поэтому свои идеи Пейдж и Брин реализовали во всемирной сети.

К фолиантам они вернулись лишь в 2002 году. Вскоре после прикладного эксперимента Пейдж отправился в свою альма-матер и обратился руководству Мичиганского университета. Заведение лидировало в направлении оцифровки книжного фонда, при этом обладая одной из самых внушительных библиотек, на 7 млн томов. Когда Пейдж спросил, сколько времени уйдет на перевод фонда «в цифру» ему сказали, что около тысячи лет. Предприниматель планировал успеть за шесть.

Стороны заключили взаимовыгодную сделку: Google брал на себя техническую часть по оцифровке, а библиотеки предоставляли им свой фонд и бесплатно получали готовые копии для публичного пользования. У компании были планы охватить забытый и неизведанный пласт информации, а также применить его для улучшения поискового движка.

Подготовка договоренностей затянулась на два года. Среди партнеров Google оказались университет Мичигана, Гарвард, Стэнфорд, Оксфорд, Нью-Йоркская публичная библиотека и другие. Однако главные испытания крылись впереди — Ocean оказался сложен не только технически, но и логистически. Каждую неделю к специальному офису в Маунтин-Вью приезжали грузовики, заполненные старинными книгами. Затем их выгружали на некоторое подобие тележек и везли к специальным станциям, которые полыхали вспышками. Эти установки были разработаны самой Google и стоили более $1000 каждая. Они использовали продвинутую оптику, четыре камеры, и сканирующий радар, который создавал трехмерный отпечаток каждой страницы. Страницы переворачивали операторы этих машин, потому что ни один механизм не мог выполнить это с должной скоростью и аккуратностью. «Сканер» приводился в действие нажатием ножной панели, поэтому операторы напоминали причудливых пианистов.

Однако самая сильная сторона устройств заключалась в том, что они, по большей части, полагались на программное обеспечение. Вместо достижения идеальных условий для съемки страницы, Google использовала продвинутое распознавание текста и данные трехмерного сканирования. На пике проекта в нем на полную ставку работали до 50 инженеров. Они занимались отладкой техники, улучшали цветокоррекцию и развивали алгоритмы, отделяющие текст от иллюстраций и диаграмм, переводящие сноски в настоящие цитаты. Книги не были единой сетью, поэтому их объединение было вызовом для сотрудников. Однако некоторые относились к делу со скептицизмом, ведь в 2011 все были заняты социальными проектами. Google и сама пыталась запустить соцсеть.

Проекту «Океан» впервые в истории компании присвоили неформальный статус «moonshot» — «полет на ЛУНу». Некоторые инженеры критиковали амбициозное начинание за расточительность: годовые траты достигали $50 млн. Общая смета достигла бы $400 млн.

К 2010 году Google провела некоторые подсчеты и написала в блог-посте, что в мире было опубликовано 129 864 880 книг. Компания собирается оцифровать их все. Но это «лунная миссия» была обречена на провал.

Изначально в Google прекрасно понимали, что взять и выложить в открытый доступ такой массив литературы равно самоубийству. Поисковой гигант собирался предоставлять пользователям доступ к поиску и показывать небольшие сниппеты, отрывки содержимого. Юристы не видели в этом никакого нарушения авторских прав, поскольку Google Books не позволял бы «читать» книгу в классическом виде.

С этими выводами была несогласна «Гильдия авторов», подавшая коллективный иск в адрес Google. Общая сумму штрафных санкций превышала триллионы долларов, поскольку за каждую цифровую копию требовали по $150 000. И это было обоснованно. Владельцы авторских прав возмутились, потому что Google изначально обратилась не к ним, а к библиотечным организациям. Имея на руках цифровые копии всей изданной в Америке литературы, компания бы просто стерла в порошок их копирайты.

Ситуация, впрочем, не выглядела новой. К примеру, в начале XIX века создатели комплектующих для пианино проигнорировали авторские права на нотную бумагу, после чего встретились с судебными исками от музыкальных издательств. Та же ситуация была у изобретателей радио и винила, первых эфирных телеканалов и VCR-магнитофонов. Наконец, в начале 2000-х музыкальный обменник Napster тоже обвинили в нарушении копирайта.

Однако юристы отметили, что такие прецеденты вывели закономерность — владельцы авторских прав судились не ради убийства технологии, а чтобы извлечь дополнительную прибыль. Чаще всего решение удовлетворяло обе стороны и они выигрывали. К примеру, музыканты обязывались лицензировать свои песни для производителей «пиано-роллов», но получали отчисления за каждую отпечатанную на них песню. Кинопроизводители начали зарабатывать даже после ухода фильмов из кинотеатральных расписаний благодаря популярности домашних магнитофонов.

Но дело против Google оказалось сложнее — издатели и авторы не сразу смекнули, какую выгоду могут извлечь. Они поздно осознали, что Google, вероятно, не хочет надругаться над чьей-то работой, а намерена вдохнуть новую жизнь в книгоиздание. Тогда истцы сообразили, что лучше подбодрить Google продолжать — пусть показывает пользователям сниппеты при поиске, а заработать можно будет на продажи цифровых копий. Но юридическая тяжба зашла слишком далеко и поставила всех участников процесса в патовую ситуацию. Если выигрывала «Гильдия авторов, то Google выплатит им компенсации за нанесение ущерба и закроет перспективный рынок. Но если выиграет Google, то правообладатели останутся ни с чем, а читателям достанутся лишь сниппеты.

Проблема заключалась в самой структуре владения авторскими правами. Представим, что автор подписал договор на издание произведения сроком 40 лет. После этого книга уходит из печати, а права возвращаются изначальному владельцу. Ему нужно подтвердить это письмом. Все эти бумаги, в итоге, оказываются в неизвестных местах и, в любом случае, вообще не рассматривают вопрос цифровых прав. При этом, по оценкам исследователей, около половины книг, изданных в период с 1923 по 1963 находятся в публичном владении, то есть свободны для распространения. Из-за утери документации установить содержание этой половины попросту невозможно — чтобы поднять архивы, найти авторов или их родственников придется потратить слишком много денег.

В ходе развития дела «Гильдия авторов против Google» у этой проблемы наметилось решение. Компания собиралась заключить такую сделку, в рамках которой владельцы авторских прав всех мастей могли бы снять свои обвинения в обмен на долю в доходах от продаж. Google собиралась разрубить гордиев узел: передавать 63% от вырученных средств в адрес фонда, в который бы обращались за выплатами владельцы копирайта. Поскольку часть из них не пришла бы за деньгами, свободные средства бы пустили на поиск настоящих правообладателей. Особенно перспективно дело выглядело для независимых авторов, которые обычно немного зарабатывают. Все детали этого соглашение занимали более 160 страниц.

Согласно условиям, Google обязалась потратить более $120 млн для запуска процесса. $45 млн из этой суммы уходили на счета правообладателей, $15,5 млн составляли налоги, $30 млн получали авторы, а $34,5 млн выделялись на создание единого реестра. Компания получала право отображать в режиме предпросмотра до 20% содержимого книги, а средние ценники при продаже составляли бы от $2 до $60. Наконец, пункт 4.8(a) подразумевал создание публичной инфраструктуры для доступа ко всей оцифрованной литературе через терминалы, установленные в библиотеках страны. Эксперты оценили намечающуюся сделку по системе «win-win-win», поскольку выгоду получали все стороны: Google, правообладатели и читатели.

Участники сделки готовились к тому, что им придется встретиться с критикой. Однако новость, которая быстро разлетелась в СМИ, вызвала небывалую шумиху. Большинство недовольных указывали на то, что Google концентрирует в своих руках слишком большую власть. Критики указывали, что крупнейшая в истории библиотека окажется во владении корпорации, которая в любой момент может изменить условия предоставления доступа к ней. Подобные прецеденты случались на рынке академических изданий — изначально справедливые цены завышались до астрономических значений. К примеру, годовая подписка на «Журнал сравнительной нейрологии» обходилась $25 910 к 2011-му для библиотек и университетов. Дело походило на сделку с дьяволом: несмотря на потенциал для создания величайшей библиотеки вместе с ней открылся бы и величайший книжный магазин. Все это оказалось бы в руках одной корпорации, что вполне соответствует понятию монополия.

Критику поддержали и соперники Google. Компания Microsoft заявила, что монопольный доступ к такому объему информации и пользовательских поисковых запросов окончательно зафиксирует лидерство Google в поисковом деле и нарушит правила конкуренции. В ответ Google говорила, что каждый может сканировать книги и показывать их в поисковой выдаче. К слову, к началу 2017 года эту практику действительно признали честной.

Кроме того, руководители проекта «Океан» настаивали, что данные сами по себе не интересуют их. Если уж на то пошло, объем информации в сети гораздо выше.

В свою очередь Amazon опасался, что конкуренты создают книжный магазин невиданного масштаба. Ведь каждый хочет продавать книги, у которых истек срок издательских прав. И должен иметь правовую базу для таких сделок, как у Google, что выглядело так же хорошо, как и невозможно.

В результате конфликт привлек внимание государства. Министерство юстиции признало намерения Google нарушением авторских прав и посягательстве на монополию. Дело было в создании опасного прецедента: каждый конкурент должен был пройти через те же шаги. Начать сканирование, затем судебные тяжбы и очень маловероятно, чтобы дела вновь заканчивались в мировую.

Google выступила с ответом. Ее юристы назвали субъектом законодательной защиты интересы покупателей. Вывод в легальную продажу «просроченных» книг стал бы улучшением для людей. Кроме того, все почему-то закрывали глаза на тот факт, что это Amazon захватила 80% рынка электронной коммерции, а у Google что-то между 0 и 1%, так что сделка лишь способствует конкуренции.

Однако дело было безнадежным — при удачном закрытии иска «Гильдия авторов против Google» права оставались бы только у Google. Чтобы заварить эту кашу кампания изначально нарушила копирайт, что недопустимо для превращения в нормальную практику.

У Минюста не было выхода. Если решить вопрос для Google, то будет нарушены антимонопольные правила, если сделать глобальное послабление то другим компаниям бы пришлось нарушать закон. Несмотря на понимание того, что проект имеет достойную цель, власти отвергли одобрение дела «Гильдия авторов против Google». Для многих по-прежнему остается непонятно, зачем правительство вообще сунулось в это дело. Крест на проекте поставило решение Верховного суда США, который в 2016 отверг петицию «Гильдии авторов».

У этого разбирательства оказалась богатая история. Критики и почитатели проекта имели на своем счету серьезные доводы. Но временами дело доходило до абсурда. Одного автора, например, приводило в ужас желание Google продавать книги. Она считала, что издания должны быть бесплатны (хотя могла бы опустить их цену до нуля, если бы пожелала). По её словам, «неприкаянные» работы все равно имели бы цену, что недопустимо. Проект застрял в странном положении: вместо того, чтобы хоть в каком-то виде дать людям доступ к книгам, их просто похоронили. Есть некая надежда, что новые законодательные решения Конгресса когда-то изменят ситуацию и дадут лазейку для легального завершения разбирательства. Но никто уже не печется о судьбе грандиозного «Океана». Маловероятно и то, чтобы кто-нибудь тратил свой политический ресурс влияния на книги, да еще и устаревшие. Ведь это же не даст желанный пост в правительстве, а просто создаст рабочие места. Проблема затронула глубинные вопросы авторского права, впервые утвержденного американцами в конце XVIII и, очевидно, требующего новой ревизии.

После завершения судебных тяжб Google просто «сдулась». Да, она могла показывать выдержки из книг — на этом возможности ограничивались. Где-то в серверных глубинах корпорации находится настоящее сокровище. 25 млн отсканированных книг. Крупнейшая в истории библиотека. 50-60 петабайтов данных и все, кто имеют к ним доступ, это группа инженеров, проверяющих исправность оборудования. Автор материала Джеймс Сомерс поговорил с участником этой команды и разузнал, трудно ли открыть доступ к хранилищу. Вот что ему ответили:

У тебя будет куча проблем, но все что нужно выполнить, по большей части, это один запрос к базе данных. Измените права доступа с «off» на «on». Выполнение команды займет пару минут.

Оставить комментарий

Комментарии | 1

Поиск