Норвежец Мартин Гундерсен решил провести небольшой эксперимент и проверить, какие данные о нем имеют владельцы мобильных приложений, установленные на его телефоне. В течение года он повсюду ходил со своим смартфоном, а затем подал в компанию Venntel, занимающуюся анализом данных, запрос на копию информации о себе.
Он сделал это, ссылаясь на нормы регламента о защите данных (General Data Protection Regulation, GDPR), которые действуют в отношении данных жителей Евросоюза.
В ответ журналист получил информацию о том, где он был более 75 тысяч раз в течение последних полгода. Эта информация позволила отследить на карте каждый шаг Мартина. Хотя в документе, который ему предоставили в Venntel, не было телефонных номеров или других идентификаторов пользователя, по которым можно было довольно легко анализировать, например, на основании его частых посещений только двух мест – дома и рабочего офиса.
В письме компания Venntel добавила, что делится этими данными со сторонними клиентами, которые могут использовать их в целях национальной безопасности, однако не указала их точных названий. При этом ни в одной сделке по конфиденциальности, ни в одном из мобильных приложений, установленных на смартфоне Мартина, компания Venntel не фигурировала.
Как оказалось впоследствии, Venntel получала информацию от материнской компании Gravy Analytics – брокера данных, который собирает информацию для улучшения таргетинга. Та, в свою очередь, получила данные от словацких разработчиков ряда популярных мобильных приложений из компании Sygic. В этих приложениях лишь попросили разрешение на «персонализацию рекламы», хотя взамен фактически продали данные Мартина третьим сторонам.
Дальнейшее исследование круговорота своих данных привело журналиста в компанию из Франции и Финляндии. А его история доказала, что новая норма GDPR так и осталась формальностью. Однако понять, кому принадлежат данные пользователей, и кто имеет к ним доступ, практически невозможно.
Цифровой след
Понять если не то, кому принадлежит информация пользователей, то, по крайней мере, то, какие данные есть у компаний – владельцев онлайн-сервисов, время от времени пытаются и журналисты, и рядовые пользователи интернета.
Журналистка из Франции Жюдит Дюпортель подала запрос в сервис знакомств Tinder с просьбой показать, какими ее данными этот сервис владеет. В ответ Жюдит получила архив из 800 страниц. Он содержал все 1700 сообщений, отправленных ею через Tinder в течение пяти лет, а еще – лайки в Фейсбуке, фотографии из Инстаграма, даже удаленные, и геолокацию, то есть места, где она физически находилась.
Такие истории, с одной стороны, вызывают недоумение – но лишь в отношении объемов данных рядовых пользователей, которые хранятся в частных компаниях. Хотя самим фактом сохранения этой информации уже никого не удивишь. Более того, многие крупные компании в специальных разделах профайлов пользователей предлагают им посмотреть, какую информацию они агрегируют, а порой даже – как они ее используют.
Такие разделы в настройках профайлов были давно, однако на них обычно обращали мало внимания, и большинство пользователей не интересовались, какие данные хранит компания о них. Однако после истории с Cambridge Analytica об использования данных фейсбук-профайлов в политической рекламе эти разделы стали востребованными среди рядовых граждан. Тогда же, к примеру, компания Facebook разрешила загружать архив информации пользователей, которые она хранит.
После запуска этой функции в медиапространстве появилось много публикаций от журналистов, удивленных объемами и детализацией этих данных. Со временем такой же архив стало возможно скачать и для Инстаграма, а интерес к этой теме постепенно сошел на нет.
Однако рядовые пользователи, которые все же интересуются тем, какие данные хранят о них техногиганты, обычно бывают удивлены не меньше авторов публикаций об этих функциях. Ведь Facebook и Instagram хранят не только историю всех переписок, взаимодействий в мессенджерах и комментариях, но и даже удаленные фотографии и сообщения.
Иными словами, объемы информации, которыми обладают и которые используют в собственных целях современные онлайн-сервисы, огромны. При этом возникает дельный вопрос: а принадлежат ли эти данные самим их владельцам – пользователям, и какие у этих пользователей есть права в отношении них?
Соглашение «за» или «против» пользователя?
Информация о том, как онлайн-сервис взаимодействует с данными, содержится в соглашении с пользователем. Это документ под названием «Term of service», который – теоретически – должен прочитать каждый пользователь сервиса, а после этого принять его условия и согласиться с ними. Однако часто эти сделки бывают длинными и запутанными, поэтому подавляющее большинство пользователей принимают, их машинально, не читая.
Зная это, время от времени онлайн-сервисы проводят то ли веселые, то ли жестокие эксперименты, добавляя странные пункты в сделки с пользователями. Например, британский провайдер Purple в условиях использования публичного Wi-Fi предусмотрел обязательство выполнять общественные работы для всех пользователей этого сервиса. А магазин Gamestation 1 апреля дополнил соглашение с пользователем пунктом о продаже бессмертной души — клиенты, которые в этот день сделали заказ, предоставили разрешение преследовать их душу с тех пор и вовек.
Есть в таких сделках и объяснение реального положения вещей. К примеру, те, кто купили смарт-телевизоры Samsung, из соглашения с пользователем могут узнать, что он будет прослушивать и записывать их разговоры и передавать эти записи третьим лицам. Отказаться от этой опции, конечно, можно, но тогда придется, выбросить телевизор или не включать его.
По сути, у пользователя нет выбора, особенно если он уже заплатил за сервис или гаджет. Нельзя не согласиться с отдельными пунктами соглашения с пользователем или принять его выборочно. Этот документ – по сути, информирование со стороны компании о том, на что она имеет право в отношении данных и устройств пользователя, и в нем почти не говорится о правах самих пользователей.
Журналисты американского издания The New York Times проанализировали около 150 сделок с пользователями и пытались выяснить, какие из них являются самыми длинными и сложными. Как оказалось, для прочтения некоторых сделок (например, сервиса Airbnb) нужно до 45 минут, и многие из них перегружены юридической терминологией и являются слишком сложными для понимания обычным человеком.
Едва ли не самая скандальная история, связанная со сделкой с пользователями, произошла уже в начале 2020 года. В первой половине января пользователи начали массово отказываться от мессенджера WhatsApp и искать альтернативу. В то же время другие мобильные приложения, среди которых проект Павла Дурова Telegram и признанный лидер среди защищенных мессенджеров Signal пережили бум загрузок от бывших пользователей Facebook.
Дело в том, что Facebook и WhatsApp изменили соглашение с пользователями. Ранее компания сообщала пользователям WhatsApp, что их данные передаются Facebook, и те могли отказаться от этого. Однако в новой сделке, которая начнет действовать 8 февраля 2021 года, говорится о том, что отказаться от передачи данных пользователей WhatsApp материнской компании невозможно, и пользователи должны выразить согласие с тем, что это правило им понятное. Кто не сделает этого, будет лишен возможности пользоваться мессенджером.
Однако даже при условии, что пользователь откажется от WhatsApp до 8 февраля, его данные будут храниться в базах данных сервиса некоторое время, и влиять на этот процесс практически невозможно. Попыткой урегулировать эту вакханалию вокруг данных пользователей было введение GDPR.
Однако, как показывают реальные истории обычных людей, для них это практически ничего не изменило. Именно поэтому этот документ часто называют провальным, хотя он стал хотя бы попыткой навести порядок во взаимоотношениях пользователей-владельцев данных и компаний, которым они эти данные предоставляют.
В то же время скандальная история с WhatsApp по изменению пользовательского соглашения не касается жителей стран ЕС — об этом в компании четко сообщили, комментируя изменения. А это можно считать условной победой GDPR.
Вероятно, от GDPR ждали быстрых изменений правил взаимодействия с данными пользователей. Однако стало понятно, что эта сфера такая сложная и многогранная, и, что самое главное – так сильно меняется каждый год, что одному-единственному документу, который, кстати, разрабатывался не один год, не под силу изменить ситуацию на рынке пользовательской информации.
Между тем, одним из требований GDPR было упрощение сделок с пользователями. И, как показал анализ экспертов The New York Times, некоторые компании, такие как Google, все-таки упростили свои документы. В то же время пользовательское соглашение самого The New York Times требует более 20 минут на прочтение, а его уровень сложности – выше среднего.
Кто владелец?
Еще одна проблема, лишь частично урегулированная в онлайн-пространстве, — вопрос о том, кому принадлежит контент, созданный пользователями. Web 2.0, концепции сети, в которой большая часть контента может создаваться кем угодно, уже более 10 лет. В то же время многие вопросы о правах на этот контент и его сохранности остаются открытыми. История с блокировкой аккаунтов Дональда Трампа в начале января частично демонстрирует эту проблему.
Facebook и Instagram заблокировали аккаунты 45-го президента США в связи с событиями, которые произошли в начале года возле Капитолия. Этому предшествовало длительное противостояние между Трампом и администрациями этих сервисов: он писал откровенно лживые или манипулятивные сообщения, а соцсети добавляли в них пометки о манипулятивности или удаляли их. Это продолжалось довольно долго, и выглядит так, что история со штурмом Капитолия стала последней каплей, из-за которой терпение социальных сетей лопнуло.
Деплатформинг Трампа (именно так назвали это явление американские техножурналисты) вызвал оживленные обсуждения о свободе слова, власти социальных сетей и ответственности за их решения. Однако на эту историю можно взглянуть с другой стороны – если аккаунт Трампа в Фейсбуке содержит старые сообщения, опубликованные до 6 января, то контент 45-го президента в Твиттере сейчас недоступный.
В то же время эти сообщения являются объектом общественного интереса и были бы интересными для изучения и для специалистов по коммуникациям, и для политтехнологов, антропологов и историков. Своим решением компания Twitter не только ограничила доступ к сообщениям президента США, но и фактически присвоила весь созданный им контент.
Его частично можно просмотреть с помощью сервиса WayBackMachine – так называемого архива интернета, который хранит отдельные копии веб-страниц. Но этот сервис не очень удобен, он содержит отрывочные данные и в нем не работает поиск. Последнее свидетельствует о том, что этот контент можно считать потерянным – и не только для других пользователей, но и для его автора.
Практически так же поступила и компания Facebook, заблокировав и удалив в начале 2019 года наибольшее львовское сообщество «Варта1». Компания фактически присвоила права на контент, который создавался не один год руками тысяч пользователей.
Право социальных платформ на удаление контента, что опубликовано на их страницах, закреплено в печально известных сделках с пользователем. Однако, доверяя свой контент социальной платформе, вряд ли кто-то готовится к ситуации, когда сообщения и фото исчезнут согласно решению одного или даже нескольких модераторов, которые руководствуются правилами работы частной компании.
Заработки на данных
Упорядочение права на информацию пользователей — это лишь одна из проблем, связанных с экономикой данных. Данные пользователей являются необходимым элементом работы и развития многих бизнесов. Но Facebook не могла бы зарабатывать, если бы, не обладала огромными массивами пользовательских данных и не умела продавать их рекламодателям.
На основе информации пользователей учатся сервисы распознаванию лиц, программам для генерации устной речи (к примеру, всем известная Siri), сервису подбора одежды, прогнозированию дорожных заторов, благодаря ним работают рекомендательные сервисы. По большому счету, вся индустрия цифровой рекламы построена на совершенном знании данных пользователей.
Даже обычные онлайн-кинотеатры или интернет-магазины в наше время не могут работать без доступа к информации о своих посетителях. Именно поэтому данные называют новой нефтью для экономики XXI века. Тем не менее, те, кто использует эту нефть, ничего не платят своим владельцам – конечным пользователям, которые создают контент в интернете или предоставляют доступ к своим смартфонам для передачи данных о геолокации, любимых фильмах или ресторанах.
В лучшем случае вместо этого пользователи могут получить бесплатные сервисы или приложения, которые тоже будут использовать их данные для улучшения собственных сервисов или продажи третьим сторонам.
По большому счету, этот обмен является так же неравнозначным, как когда-то была покупка острова Манхэттен у коренных жителей за бутылку рома, бусы и другие мелочи.
Поведенческий остаток
Экономика данных в сфере взаимодействия с данными пользователей породила новое понятие – «поведенческий остаток». Так называют информацию пользователей, которую онлайн-сервисы собирают и обрабатывают, однако не используют по прямому назначению.
Этот остаток возникает из-за того, что онлайн-сервисы или мобильные приложения собирают гораздо больше данных, чем им необходимо для улучшения своих услуг. К примеру, программа-прогноз погоды может просить доступ к камере пользователя, а калькулятор — доступ к микрофону или геолокации. Для выполнения своих функций этим приложениям такая информация не нужна.
Однако когда пользователь предоставит доступ к этим данным, возникнет ситуация поведенческого остатка. При этом компания-разработчик сможет продать эти данные третьей стороне и заработать на них.
Одной из первых монетизировать поведенческий остаток научилась компания Google, которая собирала много данных о пользователях своей поисковой системы. Часть была нужна для улучшения поиска, а часть стала основой монетизации Google за счет рекламы. По сути, рекламодатели покупали не только место в поисковой выдаче или на сети сайтов с установленными Google-блоками рекламы, но и доступ к данным пользователей, к их интересам, прогнозам относительно их поведения и предпочтений.
Цифровые дивиденды
Неупорядоченность взаимоотношений между владельцами информации и компаниями, которые ее используют, породили много идей относительно того, как эти отношения упорядочить, а именно – как пользователям попасть в цепочку создания прибавочной стоимости, которая начинается с их данных.
К примеру, политик и бывший кандидат в президенты США Эндрю Янг еще в прошлом году говорил о том, что интернет-компании должны платить за данные пользователей. Свое предложение он аргументировал тем, что без этой информации интернет-бизнес не смог бы работать, а деньги за это пользователи не получают. Именно он впервые заговорил о выплате так называемых цифровых дивидендов, сравнивая это с рентой за недра.
Янг даже начал проект под названием Data Dividend Project, целью которого является изменение концептуальных принципов взаимодействия между технологическими компаниями и пользователями.
Эндрю Янг не единственный продвигает эти идеи. Определенной их вариацией можно считать стартапы, которые предлагают пользователям продавать свои данные (Datacoup, Datacy). А в Нидерландах даже появился цифровой профсоюз Datavakbond, представители которого планируют добиться от техногигантов получения цифровых дивидендов.
Инновационная модель данных
Еще одной идеей, направленной на то, чтобы упорядочить вопросы права на персональную информацию, является инновационная модель данных, построенная вокруг пользователя (user-centric data model).
Литовский эксперт, доктор философии Паулюс Юркус (Paulius Jurcys) описывает эту модель так, что она предполагает, что вся информация будет собрана в одном месте – в определенном «облаке персональных данных». Часть данных можно добавить туда вручную, а остальные будут появляться вследствие работы некоторых приложений или устройств, как, например, информация о геолокации.
Получив такую персональную цифровую копию данных, пользователь сможет лучше контролировать доступ к ним – определять, кому этот доступ предоставляется, а кому нет и, возможно, даже получать деньги – те сами цифровые дивиденды. Этот подход позволит упорядочить рынок и даже дать толчок новым возможностям для работы с данными пользователей.
Такие данные будут наиболее актуальными и точными, не будет проблемы с незаконным получением доступа к ним, или если такая ситуация возникнет, она будет быстро выявлена, так как пользователь сможет сам решать, кому он предоставляет доступ. И, что не менее важно — эта модель может уничтожить такое понятие, как утечка данных. В то же время уровень персонализированных сервисов и таргетированной рекламы через такой легальный доступ к данным будет значительно лучше настоящего.
Но самое главное, по мнению автора этой концепции, – то, что такой подход позволит лицу иметь четыре классических права: право владеть своими личными данными, право использовать их, распоряжаться ими и получать от них пользу. Кроме того, люди будут лучше понимать, как используется их информация, и более грамотно ею управлять. Еще одна выгода — персональные данные не будут предметом одноразового использования, а превратятся в актив, который будет формировать долгосрочную ценность.
Задачи на будущее
Использование технологическими компаниями данных пользователей будет только усиливаться. С одной стороны, техногиганты – Apple, Google и другие – пытаются упорядочить эти процессы, например, сообщать пользователям, к какой информации приложение будет запрашивать доступ, и демонстрировать ее в виде этикеток – таких же, которые содержат составляющие в продуктах питания.
Такое решение можно воспринимать как ответ компаний на увеличение интереса к приватности и защите данных со стороны рядовых пользователей. С другой, эти компании научились едва ли не лучше скрывать, какие данные своих клиентов они используют и с какой целью.
Это противоречие нельзя преодолеть лишь доброй волей самих техногигантов — хотя бы потому, что они заинтересованы получить как можно большее количество данных как можно за меньшие деньги.
Европейский регламент GDPR стал первой попыткой хоть как-то упорядочить использование пользовательских данных интернет-компаниями. При наличии политической воли и при условии совместных усилий использование информации пользователей может быть упорядочено. Однако это слишком глобальная задача, которая не может быть воплощена даже в течение нескольких лет.
С другой стороны, если этот рынок не будет упорядочен, то хаоса в нем станет еще больше, и тогда пострадают все – и пользователи, и компании, для которых данные являются топливом и ресурсом, необходимым для их существования и процветания.
Автор: Надежда Баловсяк
Источник: Тиждень
Перевод: BusinessForecast.by
При использовании любых материалов активная индексируемая гиперссылка на сайт BusinessForecast.by обязательна.