Читать книгу "BIG DATA. Вся технология в одной книге - Андреас Вайгенд"
Шрифт:
Интервал:
Закладка:
Право на доступ к собственным данным, очевидно, осложняется наличием вопросов о том, кто является «владельцем информации» и что, собственно, означает «владеть информацией». Как видно на примере тэгов, интересы создателей и субъектов информации могут противоречить друг другу, и так было всегда. Наши нынешние представления о собственности складывались в физической реальности. Купив яблоко, я становлюсь его владельцем; оно исключительно мое, и я волен делать с ним все, что угодно. Могу порубить его на мелкие кусочки, могу съесть, могу отдать или продать кому-то еще. Но данное яблоко в данный момент времени может принадлежать только одному лицу. И, разумеется, вернуть съеденный кусочек этого яблока обратно невозможно. В отличие от этого, байтом данных может одновременно пользоваться множество людей и съесть его нельзя. Мы нуждаемся в новом представлении о владении информацией. Владельцами данных могут одновременно являться многие. Владение информацией не означает единоличную власть над ее судьбой, как и исключительное право продавать, покупать, дарить или уничтожать байты. Наоборот, владение информацией – это наличие доступа к данным с возможностью их использования.
После рассмотрения проблемы доступа к данным в этих разрезах становится понятным, почему недостаточно получить гору первичной информации. Право на доступ к своим данным требует значительной осмотрительности в том, что может, а что не может быть показано окружающим. Кроме того, потребуется кропотливая работа по созданию алгоритмов, пользовательских интерфейсов и программного обеспечения, которые смогут частично скрывать личность и предоставлять гибкие возможности коммуникации относительно наличия тех или иных элементов информации у тех или иных пользователей. Эти инновации и в цифровой, и в общественной жизни представляют собой важные и нетривиальные задачи. От их решения зависит наша возможность видеть и использовать свои данные.
Право на инспекцию инфопереработчиков
Как определить, достаточно ли мы получаем от инфопереработчика взамен на свою информацию? Адекватна ли предлагаемая нам «доходность информации» и насколько приемлем при этом риск? Для полной прозрачности недостаточно видеть только информацию о себе, надо иметь возможность получать информацию, позволяющую судить о деятельности тех, кто занимается ее переработкой.
Я убежден в необходимости инспектировать целостность и сохранность экосистемы инфопереработчика, оценивать его «гигиеничность» с точки зрения устойчивости перед попытками несанкционированного доступа, эффективности работы с данными и ожидаемой «доходности предоставленной информации». Говоря о здоровье, мы понимаем, что соблюдение правил гигиены не является стопроцентной гарантией от заболевания. То же можно сказать и о мерах, направленных на повышение прозрачности обработки информации.
Рассмотрим пример с инспекцией санитарно-гигиенического состояния ресторана, которая во многих регионах является обязательной. В соответствии с установленными правилами ресторан работает, когда в нем соблюдаются необходимые требования, или закрывается, если это не так. И хотя инспектор может запросто закрыть едва ли не любой ресторан (увы, идеалов не бывает), он все-таки не делает этого и обычно присваивает заведениям оценку соответствия санитарно-гигиеническим нормам в диапазоне от «плохо» до «идеально»[354].
Наличие такого диапазона оценок (а не просто шкалы «соответствует – не соответствует») позволяет властям балансировать между двумя различными требованиями своих избирателей – по охране здоровья и динамичности экономики. Человек с ослабленной иммунной системой обычно очень опасается любых инфекций и потому выберет ресторан только с высшей оценкой санитарно-гигиенического состояния. Властям приходится учитывать возможность негативных последствий для такого человека, хотя его случай является крайним. В то же время наверняка найдутся люди, готовые мириться с не совсем безупречной санитарией ради, например, исключительной дешевизны или на удивление изобретательного меню.
Санитарная инспекция не в силах предупредить редкие, но исключительно опасные случаи. Никакой иммунитет не спасет от заболевания после обеда, приготовленного заразным больным[355]. Внеплановые проверки проводятся в том числе и для того, чтобы убедиться, что кухонный персонал приучен работать в перчатках и не выходить на работу в случае болезни.
Аналогичные гигиеническим соображения применимы и при оценке плюсов и минусов процесса создания и распространения информации. В нем есть и позитивные, и негативные аспекты, равно как прогнозируемые и непрогнозируемые результаты любых принимаемых решений, в том числе и решений, к кому обратиться за помощью в принятии решений. В этом контексте непрогнозируемый результат – то, на что вы не рассчитывали и даже не представляли себе. Это редкое и маловероятное, но все же возможное событие, вроде появления заразного больного на кухне соседнего ресторанчика. Прогнозируемый результат – то, на что можно и нужно рассчитывать, вроде оплаты счета после обеда в ресторане. И непрогнозируемые, и прогнозируемые результаты бывают как негативными, так и позитивными. И заразный больной на кухне, и выставленный ресторанный счет – негативные результаты, но заранее прикинуть сумму счета намного проще, чем вычислить риск серьезного заболевания.
В мире данных одним из наиболее значительных непрогнозируемых негативных результатов (или рисков) является взлом, при котором ваша информация попадает к людям, намеревающимся использовать ее в противоправных целях и нанести вам ущерб, финансовый или какой-то иной. Каждый из таких редких инцидентов способен одновременно затронуть миллионы людей. К числу обычно прогнозиуемых негативных результатов (или издержек) относится постепенная эрозия приватности, происходящая по мере повторных обработок вашей личной информации. Вероятность увязки определенной информации конкретно с вами увеличивается по мере систематического поступления одинаковых запросов от других людей. Определенные потери частной информации неизбежны, однако степень ее выработки, или «сгорания», зависит от политики и процедур ее переработки. Это измеряется коэффициентом использования частной информации.
Прогнозируемые позитивные результаты (или выгоды) взаимообмена, на которые изо дня в день полагается подавляющее большинство людей, характеризуются значением «доходности информационных активов». Инфопереработчики отличаются друг от друга качеством обработки первичных данных и заявленными критериями их ранжирования и подбора. Благодаря праву на сравнение по этим трем показателям – рискам надежности и безопасности хранения информации, уровню приватности и агрегированной доходности информационных активов – можно выбирать инфопереработчика.
Внимание!
Сайт сохраняет куки вашего браузера. Вы сможете в любой момент сделать закладку и продолжить прочтение книги «BIG DATA. Вся технология в одной книге - Андреас Вайгенд», после закрытия браузера.