Читать книгу "BIG DATA. Вся технология в одной книге - Андреас Вайгенд"
Шрифт:
Интервал:
Закладка:
У анонимности есть и недостатки. Задумайтесь о разнице между заполнением «отзыва о качестве обслуживания» в заведении, которое вы регулярно посещаете, и онлайн-опросом. Хотя отзыв на бумаге и выглядит анонимным, многие не заполняют его, и не по причине собственной лени. Люди знают, что их смогут идентифицировать по ряду признаков – почерку, языку изложения, поставленным вопросам и времени, когда была сдана карточка с отзывом. Они могут опасаться последствий, которые способны повлечь нелестные комментарии. Кроме того, анонимный комментарий по определению является «игрой в одни ворота». Диалог между сторонами, а следовательно, и возможности прояснить смысл замечания или намерения человека, или некое сотрудничество, не предусмотрены. Это позволяет получателям обратной связи игнорировать мнение под предлогом незначительности, отклонения от общего вектора, специфичности случая или отсутствия поводов для изменений. От анонимного отзыва можно отмахнуться, сочтя его корыстным или злонамеренным.
СОЦИАЛЬНЫЕ ДАННЫЕ —
САМОЕ ЦЕННОЕ СЫРЬЕ
XXI ВЕКА,
НОВАЯ НЕФТЬ
Сетевым дискуссионным форумам вроде Reddit пришлось разбираться с этими недостатками анонимности с помощью машинного обучения. На Reddit имена пользователей могут быть и постоянными, применяемыми во взаимодействии с сообществом, и одноразовыми – для единственного комментария или голосования. Каждый псевдоним получает полную свободу самовыражения, что стимулирует людей примерять разнообразные личности, выступая на платформе. Пользователей никогда не просят привязывать аккаунты к адресам электронной почты или реальным именам: создатели сайта не хотят взывать к ответственности пользователей за свои действия такими способами. Ответственность регулируется иначе. Интересный пост привлекает внимание, с ним соглашаются или спорят, добавляют комментарии или голосуют «за» и «против» уже опубликованных. Если пост или комментарий получает достаточно много голосов «против», он постепенно исчезает со страницы, уходит в самый низ рэнкинга и попадает в категорию «оценка ниже уровня», хотя при желании его можно найти и просмотреть. Сайт не выводит из обсуждения комментарии под псевдонимом, а позволяет пользователям поддерживать диалог по существу и решать, какие комментарии заслуживают их внимания, а какие нет.
Для Reddit в первую очередь важно то, что огромному числу разных людей действительно интересно содержание дискуссий на «горячих», «набирающих обороты» и «скандальных» страницах сайта, а не «официальное» авторство. Дискуссии, попадающие в список двадцати пяти топовых тем на этих страницах, обычно вызывают пристальное внимание всего интернета. Чтобы снизить уровень «фальсификаций при голосовании», когда одни и те же люди выступают под разными именами не для того, чтобы высказаться, а для того, чтобы «заплюсовать» свои посты и «заминусовать» чужие, в Reddit не стали тратить кучу денег и времени на модераторов, следящих за соблюдением порядка, а положились на машинное обучение. Когда одновременно появляется множество активных псевдонимов, идущих с одного IP-адреса или пишущих в одинаковом стиле, их «объединяют в одно производство» как «соучастников». Голоса, поданные «соучастниками», имеют меньший вес, а иногда просто игнорируются.
Честные сигналы
В 2016 году более 100 миллионов человек обратились к приложениям или интернет-сайтам в поисках знакомств для легких связей, любовных встреч или долговременных отношений. Требуется найти человека, которому нужно то, что предлагается, и обладающего тем, что нужно, и – само трудное – проявляющего ответный интерес.
В том, что касается знакомств, некоторые люди время от времени бывают кое в чем правдивы. Уровень правдивости варьируется в зависимости от характера человека и от ситуации. Иногда люди просто экспериментируют, чтобы понять, чего они хотят на самом деле. Разговоры – это одно. То, что человек делает, – другое. Сигналы, которые следуют из фактических поступков людей, социологи назвали «честными сигналами».
Дизайн пользовательского интерфейса приложения знакомств и разработка алгоритмов рекомендаций – особенно трудная задача, поскольку пользователь может «официально» считать привлекательными одни черты, а характер его работы с сайтом свидетельствовать о совершенно других предпочтениях. Один из создателей сайта OkCupid Кристиан Руддер доказал, что пользователи могут не полностью осознавать свои расовые и этнические предпочтения или не желать в них признаваться[123]. Но простой подсчет кликов и запросов о контакте быстро выявляет такие предпочтения.
Это несколько напоминает старую проблему с оценками кинофильмов. Когда Netflix просит пользователей высказать мнение о фильмах, получивших высокую оценку критиков, вроде игрового «Гражданина Кейна» или документального «Черного плавника», огромная часть людей выставляет им «пятерки», будучи уверены, что они обязаны оценить их именно так: ведь «все» сказали, что это отличное кино. Netflix может рекомендовать клиенту фильмы на основе его оценок, но это имеет смысл только в случае, если это честные оценки. Но люди должны убедиться в том, что правдивые ответы – в их собственных интересах. В Netflix пришли к выводу, что самым честным сигналом об интересе к определенному жанру кино является продолжительность стримминга видео до момента выхода из него. Другими словами, для составления рекомендаций данные о просмотрах полезнее, чем данные об оценках фильмов[124]. Профессор социальной психологии Мичиганского университета Ричард Нисбетт утверждает, что люди часто не понимают когнитивные процессы, определяющие их поступки и решения. Наши способности к самопознанию и самонаблюдению достаточно ограничены[125].
Внимание!
Сайт сохраняет куки вашего браузера. Вы сможете в любой момент сделать закладку и продолжить прочтение книги «BIG DATA. Вся технология в одной книге - Андреас Вайгенд», после закрытия браузера.