17 апреля 2015Наука
105

Теория папки «Входящие»

Анализ 16 миллиардов писем помог ученым выяснить, как устроены правила приличия в интернете

текст: Борислав Козловский
Detailed_picture© exacttarget.com

Вот вы отправили кому-то электронное письмо, страшно важное; как скоро ждать ответа? Или, наоборот, это вас о чем-то важном спрашивают письмом, а вы увидели сообщение, но с ходу отреагировать не готовы. Будет ли невежливо ответить завтра? Похоже, что да: на половину писем отвечают в первые 47 минут. Причем если ваш собеседник пишет со смартфона, то с вероятностью 50 процентов ответ придет через 28 минут или раньше.

Команда ученых из Университета Южной Калифорнии и Yahoo Labs, исследовательского подразделения корпорации Yahoo, проанализировала самый большой в истории массив электронной почты — 16 миллиардов писем в ящиках двух миллионов пользователей (у тех, кто дал Yahoo на это согласие). Сами письма, конечно, никто не читал — больше того, у ученых не было прямого доступа к их тексту; это был типичный компьютерный эксперимент с «большими данными».

Представьте, что вся ваша переписка прошла через руки цензора-параноика, который замазал черным каждую букву по отдельности, а поля «Кому» и «От кого» заклеил бирками с условными порядковыми номерами — скажем, Щ-451 и Ф-255 (но рядом указал пол и возраст). Авторы утверждают: той скудной информации, которая осталась, с запасом хватит, чтобы предсказать ваши действия в будущем. Угадать, например, сколько времени будет Ф тянуть со следующим ответом. Каким будет его сообщение — коротким или длинным. И поставит ли очередное письмо от Щ точку в диалоге (алгоритм уверенно угадывает в двух случаях из трех).

Избегайте вложенных файлов, когда хотите быстрого ответа.

Прогноз основывается на статистике: перед заключительной репликой в цепочке писем люди почему-то выдерживают особенно долгую паузу. Таких закономерностей нашлись десятки.

Ответы на письма, присланные в выходные, особенно короткие. Мало толку рассчитывать на быструю реакцию утром в будни — адресат справедливо считает, что у него целый день впереди. Скорость ответа сильно зависит от возраста адресата: если подростки откликаются на половину писем за 13 минут с момента отправки, то у 36—50-летних на это уходит по 24 минуты.

При этом наиболее вероятное время ответа — всего 2 минуты. А самая популярная длина письма — всего 5 слов.

Доля неотвеченных писем зависит от загруженности человека — это вроде бы ясно и так, без подсчетов, но цифры говорят, что манера общения меняется очень резко. Кто получает больше 100 писем в день, тот отвечает в среднем на каждое двадцатое (5 процентов). А те, кому объемы переписки не давят на психику, — на каждое четвертое (25 процентов). Если ограничить выборку только письмами, которые шлют друг другу реальные люди (а не спамеры и не роботы разных полезных сервисов), результат выйдет похожим.

Выводы можно было бы переформатировать в список полезных советов. Не пишите по выходным, глубокой ночью и по утрам. Специально ориентируйтесь на время, когда ваш адресат не у компьютера (а разгуливает со смартфоном в кармане), если ответ требуется быстрый и короткий. Избегайте вложенных файлов, когда хотите быстрого ответа (на половину писем без вложений отвечают быстрее чем за 32 минуты, а для писем с вложениями этот показатель почти вдвое больше — 56 минут). Наконец, не тяните с письмом больше суток: в течение суток отвечают на 90 писем из 100, а оказаться среди 10 оставшихся невезучих процентов мало кому приятно.

Перед заключительным письмом в цепочке люди почему-то выдерживают особенно долгую паузу.

Задолго до всякой статистики интернет 90-х пытался выработать такой свод правил приличия, «нетикет», сетевой этикет, где электронной почте уделялось особое, почетное место. Нетикет предписывал новичкам нормы поведения в сети — предполагая неявно, что так уже ведут себя все, кто в интернете давно. И только анализ «больших данных» много лет спустя выявил, что же на самом деле норма.

Но выясняется, что и без жестких универсальных правил мы в целом справляемся. Мозг на автомате принимает в расчет представления собеседника о правилах приличия в электронной переписке. «Большие данные» показывают нашу способность бессознательно подстраиваться под адресата. Мы начинаем копировать его паузы между письмами и даже его стиль. Если собеседник отвечает быстро, то и мы стараемся держать тот же темп — хотя получается это, как правило, только до середины цепочки. Если он редко употребляет «я» — наши ответы становятся более безличными. То же самое происходит со вспомогательными глаголами, артиклями (анализ касался английских текстов) и другими маркерами стиля.

Скорее всего, это верно не только для электронной переписки, но и для любых форм общения между людьми — от разговоров в курилке до заседаний советов директоров. Просто это общение намного сложнее анализировать, поскольку оно практически не оставляет следов. Тем более в таких количествах, чтобы можно было делать статистически достоверные выводы. С электронной почтой все намного проще.

Авторы тем не менее подчеркивают, что даже электронные письма никто раньше не анализировал в таких масштабах. Мешает обычно забота о тайне переписки. Единственное известное исключение — массив из 1,6 миллиона писем, связанных с банкротством компании Enron, которые разместили в открытом доступе еще в 2003 году. Власти США сочли скандал, связанный с мошеннической схемой, достаточно резонансным для рассекречивания внутренней переписки компании — и сделали тем самым настоящий подарок ученым, специализирующимся на «больших данных». Письмам Enron посвящено уже несколько десятков научных статей по теории коммуникации. В частности, они помогли создать алгоритмы умной сортировки вроде тех, которые использует GMail, чтобы разложить письма по папкам или пометить их как «важные».


Понравился материал? Помоги сайту!

Сегодня на сайте
Разумные дебаты в эпоху соцсетей и cancel cultureОбщество
Разумные дебаты в эпоху соцсетей и cancel culture 

Как правильно читать Хабермаса? Может ли публичная сфера быть совершенной? И в чем ошибки «культуры отмены»? Разговор Ксении Лученко с Тимуром Атнашевым, одним из составителей сборника «Несовершенная публичная сфера»

25 января 20224067