17 апреля 2015Наука
105

Теория папки «Входящие»

Анализ 16 миллиардов писем помог ученым выяснить, как устроены правила приличия в интернете

текст: Борислав Козловский
Detailed_picture© exacttarget.com

Вот вы отправили кому-то электронное письмо, страшно важное; как скоро ждать ответа? Или, наоборот, это вас о чем-то важном спрашивают письмом, а вы увидели сообщение, но с ходу отреагировать не готовы. Будет ли невежливо ответить завтра? Похоже, что да: на половину писем отвечают в первые 47 минут. Причем если ваш собеседник пишет со смартфона, то с вероятностью 50 процентов ответ придет через 28 минут или раньше.

Команда ученых из Университета Южной Калифорнии и Yahoo Labs, исследовательского подразделения корпорации Yahoo, проанализировала самый большой в истории массив электронной почты — 16 миллиардов писем в ящиках двух миллионов пользователей (у тех, кто дал Yahoo на это согласие). Сами письма, конечно, никто не читал — больше того, у ученых не было прямого доступа к их тексту; это был типичный компьютерный эксперимент с «большими данными».

Представьте, что вся ваша переписка прошла через руки цензора-параноика, который замазал черным каждую букву по отдельности, а поля «Кому» и «От кого» заклеил бирками с условными порядковыми номерами — скажем, Щ-451 и Ф-255 (но рядом указал пол и возраст). Авторы утверждают: той скудной информации, которая осталась, с запасом хватит, чтобы предсказать ваши действия в будущем. Угадать, например, сколько времени будет Ф тянуть со следующим ответом. Каким будет его сообщение — коротким или длинным. И поставит ли очередное письмо от Щ точку в диалоге (алгоритм уверенно угадывает в двух случаях из трех).

Избегайте вложенных файлов, когда хотите быстрого ответа.

Прогноз основывается на статистике: перед заключительной репликой в цепочке писем люди почему-то выдерживают особенно долгую паузу. Таких закономерностей нашлись десятки.

Ответы на письма, присланные в выходные, особенно короткие. Мало толку рассчитывать на быструю реакцию утром в будни — адресат справедливо считает, что у него целый день впереди. Скорость ответа сильно зависит от возраста адресата: если подростки откликаются на половину писем за 13 минут с момента отправки, то у 36—50-летних на это уходит по 24 минуты.

При этом наиболее вероятное время ответа — всего 2 минуты. А самая популярная длина письма — всего 5 слов.

Доля неотвеченных писем зависит от загруженности человека — это вроде бы ясно и так, без подсчетов, но цифры говорят, что манера общения меняется очень резко. Кто получает больше 100 писем в день, тот отвечает в среднем на каждое двадцатое (5 процентов). А те, кому объемы переписки не давят на психику, — на каждое четвертое (25 процентов). Если ограничить выборку только письмами, которые шлют друг другу реальные люди (а не спамеры и не роботы разных полезных сервисов), результат выйдет похожим.

Выводы можно было бы переформатировать в список полезных советов. Не пишите по выходным, глубокой ночью и по утрам. Специально ориентируйтесь на время, когда ваш адресат не у компьютера (а разгуливает со смартфоном в кармане), если ответ требуется быстрый и короткий. Избегайте вложенных файлов, когда хотите быстрого ответа (на половину писем без вложений отвечают быстрее чем за 32 минуты, а для писем с вложениями этот показатель почти вдвое больше — 56 минут). Наконец, не тяните с письмом больше суток: в течение суток отвечают на 90 писем из 100, а оказаться среди 10 оставшихся невезучих процентов мало кому приятно.

Перед заключительным письмом в цепочке люди почему-то выдерживают особенно долгую паузу.

Задолго до всякой статистики интернет 90-х пытался выработать такой свод правил приличия, «нетикет», сетевой этикет, где электронной почте уделялось особое, почетное место. Нетикет предписывал новичкам нормы поведения в сети — предполагая неявно, что так уже ведут себя все, кто в интернете давно. И только анализ «больших данных» много лет спустя выявил, что же на самом деле норма.

Но выясняется, что и без жестких универсальных правил мы в целом справляемся. Мозг на автомате принимает в расчет представления собеседника о правилах приличия в электронной переписке. «Большие данные» показывают нашу способность бессознательно подстраиваться под адресата. Мы начинаем копировать его паузы между письмами и даже его стиль. Если собеседник отвечает быстро, то и мы стараемся держать тот же темп — хотя получается это, как правило, только до середины цепочки. Если он редко употребляет «я» — наши ответы становятся более безличными. То же самое происходит со вспомогательными глаголами, артиклями (анализ касался английских текстов) и другими маркерами стиля.

Скорее всего, это верно не только для электронной переписки, но и для любых форм общения между людьми — от разговоров в курилке до заседаний советов директоров. Просто это общение намного сложнее анализировать, поскольку оно практически не оставляет следов. Тем более в таких количествах, чтобы можно было делать статистически достоверные выводы. С электронной почтой все намного проще.

Авторы тем не менее подчеркивают, что даже электронные письма никто раньше не анализировал в таких масштабах. Мешает обычно забота о тайне переписки. Единственное известное исключение — массив из 1,6 миллиона писем, связанных с банкротством компании Enron, которые разместили в открытом доступе еще в 2003 году. Власти США сочли скандал, связанный с мошеннической схемой, достаточно резонансным для рассекречивания внутренней переписки компании — и сделали тем самым настоящий подарок ученым, специализирующимся на «больших данных». Письмам Enron посвящено уже несколько десятков научных статей по теории коммуникации. В частности, они помогли создать алгоритмы умной сортировки вроде тех, которые использует GMail, чтобы разложить письма по папкам или пометить их как «важные».


Понравился материал? Помоги сайту!

Сегодня на сайте
Марш микробовИскусство
Марш микробов 

Графика Екатерины Рейтлингер между кругом Цветаевой и чешским сюрреализмом: неизвестные страницы эмиграции 1930-х

3 февраля 20223825