Это пойдет вашим заметкам на пользу: в обрабатываемых данных станет видна структура. Вы поймете, какие и где данные принципиально можно найти. Сможете дать аналитикам и специалистам по инфографике такую задачу, которая усилит повествование.
Вот несколько очень коротких советов из разных областей, связанных с визуализацией данных. Они не заменят учебник, но позволят не совершать совсем грубых ошибок.
7.3.1 Графики и диаграммы
• Указывайте показатели на осях, иначе читатель не поймет вашу идею;
• Избегайте излишне крутых подъемов и спадов за счет начала оси не с нуля. Это вводит в заблуждение;
• Никогда не помещайте на график более трех показателей – он превратится в спагетти;
• Цветовое решение должно учитывать наличие у пользователя черно-белого принтера. Попробуйте сконвертировать ваше изображение в градации серого – если можно разобрать, что нарисовано, вы все делаете правильно;
• Обязательно проставляйте источник данных. Это не только вежливо по отношению к читателю, но и защищает вас в случае, если этот набор данных неверен;
• Если видите резкие перепады в показателях, объясните их себе и читателю. Возможно, вы ошиблись или изменилась методология подсчета;
• Отталкивайтесь от истории. Одинаковые цифры могут рассказать разные истории. Для банка, рассказывающего о росте объемов выданных потребительских кредитов, история может быть хорошей. История роста закредитованности существующих клиентов может оказаться совсем иной – и все на одном и том же наборе данных.
• Показывайте точку или показатель, с которыми надо сравнивать данные. Давайте контекст, отмечайте его на графике
• Правильно выбирайте вид диаграммы. Столбчатая диаграмма хороша, если надо сравнить несколько показателей. Круговая хорошо показывает долю от целого.
• Обращайте особое внимание на типографику. Плохо выбранные шрифты способны испортить все впечатление от визуализации. Не используйте одновременно полужирное и курсивное начертания. Избегайте переносов. НЕ ПИШИТЕ ПРОПИСНЫМИ. Не стоит разреживать шрифт сверх необходимого. Всегда помните: у текста в диаграмме поддерживающая, а не центральная роль.
• Не используйте разные цвета для одного и того же показателя. Можно выделить нужную точку, столбец, сегмент оттенком того же цвета. Вообще желательно работать в рамках одного базового цвета, используя другие цвета лишь для важных задач.
• Не надо красным помечать хорошие показатели, а зеленым плохие.
7.3.2 Веб-аналитика и просмотр баз данных
Раньше изучение архивов, баз данных, просмотр бесконечных рейтингов, аналитических записок и статистических таблиц было уделом расследователей и сотрудников деловых СМИ.
Сейчас почти везде в ньюсрумах вводятся цифровые показатели производительности, основанные на тех же принципах, но предназначенные для всех[31]. Поэтому базовое знакомство с аналитикой, основами статистики и приемами быстрого выхватывания важных цифр из таблиц становится необходимым – от него зависит ваша карьера.
• Прежде всего выучите накрепко определения и никогда не путайте уникальных пользователей, визиты/сессии/сеансы, а также просмотры страниц (эту разницу мы разбираем в главе о метриках).
• Если вы пишете о рекламном рынке или оцениваете возможный заработок компании, работающей по рекламной модели, не путайте просмотры страниц и число показов рекламных объявлений.
• Поймите разницу между измерением счетчиком, панелью и гибридным методом. В первом случае вы часто получаете не реальных людей, а нечто среднее между этим показателем и числом зашедших на сайт браузеров
[69]. Во втором – счетчик носят с собою сами пользователи, а так как их мало, то измерителю приходится экстраполировать данные, жертвуя точностью
[70]. В третьем – перепроверяют панельные измерения с помощью счетчиков и телефонных или реальных опросов. Последний способ кажется самым лучшим, его использует компания Mediascope (бывшая TNS), но у него свои недостатки – например, постоянные изменения в методике, следующие за структурой рынка.
• Не забывайте, что базы данных могут обновляться реже, чем ситуация в реальной жизни.
• Однофамильцы и компании с одинаковым названием встречаются чаще, чем нам кажется.
• Очень часто доступ к архивам ограничен (например, нельзя посмотреть, куда летал самолет пять лет назад, но можно – куда на прошлой неделе). Сохраняйте найденное, отслеживайте регулярно ваших героев.
• Используйте средства мониторинга изменений на сайтах. Человеку непросто постоянно делать то, с чем хорошо справляется робот.
• Пройдите базовый курс по бухгалтерской отчетности и финансам. Не одна новость окончилась пшиком из-за того,
что автор перепутал выручку и прибыль, или же валовую прибыль с чистой.
Часто данные существуют только в виде выгрузки, и вам придется их просеивать. Пройдите базовые курсы по обращению с данными. Начните со списка материалов для обучения сотрудников The New York Times[48].
Раз в неделю пересматривайте и переписывайте заново список ключевых слов. Рядом с каждым должно стоять число от 0 до 100 – уровень ваших знаний. Начните с этих слов и расширяйте список по мере необходимости: Excel, Power В1ЯаЫеаи, SQL, CSV/TSV. Если узнали что-то новое, увеличивайте оценку на один балл. Это не сделает вас профессионалом, но позволит разобраться в особенностях технологий анализа данных. Особое внимание обратите на SQL – даже базовые знания позволят вам позднее гораздо увереннее работать с любыми базами данных.
7.3.3 Программирование
Журналистам все чаще приходится программировать. Распространено мнение, что это сложный для освоения навык. Это неправда – просто сложность программирования зависит не только от знания, но и от первоначальных решений.
Здесь я перечисляю несколько простых правил, которые облегчат написание программ вне зависимости от того, какой язык программирования вы используете. Мои советы относятся в первую очередь к ситуации, когда журналисту надо что-то быстро проверить или подсчитать, а не спланировать, выпустить и поддерживать продукт.