Nachrichten
«Извлекая мнения из сети Интернет»
Этой осенью в пятом номере журнала «Мониторинг общественного мнения: Экономические и социальные перемены» была опубликована статья «Извлекая мнения из сети Интернет: могут ли методы анализа текстов заменить опросы общественного мнения?». Авторы статьи - кандидат социологических наук, доцент кафедры прикладной и отраслевой социологии СПбГУ Дудина Виктория Ивановна и социолог Центра социологических и Интернет-исследований СПбГУ Юдина Дарья Игоревна.
Пользовательский контент интернет-ресурсов становится альтернативным или дополнительным источником изучения общественного мнения. Тем не менее остается не до конца проясненным вопрос, могут ли эти данные при современных методах анализа полностью или частично заменить массовые опросы. Цель статьи— показать на примере анализа больших текстовых данных методологические возможности для такой замены методами тематического моделирования и алгоритма по извлечению мнений. В статье проводится сравнение анализа комментариев пользователей видеохостинга Youtube к фильму «Чайка» Фонда борьбы с коррупцией с результатами опроса общественного мнения по поводу отношения к фильму и представленным в нем фактам. Результаты исследования показывают, что анализ мнений в Интернете пока не может полностью заместить массовые опросы, но предоставляет более широкий контекст для интерпретации мнений и их более детальной оценки, а также может быть использован для улучшения структуры анкеты и качества самих вопросов.
Основных выводов, полученных в результате сравнения результатов массового опроса с результатами анализа больших текстовых данных из интернета, оказалось два. Первый - различные мнения и обсуждения в сети, будучи подвергнуты соответствующему анализу, позволяют исследователям получать представления о контексте формирования общественного мнения относительно события или персоналии. Второй вывод - результаты такого рода анализа можно использовать для улучшения качества структуры опросника и самих вопросов.
В статье однако отмечается, что результаты анализа текстов из интернета пока не могут рассматриваться как полноценная альтернатива массовым опросам. При подобном методе анализа отсутствует теоретическая база для переноса данных на более широкие группы населения. В случае с анализом данных из соцмедиа появляется проблема с получением надёжной демографической информации, которую предполагает традиционная модель массового опроса. Информация из онлайна позволяет определить лишь спектр обсуждаемых вопросов, их популярность, но не представляется возможным сопоставить мнения с их носителями. Другой проблемой является нерешенность вопроса, как формировать выборку, представляющую «генеральную» совокупность.
Тематическая модель отражает структуру текстов и обсуждения в целом. Алгоритмы же по извлечению мнений разрабатываются для оценки отношения к конкретным объектам, о которых говорится в тексте. Такие алгоритмы более универсальны и не столь требовательны к длине и количеству анализируемых текстов, как тематические модели. Примеры сравнений результатов алгоритмизированного анализа данных из онлайн-источников и опросов демонстрируют большую гибкость опросных методов относительно набора характеристик.