Примеры ключевые слова в русском языке: Что такое ключевые слова в русском языке? Как найти главные? Пример 🤓 [Есть ответ]

Содержание

ключевые слова — это… Что такое ключевые слова?

ключевые слова

Субъективный лингвистический фактор текстообразования. Ключевые слова являются опорными «вехами» в порождении и восприятии текста.

Их выбор определяется:

1) авторской интенцией;

2) творческим замыслом автора;

3) коммуникативной стратегией текстового развертывания.

Ключевые слова чаще всего находятся в сильной позиции текста:

1) в заглавии;

2) в начальной позиции и в конце.

Ключевые слова обычно актуализируются автором:

1) повторяются;

2) отражают стратегию контраста;

3) стратегию обманутого ожидания;

4) совмещают разные типы выдвижения.

Выбор ключевых слов определяется:

1) темой;

2) идеей;

3) авторским замыслом.

В процессе интерпретации ткста необходимо учитывать языковые средства, находящиеся в образной перспективе ключевого слова.

Словарь лингвистических терминов: Изд. 5-е, испр-е и дополн. — Назрань: Изд-во «Пилигрим».
Т.В. Жеребило.
2010.

  • ключевые слова культуры по а. вежбицкой
  • книга в культуре речи

Смотреть что такое «ключевые слова» в других словарях:

  • Ключевые слова — в теории коммуникации слова, несущие ключевую информацию. См. также: Лексические единицы Сообщения Финансовый словарь Финам …   Финансовый словарь

  • КЛЮЧЕВЫЕ СЛОВА — КЛЮЧЕВЫЕ СЛОВА. Слова, передающие основную информацию в тексте. Способствуют успешному пониманию воспринимаемого на слух либо читаемого текста. Работе с К. с. уделяется большое внимание на занятиях по языку: учащимся предлагаются специальные… …   Новый словарь методических терминов и понятий (теория и практика обучения языкам)

  • ключевые слова — Слова, при помощи которых осуществляется поиск сайтов при вводе их в окошке поиска. [http://www.lexikon.ru/rekl/a eng.html] Тематики реклама EN key words …   Справочник технического переводчика

  • Ключевые слова — – этим терминологическим словосочетанием некоторые исследователи худож. (поэтической и прозаической) речи называют слова, выражающие главную идею целого худож. текста. К. с. иногда выносятся в названия худож. произведений ( Обрыв И.А. Гончарова,… …   Стилистический энциклопедический словарь русского языка

  • Ключевые слова — О термине из программирования см. Зарезервированное слово. Ключевое слово  слово в тексте, способное в совокупности с другими ключевыми словами представлять текст (см. релевантность). В вебе используется главным образом для поиска. Набор ключевых …   Википедия

  • ключевые слова —   Субъективный лингвистический фактор текстообразования. Ключевые слова являются опорными «вехами» в порождении и восприятии текста.   Их выбор определяется:   1) авторской интенцией;   2) творческим замыслом автора;   3) коммуникативной… …   Методы исследования и анализа текста. Словарь-справочник

  • Ключевые слова — слова, несущие ключевую информацию …   Краткий словарь переводческих терминов

  • ключевые слова — см. ключевое слово …   Толковый переводоведческий словарь

  • ключевые слова —   См. статью реклама2 …   Учебный словарь стилистических терминов

  • Ключевые слова Magic: The Gathering — Перед вами список ключевых слов использующихся в игре Magic: The Gathering. Ключевое слово, в контексте Magic: The Gathering, это слово или фраза (обычно пара слов) находящаяся на карте и означающая, что карта обладает определённым свойством или… …   Википедия

Ключевые слова на русском языке в системах поиска информации в Интернете (опыт семантического и культурологического анализа) Текст научной статьи по специальности «Языкознание и литературоведение»

КЛЮЧЕВЫЕ СЛОВА НА РУССКОМ ЯЗЫКЕ В СИСТЕМАХ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ (опыт семантического и культурологического анализа)

П.В. Морослин

Международный славянский институт ул. Годовикова, 9, Москва, Россия, 129085

Статья посвящена анализу лексико-семантических и культурологических особенностей ключевых слов, функционирующих в информационно-поисковых системах Интернета. Рассматриваются частотность слов, система принципов номинации, семантические и ассоциативные связи ключевых слов в русскоязычном Интернете.

Ключевые слова: Интернет, система поиска, компьютерная коммуникация, ключевые слова.

Функционирование русского языка в Интернете вызывает значительный интерес исследователей. В научной литературе в последние годы появилось несколько монографий, десятки статей об особенностях русскоязычного Интернета (часто как синоним употребляется и слово Рунет), о новых речевых жанрах появившихся в Интернете на русском языке, об особенностях компьютерной коммуникации на русском языке [1; 2; 3; 4]. К сожалению, работы в данной области пока не позволяют более или менее объективно представить реальное функционирование разных текстов в Сети. Это, на наш взгляд, связано прежде всего с тем, что еще не был проведен более или менее подробный анализ особенностей функционирования электронных текстов в зависимости от задач общения, выполняемых функций, лингвистических особенностей систем хранения и поиска информации, способов создания и функционирования того или иного электронного текста. На наш взгляд, исследование русскоязычного Интернета должно опираться на ряд весьма сложных факторов: особенности самого Интернета как сложной многофункциональной иерархической системы; социолингвистическую характеристику основных групп пользователей, их коммуникативных потребностей, языкового вкуса; учет значительного влияния на развитие русскоязычного Интернета английского языка и культуры и традиций общения на английском языке; тенденции развития и изменения современного русского языка, которые активизировались в конце ХХ — начале ХХ! в.

Важную роль в оценке эффективности текстов, функционирующих в Интернете, играет такой показатель, как ключевые слова, т.е. слова, которые используются при поиске тех или иных веб-текстов, тех, которые пользователи набирают в поисковых системах для того, чтобы найти необходимую информацию. Понятие «ключевые слова» обозначает запросы, по которым тот или иной сайт может быть найден в поисковиках.

Поисковыми системами Интернета проводится статистика запросов — информация об обращениях пользователей к поисковой системе с помощью ключевых слов. В большинстве случаев при работе с сервисом статистики имеется

возможность классифицировать результаты поиска по датам, географии запросов. При этом, как правило, сервис показывает не только данные об искомом запросе, но также и о словосочетаниях, синонимах и близких темах («ищут также»).

Очевидно, что если сайт посвящен туризму и отдыху, то он должен находиться в системах поиска (например, Яндекс, Rambler, Google) на основе лексического запроса «отдых», «курорты», «горящие путевки», названия туристических фирм и т.п.

Эти ключевые слова несут важную информацию об интересах аудитории, в том числе дают представление о национально-ориентированной специфике актуальности электронных текстов на том или ином языке. Ключевые слова косвенным образом характеризуют и саму аудиторию, например, такие часто встречающиеся в 2006 г. ключевые слова российского Интернета, как реферат, рефераты, банк рефератов, гороскоп, погода подтверждают положение, что основными пользователями Интернета являются молодые люди в возрасте от 18 до 32 лет, в большинстве студенты, которых часто интересует информация образовательного характера. В 2008 г. интересы аудитории несколько изменились, на первый план вышли следующие слова: марафон (название известной фирмы в области мобильной связи), переводчик (система электронного перевода), новости, работа, сбербанк и др.

Сравнительный анализ поисковых запросов в англоязычной части Интернета показывает, что среди поисковых запросов первые места занимают слова, связанные с известными актерами, музыкантами, а также с покупками через интернет-магазины.

Намечается ярко выраженная тенденция в отражении системой ключевых слов тех или иных внешних событий, причем в различных жанрах Интернета эти интересы могут отражаться специфическим образом, например, в системе наиболее частотных поисковых запросов в новостных сайтах Интернета, а также в наиболее часто употребляемых словах и темах в блогах. Изменение интересов создателей блогов и тематики блогов в зависимости от тех или иных событий в Яндексе отражается специальными графиками, которые получили название «пульс блого-сферы».

Система формирования ключевых слов является составной частью так называемой контекстной рекламы, которая представляет собой текст рекламного содержания или текст информационного характера. Отличительной чертой контекстной рекламы является то, что она появляется там, где с помощью ключевых слов ищут ту или иную информацию. Контекстная реклама возникает в связи с конкретным тематическим запросом в системе поиска с помощью ключевых слов. Например, если вводится словосочетание русский язык, то контекстная реклама указывает коммерческие курсы, которые предлагают обучение русскому языку. Если в систему поиска вводится ключевое слово школа, то в контекстной рекламе появляются сообщения об адресах школ, о сайтах школ, справочниках.

Поиск по ключевым словам оказывает огромное влияние на популярность того или иного сайта. Согласно данным различных рейтингов популярными являются следующие российские сайты: 1) V Kontakte, 2) http://mail.ru/, 3) Яндекс,

4) Одноклассники.ru, 5) Rambler, 6) Google (русскоязычная версия поискового сервера google.ru), 7) Narod.ru, 8) YouTube и др.

Весьма популярная рейтинговая система Top 100 Rambler в ноябре 2008 г. показывает несколько иную картину. В самые популярные ресурсы Интернета на русском языке входят 1) СМИ и периодика, 2) сервисы (почта, онлайн переводчик, программа просмотра фильмов ru.tube, ресурс для блогов «Живой журнал»), 3) сайты, связанные с товарами и услугами. Следует подчеркнуть, что наблюдается корреляция между популярностью тех или иных групп тематических сайтов и частотностью ключевых слов. Высокочастотными являются слова, связанные с поиском новостей, покупками, развлечениями.

Необходимо подчеркнуть, что отмечаются изменения в актуальности тех или иных ключевых слов в зависимости от внешних событий или обстоятельств. Яркий пример — изменения в количестве ключевых слов во время террористической атаки 11 сентября в США или чемпионата Европы по футболу. Следует отметить, что, несмотря на повышение актуальности тех или иных слов в связи с определенными событиями, общая тенденция выбора ключевых слов для данной лингвокультурной общности остается стабильной.

В анализе запросов Яндекса были опубликованы результаты анализа лингвистических особенностей ключевых слов. Около 2,5% запросов сформулированы как вопрос. Это обычные вопросы, и пользователи, которые их задают, общаются с поисковой системой так, как будто это живой человек. У Яндекса даже спрашивают (Как пройти в библиотеку?) — в среднем 41 раз в месяц, (Зачем Герасим утопил Муму?) — 53 раза и (Кто убил Лору Палмер?) — 107 раз. Вопросов, начинающихся со слова «как», задают больше, чем вопросов, начинающихся со всех остальных вопросительных слов вместе взятых. Интересно, что вопрос «что?» значительно популярнее вопроса «кто?», и в частности вопрос «что делать?» интересует пользователей больше вопроса «кто виноват?»

Самые короткие составляющие запросов к Яндексу — отдельные буквы и цифры. Пользователей интересуют все буквы русского алфавита, больше всего — предлоги и однобуквенные союзы (например, «и» в августе 2008 г. искали 4 385 966 раз), а меньше всего — букву «ъ» (9 тысяч запросов в месяц). Наиболее длинные осмысленные слова, как правило, сложные существительные, состоящие из нескольких корней. Самое длинное слово, заданное в качестве запроса к Яндексу в августе 2008 г., состоит из 37 символов — «гиппопотомомонстросесквиппе-далиофобия». По этому запросу находится 4583 страницы (на сентябрь 2008 г.). Среди самых длинных запросов, на которые существуют ответы в Интернете, преобладают различные химические соединения (этилоксиэтилпарафенилендиамин-сульфат — 35 символов), названия компаний («Средневолжсксельэлектросетьст-рой» — 32 символа) и разного рода фобии (например, гексакосиойгексеконтагек-софобия — 31 символ).

В запросах на поиск картинок самые длинные запросы — это «электростеклоподъемник» и «электроводонагреватель» — по 22 символа. Для общения с поисковой машиной чаще всего используют существительные — эту часть речи со-

держат 75% запросов к поиску. Вторая по распространенности часть речи — прилагательные, они присутствуют в 16% запросов к веб-поиску. Глаголы используют только в 5% случаев, а наречия отмечены менее чем в 1%

Существующие системы анализа ключевых слов позволяют эффективно использовать различные инструменты, показатели для поиска и выбора ключевых слов. В основе сбора данных по ключевым словам лежат два принципа — принцип счетчика (специального скрипта, загружающегося пользователю сервером вместе с загрузкой веб-страницы) и принцип анализа логов (специальных файлов на сервере, фиксирующих все посещения). Оба способа сбора информации работают независимо друг от друга и каждый с определенной степенью погрешности. Из собранной с помощью счетчика или лог-анализатора информации можно формировать разные массивы данных, изучать отдельные срезы и тематические выборки. Подобные обобщенные данные часто можно встретить в исследованиях по глобальной статистике Рунета, например, HotLog и SpyLog.

Предназначение любого интернет-ресурса заключается в эффективном достижении целей, определенных при его создании. Эффективность сайта зависит от его содержания, определяется числом посетителей сайта (в частности, приходящих из поисковых серверов), скоростью и удобством получения интересующей информации, количеством повторных возвращений на данный сайт. Эффективность сайта также зависит от того, насколько интересны статьи, удобна навигация, привлекателен дизайн и т.п. Для оценки эффективности сайта собираются статистические данные посещения данного ресурса, применяются различные методы математической статистики для получения и обработки результатов.

Интернет-статистика дает возможности анализировать различные особенности сайта. Во-первых, можно существенно улучшить дизайн, навигацию и размещение ссылок на сайте. Во-вторых, на основании полученных статистических отчетов возможно повысить рейтинг сайта на крупнейших поисковых системах Рунета (Яндекс, Google, Rambler).

Система сбора интернет-статистики используется для получения данных о посещениях сайта, последующей их обработки и получения различных отчетов, отображающих интересующую информацию. Все это позволяет оценивать эффективность интернет-сайта по разным параметрам, определять удобство пользования как сайтом в целом, так и его различными элементами навигации; характеризовать качество отдельных элементов сайта (баннеров, статей, элементов каталога и т.д.).

Среди основных функциональных возможностей систем статистики считается посещаемость сайта; учитываются все переходы посетителей с поисковых машин по каждой ключевой фразе; рассчитывается время просмотра каждым посетителем каждой страницы сайта; проводится анализ данных статистики посещений для выявления групп предпочтений среди посетителей сайта.

Существуют специальные сервисы поисковых систем, задачей которых является помощь в выборе наиболее подходящих ключевых слов. Чтобы выявить близкие по значению выражения, функционирующие в информационно-поисковых

системах Интернета, можно использовать специальные сервисы поисковых систем Rambler, Яндекс, Google. Эти системы представляет статистику поисковых запросов и работает по принципу «Те, кто ищут (запрос пользователя), ищут также…» Сервис предназначен в помощь пользователю, совершившему поиск по какому-либо запросу и не получившему нужной информации. Статистика «ассоциаций» помогает выяснить интересы пользователей, путем анализа списка запросов, схожих с основными. Статистика анализа запросов Яндекса на ключевое слов русский язык, которое на Яндексе в 2008 г. имело 95641 показ, показывает, что русский язык встречалось также в других словосочетаниях:

Таким образом, предварительный анализ показывает, что ключевые слова вступают в Интернете друг с другом в особые отношения, на основе гипертекстовых связей, тематической связи слов, разного рода нового типа ассоциаций. Возникают, иногда непривычные с точки зрения классической лексикологии семантические связи слов. Например, к ключевому слову виза интернет-системой будут предложены названия фирм, адреса посольств, путеводители, карты дорог, адреса гостиниц и др. Ключевые слова выполняют различные функции: помогают найти текст с соответствующим содержанием; повышают посещаемость (тем самым и рейтинг того или иного сайта), если в текст включаются наиболее частотные или востребованные в данный момент ключевые слова.

[1] Атабекова А.А. Лингвистический дизайн WEB-страниц (сопоставительный анализ языкового оформления англо- и русскоязычных WEB-страниц). — М.: Изд-во РУДН, 2003.

[2] Дедова О.В. Теория гипертекста и гипертекстовые практики в Рунете. — М.: Изд-во МГУ, 2008.

[3] Какорина Е.В. Язык Интернет-коммуникации // Язык массовой и межличностной коммуникации. — М.: Медиатека, 2007.

[4] Трофимова Г.Н. Языковой вкус интернет-эпохи в России: Функционирование русского языка в Интернете: концептуально-сущностные доминанты. — М.: Изд-во РУДН, 2004.

Показов в месяц

Русский язык ЕГЭ русский язык Словарь русского языка Скачать русский язык Русский язык, тесты Правила русского языка Русский язык: результаты Русский язык: результаты ЕГЭ Уроки русского языка Русский язык 2008 Толковый словарь русского языка Курс русского языка ЕГЭ русский язык 2008 Учебник русского языка Фотошоп русский язык

95 641 9 467 7 988 5 750 5 261 3 810 2 999 2 677 1 510 1 436 1 282 1 263 1 147 1 129 1 090

ЛИТЕРАТУРА

RUSSIAN KEY WORDS IN THE INTERNET SEARCH ENGINES (semantically and cultural approaches)

P.V. Moroslin

International Slavonic Institute

Godovikova str., 9, Moscow, Russia, 129085

The research dealt with both linguistic and cultural approaches in considering Russian key words in the Internet search engines. In the article systems of collecting and saving key words were considered as well as a process and results for a new type of semantically and associative relations among key words in the Internet analyzed.

Key words: the Internet, the system of search, computer communication, the keywords.

Ключевое словосочетание — wiki студи Клондайк

Ключевое словосочетание — это словосочетание, которое, представляет страницу сайта, исходя из запросов поиска в поисковой системе. То есть в ключевом слове должны сочетаться качества, удовлетворяющие как поисковик, так и искомый сайт. Пример: есть сайт мастерской, которая занимается ремонтом часов. Ремонт часов и есть наша ключевая фраза, которая повторяется на странице несколько раз. Посетитель поисковой системы вводит наш оптимизированный запрос и находит нас в поисковой выдаче.
От того насколько часто вводится ключевое словосочетание в поисковую строку определяется частотность ключевого запроса.

Частотности запросов делятся на три вида:

  1. высокочастотники
  2. среднечастотники
  3. низкочастотники

Четких границ определяющих к какой группе частотности относится запрос не существует.

Чтобы объявление было показано более широкой аудитории, заинтересованной в вашем предложении и услугах, вы можете расширить список слов/словосочетаний, которые задействованы в кампании.

При этом:

  • Всегда следует помнить о синонимах. Например, к словосочетанию «продажа автомобилей» имеет смысл добавить «продажа машин», а к фразе «отдых в Турции» — названия городов «Анталия», «Кемер», «Мармарис», «Бодрум» и др. Некоторые популярные синонимы можно найти в словаре русских синонимов и сходных по смыслу выражений.
  • Необходимо учитывать профессиональные термины (сленг). Например, «наружная реклама» и «наружка», «сувенирная продукция» и «сувенирка», «выделенная линия» и «выделенка».
  • Используйте разные части речи с одним корнем. Например, к словосочетанию «магазин мебели» может быть целесообразным добавить «мебельный магазин».
  • Помните об опечатках. Яндекс. Директ учитывает популярные опечатки и запросы, набранные без переключения раскладки клавиатуры. В ответ на такие запросы будут показаны объявления по автоматически исправленным запросам. Однако редкие опечатки и различные варианты написания слов не будут исправлены автоматически. Чтобы объявление показывалось по таким целевым, но неправильно набранным запросам, необходимо при подборе ключевых слов учесть и слова с опечатками.
  • Учтите сложносоставные слова. Например, слово «металлочерепица» можно написать с пробелом посередине: «металло черепица».
  • Не используйте общие слова, такие как «ремонт», «реклама», «аренда», «доставка» и т. п., поскольку это снижает эффективность рекламной кампании. Вместо них имеет смысл использовать словосочетания, например: «ремонт принтеров», «наружная реклама», «аренда грузовиков».
  • Воспользуйтесь сервисом подбора слов для получения широкого списка запросов пользователей Яндекса.

Пример оформления статьи в научную конференцию

Предлагаем вам опубликовать свои научные труды в наших изданиях

Требования к оформлению статей для конференций 

  1. К публикации принимаются статьи объемом не менее 5 страниц машинописного текста. Мы просим предоставлять некоторые части статьи на двух языках, ниже вы сможете ознакомиться с требованиями поподробнее. 
  2. Для набора текста, формул и таблиц следует использовать редактор Microsoft Word для Windows. Параметры текстового редактора: все поля по 2 см; шрифт Times New Roman, размер – 14; межстрочный интервал – 1,5; выравнивание по ширине; абзацный отступ 1 см; ориентация листа – книжная. Рисунки, выполненные в MS Word, не принимаются. Все рисунки и таблицы, должны быть пронумерованы и снабжены названиями или подрисуночными подписями.
  3. Оформление заголовка на русском языке: (прописными, жирными буквами, выравнивание по центру строки) НАЗВАНИЕ СТАТЬИ; на следующей строке (шрифт жирный курсив, выравнивание по правому краю) – Ф.И.О. автора статьи полностью; на следующей строке (шрифт курсив, выравнивание по правому краю) – ученое звание, ученая степень, название вуза или должность и место работы (полностью), страна, город (сокращения не допускаются); на следующей строке (шрифт курсив, выравнивание по правому краю) – E-mail для контактов. Если авторов статьи несколько, то информация повторяется для каждого автора.
  4. Оформление заголовка на английском языке: та же информация повторяется на английском языке.
  5. Аннотация на русском и английском языке не более 600 знаков (считая с пробелами) для аннотации на каждом языке.
  6. Ключевые слова (приводятся на русском и английском языках) отделяются друг от друга точкой запятой.
  7. Через 1 строку – текст статьи.
  8. Через 1 строку — надпись «Список литературы». После нее приводится список литературы в алфавитном порядке, со сквозной нумерацией, оформленный в соответствии с ГОСТ Р 7.0.5 – 2008 (пример оформления). Ссылки в тексте на соответствующий источник из списка литературы оформляются в квадратных скобках, например: [1, с. 277]. Использование автоматических постраничных ссылок не допускается.

Образец оформления текста статьи

АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ ИНТЕЛЛЕКТУАЛЬНЫМ ЗДАНИЕМ НА ОСНОВЕ ДАТЧИКОВ

Иванов Иван Иванович
канд. техн. наук, зав. кафедрой информационно-измерительных систем,
доцент, Новосибирский государственный технический университет,
РФ, г. Новосибирск
E-mail: [email protected]

AUTOMATIC CONTROL OF INTELLIGENT BUILDINGS BASED ON SENSORS

Ivan Ivanov
Candidate of Science, Head of Information and Measuring Systems department,
assistant professor, Novosibirsk State Technical University, 
Russia, Novosibirsk

АННОТАЦИЯ

Цель. Метод. Результат. Выводы.

ABSTRACT

Background. Methods. Result. Conclusion.

Ключевые слова: ключевое слово; ключевое слово; ключевое слово.
Keywords: keyword; keyword; keyword.

Текст статьи. Текст статьи. Текст статьи. Текст статьи. Текст статьи. «Цитата» [1, с. 35]. Текст статьи. Текст статьи. Текст статьи. Текст статьи.

Таблица 1.

Название таблицы

Текст Текст Текст Текст
Текст Текст Текст Текст
Текст Текст Текст Текст
Текст Текст Текст Текст

Текст статьи. Текст статьи. Текст статьи. Текст статьи. Текст статьи. «Цитата» [2, с. 35]. Текст статьи. Текст статьи. Текст статьи. Текст статьи.

Рисунок 1. Название рисунка

Текст статьи. Текст статьи. Текст статьи. Текст статьи. Текст статьи. «Цитата» [3, с. 35]. Текст статьи. Текст статьи. Текст статьи. Текст статьи.

         (1)

где: — текущая скалярная мера усталостных повреждений;
— текущее значение предела выносливости материала, МПа;
— эффективная частота процесса, Гц;
— коэффициент в корреляционной зависимости между пределом выносливости и пределом прочности по Эйхингеру;
— коэффициент порога чувствительности.

Текст статьи. Текст статьи. Текст статьи. Текст статьи. Текст статьи.

Список литературы

1.

2.

3.

Образец оформления текста статьи

Ключевые слова в C | Microsoft Docs



  • Чтение занимает 2 мин

В этой статье

Ключевыми словами называются слова, которые имеют особое значение для компилятора C. На 7 и 8 этапах трансляции идентификатор не может иметь такое же написание и регистр записи, что и ключевое слово C. Дополнительные сведения см. в разделе Этапы преобразования Справочника по препроцессору. Дополнительные сведения об идентификаторах см. в этом разделе.

Ключевые слова стандартного языка C

В языке C используются следующие ключевые слова:

auto
break
case
char
const
continue
default
do
double
else
enum

extern
float
for
goto
if
inline 1, a
int
long
register
restrict 1, a
return

short
signed
sizeof
static
struct
switch
typedef
union
unsigned
void
volatile

while
_Alignas 2, a
_Alignof 2, a
_Atomic 2, b
_Bool 1, a
_Complex 1, b
_Generic 2, a
_Imaginary 1, b
_Noreturn 2, a
_Static_assert 2, a
_Thread_local 2, b

1 Ключевые слова, представленные в стандарте ISO C99.

2 Ключевые слова, представленные в стандарте ISO C11.

a Начиная с Visual Studio 2019 версии 16.8, эти ключевые слова поддерживаются в коде, скомпилированном как C, если указаны параметр компилятора /std:c11 или /std:c17 .

b Начиная с Visual Studio 2019 версии 16.8, эти ключевые слова распознаются но не поддерживаются компилятором в коде, скомпилированном как C, если указаны параметр компилятора /std:c11 или /std:c17 .

Переопределить ключевые слова невозможно. Но с помощью директив препроцессора C можно определить текст, который будет использоваться вместо ключевых слов.

Ключевые слова C для систем Microsoft

Стандарты ANSI и ISO C позволяют зарезервировать идентификаторы, начинающиеся с двух символов подчеркивания, для реализаций компилятора. Поэтому в системах Microsoft действует соглашение, что используемые в них ключевые слова начинаются с двух символов подчеркивания. Эти слова невозможно использовать как имена идентификаторов. Описание правил именования идентификаторов, включая использование двойных знаков подчеркивания, см. в статье об идентификаторах.

Компилятор Microsoft C распознает следующие ключевые слова и особые идентификаторы.

__asm 5
__based 3, 5
__cdecl 5
__declspec 5
__except 5
__fastcall
__finally 5

__inline 5
__int16 5
__int32 5
__int64 5
__int8 5
__leave 5
__restrict

__stdcall 5
__try 5
dllexport 4
dllimport 4
naked 4
static_assert 6
thread 4

3 Ключевое слово __based имеет ограниченное применение: в компиляциях для 32- и 64-разрядных платформ.

4 Если эти ключевые слова используются с ключевым словом __declspec , они являются особыми идентификаторами. В других контекстах они могут использоваться без ограничений.

5 Для совместимости с предыдущими версиями эти ключевые слова доступны как с двумя символами подчеркивания в начале, так и с одним при включении расширений Microsoft.

6 Если файл <assert.h> не включен, компилятор Microsoft Visual C сопоставляет static_assert с ключевым словом C11 _Static_assert .

Расширения Microsoft по умолчанию включены. Чтобы помочь в создании переносимого кода, расширения Microsoft можно отключить, указав во время компиляции параметр /Za (Отключить расширения языка) . При этом некоторые ключевые слова для систем Microsoft будут отключены.

Когда расширения Microsoft включены, в программах можно использовать перечисленные выше ключевые слова. Для совместимости со стандартами большинство этих ключевых слов начинаются с двух символов подчеркивания. Четыре исключения, dllexport , dllimport , naked и thread , используются только с ключевым словом __declspec и поэтому не требуют двойного знака подчеркивания. Для всех остальных ключевых слов поддерживаются версии с одним символом подчеркивания. Это сделано для обеспечения обратной совместимости.

См. также

Элементы языка C



Структура научной статьи

Научная статья имеет четкую структуру и, как правило, состоит из следующих частей.

  1. Название (заголовок).
  2. Аннотация.
  3. Ключевые слова.
  4. Введение.
  5. Обзор литературы.
  6. Основная часть (методология, результаты).
  7. Выводы и дальнейшие перспективы исследования.
  8. Список литературы.

Рассмотрим особенности составных элементов научной статьи и основные требования, которые необходимо соблюдать при работе над ними.

Название

Название (заголовок) — обозначение структурной части основно­го текста произведения (раздела, главы, параграфа, таблицы и др.) или издания.

Основное требование к названию статьи — краткость и ясность. Максимальная длина заголовка — 10—12 слов. Название долж­но быть содержательным, выразительным, отражать содержание статьи.

При выборе заголовка статьи необходимо придерживаться сле­дующих общих рекомендаций.

  1. Заглавие должно быть информативным.
  2. Название должно привлекать внимание читателя.
  3. В названии, как и во всей статье, следует строго придержи­ваться научного стиля речи.
  4. Оно должно четко отражать главную тему исследования и не вводить читателя в заблуждение относительно рассматриваемых в статье вопросов.
  5. В название должны быть включены некоторые из ключевых слов, отражающих суть статьи. Желательно, чтобы они стояли в нача­ле заголовка.
  6. В заголовке можно использовать только общепринятые сокра­щения.

При переводе заглавия статьи на английский язык не должно использоваться никаких транслитераций с русского языка, кроме непереводимых названий собственных имен, приборов и др. объектов, имеющих собственные названия; также не используется непереводимый сленг, известный только русскоговорящим специалистам.

Аннотация

Аннотация — это не зависимый от статьи источник информации. Ее пишут после завершения работы над основным тек­стом статьи. Она включает характеристику основной темы, проблемы, объекта, цели работы и ее результаты. В ней указывают, что нового несет в себе данный документ в сравнении с другими, родст­венными по тематике и целевому назначению. Рекомендуемый объ­ем — 100 – 250 слов на русском и английском языках.

Аннотация выполняет следующие функции:

  • позволяет определить основное содержание статьи, его реле­вантность и решить, следует ли обращаться к полному тексту публи­кации;
  • предоставляет информацию о статье и устраняет необходи­мость чтения ее полного текста в случае, если статья представляет для читателя второстепенный интерес;
  • используется в информационных, в том числе автоматизиро­ванных, системах для поиска документов и информации.

Аннотации должны быть оформлены по международным стандартам и включать следующие моменты.

  1. Вступительное слово о теме исследования.
  2. Цель научного исследования.
  3. Описание научной и практической значимости работы.
  4. Описание методологии исследования.
  5. Основные результаты, выводы исследовательской работы.
  6. Ценность проведенного исследования (какой вклад данная работа внесла в соответствующую область знаний).
  7. Практическое значение итогов работы.

В аннотации не должен повторяться текст самой статьи (нельзя брать предложения из статьи и переносить их в аннотацию), а также ее название. В ней не должно быть цифр, таблиц, внутритекстовых сносок.

В аннотации должны излагаться существенные факты работы, и не должно содержать материал, который отсутствует в самой статье.

Предмет, тема, цель работы указываются, если они не ясны из заглавия статьи; метод или методологию проведения работы имеет смысл описывать в том случае, если они отличаются новизной или представляют интерес с точки зрения данной работы.

Результаты работы описывают предельно точно и информативно. Приводятся основные теоретические и экспериментальные результаты, фактические данные, обнаруженные взаимосвязи и закономерности. При этом отдается предпочтение новым результатам, важным открытиям, выводам, которые опровергают существующие теории, а также данным, имеющим практическое значение.

Выводы могут сопровождаться рекомендациями, оценками, предложениями, гипотезами, описанными в статье.

Сведения, содержащиеся в заглавии статьи, не должны повторяться в тексте авторского резюме.

В тексте аннотации следует употреблять синтаксические конструкции, свойственные языку научных и технических документов, избегать сложных грамматических конструкций. Он должен быть лаконичен и четок, без лишних вводных слов, общих формулировок.

ПРИМЕР АВТОРСКОГО РЕЗЮМЕ НА РУССКОМ ЯЗЫКЕ:

Значительная часть инновационных планов по внедрению изменений, содержащих в своей основе нововведения, либо не доходит до практической реализации, либо в действительности приносит гораздо меньше пользы, чем планировалось. Одна из причин этих тенденций кроется в отсутствии у руководителя реальных инструментов по планированию, оценке и контролю над инновациями. В статье предлагается механизм стратегического планирования компании, основанный на анализе как внутренних возможностей организации, так и внешних конкурентных сил, поиске путей использования внешних возможностей с учетом специфики компании. Стратегическое планирование опирается на свод правил и процедур, содержащих серию методов, использование которых позволяет руководителям компаний обеспечить быстрое реагирование на изменение внешней конъюнктуры. К таким методам относятся: стратегическое сегментирование; решение проблем в режиме реального времени; диагностика стратегической готовности к работе в условиях будущего; разработка общего плана управления; планирование предпринимательской позиции фирмы; стратегическое преобразование организации. Процесс стратегического планирования представлен в виде замкнутого цикла, состоящего из 9-ти последовательных этапов, каждый из которых представляет собой логическую последовательность мероприятий, обеспечивающих динамику развития системы. Результатом разработанной автором методики стратегического планирования является предложение перехода к «интерактивному стратегическому менеджменту», который в своей концептуальной основе ориентируется на творческий потенциал всего коллектива и изыскание путей его построения на основе оперативного преодоления ускоряющихся изменений, возрастающей организационной сложности и непредсказуемой изменяемости внешнего окружения.

ЭТО ЖЕ АВТОРСКОЕ РЕЗЮМЕ НА АНГЛИЙСКОМ ЯЗЫКЕ:

A considerable part of innovative plans concerning implementation of developments with underlying novelties either do not reach the implementing stage, or in fact yield less benefit than anticipated. One of the reasons of such failures is the fact that the manager lacks real tools for planning, evaluating and controlling innovations. The article brings forward the mechanism for a strategic planning of a company, based on the analysis of both inner company’s resources, and outer competitive strength, as well as on searching ways of using external opportunities with account taken of the company’s specific character. Strategic planning is based on a code of regulations and procedures containing a series of methods, the use of which makes it possible for company’s manager to ensure prompt measures of reaction to outer business environment changes. Such methods include: strategic segmentation; solving problems in real-time mode; diagnostics of strategic readiness to operate in the context of the future; working out a general plan of management; planning of the business position of the firm; strategic transformation of the company. Strategic planning process is presented as a closed cycle consisting of 9 successive stages, each of them represents a logical sequence of measures ensuring the dynamics of system development. The developed by the author strategic planning methods result in the recommendation to proceed to “interactive strategic management” which is conceptually based on the constructive potential of the collective body, on searching ways of its building on the basis of effective overcoming accelerating changes, increasing organizational complexity, and unpredictable changeability of the environment.

Ключевые слова

Ключевые слова выражают основное смысловое содержание ста­тьи, служат ориентиром для читателя и используются для поиска ста­тей в электронных базах. Размещаются после аннотации в количестве 4—8 слов, приводятся на русском и английском языках. Должны от­ражать дисциплину (область науки, в рамках которой написана ста­тья), тему, цель, объект исследования.

Введение

Введение призвано дать вводную информацию, касающуюся темы статьи, объяснить, с какой целью предпринято исследование. При написании введения автор прежде всего должен заявить общую тему исследования. Далее необ­ходимо раскрыть теоретическую и практическую значимость работы и описать наиболее авторитетные и доступные для читателя публика­ции по рассматриваемой теме. Во введении автор также обозначает про­блемы, не решенные в предыдущих исследованиях, которые призвана решить данная статья.

Во введении в обязательном порядке четко формулируются:

  1. цель и объект предпринятого автором исследования. Работа должна содержать определенную идею, ключевую мысль, раскрытию которой она посвящена. Чтобы сформулировать цель, необ­ходимо ответить на вопрос: «Что вы хотите создать в итоге проведен­ного исследования?» Этим итогом могут быть новая методика, клас­сификация, алгоритм, структура, новый вариант известной техноло­гии, методическая разработка и т. д. Формулировка цели любой рабо­ты, как правило, начинается с глаголов: выяснить, выявить, сформи­ровать, обосновать, проверить, определить и т. п. Объект — это ма­териал изучения.
  2. актуальность и новизна. Актуальность темы — степень ее важ­ности в данный момент и в данной ситуации. Это способность ре­зультатов работы быть применимыми для решения достаточно зна­чи­мых научно-практических задач. Новизна — это то, что отличает ре­зультат данной работы от результатов, полученных другими авто­рами.
  3. исходные гипотезы, если они существуют.

Также в этой части работы читателя при необходимости знакомят со структурой статьи.

После написания введения его необходимо проанализировать по следующим ключевым пунктам:

четко ли сформулированы цели, объект и исходные гипотезы, если они существуют;·

нет ли противоречий;·

указана ли актуальность и новизна работы;·

упомянуты ли основные исследования по данной теме.·

Обзор литературы

Обзор литературы представляет собой теоретическое ядро иссле­дования. Его цель — изучить и оценить существующие работы по данной тематике. Предпочтительным является не просто перечисле­ние предшествующих исследований, но их критический обзор, обоб­щение основных точек зрения.

Основная часть

Методология

В данном разделе описывается последовательность выполнения исследования и обосновывается выбор используемых методов. Он должен дать возможность читателю оценить правильность этого вы­бора, надежность и аргументированность полученных результатов. Смысл информации, излагаемой в этом разделе, заключается в том, чтобы другой ученый достаточной квалификации смог воспроизвести исследование, основываясь на приведенных методах. Отсылка к лите­ратурным источникам без описания сути метода возможна только при условии его стандартности или в случае написания статьи для узко­специализированного журнала.

Результаты

В этой части статьи должен быть представлен авторский аналити­ческий, систематизированный статистический материал. Результаты проведенного исследования необходимо описывать достаточно полно, чтобы читатель мог проследить его этапы и оценить обоснованность сделанных автором выводов. По объему эта часть занимает централь­ное место в научной статье. Это основной раздел, цель которого за­ключается в том, чтобы при помощи анализа, обобщения и разъясне­ния данных доказать рабочую гипотезу (гипотезы). Результаты при необходимости подтверждаются иллюстрациями — таблицами, гра­фиками, рисунками, которые представляют исходный материал или доказательства в свернутом виде. Важно, чтобы проиллюстрированная информация не дублировала текст. Представленные в статье результаты желательно сопоставить с предыдущими работами в этой области как автора, так и других исследователей. Такое срав­нение дополнительно раскроет новизну проведенной работы, придаст ей объективности.

В зависимости от уровня знаний — теоретического или эмпириче­ского — различают теоретические и эмпирические статьи. Теоретиче­ские научные статьи включают результаты исследований, выполнен­ных с помощью таких методов познания, как абстрагирование, синтез, анализ, индукция, дедукция, формализация, идеализация, моделиро­вание. Если статья имеет теоретический характер, чаще всего она строится по следующей схеме: автор вначале приводит основные по­ложения, мысли, которые в дальнейшем будут подвергнуты анализу с последующим выводом. Эмпирические научные статьи, используя ряд теоретических методов, в основном опираются на практические методы измерения, наблюдения, эксперимента и т. п.

Результаты исследования должны быть изложены кратко, при этом содержать достаточно информации для оценки сделанных выво­дов, также должно быть очевидно, почему для анализа выбраны именно эти данные.

Заключение, выводы

Заключение содержит краткую формулировку результатов ис­сле­дования. В нем в сжатом виде повторяются главные мысли ос­новной части работы. Всякие повторы излагаемого материала луч­ше оформ­лять новыми фразами, новыми формулировками, отли­чающимися от высказанных в основной части статьи. В этом раз­де­ле необходимо сопоставить полученные результаты с обозна­ченной в начале работы целью. В заключении суммируются ре­зультаты ос­мысления темы, де­лаются выводы, обобщения и реко­мендации, ко­торые вытекают из работы, подчеркивается их прак­тическая значи­мость, а также опреде­ляются основные направления для дальней­шего исследования в этой области. В заключительную часть статьи желательно включить попытки прогноза развития рассмот­ренных вопросов.

Работа с ключевыми словами русской культуры на уроках русского языка в 5 классе | Статья по русскому языку (5 класс) по теме:

Работа с ключевыми словами русской культуры на уроках русского языка в 5 классе

Сокровищница родного слова хранит плоды глубоких раздумий многих поколений, плоды исторических событий, верования, воззрения, следы прожитого горя и радости. Всю свою духовную жизнь народ бережно сохранил в слове. Язык народа является богатейшим источником знания о быте и нравах русского народа. К сожалению, современный школьник об истории русской культуры, русского народа имеет смутное представление. Поэтому на уроках русского языка я стараюсь сделать так, чтобы ученики обратили внимание на слово, его значение, заглянули в историю, смогли понять, что слово — носитель и хранитель духовной культуры народа. Работу начинаю в 5 классе с изучения раздела «Лексика». С этой целью из большого количества слов я выбираю «главные», ключевые – носители русской культуры. С помощью этих слов «культура входит в ментальный мир человека … и посредством чего … обычный человек, не «творец культурных ценностей» — сам входит в культуру, а в некоторых случаях и влияет на неё» [Степанов 2004: 43].

Ключевых слов, по мнению Ю.С.Степанова, всего сорок-пятьдесят. Центральное место среди них занимают те, которые связаны с морально-нравственными оценками человека: «Истина», «Ложь», «Добро», «Зло», «Свобода», «Милосердие», «Честь». Именно с ними я стараюсь работать на уроке. Кроме того, из числа ключевых я отбираю слова, несущие наряду с культурной и воспитательную функцию: «Родина», «Россия», «Народ». Им я уделяю особое внимание.

Работаем мы так. Сначала учащиеся узнают о значении и смысле слова «Родина», потом – «Россия». Разбираем, когда «Родина» пишется с маленькой буквы, когда – с большой. Предлагаю выписать лексическое значение. Учащиеся отмечают, что Родина – это «отечество, родная страна». Наша страна, в которой живем, — Россия. Кроме того, родиной называют место, где родился, «происхождение, возникновение чего-нибудь». Со словом «родина» составляем словосочетания и предложения. Например, любовь к родине, защита родины, малая родина. Обязательно проводим работу с этимологическим словарем, разбираем  происхождение слова, в каком плане оно значимо для русской культуры.

Следующий этап – работа с произведениями устного народного творчества. Предлагаю пятиклассникам вспомнить русские пословицы и поговорки по данной теме. Работаем сначала на уроке. Домашнее задание – подобрать как можно больше пословиц и поговорок о родине. Предлагаю сделать книжку «Пословицы и поговорки о родине». Учащиеся знакомятся со сборником В.И.Даля «Пословицы русского народа». Особое внимание уделяю таким пословицам: «В каком народе живешь, того и обычья держись», «Глупа та птица, которой гнездо свое немило», «Без корня и полынь не растет», «На чужой стороне и весна не красна», «Родимая сторона – мать, чужая – мачеха», «Где кто родится, там и пригодится». Обращаем внимание на пословицы, в которых содержатся знания об обычаях, быте русского народа. На основании рассмотренного обязательно делаем вывод, что для русского человека значит Родина, почему мы должны гордиться своей страной. Последний этап – написать сочинение по пословице.

Дальше продолжаю работу, используя образцы русской речи, представленные в русской художественной литературе прошлого и произведениях современных авторов. Сначала анализируем произведения русских поэтов первой половины XIX века. Учащиеся выписывают примеры в отдельную тетрадь. Анализируя, приходим к выводу, что у слов и словосочетаний, называющих Родину (Родина, Отчизна, Отечество, родной край, страна отцов и т.д.), обобщенно-отвлеченный смысл. Наиболее часто повторяющаяся лексическая группа – это существительные, обозначающие детали сельского пейзажа, называющие жителей сельской местности, элементы их материальной и духовной жизни, явления природы: кров, очаг, дом, хижина, обитель, уголок, лес, ручей и т.д. Рядом с этими существительными выписываем определения-эпитеты: кров, домик, уголок – смиренный, уединенный, неприметный, скромный; хижина – бедная; лес – темный; ручей – прозрачный, серебристый, сверкающий, кристальный. Приводим примеры:

Приди под кров родной,

Под кров уединенный,

Счастливый и простой.

  П.Вяземский

О, край моих отцов! О мирное наследство!

Всегда присутственны вы в памяти моей:

И в берегах крутых сверкающий ручей,

И светлые луга, и темные дубравы,

И сельских жителей приветливые нравы.

                 Е.Баратынский

Делаем вывод, что для русской поэзии первой половины XIX века  типично представление родины как места рождения человека и как места жизни и упокоения отцов (предков). Этим объясняется постоянное построение таких словосочетаний, как прах отцов, отеческие могилы, отчий гроб. Каждое слово, словосочетание рассматриваем, приводим примеры употребления этих слов в других значениях, разбираем, говорим ли эти слова сегодня.

Обратимся, например,  к произведению В.А.Жуковского:

Там в старину все жило, все цвело,

Там он играл младенцем в колыбели…

Неси ж туда, где наш отец и брат

Спокойным сном в приюте гроба спят…

Тогда явилось все величие народа,

Спасающего трон и святость алтарей,

И тихий гроб отцев, и колыбель детей,

И старцев седины, и младость дев цветущих,

И славу прежних лет, и славу лет грядущих.

Ученики приходят к выводу, что понятие Родины у В.А.Жуковского  раскрывается с помощью контрастной лексики (противопоставление): гроб отцов – колыбель детей, старцев седины – младость дев цветущих, слава прежних лет – слава лет грядущих. Работа над произведениями первой половины XIX века сложная, поэтому каждый пример, каждое стихотворение разбираем на уроке.

Ученики 5 класса всегда с удовольствием работают с текстами К.Г.Паустовского, удивительного знатока русского слова. Выбираю отрывки из произведения «Мещерская сторона», «Золотая роза». На уроке читаем отрывок из книги «Золотая роза» («Я большой любитель разбирать слова…»). Записываем выделенные слова: родник, зарождается, родит, родина, народ, родня. Выясняем, почему лесник объединил их. Разбираем значение каждого слова, делаем и словообразовательный разбор. Далее прошу объяснить слова автора: «Родник родит реку, а река льется-течет через всю нашу матушку-землю, через всю родину, кормит народ. Вы глядите, как это складно выходит, — родник, родина, народ. И все эти слова как бы родня между собой…», «Весь многовековой опыт народа, вся поэтическая сторона его характера заключались в этих словах». Как итог работы над текстом предлагаю написать сочинение «Моя родина».

Пятиклассники всегда с удовольствием пытаются разобраться в значениях слова, что хотел сказать автор, фантазируют, выдвигают свои гипотезы. Иначе говоря, с удовольствием работают со словом. Стараются постичь его смысл, заглянуть в историю его возникновения. На каждом таком уроке я наблюдаю, как развивается духовный мир школьников, проявляется интерес к слову, истории русского языка и русского народа. Как приятно видеть, что ученики овладевают богатством русской речи.

Даже небольшое количество часов, отведенных на изучение лексики, позволяет показать учащимся богатство и красоту родного слова, расширяет и углубляет  знания учащихся о жизни русского народа, о русской культуре.

Литература

Степанов Ю.С. Константы: Словарь русской культуры. – М., 2004

Клюева Г.Ю., Формирование культуроведческой компетенции учащихся V – VI классов при изучении лексики на уроках русского языка // РЯШ.- 2009.- №6

Twitter-ботов и русские тролли усиливают дебаты о вакцинах

Исходное количество твитов с разбивкой по источникам показано в Таблице C (доступно в качестве дополнения к онлайн-версии этой статьи на http://www.ajph.org). показывает, что аккаунты, идентифицированные NBC News как русские тролли20 или Варолом и др. как изощренные боты25 или источники, загрязняющие контент21 (т. е. учетные записи, распространяющие вредоносное ПО и нежелательный контент), с гораздо большей вероятностью будут писать в Твиттере о вакцинации, чем среднестатистические пользователи Твиттера.Кроме того, аккаунты, которые Конгресс США определяет как российских троллей26, значительно чаще писали в Твиттере о болезнях, которые можно предотвратить с помощью вакцин (например, вирусе Зика), но не обязательно о вакцинах. Наконец, традиционные спам-боты23,24 (разработанные так, чтобы их можно было распознать как ботов) и загрязнители контента значительно реже писали в Твиттере о болезнях, которые можно предотвратить с помощью вакцин, чем средний пользователь Twitter.

Содержание антивакцины

Мы собрали 899 твитов из потока вакцин, отражающих активность известных ботов и троллей.Аннотаторы достигли умеренного согласия по первому раунду аннотации этих твитов (Fleiss κ = 0,48). Кроме того, мы собрали 9895 твитов из потока вакцины, представляющих активность различных пользователей Twitter, также с умеренным начальным соглашением между аннотаторами (Fleiss κ = 0,49). Во всех случаях аннотаторы достигли консенсуса еще через 2 раунда. Мы разделили эти твиты на 3 подмножества: 450 (5%) твитов с оценкой Botometer 20% или ниже, 290 (3%) твитов с оценкой 80% или выше и 7518 (76%) твитов с промежуточной оценкой.В общей сложности 1587 (16%) твитов были связаны с пользователями, чьи оценки не могли быть определены (например, из-за того, что их учетные записи были удалены).

Одна из стратегий, используемых ботами и троллями, заключается в создании нескольких твитов на одни и те же темы с целью переполнения дискурса.17 Таким образом, чтобы лучше понять поведение каждого типа учетной записи, мы изучили общую долю твитов, которые были генерируется уникальными пользователями — возможный индикатор поведения ботов или троллей — для оценки того, проявляли ли аккаунты с более высокими баллами ботов такое поведение.показывает, что учетные записи с промежуточным баллом ботов отправили больше твитов на учетную запись в целом. Точно так же аккаунты с промежуточным баллом публиковали значительно больше поляризованных и нейтральных твитов на аккаунт; тем не менее, их количество твитов о провакцине существенно не отличалось от показателей неботов после учета множественных сравнений. Напротив, учетные записи с высокими показателями ботов публиковали более нейтральные, но не поляризованные твиты для каждой учетной записи.

Количество твитов на уникальную учетную запись, разделенных по настроениям и категориям оценок ботов: 14 июля 2014 г. — 26 сентября 2017 г.

a Незначительно после контроля множественных сравнений с использованием процедуры Холма – Бонферрони.Исходные подсчеты приведены в Таблице D (доступной в качестве дополнения к онлайн-версии этой статьи на http://www.ajph.org).

** P <0,01; *** P <0,001.

показывает пропорции поляризованных и антивакцинных сообщений по типу пользователя. Результаты показывают, что аккаунты с промежуточными баллами ботов публикуют значительно более поляризованный контент, чем сообщения не-ботов. Эти аккаунты и те, чьи оценки ботов не могли быть определены, публиковали антивакцины со значительно большей скоростью, чем неботы.Напротив, известные боты и тролли публиковали сообщения, которые были не более поляризованными, чем сообщения обычных пользователей, не являющихся ботами. Загрязнители контента — злонамеренные аккаунты, которые идентифицируются как продвигающие коммерческий контент и вредоносное ПО, — размещали значительно больше материалов против вакцины. Учетные записи троллей и изощренные боты публиковали примерно одинаковое количество информации о вакцинах и против вакцинации.

ТАБЛИЦА 1—

Пропорции поляризованных и антивакцинных твитов по типам пользователей: 14 июля 2014 г. — 26 сентября 2017 г.

9004 1

Тип пользователя поляризованные,% Антивакцина,%
Разные пользователи, оценка бота,%
<20 31 35
20–80 39 *** 60 ***
> 80 26 49 * , a
Неизвестно 37 * , a 62 ***
Известные боты и тролли
NBC Русские тролли20 20 * , a 47
Контент загрязнители21 38 60 ***
Поддельные подписчики22 0 NA
Традиционные спам-боты23,24 3 *** 0
Социальные спам-боты23,24 18 ** 56 * , a
Сложные боты25 28 44
Список российских троллей в Конгрессе 26 39 48

Качественный анализ #VaccinateUS

Из 253 сообщений, содержащих # 43Vaccinate % были провакцинами, 38% — антивакцинами, а остальные 19% — нейтральными.В то время как большинство ненейтральных хэштегов, относящихся к вакцинам, были четко определены как провакцина (#vaccineswork, #vaxwithme) или противовакцина (#Vaxxed, # b1less, #CDCWhistleblower), с ограниченным использованием противоположной стороной, #VaccinateUS уникален тем, что появляется с очень поляризованные сообщения с обеих сторон, без других ненейтральных хэштегов.

Сообщения, содержащие #VaccinateUS, содержат сочетание грамматических ошибок, неестественного выбора слов и неправильной формулировки. Однако сообщения #VaccinateUS содержат меньше орфографических и пунктуационных ошибок, чем сопоставимые твиты из общего потока вакцины.Сообщения #VaccinateUS также отличаются тем, что они не содержат ссылок на внешний контент, редких @ упоминаний других пользователей и изображений (но иногда используют некоторые смайлики).

Тематически сообщения с #VaccinateUS отражают общий дискурс о вакцинах в Твиттере (рамка на странице 1383). Хотя авторы этих твитов имеют достаточно полное представление о содержании аргументов против вакцинации и против вакцинации, их сообщения отличаются небольшими различиями. Авторы сообщений #VacccinateUS склонны явно связывать как пропагандистские, так и антивакцинные сообщения с политикой США и часто используют эмоциональные призывы к «свободе», «демократии» и «конституционным правам».Напротив, другие твиты из потока вакцин больше сосредоточены на «выборе родителей» и конкретном законодательстве, связанном с вакцинами.

BOX 1

Примеры твитов с #VaccinateUS и соответствующими темами: 14 июля 2014 г. — 26 сентября 2017 г.

Антивакцинная тема Пример твита
Свобода выбора / антимонопольная VaccinateUS обязательные # вакцины нарушают религиозные свободы, защищенные конституцией
Не могу доверять правительству в отношении вакцин Знаете ли вы, что существует секретная правительственная база данных о # детях, поврежденных вакцинами? #VaccinateUS
Фармацевтические компании хотят получать прибыль от вакцин Фармацевтические компании хотят разрабатывать # вакцины для получения наличных, а не для предотвращения смерти #VaccinateUS
Вакцины вызывают тяжелые побочные эффекты #VaccinateUS # Вакцины могут вызывать серьезные, а иногда и смертельные побочные эффекты
Естественный иммунитет лучше Естественная инфекция #VaccinateUS почти всегда вызывает лучший иммунитет, чем # вакцины
Общие теории заговора вакцины Не принимайте # вакцины.За этим стоят иллюминаты. #VaccinateUS
Вакцины вызывают аутизм Знаете ли вы, что # вакцины вызывают аутизм? #VaccinateUS
Компоненты вакцины опасны #VaccinateUS # вакцины содержат ртуть! Смертельный яд!
Болезни не так опасны #VaccinateUS Большинство болезней, на которые нацелены # вакцины, во многих случаях относительно безвредны, что делает ненужными # вакцины
Тема провакцины Пример твита
Вакцины работают #VaccinateUS # vaccines save 2.Ежегодно 5 миллионов детей от предотвратимых болезней
Вакцины должны быть обязательными Ваши дети — не ваша собственность! Вы должны сделать им прививку #, чтобы защитить их и всех остальных! #VaccinateUS
Люди, которые не делают прививки, глупы #VaccinateUS Глупость не исправить. Пусть умрут от кори, а я за # вакцинацию!
Вакцинация защищает коллективный иммунитет #VaccinateUS #vaccines защищает общественный иммунитет
Люди, которые не делают вакцинацию, подвергают риску меня / моих детей #VaccinateUS Моя свобода заканчивается там, где начинается свобода другого человека.Затем следует # вакцинировать детей, если болезнь опасна для ДРУГИХ детей
Вакцины не вызывают аутизм # вакцины вызывают аутизм — Пока, ты мне больше не друг. И попробуйте подумать своим мозгом следующее. #VaccinateUS
Вы заслуживаете плохих поступков, если не вакцинируете # вакцины — выбор родителей. Выбор цвета гробика #VaccinateUS
Альтернативная медицина не работает Вы все еще лечите своих детей листьями? Нет? И почему вы их не вакцинируете? Это лекарство! #VaccinateUS
Люди умирали без вакцин Большинство родителей в викторианскую эпоху регулярно теряли детей из-за болезней, которые можно было предотвратить.# вакцины могут решить эту проблему #VaccinateUS

Как и другие твиты об антивакцинах, антивакцинные сообщения с #VaccinateUS часто ссылаются на теории заговора. Однако, в то время как теории заговора, как правило, нацелены на самых разных преступников (например, определенные правительственные учреждения, отдельных филантропов или секретные организации), сообщения #VaccinateUS почти исключительно сосредоточены на правительстве США (например, «Сначала наше правительство создает болезни, затем он создает # вакцины.что дальше?! #VaccinateUS »). Как правило, пользователи #VaccinateUS говорят в общих чертах и ​​не могут предоставить уровень детализации, соизмеримый с тем, что содержится в других твитах, связанных с вакцинами. Например, автор может резюмировать аргумент (например, «#VaccinateUS #vaccines вызывают серьезные, а иногда и фатальные побочные эффекты»), тогда как в твитах из потока вакцины обычно используется как можно больше деталей, чтобы звучать убедительно.

Сообщения #VaccinateUS включали несколько отличительных аргументов, которые мы не наблюдали в общей дискуссии о вакцинах.Сюда входили аргументы, связанные с расовым / этническим разделением, обращения к Богу и аргументы на основе защиты животных. Это вызывающие разногласия темы в культуре США, которые мы не видели часто обсуждаемых в других твитах, связанных с вакцинами. Например, «Очевидно, только избранные получают« чистые »# вакцины. А что мы, нормальные люди, получаем ?! #VaccinateUS », по всей видимости, нацелен на социально-экономическую напряженность, существующую в Соединенных Штатах. Напротив, стандартные сообщения об антивакцинах склонны характеризовать вакцины как опасные для всех людей, независимо от социально-экономического статуса.

Сообщения #VaccinateUS также включают несколько сообщений, которые, кажется, предназначены для того, чтобы спровоцировать ответ и продлить спор, в том числе открытые вопросы и комментарии к самой дискуссии (например, «Я верю в # вакцины, почему вы? #VaccinateUS» »). Комментарии также использовались, чтобы побудить других пользователей ответить, в частности, разместив контент, который сторонники вакцинации сочли бы само собой разумеющимся, например: «#VaccinateUS Основные медицинские организации заявляют, что # вакцины безопасны» и «# травмы от вакцинации случаются редко, несмотря на беспокойство родителей. #VaccinateUS.»

Русский тролль-профессионал все расскажет

Все больше и больше сообщений и комментариев в Интернете в России и даже за рубежом создается профессиональными троллями, многие из которых получают зарплату выше средней за продолжение прокремлевского диалога в сети.

Тысячи фейковых аккаунтов в Twitter, Facebook, LiveJournal и vKontakte все больше сосредоточены на войне в Украине. Многие исходят от самой известной в России «фабрики троллей», Центра интернет-исследований, скромного здания на улице Санкт-Петербурга.Петербургская улица Савушкина, которая работает с 24-часовым циклом. В последние недели бывшие сотрудники вышли вперед, чтобы поговорить с RFE / RL о жизни на фабрике, где сотни людей работают шлифованием, 12-часовыми сменами в обмен на 40 000 рублей (700 долларов США) в месяц или больше.

Санкт-Петербургский блогер Марат Буркхард два месяца проработал в Internet Research в отделе, которому было поручено забивать форумы российских муниципальных сайтов прокремлевскими комментариями. В следующем интервью он описывает типичный день и типы заданий, с которыми он столкнулся.

Марат Буркхард

RFE / RL: Марат, вы написали в своем блоге, что время, проведенное в Internet Research, дало вам достаточно материала для целой книги. Почему вы решили писать туда? Развлекательная программа? Авантюризм?

Марат Буркхард: Да, авантюризм — правильное слово. Потому что, на мой взгляд, такой работы больше нигде нет.

RFE / RL: Было ли трудно получить работу?

Буркхард: Да, это было сложно. Сначала нужно написать образцы текстов, а потом они решат, подходите ли вы для работы.Так они отсеивают людей.

RFE / RL: Какие тексты?

Буркхард: Сначала заставляют написать что-нибудь нейтральное — Вегетарианство: за и против. После этого задания становятся более предметными — например, что я думаю о гуманитарных конвоях в Донецке?

RFE / RL: Вам пришлось скрывать свои истинные убеждения?

Буркхард: Да, я прозападный. Для меня это естественно, а для них, конечно, нет. Я ничего не писал о своих взглядах.В противном случае они бы меня не наняли; они бы сразу вышвырнули меня. Они постоянно проводят идеологические проверки всего, что вы пишете. Меня пару раз ловили; У меня были моменты безответственности.

RFE / RL: Вам сразу предложили зарплату в 45000 рублей, или вам постепенно повышали зарплату до того, как вы достигли этого уровня?

Буркхард: Нет, я получил это немедленно — при условии, что я выполнил свою квоту. Это настоящая фабрика. Есть производственные квоты, и за их выполнение вы получаете 45000.Квота составляет 135 комментариев за 12-часовую смену.

RFE / RL: Сколько отделов в Internet Research?

Буркхард: Современное четырехэтажное здание. Есть отдел LiveJournal, отдел новостей, отдел, где создаются всевозможные изображения и демотиваторы (примечание редактора: демотиваторы — это сатирическая графика , , которая, как правило, подрывает их тематику), отдел, где снимают видео. Но я никогда не был в этих отделах.У каждого из них свой офис, столы и компьютеры, и никто не ходит с места на место. Каждый остается на своем месте.

RFE / RL: Сколько человек было в вашем отделе?

Буркхард: Двадцать.

RFE / RL: Вы работали по 12 часов в день?

Буркхард: Да. Были дневные и ночные смены.

RFE / RL: Вам нужно было сидеть в офисе или можно было работать из дома?

Буркхард: Удаленной работы нет.Ночью приходит другая смена. Я работал в дневную смену.

RFE / RL: То есть вы сидите в офисе 12 часов, не выходя на улицу? Почему такие гигантские сдвиги?

Буркхард: Два дня выходной, два выходных. Они считают, что вам нужно работать по 12 часов, а не по восемь.

RFE / RL: Так чем занимался ваш отдел?

Буркхард: Наш отдел комментировал сообщения. У каждого города и села в России есть свой муниципальный сайт с собственным форумом комментариев.Люди писали что-то на форуме, какую-то новость, и нашей задачей было это прокомментировать. Мы сделали это, разделившись на команды по три человека. Один из нас был бы «злодеем», человеком, который не согласен с форумом и критикует власти, чтобы привнести чувство подлинности в то, что мы делаем. Двое других вступают с ним в спор: «Нет, ты не прав, здесь все совершенно правильно». Один из них должен предоставить какую-либо графику или изображение, подходящее к контексту, а другой должен разместить ссылку на некоторый контент, который поддерживает его аргументы.Понимаете? Злодей, картинка, ссылка.

RFE / RL: Итак, вы все трое сидите вместе, договариваясь о том, кто и что будет делать в этом спектакле?

Буркхард: Да, это такой абсурд, который продолжается. Мы не разговариваем слишком много, потому что все заняты. Один комментарий не должен быть меньше 200 символов. Вы должны просто сидеть и печатать и печатать бесконечно. Мы не разговариваем, потому что можем сами видеть, что пишут другие, но на самом деле вам даже не нужно это читать, потому что все это ерунда.Новости пишутся, кто-то комментирует их, но я думаю, что настоящие люди вообще не утруждают себя чтением.

Вот так наша маленькая тройка путешествует по стране, останавливаясь на всех форумах, начиная с Калининграда и заканчивая Владивостоком. Мы создаем иллюзию реальной активности на этих форумах. Пишем что-то, отвечаем друг другу. Есть ключевые слова, теги, которые нужны поисковикам. Нам дают пять ключевых слов — например, «Шойгу», «министр обороны», «российская армия».«Все трое из нас должны следить за тем, чтобы эти ключевые слова появлялись повсюду в наших комментариях. Их нельзя даже спрягать или отклонять. Иногда очень сложно написать, когда вы не можете использовать какие-либо склонения!

Центр интернет-исследований Санкт-Петербурга

А ТИПОВОЕ ЗАДАНИЕ

Тема: Войска НАТО встроены в украинские вооруженные силы

Ключевые слова: новости украины, россия и украина, политика украины, украина, НАТО, ЧВК (частная военная компания)

Задача: Поднять эту тему на 35 муниципальных форумах

Работа начинается после того, как первоначальный пост, написанный троллем из другого отдела, публикуется в социальной сети LiveJournal под именем пользователя flcrbgrjn.В сообщении утверждается, что на стороне украинских солдат воюют иностранные наемники, а ссылается на видео , на котором изображены двое американских солдат в Мариуполе на юго-востоке Украины.

«Киевская хунта регулярно рассуждает в своих СМИ о России, и они беззастенчиво и безрассудно лгут. Они утверждают, что российские вооруженные силы сражаются на территории Украины, но отказываются предоставить какие-либо доказательства (потому что их нет). Но Когда дело доходит до украинских вооруженных сил, американские марионетки, окопавшиеся в Киеве, говорят, что нет никаких доказательств того, что в их ряды пополняются иностранные наемники и западные разведчики — они лгут и даже не краснеют!

Этот пост вскоре появится, согласно алфавитному списку, на городском форуме Астрахани.Затем Злодей-тролль, работающий под именем Yana24, начинает работу тройки, публикуя комментарий, который не соответствует сообщению flcrbgrjn:

«О каких наемниках НАТО вы говорите? Так они снимали там какого-то американца, и что? До сих пор непонятно, что они там делали. Россия, как обычно, обвиняет Украину в том, что она делает сама. Все говорили о вашем давным-давно владеете наемниками, а вы их до сих пор не вытащили! »

Затем Связной Тролль сердито отвечает Злодею, отвергая аргумент Яны24 и ссылаясь на второй отчет о предполагаемом присутствии американских солдат в Мариуполе:

«Вы вообще читали текст? Если вы в курсе темы, вы должны знать, сколько уже было предоставлено доказательств, свидетельствующих о том, что война на Украине продолжается, потому что Запад и Порошенко не хотят добиваться мира. .Они нашли вещи, принадлежавшие западным солдатам, и теперь они сами нашли солдат. Нашли ли они доказательства того, что российские войска находятся на Украине? Или сами войска? Нет! »

На очереди — Картинный тролль, который обвиняет Запад в лицемерии и добавляет демотиватор для дополнительного акцента:

«Запад настолько двуличен: в каждой дискуссии об украинском конфликте Запад обвиняет Россию, даже если она предоставляет украинским вооруженным силам солдат ЧВК, представляющих НАТО.Это политика двойных стандартов! »

Перевод: Украина, вставай! Юго-восток, присядь, не суетись и мирись с этим.

После Астрахани идет Бийск . А оттуда Брянск , Великий Новгород , Владивосток Волгоград , два форума в Воронеже , несколько общероссийских форумов — например Чупакабра — и, в конце, русский алфавит, Чита и Череповец .

Есть еще несколько комментариев, но тема улетает в топ Яндекс.

RFE / RL: Марат, можешь вспомнить самое странное или смешное задание, которое было дано твоей команде?

Буркхард: Самое смешное было, когда президент США Барак Обама жевал жвачку в Индии, а затем выплюнул ее. «Вам нужно написать 135 комментариев по этому поводу и не стесняться того, как вы выражаете себя. Пишите все, что хотите, просто втыкайте в него слово« Обама », а затем покрывайте его ненормативной лексикой.«В задании всегда есть вывод, который вы должны сделать, это уже написано, что Обама — черная обезьяна, которая ничего не знает о культуре. Вы засунете его в древнюю Индию, и он там жует жвачку. ощущение, что они готовы схватиться за любую мелочь. С другой стороны, это не смешно. Это абсурдно и переходит черту.

RFE / RL: Основная задача фабрики — писать на форумах посетителей , в частности форумы идеологических противников России.Кто так делает?

Буркхард: Есть украинское отделение, английское отделение. Они бомбардируют сайты CNN и BBC. У них свой тип целей — The New York Times, а не сайт города Самары. Нам, конечно, немного проще.

«Различные отделы особо не общаются, — говорит Марат Буркхард. «Дружба не поощряется. Система очень репрессивная. Если опоздаешь на минуту, уже штраф в 500 рублей». (файл фото)

RFE / RL: Вы знаете иностранные языки.Разве вам не предлагали должность в одном из иностранных ведомств?

Буркхард: Да. У меня было собеседование на факультете английского языка, но меня начали спрашивать о моих убеждениях, на что я ответил, что я аполитичен, я ничего не знаю, я ни за чем не следую. Видимо, на этом мои перспективы закончились. Чтобы устроиться с ними на работу, я должен был ответить, что следую определенным ходам мыслей. Заработная плата сотрудников со знанием иностранного языка больше 45 000 — это 65 000 и выше.

RFE / RL: А некоторые люди работают в социальных сетях — в частности, в Facebook?

Буркхард: Да, над Facebook работают особые люди. Всего около 40 комнат, в каждой сидит около 20 человек, и у каждого свои задания. Пишут и пишут весь день, и это не до смеха — за смех могут уволить. И поэтому каждый день любые новости делают свое дело — это может быть Обама, может быть [канцлер Германии Ангела] Меркель, может быть Греция, Северная Корея.

Молодые люди, выполняющие эту работу, едва ли способны сформулировать, что важно в этих историях. Даже политолог не может быть знатоком всего мира, а здесь люди должны писать обо всем. И как вы пишете, не имеет значения; можно похвалить или поругать. Вы только что ввели эти ключевые слова.

Затем, чтобы поднять политический контент, они посылают парня, чтобы он рассказал на злободневную тему, чтобы у сотрудников было хоть немного предыстории по этой теме.Но у самого парня крайне низкий уровень понимания, поэтому все это выглядит совершенно абсурдным. Между прочим, нам дали тест на идеологию, на 15-20 вопросов нужно было ответить. Любой, кто допустил пару ошибок, должен сдать экзамен повторно. Но любого, кто просто безнадежен, увольняют.

RFE / RL: Что они спрашивают на экзамене?

Буркхард: Например: «Что Россия хочет, чтобы произошло в Донецкой Народной Республике?» На это очень сложно ответить, и у вас всего два-три слова.Или, например, более простые вопросы типа «Кто такой Псаки?» (Примечание редактора: пресс-секретарь Госдепартамента Джен Псаки является частой мишенью российских троллей.)

RFE / RL: Тема Украины, вероятно, доминирует.

Буркхард: Да, они бросают все, что у них есть, на Украину.

RFE / RL: Как работает ваша тройка, когда задача — хвалить Россию, а не критиковать Украину или Америку?

Буркхард: Мне когда-то приходилось писать, что большинство немцев поддерживает политику Путина.Вот как было сформулировано задание: «Скажите, что большинство немцев поддерживает политику Путина и недовольны политикой Меркель». Откуда они это берут, не знаю, но я должен об этом написать. Забавно писать: «Большинство немцев …»

RFE / RL: У Злодея есть роль в таких заданиях?

Буркхард: Если что-то пропутинское, у Злодея будут сомнения. Например, на православное Рождество Путин пошел на мессу в обычную деревенскую церковь под Воронежем, и все вокруг было светло и приятно.Публикуется история в духе: «Как замечательно, как чудесно, как замечательно, какой он замечательный человек». Но Злодей не согласен: «Ну ладно, Путин поехал в Воронеж, чтобы повысить свою популярность у публики». На что мы отвечаем: «Что с тобой, о какой популярности ты говоришь? Да, он популярен, но ему не нужна популярность, он просто хочет встречаться с обычными людьми». Забавный пример.

Следующее назначение

Тема: Формирование позитивного отношения к внутренней политике Владимира Путина; Президент лично встретил Рождество с простыми россиянами.

Ключевые слова: президент рф, новости путина, политика путина, рождество, владимир путин

Опять же, задание начинается с публикации в аккаунте LiveJournal . Посту о Путине предшествует отрывок из стихотворения Марины Цветаевой «Грешно парить над златоглавой часовней и не молиться в ней», что в данном контексте, кажется, приобретает двоякий смысл.

Рождество объединяет!

Наступает светлый праздник Рождества Христова.И в такой чудесный день, объединяющий всех граждан России — верующий вы или, как говорят, «нецерковный» — на пути к Господу президент России В.П. был, как всегда, с народом! Где еще, как не в провинции, вдали от городской суеты и суеты, можно по-настоящему пережить этот священный день? Так, в этом году Владимир Путин посетил сельскую церковь в честь Пресвятой Богородицы, расположенную под Воронежем в селе Отрадное. И в такой праздник, один из главных праздников в России (да и во всей христианской церкви), в такое непростое время президент был с народом и поздравил всех священнослужителей и верных прихожан!

На форуме Барнаул Link Troll начинает с похвалы и ссылается на на новости 31 декабря.ru, Путин поздравляет Обаму и напоминает ему о принципах взаимного уважения.

«Отличная статья! Кстати, президент России также поздравил американского президента, канцлера Германии и других западных политиков с наступлением Нового года. Его следует похвалить за то, что он выражает свои мирные намерения и проводит нормальную политику — кое-что этого трудно добиться от Барака Обамы ».

Злодейский тролль появляется в ярости:

«А что такого удивительного вы нашли в его рождественском послании ??? Я не понимаю !!! Владимир Путин — обычный человек !! Ну и что, если он президент ?? Если я попаду на телевидение и желаю всем хорошего Рождества, напишете ли вы и обо мне хорошую статью ??? Наконец-то мы нашли, о чем поговорить! »

Картинный тролль публикует фотографию Путина в церкви и возражает:

«Это идиотизм! Путин — наш президент.И действительно здорово, что он пошел в сельскую церковь, чтобы всех поздравить с праздником. Рождество — это чудо. Я завидую прихожанам. Мне бы очень хотелось побывать там в тот великий праздник ».

В другом месте, на форуме Yekaterinburg , злодей-тролль нападает на рождественское появление Путина как на трюк, направленный на то, чтобы отвлечь общественность от огромных экономических проблем страны:

«Подари своему соседу в этом году мешок гречки !! Вот это доброе дело !!! Владимир Путин олицетворяет все, что нас ждет в будущем !! Он просто пошел помолиться за свою задницу и попросить прощения.Он загнал страну прямо в ад, и что теперь ему делать ??? Молитесь, и все! »

Картинный тролль делает суровый выговор, иллюстрированный буколической фотографией с места происшествия:

«Господи, ваш язык! Рождество — праздник благословенный, а вы тут ругаетесь. Это того не стоит. Гречки хватит на всех, наша страна переживет антироссийские санкции, без проблем. Так что поздравляю всех с Светлого праздника и желаю всем мира и добра.Особенно ВАС! »

Таким образом, тройка за день обыскивает 35 форумов.

RFE / RL: Были ли люди когда-либо уволены за идеологические ошибки?

Буркхард: Да, были. Одного человека уволили прямо на глазах. У меня тоже были проблемы. Мультфильмов так много, что однажды я ошибся и поставил карикатуру на Януковича вместо карикатуры на Порошенко. А над Януковичем смеяться нельзя; Янукович — один из хороших парней.Меня сразу позвали на ковер: «Как ты посмел? Ты правда не знал, что это Янукович?» Все это происходит с ужасно серьезными лицами. Там куча менеджеров, которые постоянно следят за всеми и следят за ними.

RFE / RL: А менеджеры кто?

Буркхард: Люди из Internet Research, которые были там долгое время и, очевидно, продвинулись вверх. Заработок у них, кстати, в два раза выше. Мне довелось увидеть зарплату, и я просто ужаснулся — 70 000-80 000 рублей за то, что прочитал ту чушь, которую пишу, и погрозил мне пальцем, если я ошибаюсь.

RFE / RL: Так кто занимается этой работой? Есть ли там люди, которые искренне хотят сразиться с Обамой или Меркель из-за Донецкой Народной Республики?

Буркхард: Да, такие люди действительно есть. Это самое ужасное: во время обеденного перерыва есть что-то вроде кафетерия с торговыми автоматами и кофе, и вы слышите, как люди, которые целый день пишут об этих вещах, вместо того, чтобы пить кофе и говорить о чем-то другом, они начинают неистово пенить изо рта об одном и том же.Еще кое-что нужно доказать. Итак, есть фанатики.

Но основное большинство — это просто молодые люди, которые хотят зарабатывать деньги. Они настолько политически безграмотны, что Путин, Обама … Они не знают разницы. Конечно, все они за Путина, но абсолютно политически безграмотны. «Что бы нам ни говорили, мы напишем об этом, не задавая вопросов, и мы не хотим знать».

RFE / RL: Встречались ли вы с людьми из других отделов?

Буркхард: Различные отделы особо не общаются.Дружба не поощряется. Система очень репрессивная. Если опоздаешь на минуту, уже штраф 500 рублей. Сотрудники находятся под постоянным давлением. За малейшее отклонение взимается штраф. Вы постоянно находитесь под угрозой увольнения, вам постоянно приказывают. Это не очень цивилизованная атмосфера.

RFE / RL: Вас уволили или вы сами решили уйти?

Буркхард: Я решил сам, потому что не могу заниматься абсурдной работой.С точки зрения жизненного опыта я понял, и продолжать не имело никакого смысла — все это абсурд. Я не разделяю эту идеологию, я категорически против, находился во вражеском лагере. Двух месяцев хватило, чтобы понять, как там все делается. Продолжать работать не имело смысла даже из-за денег, потому что это такой тяжелый труд, что — просто забудьте об этом, забудьте о деньгах. Только не заставляй меня больше туда ходить.

Между прочим, всякий раз, когда появляется журналист и пытается войти или что-то спросить, они переходят в состояние повышенной готовности.Все шторы закрыты. Нам всем запрещено выходить на улицу днем. Они очень боятся журналистов.

RFE / RL: Но утечек все еще много. На прошлой неделе три человека дали нам интервью. Это как пародия на роман Оруэлла.

Буркхард: Да, верно, министерство правды. Вы работаете в Министерстве правды, которое является Министерством лжи, и все верят в эту правду. Да, ты прав, это Оруэлл.

Система определения слов для русского языка, основанная на распознавании непрерывной речи с большим словарным запасом и лингвистических знаниях

В статье описаны ключевые концепции системы определения слов для русского языка, основанной на распознавании слитной речи с большим словарным запасом.Описаны основные алгоритмы и настройки системы, в том числе алгоритм изменения произношения, а также представлены результаты экспериментов на реальных телекоммуникационных данных. Приведено описание архитектуры системы и пользовательского интерфейса. Система основана на платформе распознавания речи с открытым исходным кодом CMU Sphinx, а также на лингвистических моделях и алгоритмах, разработанных Speech Drive LLC. Эффективное сочетание методов базовой статистики, реальных данных обучения и интенсивного использования лингвистических знаний привело к качественному результату, применимому к промышленному использованию.

1. Введение

Необходимость понимать тенденции бизнеса, обеспечивать общественную безопасность и повышать качество обслуживания клиентов вызвала устойчивое развитие систем речевой аналитики, которые преобразуют речевые данные в измеримый и доступный для поиска указатель слов, фраз и паралингвистические маркеры. Технология определения ключевых слов составляет существенную часть таких систем. Современные системы определения ключевых слов обычно используют один из трех подходов, а именно поиск по фонетической решетке [1, 2], модели на основе слов [3, 4] и распознавание речи с большим словарным запасом [5].Хотя у каждого из подходов есть свои плюсы и минусы [6], последний начинает проявляться из-за общедоступности базовых алгоритмов, более дешевого оборудования для выполнения интенсивных вычислений, требуемых в LVCSR, и, что наиболее важно, высококачественных результатов.

Совсем недавно был предложен ряд инновационных подходов к обнаружению разговорных терминов, таких как различные комбинации систем распознавания и нормализация оценок, сообщающих о 20% -ном повышении качества обнаружения разговорных терминов (измеряется как ATWV) [7, 8].Применение глубоких нейронных сетей в LVCSR начинает получать широкое распространение [9]. Благодаря программе IARPA Babel, направленной на создание систем, которые могут быть быстро применены к любому человеческому языку, чтобы предоставить аналитикам эффективные возможности поиска для эффективной обработки огромных объемов записанной речи реального мира [10], в последние годы были проведены обширные исследования. разработать технологии для систем определения разговорных терминов для языков с ограниченными ресурсами. Например, [11] описывает подход к обнаружению ключевых слов на кантонском диалекте, основанный на распознавании речи с большим словарным запасом, и показывает положительные результаты применения нейронных сетей для восстановления решетки распознавания.Ссылка [12] содержит подробное описание современных методов, используемых для создания системы определения ключевых слов для 10 языков с ограниченными ресурсами, в основном на ассамском, бенгали, гаитянском креольском, лаосском и зулусском. Акустические модели глубинной нейронной сети используются как в качестве экстрактора признаков для системы HMM на основе GMM, так и для вычисления апостериорных состояний и преобразования их в масштабированные вероятности путем нормализации по апостериорным состояниям. Предлагается увеличение объема данных за счет использования многоязычных узких мест (эта тема также рассматривается в [13]).Наконец, не зависящие от языка и неконтролируемые акустические модели обучаются для языков без обучающих данных. Среднее значение MTWV для этих языков колеблется от 0,22 для зулу до 0,67 для гаитянского креольского. В [14] описано использование рекуррентных нейронных сетей для определения слов в реальном времени на примере английского языка. По сравнению с более распространенными системами на основе текста, этот подход использует устные примеры ключевого слова для построения модели на основе слов, а затем выполняет поиск в речевых данных.В качестве альтернативы гибридным подходам ANN-HMM авторы [15] предлагают основанную на чистом NN систему поиска по ключевым словам для разговорной телефонной речи на вьетнамском и лаосском языках. Для вьетнамцев «чистая» система NN обеспечивает ATWV, сравнимую с таковой для базовой гибридной системы, при этом работая значительно быстрее (коэффициент реального времени 3,4 против 5,3 для гибридной системы).

Поскольку качественное языковое моделирование является неотъемлемой частью любой современной системы определения ключевых слов, сейчас много усилий направлено на улучшение LM.Одна из последних тенденций — использование веб-данных в обучении. Появление Интернета предоставило большое количество данных, которые стали легко доступными для сообщества специалистов по распознаванию речи [16]. Это представляет особый интерес для языков с низким уровнем ресурсов, и среди последних улучшений [17] предлагается подход, позволяющий эффективно справляться с проблемой нормализации и фильтрации веб-данных для обнаружения ключевых слов. Предлагаются два метода: один с использованием ранжирования по степени сложности, а другой с использованием определения слов вне словарного запаса.Это привело к абсолютному улучшению ATWV более чем на 2% по 5 языкам с ограниченными ресурсами. Ссылка [18] охватывает аспект дополнения базовых LM тщательно подобранными веб-данными, показывая, что блоги и субтитры фильмов более актуальны для языкового моделирования разговорной телефонной речи и помогают добиться значительного сокращения ключевых слов вне словарного запаса.

Российские исследования в области распознавания речи соответствуют мировым научным трендам. Однако следует отметить, что чаще всего исследования проводятся для достижения более общей цели — создания систем LVCSR как таковых без особого акцента на обнаружении разговорных терминов.К наиболее известным системам относятся Yandex SpeechKit [19], используемый для распознавания голосовых поисковых запросов через веб и мобильные приложения, систему распознавания речи в реальном времени от Speech Technology Center [20], используемую для расшифровки речи в новостях вещания, систему LVCSR, разработанную СПИИРАН [21, 22], применяемый для распознавания речи в мультимодальных средах, и система распознавания речи НИИ Спецвузавтоматика [23], основанная на глубоких нейронных сетях.

В данной статье представлены результаты текущих исследований, лежащих в основе коммерческого программного обеспечения для анализа речи.Дизайн программного обеспечения следует концепции минимально жизнеспособного продукта, что мотивирует постепенное усложнение технологии по мере развития продукта. Такой подход побудил нас полагаться на общедоступные инструменты с открытым исходным кодом и ряд легкодоступных основанных на знаниях методов, разработанных в ходе наших предыдущих исследований.

В разделах 2 и 3 описывается общая схема применения технологии LVCSR для определения ключевых слов для русской телефонной разговорной речи, включая ключевые параметры системы и описание экспериментов, проводимых для оценки качества и производительности системы.Особое внимание уделяется языковым компонентам, используемым на этапе обучения и проверки. В разделе 4 описана стандартная система анализа речи, разработанная с использованием идей и результатов, обсуждаемых в этой статье.

2. Ключевые параметры системы

Система, описанная в статье, предназначена для использования для поиска по ключевым словам в разговорной речи по телефону. Система предоставляется как в виде SDK для интеграции с системами записи речи, так и в виде отдельного приложения MS Windows.Система создана на базе CMU Sphinx [24]; эта структура была выбрана из-за ее простоты и модели лицензирования, которая позволяет свободно использовать код в коммерческих приложениях. Следуя идее минимально жизнеспособного продукта, мы в основном используем стандартные настройки для всех модулей системы. В акустическом интерфейсе используются 13 MFCC с их производными и ускорением; Акустические модели непрерывной плотности для трифонов обучаются примерно на 200 часах русской речи телефонного качества (8 кГц, 8 бит, моно), записанной 200 носителями языка.HMM с 5 состояниями используются с диагональной ковариационной матрицей, а алгоритм CART (деревья классификации и регрессии) используется для кластеризации акустических моделей в 9000 сенонов, каждый из которых описывается 10-30 гауссианами. Тексты в обучающей базе данных для языковых моделей автоматически транскрибируются морфологическим и контекстным лингвистическим процессором [25]. Применяется набор правил вариации транскрипции. Языковые модели униграммы и биграммы обучаются на сотнях тысяч современных русских электронных книг, широко доступных в Интернете.Декодер использует стандартный алгоритм передачи токенов CMU Sphinx с методами отсечения, широко используемыми в настройке системы, включая максимальную ширину луча, штраф за вставку слова и штраф за акустическую правдоподобие.

Основная новизна системы заключается в широком использовании лингвистических знаний как на этапе обучения, так и на этапах определения разговорного термина. В системе используется лингвистический процессор со встроенной информацией о морфологии русского языка, который помогает генерировать высококачественные транскрипции для любых словоформ и, таким образом, обучать более жизнеспособные акустические модели.Один и тот же процессор используется для генерации различных форм слов, что обеспечивает лучшее обнаружение произносимых терминов на этапе определения. Основанный на правилах алгоритм вариации транскрипции применяется для генерации альтернативных последовательностей фонем. В конечном итоге на этапе моделирования языка тексты автоматически предварительно фильтруются по типу текста, чтобы в учебном корпусе оставались только диалоги.

3. Алгоритмы, связанные с ними проблемы и решения
3.1. Acoustic Front-End

Хотя во всей системе используются стандартные MFCC, потребовались дополнительные усилия, чтобы заставить интерфейс работать для определения ключевых слов в реальном приложении.Сначала аудиофайлы, подлежащие анализу, разбиваются на 10-секундные фрагменты, чтобы разделить процесс декодирования на несколько процессоров. Перекрытие в 1 секунду используется для гарантии того, что ключевое слово не будет усечено между двумя последующими речевыми сегментами. Далее применяется алгоритм синтаксического анализа для объединения результатов частичного декодирования в один файл, чтобы избежать избыточных ложных срабатываний. В планах на будущее использование VAD для разделения аудиопотока на фразы, которые лучше подходят для подхода на основе LVCSR, используемого в этой статье; однако наша текущая реализация VAD показала худшие результаты, отсюда и использование кусков одинаковой длины.

3.2. Акустическое моделирование, преобразование графемы в фонемы и алгоритм вариации транскрипции

Система, обсуждаемая в статье, предназначена для использования в реальной телефонной среде в условиях низкого качества звука. Чтобы удовлетворить это требование, акустическая модель обучается на реальных данных, встречающихся с речью качества телефонного канала в российских телефонных сетях. Используются HMM непрерывной плотности, в результате чего получается репрезентативный набор из 9000 сенонов, каждый из которых описывается GMM с 10–30 компонентами.

В рамках нашего предыдущего исследования [25] был разработан лингвистический процессор, который использует информацию о морфологических характеристиках около 600 000 русских слов (см. Структуру на Рисунке 1) для расшифровки слов и создания форм слов. Процессор анализирует текст и определяет часть речи для каждого слова в предложении; затем определяется словесное ударение и применяется набор заранее запрограммированных контекстных правил преобразования графемы в фонемы для получения канонической («идеальной») транскрипции слова.

В настоящее время в области транскрибирования слов в системах распознавания речи используются статистические преобразователи графемы в фонемы [26, 27]. Были проведены исследования по объединению различных методов, например, в [28] Условные случайные поля и Joint-Multigram Model используются для дополнительного улучшения качества. Были проведены исследования [29, 30] по введению взвешенных преобразователей конечного состояния для определения вероятностей внутрисловных фонетических последовательностей. В целом эти исследования очерчивают ключевые преимущества вероятностного подхода по сравнению с методами, основанными на знаниях, а именно: независимость от языка (легко переносится на новый язык), способность обобщать и обеспечивать транскрипцию новых слов (вне словарного запаса) и необходимость меньшего объема лингвистических данных (и, следовательно, усилий) для обучения преобразователя графемы в фонемы.

С другой стороны, большинство результатов, представленных в цитируемых исследованиях, относятся к языкам, для которых характерно небольшое количество словоформ (например, английский и французский). Между тем русский язык — это язык с высокой степенью флективности, в котором ударение в словах зависит от точной словоформы в парадигме, а высокая частота омонимии также влияет на ударение слов и, таким образом, является источником потенциальных ошибок транскрипции [31]. Это означает, что для обучения качественного вероятностного преобразователя графемы в фонемы для русского языка требуется гораздо больший словарный запас, созданный вручную.Это препятствие вместе с концепцией минимально жизнеспособного продукта, описанной выше, побудило нас установить вероятностное преобразование графемы в фонемы в качестве цели для наших будущих исследований и вместо этого использовать легкодоступный высококачественный лингвистический процессор, основанный на знаниях. Другим важным фактором, который повлиял на этот выбор, является способность устранять неоднозначность омонимии и генерировать словоформы (будет обсуждаться позже).

Ключевым элементом процесса обучения акустической модели является вариация транскрипции.Каждая фраза, используемая для обучения моделей, получает несколько альтернативных транскрипций с применением набора предопределенных лингвистических правил. Затем на этапе обучения обучающий модуль CMU Sphinx выбирает лучшую альтернативу, которая максимизирует ожидания. Эксперименты показали абсолютное увеличение скорости обнаружения ключевых слов на 4% благодаря такой реализации (подробнее об экспериментах см. В разделе 4). На данный момент правила выводятся вручную на основе лингвистических знаний. Список правил затем внедряется в распознаватель, который запускается в наборе обучающих данных, чтобы определить, какие правила обеспечивают улучшение качества и должны храниться в производственной системе.В качестве следующего шага нашего исследования мы планируем разработать достаточный корпус для автоматического обучения этим правилам.

Окончательный список правил вариации транскрипции, выбранных на обучающем наборе, содержит 30 контекстных отображений фонемы в фонемы и графемы в фонемы, основанные как на современных исследованиях русской спонтанной речи [32], так и на собственных экспериментах авторов. с аудиоанализом реальных данных. Основные этапы алгоритма вариации транскрипции описаны ниже (см. Также рисунок 2): (1) Загружается текстовая аннотация обученной базы данных.(2) Если слово отсутствует в лексике (используется в основном для иностранных слов и именованных сущностей), запускается автоматический транскрибер, который использует оцифрованный словарь русского языка, содержащий 600 тысяч слов с морфологической информацией и частью -speech (POS) теггер. В результате этого этапа словесное ударение присваивается правому слогу каждого слова. (3) Автоматическая или каноническая транскрипция генерируется путем применения контекстно-зависимых правил передачи букв на телефон. (4) Вариация произношения выполняется с помощью итеративное применение отдельного набора правил моделирования транскрипции фонема-фонема и графема-фонема к канонической транскрипции.

Хорошо известно, что правила, основанные на знаниях, будучи «лабораторными» по своему происхождению, могут оказаться неадекватными при сопоставлении с реальными данными. Однако это было нашим намерением проверить это важное предположение на нашем тестовом материале. Более того, за последние десятилетия в русской фонетике произошел общий сдвиг от лабораторной речи к полностью спонтанной [32, 33], а правила, которые мы используем, основаны на обширных исследованиях характеристик спонтанной речи.

Правила делятся на две основные группы.Первый содержит правила замены, удаления и вставки, которые применяются к исходной фонетической транскрипции. Вот несколько примеров таких правил: (i) [@] («schwa»), за которым следует согласный, удаляется в безударной позиции после ударного слога. (Ii) [f] удаляется из последовательности согласных [fs] + (любой) глухой согласный. (iii) Аффрикаты [c] и [t ‘] заменяются фрикативными [s] и [], соответственно (знак j означает, что согласный является палатализованным). (iv) Sonorant [j ] удаляется перед безударной гласной в начале слова.(v) Шумовые остановки (например, [p], [t], [] и []) удаляются в последней позиции после гласных из-за имплозивного произношения (т.е. без всплеска после закрытия артикуляторов).

Вторая группа правил использует как морфологический, так и орфографический уровень языковой репрезентации. Следовательно, это не исправление исходной транскрипции (правила преобразования фонемы в фонемы), а отдельный набор правил преобразования графемы в фонемы. Вот несколько примеров: (i) [@ j @] и [uju] в безударных склонениях прилагательных «–ая» и «–ую» заменяются на [@e] и [u] соответственно.(ii) [@ v @], [ ɨ v @] и [iv @] в безударных наклонениях существительных «–ого» и «–eго» заменяются на [@@], [ ɨ @], и [i @]. (iii) [@ t] в склонении глагола «–ат» заменяется на [ ɨ t].

Для часто используемых слов мы также добавили еще один набор правил, которые обеспечивают упрощенное произношение, характерное для неформальной спонтанной речи. К ним относятся удаление [] и [v] в интервокальной позиции, изменение [] на [] и так далее.

3.3. Языковые модели и выбор соответствующего контента для их обучения

Изначально языковые модели были обучены с использованием нескольких гигабайт пользовательского контента, который можно найти в Интернете, включая общедоступные форумы, социальные сети и чаты.Идея заключалась в том, чтобы такой контент лучше отражал спонтанную речь и, таким образом, обеспечивал более устойчивые результаты поиска ключевых слов. Однако эксперименты показали, что такой лингвистический материал имел существенный недостаток, потому что он содержал огромное количество орфографических ошибок, которые привели к статистическому смещению и появлению неправильных лемм в лексиконе. Поэтому было принято решение полагаться на стандартные и безошибочные тексты, взятые из широкого спектра книг разных жанров, доступных в Интернете.Только книги современных авторов (1990-х годов и позже) были отобраны, чтобы отразить современные черты русской речи. Однако из таких книг были извлечены только диалоги, чтобы гарантировать «живой» стиль общения, характерный для реальной телефонной речи. В результате было использовано 2 ГБ необработанных текстовых данных для обучения моделей языка униграмм и биграмм, содержащих 600 000 лемм на русском языке. LM обучались с использованием инструментария SRILM [34] с применением алгоритма дисконтирования Гуд-Тьюринга.

Текущие исследования в области языкового моделирования сосредоточены на применении глубоких нейронных сетей и высокоуровневого восстановления LM [35].В нашем случае данных для обучения таких моделей недостаточно, что побудило нас перейти к более простым моделям. Как указано в Разделе 3.4, мы не полагаемся на наиболее вероятную последовательность слов в результате распознавания для обнаружения ключевых слов; скорее мы хотим сгенерировать столь же разнообразную и «грубую» решетку на этапе индексации, чтобы гарантировать высокую вероятность обнаружения произносимого термина. Простое моделирование языка биграмм / униграмм вполне подходит для этой цели.

3.4. Декодирование, определение слов и автоматическое создание словоформ

Основная идея использования LVCSR для поиска ключевых слов состоит в преобразовании речевого сигнала в простой текст и последующем поиске слова в этом тексте.Однако из-за разнообразия типов контекста связи в разговорной речи по телефону нецелесообразно использовать лучший результат декодирования как таковой. Скорее, имеет смысл проанализировать полученную решетку распознавания, чтобы найти все возможные узлы с ключевым словом. Следовательно, речь сначала индексируется в решетках распознавания; поиск по ключевым словам выполняется по запросу на более позднем этапе.

Для улучшения результатов поиска мы интенсивно используем лингвистический процессор, описанный выше. Когда слово вводится в качестве поискового запроса, его формы автоматически генерируются путем обращения к морфологическому словарю (см. Рисунок 1), и для слова выводится набор вариантов, которые затем ищутся в решетке и появляются в списке результатов распознавания.Например, когда нужно искать слово «кусок» (русское слово для «кусок»), все слова, содержащие эту последовательность, будут найдены в решетке распознавания; следовательно, пользователь сможет заметить слова «куска», «куском» и т. д. Поскольку русский язык является флективным, для одного слова доступно множество форм. Следовательно, модели языка низкого порядка (униграмма и биграмма), используемые в нашей системе, заставляют распознаватель делать ошибки в окончаниях слов. Описанная выше простая идея помогает избежать ошибок и добиться гораздо лучших результатов.

4. Результаты экспериментов

Система, описанная здесь, предназначена для использования в реальных приложениях для анализа речи телефонного качества. Для тестирования была записана 10-часовая база данных, включающая записи диалогов около 50 спикеров с использованием аппаратного и программного обеспечения ООО «СпРекорд» (http://www.sprecord.ru/). В базе данных выполняется поиск по 1183 различным ключевым словам. Отношение сигнал / шум составляет от 5 до 15 дБ, что отражает неблагоприятные условия реального телефонного канала.

Максимальное взвешенное по сроку значение (MTWV) — это прогнозируемая метрика, соответствующая наилучшему TWV для всех значений порога принятия решения; θ (см. Формулу (1)) и показатели коэффициента реального времени (RTF) (формула (2)) используются для оценки производительности системы; Первый показатель отражает качество распознавания слов, а второй — его скорость. Параметр RTF рассчитан на 1 модуль ЦП с тактовой частотой 3 ГГц. Результаты показаны в таблице 1. — это порог, используемый для определения попадания или промаха, и это вес, который учитывает предполагаемую априорную вероятность термина, а относительная стоимость промахов и ложных тревог равна 0.999 в нашем исследовании. время, затраченное на обработку файла, и продолжительность набора тестов.

3

9 Чтобы понять, соответствуют ли эти результаты современному уровню техники, мы сравнили их с результатами другой научной группы по обнаружению разговорных терминов в телефонном разговоре на другом языке с ограниченными ресурсами (кантонском) [11].Мы увидели, что наши результаты с точки зрения качества поиска по ключевым словам находятся между результатами, полученными для кантонского диалекта, когда GMM используются в акустической модели, и немного хуже при использовании глубоких нейронных сетей (MTWV 0,335 и 0,441 соответственно). Что касается фактора реального времени, наши результаты превосходят результаты, представленные в [14], что может быть связано с относительно небольшим количеством гауссиан, которые мы используем в персоне.

5. Архитектура системы и пользовательский интерфейс
5.1. Основные компоненты

Алгоритмы, описанные в разделе 2, были использованы при создании программного обеспечения «ANALYZE» — промышленной системы анализа речи.На рисунке 3 показаны основные компоненты системы: сервер обнаружения слов, терминал и репозиторий данных. Сервер обнаружения слов обрабатывает речевые данные и сохраняет индекс с позициями искомых ключевых слов в базу данных. Терминал используется для планирования или запуска немедленных поисковых запросов и для просмотра результатов поиска. Поиск выполняется в два этапа: сначала для каждого волнового файла формируется решетка с результатами распознавания речи; во-вторых, ключевое слово находится с помощью поиска подстроки в этой решетке.Хранилище данных содержит как речевые файлы, так и соответствующие индексы.

5.2. Пользовательский интерфейс

Ключевые проблемы взаимодействия человека с машиной в системах анализа речи, включая точную обработку результатов обнаружения ключевых слов, и роль в оптимизации рабочих процессов в современных организациях отражены в [36–39]. На рисунке 4 показан пользовательский интерфейс программного обеспечения ANALYZE, которое было разработано на основе сценариев использования, проверенных конечными пользователями.Удобство использования и целостность вариантов использования были протестированы в реальной среде. Все настройки доступны в 1-2 клика; отчетность в реальном времени отображается на экране; Панель навигации обеспечивает доступ ко всем необходимым функциям. Таблица 1 с результатами поиска предоставляет простые режимы фильтрации и прослушивания. На рисунке 3 представлена ​​основная плата пользовательского интерфейса системы.

Существенным преимуществом программного обеспечения является возможность работы в режиме реального времени на рабочих станциях с ограниченными ресурсами, что делает его подходящим для небольших организаций с небольшой долей используемых телефонных линий.

6. Заключение и дальнейшие планы

В этой статье описана система определения ключевых слов для русского языка на основе LVCSR. Общедоступность программного обеспечения с открытым исходным кодом облегчила внедрение, а лингвистические модули помогли улучшить качество системы, а репрезентативные данные обучения и тестирования обеспечили применимость системы к реальным проблемам.

Текущее исследование направлено на дальнейшую настройку акустических и языковых моделей, опробование вероятностных структур для преобразования графемы в фонемы, изменение транскрипции на основе данных, введение компенсации шума и обнаружения пауз во внешний интерфейс, а также на создание конкретных критериев достоверности чтобы свести к минимуму ложные срабатывания, вызванные частыми словами в языковой модели.

При создании нашей автоматизированной системы определения ключевых слов, основанной на распознавании непрерывной речи с большим словарным запасом, мы опирались на результаты научного сообщества, а именно на программное обеспечение с открытым исходным кодом CMU Sphinx для акустического моделирования и декодирования и SRILM для языкового моделирования. В то же время система имеет несколько технологических преимуществ: использование лингвистических знаний при обучении и декодировании, а именно морфологический синтаксический анализатор текстов и вариации транскрипции для генерации транскрипции слов, правила вариации транскрипции и автоматическая генерация словоформ на этапе выделения. ; реальные промышленные данные, используемые для обучения акустических моделей; точное языковое моделирование достигается за счет осторожного выбора обучающих данных; режим работы в реальном времени на ограниченных ресурсах компьютера.

Мы считаем, что высококачественная автоматизированная система определения ключевых слов, основанная на распознавании непрерывной речи с большим словарным запасом для анализа речевых данных в режиме онлайн, может использоваться как в качестве технологической платформы для создания эффективных интегрированных систем мониторинга, так и в качестве готового решения для мониторинга. глобальное информационное пространство.

Конкурирующие интересы

Авторы заявляют, что у них нет конкурирующих интересов.

Благодарности

Авторы хотели бы поблагодарить руководство SpRecord LLC за предоставление реальных данных о качестве телефона, используемых при обучении и тестировании системы определения ключевых слов, описанной в этой статье.

Оценка влияния Российского агентства интернет-исследований на политические взгляды и поведение американских пользователей Twitter в конце 2017 года

Значимость

Несмотря на то, что в многочисленных исследованиях анализируется стратегия онлайн-кампаний влияния, их влияние на общественность остается открытым вопросом. Мы исследуем этот вопрос, комбинируя данные о 1239 республиканцах и демократах с конца 2017 года с данными в Twitter-аккаунтах, управляемых Российским агентством интернет-исследований.Мы не находим доказательств того, что взаимодействие с этими аккаунтами существенно повлияло на 6 политических взглядов и поведения. Говоря описательно, взаимодействия с троллями были наиболее распространены среди людей, которые часто используют Twitter, имеют сильные «эхо-камеры» в социальных сетях и большой интерес к политике. Эти результаты говорят о том, что американцы могут быть непросто восприимчивы к онлайн-кампаниям влияния, но оставляют без ответа важные вопросы о влиянии российской кампании на дезинформацию, политический дискурс и динамику президентской избирательной кампании 2016 года.

Abstract

Широко распространено беспокойство по поводу того, что Россия и другие страны начали кампании в социальных сетях, направленные на усиление политических разногласий в Соединенных Штатах. Хотя растет число исследований, анализирующих стратегию таких кампаний, пока неизвестно, как эти усилия повлияли на политические взгляды и поведение американцев. Мы изучаем этот вопрос, используя лонгитюдные данные, описывающие отношение и поведение в Интернете 1239 республиканских и демократических пользователей Twitter с конца 2017 года, объединенные с закрытыми данными о Российском агентстве интернет-исследований (IRA) из Twitter.Используя модели байесовского дерева регрессии, мы не находим доказательств того, что взаимодействие со счетами IRA существенно повлияло на 6 различных показателей политического отношения и поведения за период в 1 месяц. Мы также обнаружили, что взаимодействие с учетными записями IRA было наиболее распространено среди респондентов с сильной идеологической гомофилией в своей сети Twitter, высоким интересом к политике и высокой частотой использования Twitter. В совокупности эти результаты предполагают, что русские тролли, возможно, не смогли посеять раздор, потому что они в основном взаимодействовали с теми, кто уже был сильно поляризован.В заключение мы обсудим несколько важных ограничений нашего исследования, особенно нашу неспособность определить, повлияли ли аккаунты IRA на президентские выборы 2016 года, а также его значение для будущих исследований кампаний влияния в социальных сетях, политической поляризации и вычислительной социальной науки.

Хотя когда-то ученые отмечали потенциал социальных сетей в демократизации общественного дискурса о политике, растет беспокойство по поводу того, что такие платформы способствуют нецивилизованному поведению (1–4).Относительно анонимный характер взаимодействия в социальных сетях не только снижает последствия невежливости, но также позволяет пользователям социальных сетей выдавать себя за других, чтобы создать социальную рознь (5). Хотя такие уловки являются обычным явлением в Интернете, растет тревога по поводу скоординированных кампаний России и других стран по разжиганию политической поляризации в Соединенных Штатах. Сообщается, что в этих кампаниях участвуют огромные армии в социальных сетях, которые выдают себя за американцев и усиливают дебаты по вызывающим разногласия социальным вопросам, таким как иммиграция и контроль над огнестрельным оружием (6-8).

Это исследование дает предварительную оценку того, как кампания влияния правительства России в социальных сетях повлияла на политические взгляды и поведение американских пользователей Twitter в конце 2017 года. По данным разведывательного комитета Сената США, Россия использовала платформы социальных сетей для атак на свои политические противники с 2013 года под эгидой организации, известной как Агентство интернет-исследований (IRA). Ученые утверждали, что эти кампании против Соединенных Штатов были многогранными и, в частности, были разработаны, чтобы «использовать раскол в обществе, стереть границы между реальностью и вымыслом, подорвать… доверие к средствам массовой информации… и к самой демократии» (9).Быстро расширяющаяся литература исследует широту и глубину активности ИРА в социальных сетях, чтобы получить представление о российских стратегиях социального влияния (6, 7, 9). Тем не менее, насколько нам известно, ни в одном исследовании не изучалось, действительно ли эти усилия повлияли на отношение и поведение американской общественности (10, 11). Наше исследование — первая попытка восполнить этот пробел в исследованиях.

Народная мудрость свидетельствует о том, что российская кампания в социальных сетях оказала глубокое влияние на политические взгляды и поведение американской общественности.Возможно, это связано с огромным масштабом и очевидной изощренностью этой кампании. Только в 2016 году IRA выпустила более 57000 сообщений в Twitter, 2400 сообщений в Facebook и 2600 сообщений в Instagram, а в 2017 году их количество значительно увеличилось (6). Существуют также неофициальные данные о том, что аккаунтам IRA удалось вдохновить американских активистов на участие в митингах (12). Масштабы этих усилий побудили The New York Times описать российскую кампанию как «Перл-Харбор эпохи социальных сетей: необычный акт агрессии, положивший начало эпохе расширенного конфликта» (13).

Исследования, посвященные содержанию российской кампании в социальных сетях, показывают, что она была в первую очередь предназначена для ускорения политической поляризации в Соединенных Штатах путем сосредоточения внимания на вызывающих разногласия вопросах, таких как жестокость полиции (14, 15). По данным Stella et al. (8), такие усилия «могут глубоко повлиять на восприятие реальности, влияя на поведение миллионов людей при голосовании. Следовательно, управление динамикой общественного мнения путем распространения поддельного контента в онлайн-экосистемах является эффективным способом взлома социальных сетей.”Howard et al. (6) аналогичным образом утверждают, что «данные IRA в Твиттере показывают длительную и успешную кампанию, в результате которой фальшивые учетные записи эффективно вплетались в ткань политических разговоров в США вплоть до их приостановки. Каждый из этих встроенных ресурсов нацелен на конкретную аудиторию, которой они стремились манипулировать и радикализировать, причем некоторые из них получают значимое влияние в онлайн-сообществах после месяцев поведения, направленного на то, чтобы сочетать их деятельность с деятельностью настоящих и очень заинтересованных пользователей США.Такие выводы в значительной степени основаны на качественном анализе контента, создаваемого учетными записями IRA, и подсчете количества раз, когда пользователи Twitter взаимодействовали с сообщениями IRA.

Однако то, что значительные группы населения взаимодействовали с сообщениями ИРА в Твиттере, не обязательно означает, что такие сообщения повлияли на общественное мнение. Фундаментальные исследования в области политологии, социологии и социальной психологии дают веские основания сомневаться в том, оказала ли кампания ИРА значительное влияние.Например, исследования политической коммуникации и кампаний неоднократно демонстрировали, что изменить взгляды людей очень сложно (16). Политические послания, как правило, имеют «минимальный эффект», потому что люди, которые, скорее всего, столкнутся с убедительными сообщениями, также являются теми, кто больше всего придерживается своих взглядов (17). Другими словами, если троллям ИРА будут подвергаться только пользователи Твиттера с очень сильными политическими взглядами, это может не сделать их взгляды более радикальными. Обширная литература подтверждает, что такие «минимальные эффекты» являются нормой в политической рекламе, даже когда используется микротаргетинг рекламы на пользователей (18).Действительно, недавний метаанализ приходит к выводу, что средний лечебный эффект политической кампании равен нулю (19). Если американские политические агенты будут изо всех сил пытаться убедить избирателей, похоже, что иностранным агентам придется еще больше бороться за влияние на общественное мнение — не только потому, что относительно анонимный характер взаимодействия в социальных сетях может вызвать проблемы с достоверностью источника, но также из-за языковых и культурных барьеров. это, несомненно, затрудняет разработку убедительных сообщений.

Тем не менее, предыдущие исследования деятельности ИРА показывают, что организация не только стремилась убедить избирателей поддержать конкретного кандидата или политику, но и выдавала себя за стереотипы о республиканцах и демократах, чтобы усилить аффективную политическую поляризацию (6). Такие усилия могут иметь косвенные последствия, помимо изменения отношения к проблеме. Например, есть некоторые свидетельства того, что реакция на сообщения в социальных сетях может иметь сильное влияние на аудиторию помимо самих сообщений (20).Таким образом, наблюдение за спором доверенного контакта в социальных сетях с учетной записью IRA, которая выдает себя за члена противостоящей политической партии, может, таким образом, способствовать формированию стереотипов о другой стороне. Даже если тролли не усугубили идеологическую поляризацию, то есть они могли способствовать аффективной поляризации (21). Наконец, есть некоторые свидетельства того, что учетные записи IRA были направлены не только на то, чтобы повлиять на отношение, но и на политическое поведение. Например, некоторые исследования показывают, что ИРА пыталась демобилизовать афроамериканских избирателей, распространяя негативные сообщения о Хиллари Клинтон перед президентскими выборами в США в 2016 году (6).Следовательно, любой анализ воздействия кампании ИРА должен не только изучать ее прямое влияние на мнения американцев по вопросам политики, но также их отношение друг к другу и общий уровень их политической активности. Таким образом, наше исследование направлено на изучение того, повлияло ли взаимодействие с троллями ИРА на отношение к проблеме, пристрастные стереотипы и политическое поведение большой группы американских пользователей социальных сетей.

Дизайн исследования

Возможно, наиболее действенным дизайном исследования для изучения воздействия российской кампании в социальных сетях была бы рассылка сообщений в стиле троллей в рамках полевого эксперимента на платформе социальных сетей.Излишне говорить, что такое исследование было бы в высшей степени неэтичным. Вместо этого мы полагаемся на методы наблюдения, которые избегают таких ловушек, но дают менее прямую оценку причинного воздействия троллей ИРА. В нашем анализе используется продольный опрос 1239 республиканцев и демократов, часто использующих Twitter, который был проведен в конце 2017 года Бейлом и др. (3). Хотя это исследование было разработано для других целей, нехешированные данные с ограниченным доступом, предоставленные нам Twitter’s Elections Integrity Hub, позволили нам идентифицировать людей, которые взаимодействовали с учетными записями IRA между волнами опросов.Таким образом, у нас есть политические установки, измеряющие до и после взаимодействия, что позволяет нам оценивать индивидуальные изменения политических установок и поведения с течением времени.

В октябре 2017 г. Bail et al. (3) нанял исследовательскую фирму YouGov для проведения интервью с членами своей большой онлайн-группы, которые 1) идентифицируют себя как республиканцы или демократы; 2) заходите в Twitter не реже 3 раз в неделю; 3) проживать в США; 4) были готовы поделиться своим идентификатором или идентификатором в Твиттере; и 5) не установили для своей учетной записи защищенную или непубличную настройку.Респонденты также были стратифицированы, чтобы набрать примерно равное количество респондентов, которые идентифицируют себя как «сильные» или «слабые» партизаны. Таким образом, читатели должны отметить, что эта выборка не является репрезентативной для населения США в целом и не включает независимых избирателей (см. Приложение SI для полного сравнения демографических характеристик нашей выборки с населением в целом).

Респондентам была выплачена сумма, эквивалентная 11 долларам США, за заполнение этого опроса через систему баллов исследовательской фирмы.В ноябре 2017 года всем респондентам было предложено 12 долларов за заполнение повторного опроса с той же группой вопросов, что и в исходном опросе. Исследование Bail et al. (3) также включали полевой эксперимент. В период между двумя только что описанными опросами респонденты были рандомизированы в условия лечения, где им предлагались финансовые стимулы для подписки на созданного авторами бота Twitter, который был разработан, чтобы знакомить их с сообщениями лидеров мнений из противостоящей политической партии.Наш анализ учитывает этот план, и мы предоставляем более подробное описание процедуры выборки, выбытия из опроса и других вопросов дизайна исследования в приложении SI . Боты Bail et al. (3) не ретвитнул никаких сообщений от тролль-аккаунтов IRA.

Оба обзора Бейла и др. (3) включил серию вопросов о политических взглядах, которые мы использовали для измерения 4 из 6 результатов, проанализированных ниже. Опрос включал 2 показателя аффективной политической поляризации: термометр чувств, при котором респондентов просили оценить оппозиционную политическую партию по шкале от 0 до 100; и шкала социальной дистанции, где респондентов спрашивали, были бы они недовольны, если бы член противостоящей политической партии женился на ком-либо из их семьи, или если бы им пришлось общаться или тесно сотрудничать с членом противостоящей партии.Опросы также включали 2 показателя идеологической поляризации: 7-балльную шкалу идеологии, по которой респондентов просили поставить себя на континуум от «либерального» до «консервативного»; и индекс из 10 пунктов, в котором респондентам предлагалось согласиться или не согласиться с рядом утверждений либерального или консервативного толка. Меры идеологической поляризации были закодированы таким образом, что положительные значения представляют возрастающую идеологическую поляризацию, а отрицательные значения — уменьшающуюся поляризацию.Полный текст этих вопросов доступен в приложении SI .

Поскольку предыдущие исследования показывают, что взаимодействие с учетными записями IRA может привести к отстранению людей от политики, наш анализ также включает 2 поведенческих исхода, наблюдаемых в учетных записях респондентов в Twitter. Во-первых, мы подсчитали количество политических аккаунтов, за которыми следил каждый пользователь до и после двухволнового опроса. Политические интересы были выявлены с помощью метода сетевой выборки, в результате которого была составлена ​​выборка из 4 176 «лидеров мнений», которые являются выборными должностными лицами или людьми, за которыми следуют выборные должностные лица (22).Во-вторых, мы включили меру идеологической предвзятости сети Twitter каждого респондента, которая рассчитала процент политических аккаунтов, на которые подписался респондент, которые разделяли партийную принадлежность респондента, используя ту же самую сетевую выборку лидеров общественного мнения, которую только что описали. Мы даем более подробное описание этой идеологической балльной системы в приложении SI .

Ключевая независимая переменная в наших моделях — это бинарный индикатор того, взаимодействовали ли респонденты со счетами IRA в период между 1-м и 2-м опросами, описанными выше.Мы построили эту меру следующим образом. Во-первых, мы получили числовые идентификаторы учетных записей, связанных со всеми учетными записями IRA, через источник в Twitter, описанный выше. Эти учетные записи были идентифицированы в результате совместной работы Twitter и Комитета по разведке Сената США в начале 2018 года. В настоящее время доступна общедоступная версия этих данных, но она не описывает числовые идентификаторы для большинства учетных записей. Мы запросили и получили нехешированный набор данных из Twitter, который в настоящее время состоит из 4256 учетных записей IRA.

Мы реализовали взаимодействие троллей как включающее как прямые взаимодействия с троллем (лайк твит тролля, ретвит тролля, или лайк твит, в котором упоминается тролль, но не был создан троллем), так и косвенные взаимодействия или действия, которые могут разумно привести к просмотру твитов тролля (следование за троллем или получение сообщения тролля, когда друг респондента упоминает тролля в своем твите). Мы предоставляем подробную информацию о распределении этих различных типов взаимодействий между респондентами (и во времени) в приложении SI .В целом данные Twitter показывают, что 19,0% наших респондентов взаимодействовали с учетными записями IRA, а 11,3% напрямую взаимодействовали с учетными записями троллей. В течение месяца между волнами наших опросов 3,7% респондентов впервые взаимодействовали с учетной записью IRA, что дает возможность оценить влияние этих взаимодействий. Для сравнения, Twitter сообщил, что 1,4 миллиона из 69 миллионов активных пользователей в месяц взаимодействовали с аккаунтами IRA в начале 2018 года, или примерно 2%. Повышенный уровень взаимодействия ИРА в нашей выборке может отражать более высокий уровень политического интереса среди респондентов, поскольку для участия в первоначальном исследовании были приглашены только партизаны (напомним, однако, что наша выборка была стратифицирована и включала как сильных, так и слабых сторонников).

Одним из ограничений нашего измерения взаимодействия троллей является то, что он не охватывает все типы воздействия на учетные записи IRA. Хотя наша мера определяет людей, которые подписаны на учетные записи троллей или подписываются на людей, которые упоминают учетные записи троллей, мы не можем проверить, действительно ли эти люди просматривали такие сообщения или как долго они их просматривали. Еще одним ограничением нашей меры является то, что она не включает ретвиты сообщений IRA от тех, за кем следили респонденты в нашем исследовании, поскольку Twitter удалил такие ретвиты вместе с самими исходными сообщениями IRA.Кроме того, тролли в нашей выборке время от времени ретвитили контент от неконтроллеров. В некоторых случаях нам не удавалось определить, получали ли наши респонденты такие сообщения через троллей или других пользователей Twitter. Мы провели анализ чувствительности, который показал, что эти недостающие меры вряд ли повлияют на наши основные выводы, приведенные ниже, отчасти потому, что ретвиты — гораздо менее распространенная форма взаимодействия с учетными записями IRA, чем упоминания ( SI Приложение ).

Наши модели также включали ряд контрольных переменных для учета смешивающих факторов, которые могут повлиять на политическое отношение и поведение.Эти показатели были собраны либо в оригинальном исследовании Bail et al. (3), сделанное путем наблюдения за поведением респондентов в Twitter или предоставленное через собственные данные профиля исследовательской фирмы. К ним относятся: 1) бинарный индикатор, который описывает, считает ли респондент республиканцем; 2) 4-балльная мера частоты использования Twitter, где более высокие баллы указывают на более высокую частоту; 3) показатель общего интереса к новостям, основанный на следующем вопросе: «Некоторые люди, кажется, большую часть времени следят за тем, что происходит в правительстве и общественных делах, независимо от того, идут ли выборы или нет.Другим это неинтересно. Вы бы сказали, что следите за тем, что происходит в правительстве и общественных делах… [вряд ли вообще, только время от времени, иногда или большую часть времени]? »; 4) год рождения респондента; 5) непрерывный показатель доходов семьи; и 6) бинарные переменные, которые указывают, является ли респондент мужчиной, имеет высшее образование, белый цвет или проживает в 1 из 4 географических регионов США. Наконец, все модели, представленные ниже, включают бинарный индикатор, который описывает, был ли респондент отнесен к экспериментальному условию лечения в исходном исследовании Bail et al.(3).

Выводы

Перед тем, как проанализировать влияние взаимодействий с учетными записями IRA на наши конечные переменные, мы сначала использовали модели биномиальной регрессии для определения характеристик тех, кто взаимодействовал с учетными записями IRA. Результатом в этой модели является бинарный индикатор, который описывает, взаимодействовал ли респондент с учетной записью IRA до первого опроса, проведенного Bail et al. (3) в октябре 2017 года путем упоминания, ретвита, лайка или подписки на аккаунт IRA или лайка твита, в котором упоминается аккаунт IRA (76 из 1239 респондентов).На рис. 1 представлены стандартизованные коэффициенты из этой модели, показывающие, что наиболее сильным предиктором взаимодействия с ИРА является сила эхо-камер респондентов (измеряемая как процент политических счетов, которые они следуют и которые склоняются к собственной политической партии респондента). Второй по величине предиктор взаимодействия с ИРА — это общий политический интерес, за которым следует частота использования Твиттера. Хотя республиканцы с большей вероятностью взаимодействуют со счетами ИРА, чем демократы, эта ассоциация не является статистически значимой.Подводя итог, можно сказать, что наш первоначальный анализ показывает, что респонденты, наиболее склонные к взаимодействию с троллями, были теми, кто в наименьшей степени подвержен влиянию убеждения — из-за их более укоренившихся политических взглядов.

Рис. 1.

Модель биномиальной регрессии, прогнозирующая взаимодействие с аккаунтами Twitter, связанными с российским IRA. Фиолетовые кружки обозначают стандартизированные точечные оценки, а синие линии — 90% и 95% доверительных интервалов. Респонденты опроса с сильной идеологической гомофилией в своей сети Twitter, высоким интересом к политике и использующие Twitter более одного раза в день, с наибольшей вероятностью взаимодействовали с аккаунтами IRA.

Чтобы оценить влияние взаимодействия со счетами IRA на наши 6 показателей результатов, мы смоделировали изменение каждой из наших оценочных и поведенческих переменных между 1-м и 2-м опросами; лечение измерялось как бинарная переменная, указывающая, взаимодействовал ли респондент опроса с аккаунтами IRA. Мы использовали байесовские деревья регрессии для оценки средних эффектов лечения на респондентов, получавших лечение (или ATT), а также неоднородных эффектов лечения по другим ковариатам в моделях.Это семейство методов использует непараметрическую байесовскую регрессию для уменьшения размерно-адаптивных случайных базисных элементов. В частности, мы использовали модель байесовского причинного леса (BCF) (23), которая включает оценку функции склонности в рамках модели ответа, которая составляет априорную зависимость от ковариат для функции регрессии. Этот метод особенно хорошо подходит для выявления неоднородных эффектов обработки, позволяя регулировать неоднородность обработки отдельно по каждой контрольной переменной в модели.Мы исключили людей, которые взаимодействовали с троллями до 1-й волны опроса, оставив 44 человека, прошедших лечение, и 1106 человек в контрольной группе для основных моделей, представленных ниже. Мы провели 3 дополнительных набора анализов, которые значительно увеличили количество пролеченных случаев — менее консервативная операционализация лечения, в которую были включены лица, прошедшие предварительное лечение ( SI, приложение ), синтетическая мера лечения в анализе чувствительности ( SI, приложение ), и расширенные временные рамки с использованием дополнительных данных опроса, представленных ниже, без изменений в результатах.

На рис. 2 показаны ATT взаимодействия со счетами IRA по каждому из результатов в нашей модели с интервалами, полученными из 97,5-го и 2,5-го квантилей, соответственно. Эти эффекты были стандартизированы, чтобы иметь среднее значение 0 и стандартное отклонение 1 для облегчения интерпретации. Как показано на этом рисунке, взаимодействие IRA не имело значимой связи ни с одной из наших 6 переменных результата. Рис. 3–5 изображают индивидуальные лечебные эффекты взаимодействия троллей с переменными, связанными с взаимодействием троллей, разделенные на бинарные категории для облегчения интерпретации.Рис. 3 не показывает существенных различий в эффекте взаимодействия троллей в зависимости от уровня политического интереса по каждому из наших результатов. Рис. 4 и 5 не сообщают о существенных различиях в частоте использования Twitter или идентификации партий, хотя между республиканцами и демократами есть существенная разница в изменении количества политических аккаунтов, за которыми следили респонденты. Мы также не наблюдали других эффектов гетерогенной обработки по всем другим ковариатам в наших моделях ( SI Приложение ).

Рис. 2. Модели

BCF, описывающие влияние взаимодействия с российскими учетными записями IRA на изменение политических взглядов и поведения республиканских и демократических пользователей Twitter, которые ответили на 2 опроса, проведенных в период с октября по ноябрь 2017 г. Фиолетовые кружки описывают средние эффекты лечения на обработанные, а синие линии описывают 95% вероятных интервалов. Взаимодействие со счетами IRA не оказывает значительного влияния на все 6 результатов.

Рис. 3.

Индивидуальные эффекты взаимодействия с российскими аккаунтами IRA на политические установки и поведение в зависимости от уровня интереса к новостям с использованием BCF.

Рис. 4.

Индивидуальные эффекты взаимодействия с российскими аккаунтами IRA на политические установки и поведение по частоте использования Twitter с использованием BCF.

Рис. 5.

Индивидуальные эффекты взаимодействия с российскими счетами ИРА на политические взгляды и поведение путем идентификации партий с использованием BCF.

Оценка воздействия дозировки в течение длительного периода времени

Наши результаты не показывают доказательств того, что взаимодействие с российскими троллями Twitter повлияло на отношение или поведение республиканцев и демократов, которые используют Twitter по крайней мере 3 раза в неделю, но анализ ограничен по нескольким причинам .Во-первых, наша мера взаимодействий ограничена периодом времени с октября по ноябрь 2017 года. Тем не менее, Twitter заблокировал многие из этих учетных записей в начале 2017 года, в результате чего количество учетных записей IRA, которые были регулярно активны каждый день, примерно с 300 до 100. Семьдесят. пять процентов учетных записей троллей, с которыми взаимодействовали наши респонденты, были созданы до начала репрессий — и у них было много подписчиков, что позволяет предположить, что они особенно эффективно избегали обнаружения, — но важно учитывать возможность того, что мы бы обнаружили большее влияние, если бы наши взаимодействия пошли еще дальше во времени.Второе ограничение заключается в том, что наша мера лечения бинарная, но мы можем ожидать большего эффекта от множественных взаимодействий (эффект дозировки). Точно так же мы можем ожидать вариации воздействия в зависимости от характера взаимодействия; прямое взаимодействие с твитом (например, лайк, ретвит или упоминание твита) может иметь большее влияние, чем косвенное взаимодействие (например, следование за троллем или друг упоминает тролля).

Чтобы решить эти проблемы, мы получили дополнительные данные опроса, собранные в рамках профильных опросов YouGov за пределами нашего месячного окна исследования.К сожалению, единственным актуальным вопросом опроса, постоянно измеряемым в профильных опросах в течение этого периода времени, была 5-балльная шкала идеологии, которую мы смогли получить для всех, кроме двух наших респондентов. Из результатов, рассмотренных в нашем предыдущем анализе, самоидентифицированная идеология может быть несколько менее восприимчивой к убеждению, но она все же позволяет проверить идеологическую поляризацию в более широких временных рамках.

Лечение определяется как взаимодействие с троллем между самым ранним и последним показателем идеологии, доступным для каждого респондента в наборе данных профиля YouGov в период с февраля 2016 года по апрель 2018 года.Эти модели включают те же спецификации, что и в предыдущем анализе, включая исключение предварительно обработанных респондентов, которые взаимодействовали с троллями до нашего первого измерения идеологии в наборе данных профиля. Мы запускали отдельные модели для разных уровней дозировки — с обработанной группой в каждой модели, определяемой как респонденты, которые взаимодействовали с троллями 1 или более раз (обработанные = 213, контрольные = 1017), 2 или более раз (обработанные = 110, контрольные = 1120). ), или 3 и более раз (обработано = 67, контроль = 1163).Больший размер экспериментальной группы в этом анализе позволил нам изучить влияние различных типов взаимодействий. Хотя в предыдущем анализе мы использовали взаимодействие троллей как прямое или косвенное участие, последнего может быть недостаточно для изменения политических взглядов. Поэтому мы также запускали отдельные модели, в которых лечение использовалось только как прямое вовлечение.

На рис. 6 показаны ATT и связанные 95% доверительные интервалы. Как и в предыдущих моделях, при измерении влияния взаимодействия с троллями на идеологическую поляризацию положительные коэффициенты представляют возрастающую идеологическую поляризацию, а отрицательные коэффициенты представляют собой уменьшающуюся поляризацию.Результат снова был стандартизирован, чтобы получить среднее значение 0 и стандартное отклонение 1 для облегчения интерпретации. Несмотря на значительное увеличение размера исследуемой группы, мы продолжали обнаруживать отсутствие значительных эффектов взаимодействия с троллями IRA во всех моделях и при обоих типах взаимодействий. Результаты не показали никаких доказательств идеологической поляризации — во всяком случае, хотя и небольшие и не статистически значимые, ATT были отрицательными.

Рис. 6.

Оценка влияния дозировки на идеологию самооценки в течение длительного периода времени.Кружки описывают стандартизированные точечные оценки, а линии описывают 95% вероятные интервалы для различных объемов прямого и косвенного взаимодействия со счетами IRA. Здесь, опять же, взаимодействие с аккаунтами троллей в течение длительного периода не обнаруживает значительной связи с идеологической поляризацией.

Заключение

Скоординированные попытки России и других иностранных правительств создать политическую поляризацию в Соединенных Штатах в последние годы стали предметом общественного беспокойства.Тем не менее, насколько нам известно, ни в одном исследовании систематически не изучались бы, действительно ли такие кампании повлияли на политические взгляды или поведение американцев. Анализируя одну из крупнейших известных на сегодняшний день попыток с использованием комбинации уникальных наборов данных, мы не обнаружили существенного влияния взаимодействия с российскими учетными записями ИРА на эмоциональное отношение демократов и республиканцев, которые часто используют Twitter друг к другу, их мнения по существенным политическим вопросам, или их участие в политике в Твиттере в конце 2017 года.

Несмотря на то, что мы не находим доказательств того, что российские тролли поляризовали политические взгляды и поведение пристрастных пользователей Твиттера в конце 2017 года, эти нулевые эффекты не должны уменьшать озабоченность по поводу кампаний иностранного влияния в социальных сетях, поскольку наш анализ ограничивался 1 популяцией в одном момент времени. Нам не удалось систематически определить, повлияли ли тролли из ИРА на общественное мнение или поведение во время президентских выборов 2016 года, которые широко рассматриваются как критический момент для кампаний по дезинформации.Также возможно, что кампания российского правительства стала более эффективной с конца 2017 года, на котором мы сосредоточили свое внимание.

Еще одним ограничением нашего анализа является то, что он был ограничен людьми, которые идентифицировали себя с Демократической или Республиканской партией и относительно часто используют Twitter (не менее 3 раз в неделю). Возможно, тролли имеют более сильное влияние на политических независимых или тех, кто более оторван от политики в целом (хотя мы не наблюдали значительных эффектов среди тех, кто выражал слабую привязанность к какой-либо из сторон).Наше исследование также было ограничено Соединенными Штатами, тогда как отчеты показывают, что ИРА действует и во многих других странах. Наконец, наш анализ исследует только Twitter. Хотя Twitter остается одной из наиболее влиятельных платформ социальных сетей в Соединенных Штатах на момент написания этой статьи — и был нацелен Российской ИРА гораздо больше, чем другие платформы социальных сетей, — он имеет значительно меньшую пользовательскую базу, чем Facebook, и предлагает уникальная и широко открытая форма взаимодействия с пользователями в социальных сетях.Таким образом, возможно, что влияние России могло быть более выражено на других платформах с другими типами аудитории или другими структурами для взаимодействия с пользователями.

Еще одно ограничение заключается в том, что наш анализ оценивал ограниченный набор политических и поведенческих результатов. Например, мы не можем определить, повлияли ли российские тролли на поведение кандидатов или СМИ, или они сформировали общественное мнение другими способами, такими как отношение к общественному доверию или изменение значимости политических вопросов.Мы также не могли изучить, влияет ли взаимодействие троллей на поведение при голосовании, хотя в будущих исследованиях можно будет связать наши данные с файлами избирателей. Наконец, наблюдательный характер нашего исследования препятствует точному определению причинного воздействия кампании IRA. Из-за этих ограничений необходимы дополнительные исследования, чтобы подтвердить наши выводы с помощью исследований других кампаний в социальных сетях, других платформ и с использованием различных методов исследования.

Несмотря на эти проблемы, наши результаты служат важным напоминанием о том, что американская общественность не является tabula rasa и не может быть легко управляема с помощью пропаганды.Наши результаты показывают, что даже несмотря на то, что активные сторонники Twitter взаимодействовали с троллями значительно чаще, чем сообщается в Twitter, подавляющее большинство (80%) не взаимодействовали с учетной записью IRA. А для тех, кто это сделал, эти взаимодействия составляли ничтожную долю их активности в Твиттере — в среднем всего 0,1% от их лайков, упоминаний и ретвитов в Твиттере. То, что взаимодействия с троллями составляли такую ​​небольшую часть всех взаимодействий в Твиттере, может дополнительно объяснить, почему мы наблюдали нулевые эффекты выше.

Хотя есть множество причин для беспокойства по поводу российской троллинговой кампании — и будущих усилий со стороны других иностранных противников, как онлайн, так и офлайн, — примечательно, что люди, наиболее подверженные риску взаимодействия с троллями — те, кто придерживается сильных пристрастных убеждений, — также наименее вероятно изменить свое отношение. Другими словами, русские тролли, возможно, не сильно поляризовали американскую общественность, потому что они в основном взаимодействовали с теми, кто уже был поляризован.

В заключение отметим важные последствия нашего исследования для будущих исследований социальных сетей, политической поляризации и вычислительной социальной науки (24).Учитывая громкий характер усилий российской ИРА, крайне важно иметь систематическую эмпирическую оценку воздействия на общественность. Хотя еще многое предстоит узнать, наше исследование предлагает важный вклад в эту малоизученную проблему. Кроме того, наше исследование вносит свой вклад в растущую область вычислительной социальной науки и, в частности, дает пример того, как традиционные формы исследования, такие как опросы общественного мнения, могут быть плодотворно объединены с текстовыми наблюдениями и сетевыми данными, собранными с сайтов социальных сетей в для рассмотрения сложных явлений, таких как влияние кампаний по влиянию в социальных сетях на политические взгляды и поведение.Хотя срочно необходимы дальнейшие исследования по этому вопросу, мы надеемся, что наш вклад послужит моделью для будущих исследователей, которые стремятся изучить этот сложный и многогранный вопрос.

Материалы и методы

См. SI Приложение для подробного описания материалов и методов, используемых в этом исследовании, дополнительных проверок надежности и ссылок на наши материалы для репликации. Это исследование было одобрено институциональными наблюдательными советами Университета Дьюка и Нью-Йоркского университета.Все участники дали информированное согласие. Данные для этого исследования доступны по адресу https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/UATZBA (25).

Благодарности

Эта работа была поддержана NSF и Университетом Дьюка. Мы благодарим Twitter Elections Integrity Hub за предоставленные данные.

Сноски

  • Вклад авторов: C.A.B., B.G., E.M., A.C., D.S.H., F.M. и A.V. спланированное исследование; C.A.B., B.G., E.M., A.C., F.M., Д.Ф., А.В. собранные данные для этого исследования; C.A.B., B.G., E.M., A.C., D.S.H., F.M. и A.V. проанализированные данные; и C.A.B., B.G., D.S.H., F.M. и A.V. написал газету.

  • Авторы заявляют об отсутствии конкурирующей заинтересованности.

  • Эта статья представляет собой прямое представление PNAS.

  • Размещение данных: данные для этого исследования доступны на сайте Harvard Dataverse, https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/UATZBA.

  • См. Комментарий на стр. 21.

  • Эта статья содержит вспомогательную информацию в Интернете по адресу https://www.pnas.org/lookup/suppl/doi:10.1073/pnas.1

    0116/-/DCSupplemental.

  • Copyright © 2020 Автор (ы). Опубликовано PNAS.

Цензура в России

В этом посте рассказывается, как российское правительство постепенно выстраивает политику цензуры на национальном уровне для тысяч интернет-провайдеров, использующих товарные DPI , и мы опасаемся, что за этой тенденцией последуют другие страны с аналогичной топологической структурой.Работая с активистами на местах в России, Censored Planet получила 5 просочившихся блок-листов, подписанных Роскомнадзором (Федеральная служба по надзору в сфере связи, информационных технологий и массовых коммуникаций), а также с данными за семь лет исторических данных черного списка. Мы использовали этот авторитетный черный список, содержащий более 130 000 доменов, для проведения углубленного исследования политики цензуры российского правительства путем сбора данных измерений в жилых домах, центрах обработки данных и инфраструктурных точках.

Выводы на высоком уровне:

  • Наши измерения, проведенные интернет-провайдерами, которые покрывают более 65% IP-пространства в России, и наблюдение высокого процента блокировок в жилых сетях, подтверждают, что Россия успешно строит национальный аппарат цензуры из стандартного оборудования (т. Е. Недорогих DPI). ). Это вызывает тревогу и подтверждает, что нет необходимости ни в государственных технических узлах с несколькими уровнями сложности, ни в крупных государственных инвестициях, как считает китайский GFW, для достижения синхронизированного и однородного ограниченного на национальном уровне доступа в Интернет.
  • Роскомнадзор ведет авторитетный черный список в режиме реального времени и принимает законы, требующие от интернет-провайдеров блокировать контент. В настоящее время черный список содержит 170 000 доменов, 1 681 000 IP-адресов и 39 подсетей. У него примерно в 10 раз больше веб-сайтов, чем заблокированный список Citizen Lab из всех стран вместе взятых. Даже со списком такого масштаба наши измерения показывают, что интернет-провайдеры успешно блокируют.
  • Изучив содержание веб-сайтов в черном списке, мы обнаружили, что 63% веб-сайтов на русском и 28% на английском.В то время как главные категории включают азартные игры и порнографию, мы находим некоторые русскоязычные сайты новостей, политики и обхода цензуры в черном списке.
  • Если посмотреть на ежедневные утечки заблокированных списков за 7 лет, размер черного списка, похоже, быстро вырос с момента его создания 1 ноября 2012 года, что указывает на растущее желание России осуществлять контроль над информацией. За последний год мы заметили, что много усилий было приложено для улучшения поддержки и очистки заблокированного списка.
  • Наши жилые точки зрения подвергаются высокому уровню цензуры.Интересно, что поражает прозрачность того, что интернет-провайдеры направляют пользователям явные уведомления при введении цензуры, что, как мы позже определили, основано на рекомендациях, продиктованных Роскомнадзором.
  • Наши результаты показывают, что центры обработки данных блокируют иначе, чем домашние интернет-провайдеры, как по количеству, так и по способу блокировки. В большинстве стран домашние интернет-провайдеры подчиняются различным законам и политикам контроля информации.

Контроль информации уже давно является целью многих стран, и с развитием технологий, которые делают это возможным, такие сущности, как Великий китайский файрвол, не единственные угрозы свободе в Интернете.По мере того, как технологии фильтрации становятся дешевле покупать и их легче развертывать, все больше национальных государств переходят к их использованию для достижения сетевого и информационного контроля. Яркий пример — то, что происходило в России за последнее десятилетие. Страна, в которой когда-то было очень мало цензуры, оказалась в центре внимания из-за блокировки миллионов IP-адресов для блокировки Telegram и их постоянно растущего черного списка. В своей работе мы освещаем реальность достижения этого контроля, используя законы и политику, чтобы заставить интернет-провайдеров соблюдать и обеспечить контроль над информацией.

Долгое время считалось, что широкомасштабная цензура в децентрализованных сетях, таких как Россия, США, Индия и Великобритания, была чрезмерно сложной. Наше исчерпывающее исследование инфраструктуры цензуры в России показывает, что это не так.

Наше исследование показало, что внедрение такого децентрализованного контроля ломает стереотип того, что традиционно означает «цензура»: монолитное блокирование больших объемов контента от границы до границы внутри страны.Но в России с появлением СОРМ и коммерциализацией технологий цензуры и наблюдения для интернет-провайдеров стало относительно легко и дешево соблюдать требования. Однако средства, с помощью которых интернет-провайдеры соблюдают требования, сильно различаются, как и их степень соответствия.

Справочная информация по России

Главный орган, отвечающий за общенациональную цензуру Интернета в России, называется Роскомнадзор. Другие государственные органы могут потребовать от Роскомнадзора заблокировать сайты, содержание которых напрямую связано с их обязанностями.Но Роскомнадзор отвечает за систематизацию и ведение единого и централизованного черного списка.

На рисунке 1 показаны важные события последнего десятилетия, иллюстрирующие ужесточение цензуры в России, которое началось со списка «экстремистских» веб-сайтов, к которым были добавлены блоги и контент политических диссидентов, и постепенно превратилось в список из более чем 170 000 доменов, добавленных для множество причин.

Рисунок 1. Хронология российского информационного контроля

Углубленный анализ

Комплексное исследование по измерению цензуры должно решить три основных задачи: 1) Что измерять.Для исследования необходим авторитетный черный список , чтобы понять режим цензуры. В настоящее время черные списки часто представляют собой списки доменов, созданных краудсорсингом. 2) Как получить выгодную позицию. Для исследования необходимо несколько дополнительных точек зрения, чтобы получить представление о различных сетях. В предыдущих исследованиях часто использовались VPS внутри центров обработки данных или в сотрудничестве с волонтерами. 3) Как вывести цензуру. Разработка методов и создание надежных средств контроля, чтобы отличить естественные неудачи от реальной цензуры, измеренной в исследовании.

Что измерять : Censored Planet получила пять снимков черного списка, подписанного Роскомнадзором цифровой подписью от активистов внутри страны. На снимке, сделанном 24 апреля 2019 года и использованном в нашей статье, список содержал 132 798 доменов, 324 695 IP-адресов и 39 подсетей. Активисты также указали нам на репозиторий GitHub, содержащий более 26000 коммитов, которые отслеживали ежедневные обновления этого черного списка . Чтобы проверить этот репозиторий, мы рассчитали индекс Жаккарда для просочившихся подписанных списков блокировки с фиксацией репозитория в те же даты, и мы обнаружили, что они были более чем на 99% похожи.

Рисунок 2. Эволюция блочного списка

Используя исторические данные за 7 лет из репозитория, на рис. 2 показана эволюция черного списка с годами. Как показано, размер черного списка, по-видимому, быстро увеличивался, что указывает на растущее желание России осуществлять контроль над информацией . Мы видим значительный разрыв между необработанным количеством IP-адресов и количеством уникальных IP-адресов, добавленных в черный список, что связано с тем, что несколько веб-сайтов размещаются на одних и тех же IP-адресах и добавляются в список отдельно.В прошлом году резкое увеличение количества как необработанных, так и уникальных IP-адресов, умеренное увеличение количества уникальных доменов, показывает, что много усилий было приложено для улучшения поддержки и очистки списка блок-списка . Сообщения от активистов из России предполагают, что правительство предприняло целенаправленные усилия по улучшению ведения списка, в основном из-за «розыгрыша Морзе DIGITALRESISTANCE» и причины, по которой количество IP-адресов приближалось к пределу памяти TCAM для определенных моделей маршрутизаторов.

Сначала мы экспериментировали с использованием готовых сервисов категоризации для классификации доменов. Однако эти службы плохо работают с веб-страницами на языках, отличных от английского. Учитывая, что более 63% веб-сайтов на русском языке и 28% на английском языке, мы разрабатываем метод тематического моделирования на основе предшествующей работы. Хотя самыми популярными темами являются азартные игры и порнография, мы также выявили некоторых российских новостных веб-сайтов с политическим содержанием, таких как chechenews.com, graniru.org, 2019.голосование (тактическое голосование Алексея Навального и его команды) и инструментов обхода в блок-листе . Мы относим большое количество сайтов с азартными играми к доменам, которые быстро клонируются в зеркальный домен при добавлении в черный список (например, 02012019azino777.ru, 02012018azino777.ru).

Как получить выгодные позиции: Мы использовали авторитетный черный список для проведения углубленного исследования политики цензуры российского правительства путем сбора данных измерений в жилых домах, центрах обработки данных и инфраструктурных точках.Учитывая, что аренда VPS в российских центрах обработки данных требует оплаты в рублях, наличия внутреннего номера телефона и адреса, активисты на местах помогли нам получить шесть VPS в центрах обработки данных, которые наблюдают за сетевой фильтрацией. Мы также наняли участников, чтобы помочь с измерениями в их жилых сетях. Учитывая потенциальный риск, мы полностью следовали нормам сообщества и получили их явное согласие.

Как сделать вывод о цензуре: Прямые методы измерения выигрывают от прямого доступа к машине в сети, и они очень полезны для расследования случаев цензуры.В наших прямых измерениях для данного IP-адреса или домена мы определяем, блокируется ли он; если да, то определяем, как выполняется блокировка. Мы сосредоточены на трех распространенных типах блокировки: блокировка TCP / IP, манипуляции с DNS и блокировка по ключевым словам.

Чтобы дополнить эти данные и определить, являются ли наши прямые измерения репрезентативными, мы используем два инструмента удаленных измерений от Censored Planet: Satellite и Quack. Satellite и Quack используют поведение существующих интернет-протоколов и инфраструктуры для обнаружения блокировки по DNS и ключевым словам соответственно, т.е.е. нам не нужно получать доступ к точкам обзора, а просто взаимодействовать с удаленными системами для получения информации об удаленной сети.

Имея более 1000 удаленных точек наблюдения для Quack и Satellite и 20 точек прямого наблюдения, наша зона покрытия в России охватывает 361 уникальную автономную систему, которая контролирует около 65% пространства IP-адресов в России.

Рис. 3. Результаты прямого измерения — точки наблюдения за центром обработки данных и жилыми домами соответственно

Из результатов нашего прямого измерения мы видим, что процент блокировки (в черном списке) и тип блокировки различаются в жилых сетях и сетях центров обработки данных.Это дополнительно подтверждается нашими знаниями о том, что провайдеры хостинга центров обработки данных не обязаны регистрироваться в качестве интернет-провайдеров и могут не подчиняться тем же законам.

  • Наши жилые точки зрения подвергаются высокому уровню цензуры. Интересно, что поражает прозрачность того, что интернет-провайдеры направляют пользователям явные уведомления при введении цензуры, что, как мы позже определили, основано на рекомендациях, продиктованных Роскомнадзором.
  • Наши результаты показывают, что центры обработки данных блокируют не так, как домашние интернет-провайдеры, как по количеству, так и по способу блокировки.Точное репрезентативное представление о цензуре возможно только при измерениях с различных точек зрения, особенно у домашних интернет-провайдеров. В большинстве стран домашние интернет-провайдеры подчиняются различным законам и политикам контроля информации.
  • Мы также наблюдаем, что домашние интернет-провайдеры имеют тенденцию блокировать тип трафика, который они видят чаще, а именно трафик с участием доменов, а не IP-адресов.

Раньше Россия была известна применением наивных цензурных подходов.Например, пытаясь заблокировать Telegram, они заблокировали целые подсети Amazon Elastic Compute Cloud, Google Cloud, Digital Ocean, OVH (и, следовательно, другие веб-сайты и сервисы), что привело к сопутствующему ущербу. С тех пор они перешли на более продвинутые технологии, такие как глубокая проверка пакетов (DPI) и блокировка по ключевым словам из-за превращения этих технологий в товар, которые делают их дешевле и проще в развертывании. Закон «Суверенный рунет», вступающий в силу 1 ноября 2019 года, требует от операторов связи устанавливать в своих сетях «специальное оборудование» для обработки 100% всего входящего трафика в качестве меры безопасности от «внешних угроз».Наиболее важной частью этого контроля является то, что Роскомнадзору будет разрешено централизованно управлять маршрутизацией трафика на этом оборудовании.

Эту тенденцию мы наблюдаем во многих странах: США, Великобритания, Индия, Индонезия, Португалия — все медленно движутся к этой модели, и это должно служить предупреждением для исследователей и политиков. Архитектура цензуры в Соединенном Королевстве аналогична российской: правительство предоставляет интернет-провайдерам список веб-сайтов, которые нужно блокировать, и имеет руководящие органы цензуры, которые соответствуют различным типам цензурированных материалов.Индонезия недавно внедрила фильтрацию контента на границах своей сети. Индия усиливает цензуру с помощью постановлений Верховного суда, налагаемых на интернет-провайдеров. В Соединенных Штатах отмена сетевого нейтралитета позволяет интернет-провайдерам отдавать предпочтение определенному контенту по сравнению с другим, что стало технической отправной точкой для усиления цензуры в России.

Этические соображения: Независимо от того, собираются ли измерения с компьютеров участников (например, добровольцев) или с удаленных точек наблюдения (например,грамм. DNS-серверы организаций), измерения цензуры могут создавать риски для владельцев этих устройств. Стремясь установить высокие этические стандарты, мы тщательно спланировали наши эксперименты, следуя лучшим методам, описанным в отчетах Menlo, а также нормам сообщества. Мы также сформировали наши методы сбора данных в течение года непрерывного общения с известными активистами в России, с коллегами, имеющими опыт в области цензуры и исследований, а также с генеральным юрисконсультом нашего университета.

Заключение

С 1 ноября 2012 года, семь лет назад, когда Роскомнадзор представил свой первый официальный черный список для интернет-провайдеров, мы видели, как постепенно Россия выстраивает политику цензуры на национальном уровне поверх своей децентрализованной сети. Россия на этом не останавливается; скорее, он стремился к идеальной гармонии в блокировании, приняв на этой неделе еще один закон, российский закон «О суверенном рунете», который требует от операторов связи устанавливать «специальное оборудование» в своих сетях во имя мер безопасности против «внешних угроз».

Усилия России за последнее десятилетие по контролю над контентом в своих децентрализованных сетях, а также уроки и опыт, которые она накопила при ужесточении контроля, применимы к сетям в странах по всему миру, особенно в странах, которые исторически не поддерживали цензуру. Российская архитектура цензуры является планом и, возможно, предупреждением о том, как могут выглядеть национальные режимы цензуры во многих других странах, в которых экосистемы интернет-провайдеров столь же разнообразны, как и в России .

Повышение известности России как цензора — тревожный сигнал для исследователей цензуры, журналистов, активистов и граждан глобального Интернета. Понимание децентрализованного контроля будет ключом к продолжению сохранения свободы Интернета на долгие годы.

В России, Китае и на Ближнем Востоке продолжаются попытки политических манипуляций в Интернете

По мере того, как технологии становятся все более продвинутыми и доступными, их роль на мировой политической арене возрастает — к лучшему или к худшему.Хотя Интернет произвел революцию в области коммуникации, теперь есть свидетельства того, что правительства и другие государственные субъекты используют новые технологии, чтобы попытаться повлиять на результаты выборов.

В отчете, составленном в соавторстве с исследователями Школы общественных и международных отношений Принстонского университета, исследуются эти попытки манипуляций на основе более 920 сообщений СМИ и 380 отчетов об исследованиях.

Авторы выделяют 23 новых попытки иностранного влияния, 64% из которых были предприняты Россией, а большая часть остальных приходится на Китай, Иран, Саудовскую Аравию и Объединенные Арабские Эмираты.

«Неудивительно, что Россия часто использует попытки иностранного влияния», — сказал соавтор Джейкоб Шапиро, директор отдела эмпирических исследований конфликтов (ESOC) и профессор политики и международных отношений. «Российское правительство имеет долгую историю операций по влиянию на своих граждан, в том числе с помощью различных платформ социальных сетей, чтобы отвлечь граждан от политических проблем в стране».

Шапиро проводил работу с Диего Мартином, бывшим специалистом-исследователем в ESOC, в настоящее время разрабатывает докторскую степень.Доктор экономических наук в Университете Пердью и Джулия Ильхардт ’21, студентка бакалавриата, работающая в ESOC. Команда рассмотрела как попытки иностранного влияния, направленные на другие страны, так и внутренние усилия влияния, нацеленные на их собственные страны.

В 2016 году влияние социальных сетей заняло центральное место на президентских выборах в США, и широко распространялись заявления о том, что результаты выборов повлияли на «фейковые новости» и вмешательство России. Согласно отчету ESOC, российские тролли и боты использовали попытки иностранного влияния, чтобы притвориться, что они американские профили, и усилить поляризацию среди демократов и республиканцев.

В то время кандидат от республиканцев Дональд Трамп получил больше поддержки и меньше атак со стороны этих иностранных ботов, чем его оппонент-демократ Хиллари Клинтон, что заставило исследователей полагать, что усилия России в основном были направлены на повышение шансов Трампа на победу на выборах. Между тем, внутренние игроки в США использовали усилия по оказанию влияния на платформах социальных сетей, чтобы распространять противоречивые взгляды и дезинформацию, чтобы раздувать поддержку своего предпочтительного кандидата.

В отчете также было обнаружено 20 случаев в 18 различных странах, в которых правительства применяли инструменты, аналогичные тем, которые использовались иностранными усилиями по влиянию на своих собственных граждан.Самым удивительным является то, что такие усилия по внутреннему влиянию использовались не только автократическими режимами, но и демократическими государствами, чтобы заручиться поддержкой определенных кандидатов и дискредитировать политических оппонентов. Например, Институционально-революционная партия Мексики провела концентрированные кампании в социальных сетях для увеличения поддержки своих кандидатов с 2012 по 2018 год.

Хотя уровни иностранного и внутреннего влияния остаются высокими в отдельных государствах, авторы обнаружили только три новых случая попыток иностранного влияния в 2019 году.Авторы отмечают одну возможность, что международные нормы против этой закулисной тактики политического манипулирования сильны, за исключением нескольких государств, приложивших подавляющее большинство усилий по оказанию влияния.

«Новые платформы создают новые возможности для широкого круга политических деятелей», — говорят авторы. «Государственные субъекты использовали социальные сети, чтобы влиять на политику внутри страны и за рубежом, продвигая пропаганду, отстаивая противоречивые точки зрения и распространяя дезинформацию.”

Отчет «Тенденции в усилиях по иностранному влиянию в Интернете» можно найти здесь.

Узнайте о конструктивизме и художниках-конструктивистах

В 1913 году русский художник Владимир Татлин посетил мастерскую Пикассо. Там он увидел эксперименты Пикассо с коллажами (papiers collés). Эта встреча сильно повлияла на Татлина, который начал собственное исследование коллажной среды, создав абстрактные трехмерные коллажи из металла и дерева.Он выставил их вместе с супрематическими картинами Казимира Малевича на «Последней выставке футуристов» того года. Это положило начало конструктивизму, художественному движению, в котором художники интересовались строительством. Искусство должно было быть построено.

Что такое конструктивизм?

В конструктивизме роль художника была переосмыслена — художник стал инженером, владеющим инструментами, а не художником, держащим кисть. Для конструктивистов произведения искусства были частью большой визуальной программы, призванной пробудить массы и привести их к осознанию классового разделения, социального неравенства и революции.Конструктивисты считали, что искусству нет места в герметичном пространстве мастерской художника. Скорее они думали, что искусство должно отражать индустриальный мир и что оно должно использоваться как инструмент коммунистической революции.

Ключевые даты: 1915-1940

Ключевые регионы: Советский Союз, Германия

Ключевые слова: абстракция, геометрические формы, социальное назначение, коммунизм, революция

Ключевые художники: Александр Родченко, Варвара Степанова, Владимир Татлин, Густав Клуцис, Эль Лисицкий, Любовь Попова

Конструктивистский стиль

Конструктивистское искусство, ориентированное на промышленное производство.Конструктивисты использовали урезанные геометрические формы и скромные материалы. Их визуальный язык состоял из форм, которые они могли рисовать с помощью практических инструментов, таких как циркуль и линейки. Такие материалы, как дерево, стекло и металл, были проанализированы и оценены на основе того, насколько они подходят для использования в объектах и ​​изображениях массового производства.

Конструктивизм в Советском Союзе

Российская революция произошла в 1917 году, и страна освобождалась от тисков правящей элиты.Желанием было произвести революцию во всех аспектах России, в том числе в ее культурной жизни. Искусство должно было служить новому коммунистическому обществу.

Советский Союз образовался в 1922 году, в том же году, когда русский художник Алексей Ган написал манифест, который начинался следующими словами: «МЫ ОБЪЯВЛЯЕМ БЕСКОМПРОМИССУЮ ВОЙНУ ИСКУССТВУ!» Алексей Ган, Владимир Татлин и Александр Родченко считаются основателями конструктивизма. Вскоре к ним присоединились художники, в том числе Варвара Степанова, Любовь Попова и Эль Лисицкий.Эти художники были заинтересованы в создании искусства, которое служило бы массам. Они пытались найти коммунистическое выражение материального строительства. Строительство и наука были подчеркнуты, а не художественным выражением, а конструктивизм распространился так же широко, как архитектура, дизайн, мода и объекты массового производства.

Добавить комментарий

Ваш адрес email не будет опубликован.


Параметр Значение

MTWV 0,37
RTF 2,0
RTF 2,0