Содержание
ключевые слова — это… Что такое ключевые слова?
- ключевые слова
-
Субъективный лингвистический фактор текстообразования. Ключевые слова являются опорными «вехами» в порождении и восприятии текста.
Их выбор определяется:
1) авторской интенцией;
2) творческим замыслом автора;
3) коммуникативной стратегией текстового развертывания.
Ключевые слова чаще всего находятся в сильной позиции текста:
1) в заглавии;
2) в начальной позиции и в конце.
Ключевые слова обычно актуализируются автором:
1) повторяются;
2) отражают стратегию контраста;
3) стратегию обманутого ожидания;
4) совмещают разные типы выдвижения.
Выбор ключевых слов определяется:
1) темой;
2) идеей;
3) авторским замыслом.
В процессе интерпретации ткста необходимо учитывать языковые средства, находящиеся в образной перспективе ключевого слова.
Словарь лингвистических терминов: Изд. 5-е, испр-е и дополн. — Назрань: Изд-во «Пилигрим».
Т.В. Жеребило.
2010.
- ключевые слова культуры по а. вежбицкой
- книга в культуре речи
Смотреть что такое «ключевые слова» в других словарях:
-
Ключевые слова — в теории коммуникации слова, несущие ключевую информацию. См. также: Лексические единицы Сообщения Финансовый словарь Финам … Финансовый словарь
-
КЛЮЧЕВЫЕ СЛОВА — КЛЮЧЕВЫЕ СЛОВА. Слова, передающие основную информацию в тексте. Способствуют успешному пониманию воспринимаемого на слух либо читаемого текста. Работе с К. с. уделяется большое внимание на занятиях по языку: учащимся предлагаются специальные… … Новый словарь методических терминов и понятий (теория и практика обучения языкам)
-
ключевые слова — Слова, при помощи которых осуществляется поиск сайтов при вводе их в окошке поиска. [http://www.lexikon.ru/rekl/a eng.html] Тематики реклама EN key words … Справочник технического переводчика
-
Ключевые слова — – этим терминологическим словосочетанием некоторые исследователи худож. (поэтической и прозаической) речи называют слова, выражающие главную идею целого худож. текста. К. с. иногда выносятся в названия худож. произведений ( Обрыв И.А. Гончарова,… … Стилистический энциклопедический словарь русского языка
-
Ключевые слова — О термине из программирования см. Зарезервированное слово. Ключевое слово слово в тексте, способное в совокупности с другими ключевыми словами представлять текст (см. релевантность). В вебе используется главным образом для поиска. Набор ключевых … Википедия
-
ключевые слова — Субъективный лингвистический фактор текстообразования. Ключевые слова являются опорными «вехами» в порождении и восприятии текста. Их выбор определяется: 1) авторской интенцией; 2) творческим замыслом автора; 3) коммуникативной… … Методы исследования и анализа текста. Словарь-справочник
-
Ключевые слова — слова, несущие ключевую информацию … Краткий словарь переводческих терминов
-
ключевые слова — см. ключевое слово … Толковый переводоведческий словарь
-
ключевые слова — См. статью реклама2 … Учебный словарь стилистических терминов
-
Ключевые слова Magic: The Gathering — Перед вами список ключевых слов использующихся в игре Magic: The Gathering. Ключевое слово, в контексте Magic: The Gathering, это слово или фраза (обычно пара слов) находящаяся на карте и означающая, что карта обладает определённым свойством или… … Википедия
Ключевые слова на русском языке в системах поиска информации в Интернете (опыт семантического и культурологического анализа) Текст научной статьи по специальности «Языкознание и литературоведение»
КЛЮЧЕВЫЕ СЛОВА НА РУССКОМ ЯЗЫКЕ В СИСТЕМАХ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ (опыт семантического и культурологического анализа)
П.В. Морослин
Международный славянский институт ул. Годовикова, 9, Москва, Россия, 129085
Статья посвящена анализу лексико-семантических и культурологических особенностей ключевых слов, функционирующих в информационно-поисковых системах Интернета. Рассматриваются частотность слов, система принципов номинации, семантические и ассоциативные связи ключевых слов в русскоязычном Интернете.
Ключевые слова: Интернет, система поиска, компьютерная коммуникация, ключевые слова.
Функционирование русского языка в Интернете вызывает значительный интерес исследователей. В научной литературе в последние годы появилось несколько монографий, десятки статей об особенностях русскоязычного Интернета (часто как синоним употребляется и слово Рунет), о новых речевых жанрах появившихся в Интернете на русском языке, об особенностях компьютерной коммуникации на русском языке [1; 2; 3; 4]. К сожалению, работы в данной области пока не позволяют более или менее объективно представить реальное функционирование разных текстов в Сети. Это, на наш взгляд, связано прежде всего с тем, что еще не был проведен более или менее подробный анализ особенностей функционирования электронных текстов в зависимости от задач общения, выполняемых функций, лингвистических особенностей систем хранения и поиска информации, способов создания и функционирования того или иного электронного текста. На наш взгляд, исследование русскоязычного Интернета должно опираться на ряд весьма сложных факторов: особенности самого Интернета как сложной многофункциональной иерархической системы; социолингвистическую характеристику основных групп пользователей, их коммуникативных потребностей, языкового вкуса; учет значительного влияния на развитие русскоязычного Интернета английского языка и культуры и традиций общения на английском языке; тенденции развития и изменения современного русского языка, которые активизировались в конце ХХ — начале ХХ! в.
Важную роль в оценке эффективности текстов, функционирующих в Интернете, играет такой показатель, как ключевые слова, т.е. слова, которые используются при поиске тех или иных веб-текстов, тех, которые пользователи набирают в поисковых системах для того, чтобы найти необходимую информацию. Понятие «ключевые слова» обозначает запросы, по которым тот или иной сайт может быть найден в поисковиках.
Поисковыми системами Интернета проводится статистика запросов — информация об обращениях пользователей к поисковой системе с помощью ключевых слов. В большинстве случаев при работе с сервисом статистики имеется
возможность классифицировать результаты поиска по датам, географии запросов. При этом, как правило, сервис показывает не только данные об искомом запросе, но также и о словосочетаниях, синонимах и близких темах («ищут также»).
Очевидно, что если сайт посвящен туризму и отдыху, то он должен находиться в системах поиска (например, Яндекс, Rambler, Google) на основе лексического запроса «отдых», «курорты», «горящие путевки», названия туристических фирм и т.п.
Эти ключевые слова несут важную информацию об интересах аудитории, в том числе дают представление о национально-ориентированной специфике актуальности электронных текстов на том или ином языке. Ключевые слова косвенным образом характеризуют и саму аудиторию, например, такие часто встречающиеся в 2006 г. ключевые слова российского Интернета, как реферат, рефераты, банк рефератов, гороскоп, погода подтверждают положение, что основными пользователями Интернета являются молодые люди в возрасте от 18 до 32 лет, в большинстве студенты, которых часто интересует информация образовательного характера. В 2008 г. интересы аудитории несколько изменились, на первый план вышли следующие слова: марафон (название известной фирмы в области мобильной связи), переводчик (система электронного перевода), новости, работа, сбербанк и др.
Сравнительный анализ поисковых запросов в англоязычной части Интернета показывает, что среди поисковых запросов первые места занимают слова, связанные с известными актерами, музыкантами, а также с покупками через интернет-магазины.
Намечается ярко выраженная тенденция в отражении системой ключевых слов тех или иных внешних событий, причем в различных жанрах Интернета эти интересы могут отражаться специфическим образом, например, в системе наиболее частотных поисковых запросов в новостных сайтах Интернета, а также в наиболее часто употребляемых словах и темах в блогах. Изменение интересов создателей блогов и тематики блогов в зависимости от тех или иных событий в Яндексе отражается специальными графиками, которые получили название «пульс блого-сферы».
Система формирования ключевых слов является составной частью так называемой контекстной рекламы, которая представляет собой текст рекламного содержания или текст информационного характера. Отличительной чертой контекстной рекламы является то, что она появляется там, где с помощью ключевых слов ищут ту или иную информацию. Контекстная реклама возникает в связи с конкретным тематическим запросом в системе поиска с помощью ключевых слов. Например, если вводится словосочетание русский язык, то контекстная реклама указывает коммерческие курсы, которые предлагают обучение русскому языку. Если в систему поиска вводится ключевое слово школа, то в контекстной рекламе появляются сообщения об адресах школ, о сайтах школ, справочниках.
Поиск по ключевым словам оказывает огромное влияние на популярность того или иного сайта. Согласно данным различных рейтингов популярными являются следующие российские сайты: 1) V Kontakte, 2) http://mail.ru/, 3) Яндекс,
4) Одноклассники.ru, 5) Rambler, 6) Google (русскоязычная версия поискового сервера google.ru), 7) Narod.ru, 8) YouTube и др.
Весьма популярная рейтинговая система Top 100 Rambler в ноябре 2008 г. показывает несколько иную картину. В самые популярные ресурсы Интернета на русском языке входят 1) СМИ и периодика, 2) сервисы (почта, онлайн переводчик, программа просмотра фильмов ru.tube, ресурс для блогов «Живой журнал»), 3) сайты, связанные с товарами и услугами. Следует подчеркнуть, что наблюдается корреляция между популярностью тех или иных групп тематических сайтов и частотностью ключевых слов. Высокочастотными являются слова, связанные с поиском новостей, покупками, развлечениями.
Необходимо подчеркнуть, что отмечаются изменения в актуальности тех или иных ключевых слов в зависимости от внешних событий или обстоятельств. Яркий пример — изменения в количестве ключевых слов во время террористической атаки 11 сентября в США или чемпионата Европы по футболу. Следует отметить, что, несмотря на повышение актуальности тех или иных слов в связи с определенными событиями, общая тенденция выбора ключевых слов для данной лингвокультурной общности остается стабильной.
В анализе запросов Яндекса были опубликованы результаты анализа лингвистических особенностей ключевых слов. Около 2,5% запросов сформулированы как вопрос. Это обычные вопросы, и пользователи, которые их задают, общаются с поисковой системой так, как будто это живой человек. У Яндекса даже спрашивают (Как пройти в библиотеку?) — в среднем 41 раз в месяц, (Зачем Герасим утопил Муму?) — 53 раза и (Кто убил Лору Палмер?) — 107 раз. Вопросов, начинающихся со слова «как», задают больше, чем вопросов, начинающихся со всех остальных вопросительных слов вместе взятых. Интересно, что вопрос «что?» значительно популярнее вопроса «кто?», и в частности вопрос «что делать?» интересует пользователей больше вопроса «кто виноват?»
Самые короткие составляющие запросов к Яндексу — отдельные буквы и цифры. Пользователей интересуют все буквы русского алфавита, больше всего — предлоги и однобуквенные союзы (например, «и» в августе 2008 г. искали 4 385 966 раз), а меньше всего — букву «ъ» (9 тысяч запросов в месяц). Наиболее длинные осмысленные слова, как правило, сложные существительные, состоящие из нескольких корней. Самое длинное слово, заданное в качестве запроса к Яндексу в августе 2008 г., состоит из 37 символов — «гиппопотомомонстросесквиппе-далиофобия». По этому запросу находится 4583 страницы (на сентябрь 2008 г.). Среди самых длинных запросов, на которые существуют ответы в Интернете, преобладают различные химические соединения (этилоксиэтилпарафенилендиамин-сульфат — 35 символов), названия компаний («Средневолжсксельэлектросетьст-рой» — 32 символа) и разного рода фобии (например, гексакосиойгексеконтагек-софобия — 31 символ).
В запросах на поиск картинок самые длинные запросы — это «электростеклоподъемник» и «электроводонагреватель» — по 22 символа. Для общения с поисковой машиной чаще всего используют существительные — эту часть речи со-
держат 75% запросов к поиску. Вторая по распространенности часть речи — прилагательные, они присутствуют в 16% запросов к веб-поиску. Глаголы используют только в 5% случаев, а наречия отмечены менее чем в 1%
Существующие системы анализа ключевых слов позволяют эффективно использовать различные инструменты, показатели для поиска и выбора ключевых слов. В основе сбора данных по ключевым словам лежат два принципа — принцип счетчика (специального скрипта, загружающегося пользователю сервером вместе с загрузкой веб-страницы) и принцип анализа логов (специальных файлов на сервере, фиксирующих все посещения). Оба способа сбора информации работают независимо друг от друга и каждый с определенной степенью погрешности. Из собранной с помощью счетчика или лог-анализатора информации можно формировать разные массивы данных, изучать отдельные срезы и тематические выборки. Подобные обобщенные данные часто можно встретить в исследованиях по глобальной статистике Рунета, например, HotLog и SpyLog.
Предназначение любого интернет-ресурса заключается в эффективном достижении целей, определенных при его создании. Эффективность сайта зависит от его содержания, определяется числом посетителей сайта (в частности, приходящих из поисковых серверов), скоростью и удобством получения интересующей информации, количеством повторных возвращений на данный сайт. Эффективность сайта также зависит от того, насколько интересны статьи, удобна навигация, привлекателен дизайн и т.п. Для оценки эффективности сайта собираются статистические данные посещения данного ресурса, применяются различные методы математической статистики для получения и обработки результатов.
Интернет-статистика дает возможности анализировать различные особенности сайта. Во-первых, можно существенно улучшить дизайн, навигацию и размещение ссылок на сайте. Во-вторых, на основании полученных статистических отчетов возможно повысить рейтинг сайта на крупнейших поисковых системах Рунета (Яндекс, Google, Rambler).
Система сбора интернет-статистики используется для получения данных о посещениях сайта, последующей их обработки и получения различных отчетов, отображающих интересующую информацию. Все это позволяет оценивать эффективность интернет-сайта по разным параметрам, определять удобство пользования как сайтом в целом, так и его различными элементами навигации; характеризовать качество отдельных элементов сайта (баннеров, статей, элементов каталога и т.д.).
Среди основных функциональных возможностей систем статистики считается посещаемость сайта; учитываются все переходы посетителей с поисковых машин по каждой ключевой фразе; рассчитывается время просмотра каждым посетителем каждой страницы сайта; проводится анализ данных статистики посещений для выявления групп предпочтений среди посетителей сайта.
Существуют специальные сервисы поисковых систем, задачей которых является помощь в выборе наиболее подходящих ключевых слов. Чтобы выявить близкие по значению выражения, функционирующие в информационно-поисковых
системах Интернета, можно использовать специальные сервисы поисковых систем Rambler, Яндекс, Google. Эти системы представляет статистику поисковых запросов и работает по принципу «Те, кто ищут (запрос пользователя), ищут также…» Сервис предназначен в помощь пользователю, совершившему поиск по какому-либо запросу и не получившему нужной информации. Статистика «ассоциаций» помогает выяснить интересы пользователей, путем анализа списка запросов, схожих с основными. Статистика анализа запросов Яндекса на ключевое слов русский язык, которое на Яндексе в 2008 г. имело 95641 показ, показывает, что русский язык встречалось также в других словосочетаниях:
Таким образом, предварительный анализ показывает, что ключевые слова вступают в Интернете друг с другом в особые отношения, на основе гипертекстовых связей, тематической связи слов, разного рода нового типа ассоциаций. Возникают, иногда непривычные с точки зрения классической лексикологии семантические связи слов. Например, к ключевому слову виза интернет-системой будут предложены названия фирм, адреса посольств, путеводители, карты дорог, адреса гостиниц и др. Ключевые слова выполняют различные функции: помогают найти текст с соответствующим содержанием; повышают посещаемость (тем самым и рейтинг того или иного сайта), если в текст включаются наиболее частотные или востребованные в данный момент ключевые слова.
[1] Атабекова А.А. Лингвистический дизайн WEB-страниц (сопоставительный анализ языкового оформления англо- и русскоязычных WEB-страниц). — М.: Изд-во РУДН, 2003.
[2] Дедова О.В. Теория гипертекста и гипертекстовые практики в Рунете. — М.: Изд-во МГУ, 2008.
[3] Какорина Е.В. Язык Интернет-коммуникации // Язык массовой и межличностной коммуникации. — М.: Медиатека, 2007.
[4] Трофимова Г.Н. Языковой вкус интернет-эпохи в России: Функционирование русского языка в Интернете: концептуально-сущностные доминанты. — М.: Изд-во РУДН, 2004.
Показов в месяц
Русский язык ЕГЭ русский язык Словарь русского языка Скачать русский язык Русский язык, тесты Правила русского языка Русский язык: результаты Русский язык: результаты ЕГЭ Уроки русского языка Русский язык 2008 Толковый словарь русского языка Курс русского языка ЕГЭ русский язык 2008 Учебник русского языка Фотошоп русский язык
95 641 9 467 7 988 5 750 5 261 3 810 2 999 2 677 1 510 1 436 1 282 1 263 1 147 1 129 1 090
ЛИТЕРАТУРА
RUSSIAN KEY WORDS IN THE INTERNET SEARCH ENGINES (semantically and cultural approaches)
P.V. Moroslin
International Slavonic Institute
Godovikova str., 9, Moscow, Russia, 129085
The research dealt with both linguistic and cultural approaches in considering Russian key words in the Internet search engines. In the article systems of collecting and saving key words were considered as well as a process and results for a new type of semantically and associative relations among key words in the Internet analyzed.
Key words: the Internet, the system of search, computer communication, the keywords.
Ключевое словосочетание — wiki студи Клондайк
Ключевое словосочетание — это словосочетание, которое, представляет страницу сайта, исходя из запросов поиска в поисковой системе. То есть в ключевом слове должны сочетаться качества, удовлетворяющие как поисковик, так и искомый сайт. Пример: есть сайт мастерской, которая занимается ремонтом часов. Ремонт часов и есть наша ключевая фраза, которая повторяется на странице несколько раз. Посетитель поисковой системы вводит наш оптимизированный запрос и находит нас в поисковой выдаче.
От того насколько часто вводится ключевое словосочетание в поисковую строку определяется частотность ключевого запроса.
Частотности запросов делятся на три вида:
- высокочастотники
- среднечастотники
- низкочастотники
Четких границ определяющих к какой группе частотности относится запрос не существует.
Чтобы объявление было показано более широкой аудитории, заинтересованной в вашем предложении и услугах, вы можете расширить список слов/словосочетаний, которые задействованы в кампании.
При этом:
- Всегда следует помнить о синонимах. Например, к словосочетанию «продажа автомобилей» имеет смысл добавить «продажа машин», а к фразе «отдых в Турции» — названия городов «Анталия», «Кемер», «Мармарис», «Бодрум» и др. Некоторые популярные синонимы можно найти в словаре русских синонимов и сходных по смыслу выражений.
- Необходимо учитывать профессиональные термины (сленг). Например, «наружная реклама» и «наружка», «сувенирная продукция» и «сувенирка», «выделенная линия» и «выделенка».
- Используйте разные части речи с одним корнем. Например, к словосочетанию «магазин мебели» может быть целесообразным добавить «мебельный магазин».
- Помните об опечатках. Яндекс. Директ учитывает популярные опечатки и запросы, набранные без переключения раскладки клавиатуры. В ответ на такие запросы будут показаны объявления по автоматически исправленным запросам. Однако редкие опечатки и различные варианты написания слов не будут исправлены автоматически. Чтобы объявление показывалось по таким целевым, но неправильно набранным запросам, необходимо при подборе ключевых слов учесть и слова с опечатками.
- Учтите сложносоставные слова. Например, слово «металлочерепица» можно написать с пробелом посередине: «металло черепица».
- Не используйте общие слова, такие как «ремонт», «реклама», «аренда», «доставка» и т. п., поскольку это снижает эффективность рекламной кампании. Вместо них имеет смысл использовать словосочетания, например: «ремонт принтеров», «наружная реклама», «аренда грузовиков».
- Воспользуйтесь сервисом подбора слов для получения широкого списка запросов пользователей Яндекса.
Пример оформления статьи в научную конференцию
Предлагаем вам опубликовать свои научные труды в наших изданиях
Требования к оформлению статей для конференций
- К публикации принимаются статьи объемом не менее 5 страниц машинописного текста. Мы просим предоставлять некоторые части статьи на двух языках, ниже вы сможете ознакомиться с требованиями поподробнее.
- Для набора текста, формул и таблиц следует использовать редактор Microsoft Word для Windows. Параметры текстового редактора: все поля по 2 см; шрифт Times New Roman, размер – 14; межстрочный интервал – 1,5; выравнивание по ширине; абзацный отступ 1 см; ориентация листа – книжная. Рисунки, выполненные в MS Word, не принимаются. Все рисунки и таблицы, должны быть пронумерованы и снабжены названиями или подрисуночными подписями.
- Оформление заголовка на русском языке: (прописными, жирными буквами, выравнивание по центру строки) НАЗВАНИЕ СТАТЬИ; на следующей строке (шрифт жирный курсив, выравнивание по правому краю) – Ф.И.О. автора статьи полностью; на следующей строке (шрифт курсив, выравнивание по правому краю) – ученое звание, ученая степень, название вуза или должность и место работы (полностью), страна, город (сокращения не допускаются); на следующей строке (шрифт курсив, выравнивание по правому краю) – E-mail для контактов. Если авторов статьи несколько, то информация повторяется для каждого автора.
- Оформление заголовка на английском языке: та же информация повторяется на английском языке.
- Аннотация на русском и английском языке не более 600 знаков (считая с пробелами) для аннотации на каждом языке.
- Ключевые слова (приводятся на русском и английском языках) отделяются друг от друга точкой запятой.
- Через 1 строку – текст статьи.
- Через 1 строку — надпись «Список литературы». После нее приводится список литературы в алфавитном порядке, со сквозной нумерацией, оформленный в соответствии с ГОСТ Р 7.0.5 – 2008 (пример оформления). Ссылки в тексте на соответствующий источник из списка литературы оформляются в квадратных скобках, например: [1, с. 277]. Использование автоматических постраничных ссылок не допускается.
Образец оформления текста статьи
АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ ИНТЕЛЛЕКТУАЛЬНЫМ ЗДАНИЕМ НА ОСНОВЕ ДАТЧИКОВ
Иванов Иван Иванович
канд. техн. наук, зав. кафедрой информационно-измерительных систем,
доцент, Новосибирский государственный технический университет,
РФ, г. Новосибирск
E-mail: [email protected]
AUTOMATIC CONTROL OF INTELLIGENT BUILDINGS BASED ON SENSORS
Ivan Ivanov
Candidate of Science, Head of Information and Measuring Systems department,
assistant professor, Novosibirsk State Technical University,
Russia, Novosibirsk
АННОТАЦИЯ
Цель. Метод. Результат. Выводы.
ABSTRACT
Background. Methods. Result. Conclusion.
Ключевые слова: ключевое слово; ключевое слово; ключевое слово.
Keywords: keyword; keyword; keyword.
Текст статьи. Текст статьи. Текст статьи. Текст статьи. Текст статьи. «Цитата» [1, с. 35]. Текст статьи. Текст статьи. Текст статьи. Текст статьи.
Таблица 1.
Название таблицы
Текст | Текст | Текст | Текст |
---|---|---|---|
Текст | Текст | Текст | Текст |
Текст | Текст | Текст | Текст |
Текст | Текст | Текст | Текст |
Текст статьи. Текст статьи. Текст статьи. Текст статьи. Текст статьи. «Цитата» [2, с. 35]. Текст статьи. Текст статьи. Текст статьи. Текст статьи.
Рисунок 1. Название рисунка
Текст статьи. Текст статьи. Текст статьи. Текст статьи. Текст статьи. «Цитата» [3, с. 35]. Текст статьи. Текст статьи. Текст статьи. Текст статьи.
(1)
где: — текущая скалярная мера усталостных повреждений;
— текущее значение предела выносливости материала, МПа;
— эффективная частота процесса, Гц;
— коэффициент в корреляционной зависимости между пределом выносливости и пределом прочности по Эйхингеру;
— коэффициент порога чувствительности.
Текст статьи. Текст статьи. Текст статьи. Текст статьи. Текст статьи.
Список литературы
1.
2.
3.
Образец оформления текста статьи
Ключевые слова в C | Microsoft Docs
-
- Чтение занимает 2 мин
В этой статье
Ключевыми словами называются слова, которые имеют особое значение для компилятора C. На 7 и 8 этапах трансляции идентификатор не может иметь такое же написание и регистр записи, что и ключевое слово C. Дополнительные сведения см. в разделе Этапы преобразования Справочника по препроцессору. Дополнительные сведения об идентификаторах см. в этом разделе.
Ключевые слова стандартного языка C
В языке C используются следующие ключевые слова:
auto
break
case
char
const
continue
default
do
double
else
enum
extern
float
for
goto
if
inline
1, aint
long
register
restrict
1, areturn
short
signed
sizeof
static
struct
switch
typedef
union
unsigned
void
volatile
while
_Alignas
2, a_Alignof
2, a_Atomic
2, b_Bool
1, a_Complex
1, b_Generic
2, a_Imaginary
1, b_Noreturn
2, a_Static_assert
2, a_Thread_local
2, b
1 Ключевые слова, представленные в стандарте ISO C99.
2 Ключевые слова, представленные в стандарте ISO C11.
a Начиная с Visual Studio 2019 версии 16.8, эти ключевые слова поддерживаются в коде, скомпилированном как C, если указаны параметр компилятора /std:c11
или /std:c17
.
b Начиная с Visual Studio 2019 версии 16.8, эти ключевые слова распознаются но не поддерживаются компилятором в коде, скомпилированном как C, если указаны параметр компилятора /std:c11
или /std:c17
.
Переопределить ключевые слова невозможно. Но с помощью директив препроцессора C можно определить текст, который будет использоваться вместо ключевых слов.
Ключевые слова C для систем Microsoft
Стандарты ANSI и ISO C позволяют зарезервировать идентификаторы, начинающиеся с двух символов подчеркивания, для реализаций компилятора. Поэтому в системах Microsoft действует соглашение, что используемые в них ключевые слова начинаются с двух символов подчеркивания. Эти слова невозможно использовать как имена идентификаторов. Описание правил именования идентификаторов, включая использование двойных знаков подчеркивания, см. в статье об идентификаторах.
Компилятор Microsoft C распознает следующие ключевые слова и особые идентификаторы.
__asm
5__based
3, 5__cdecl
5__declspec
5__except
5__fastcall
__finally
5
__inline
5__int16
5__int32
5__int64
5__int8
5__leave
5__restrict
__stdcall
5__try
5dllexport
4dllimport
4naked
4static_assert
6thread
4
3 Ключевое слово __based
имеет ограниченное применение: в компиляциях для 32- и 64-разрядных платформ.
4 Если эти ключевые слова используются с ключевым словом __declspec
, они являются особыми идентификаторами. В других контекстах они могут использоваться без ограничений.
5 Для совместимости с предыдущими версиями эти ключевые слова доступны как с двумя символами подчеркивания в начале, так и с одним при включении расширений Microsoft.
6 Если файл <assert.h> не включен, компилятор Microsoft Visual C сопоставляет static_assert
с ключевым словом C11 _Static_assert
.
Расширения Microsoft по умолчанию включены. Чтобы помочь в создании переносимого кода, расширения Microsoft можно отключить, указав во время компиляции параметр /Za (Отключить расширения языка) . При этом некоторые ключевые слова для систем Microsoft будут отключены.
Когда расширения Microsoft включены, в программах можно использовать перечисленные выше ключевые слова. Для совместимости со стандартами большинство этих ключевых слов начинаются с двух символов подчеркивания. Четыре исключения, dllexport
, dllimport
, naked
и thread
, используются только с ключевым словом __declspec
и поэтому не требуют двойного знака подчеркивания. Для всех остальных ключевых слов поддерживаются версии с одним символом подчеркивания. Это сделано для обеспечения обратной совместимости.
См. также
Элементы языка C
Структура научной статьи
Научная статья имеет четкую структуру и, как правило, состоит из следующих частей.
- Название (заголовок).
- Аннотация.
- Ключевые слова.
- Введение.
- Обзор литературы.
- Основная часть (методология, результаты).
- Выводы и дальнейшие перспективы исследования.
- Список литературы.
Рассмотрим особенности составных элементов научной статьи и основные требования, которые необходимо соблюдать при работе над ними.
Название
Название (заголовок) — обозначение структурной части основного текста произведения (раздела, главы, параграфа, таблицы и др.) или издания.
Основное требование к названию статьи — краткость и ясность. Максимальная длина заголовка — 10—12 слов. Название должно быть содержательным, выразительным, отражать содержание статьи.
При выборе заголовка статьи необходимо придерживаться следующих общих рекомендаций.
- Заглавие должно быть информативным.
- Название должно привлекать внимание читателя.
- В названии, как и во всей статье, следует строго придерживаться научного стиля речи.
- Оно должно четко отражать главную тему исследования и не вводить читателя в заблуждение относительно рассматриваемых в статье вопросов.
- В название должны быть включены некоторые из ключевых слов, отражающих суть статьи. Желательно, чтобы они стояли в начале заголовка.
- В заголовке можно использовать только общепринятые сокращения.
При переводе заглавия статьи на английский язык не должно использоваться никаких транслитераций с русского языка, кроме непереводимых названий собственных имен, приборов и др. объектов, имеющих собственные названия; также не используется непереводимый сленг, известный только русскоговорящим специалистам.
Аннотация
Аннотация — это не зависимый от статьи источник информации. Ее пишут после завершения работы над основным текстом статьи. Она включает характеристику основной темы, проблемы, объекта, цели работы и ее результаты. В ней указывают, что нового несет в себе данный документ в сравнении с другими, родственными по тематике и целевому назначению. Рекомендуемый объем — 100 – 250 слов на русском и английском языках.
Аннотация выполняет следующие функции:
- позволяет определить основное содержание статьи, его релевантность и решить, следует ли обращаться к полному тексту публикации;
- предоставляет информацию о статье и устраняет необходимость чтения ее полного текста в случае, если статья представляет для читателя второстепенный интерес;
- используется в информационных, в том числе автоматизированных, системах для поиска документов и информации.
Аннотации должны быть оформлены по международным стандартам и включать следующие моменты.
- Вступительное слово о теме исследования.
- Цель научного исследования.
- Описание научной и практической значимости работы.
- Описание методологии исследования.
- Основные результаты, выводы исследовательской работы.
- Ценность проведенного исследования (какой вклад данная работа внесла в соответствующую область знаний).
- Практическое значение итогов работы.
В аннотации не должен повторяться текст самой статьи (нельзя брать предложения из статьи и переносить их в аннотацию), а также ее название. В ней не должно быть цифр, таблиц, внутритекстовых сносок.
В аннотации должны излагаться существенные факты работы, и не должно содержать материал, который отсутствует в самой статье.
Предмет, тема, цель работы указываются, если они не ясны из заглавия статьи; метод или методологию проведения работы имеет смысл описывать в том случае, если они отличаются новизной или представляют интерес с точки зрения данной работы.
Результаты работы описывают предельно точно и информативно. Приводятся основные теоретические и экспериментальные результаты, фактические данные, обнаруженные взаимосвязи и закономерности. При этом отдается предпочтение новым результатам, важным открытиям, выводам, которые опровергают существующие теории, а также данным, имеющим практическое значение.
Выводы могут сопровождаться рекомендациями, оценками, предложениями, гипотезами, описанными в статье.
Сведения, содержащиеся в заглавии статьи, не должны повторяться в тексте авторского резюме.
В тексте аннотации следует употреблять синтаксические конструкции, свойственные языку научных и технических документов, избегать сложных грамматических конструкций. Он должен быть лаконичен и четок, без лишних вводных слов, общих формулировок.
ПРИМЕР АВТОРСКОГО РЕЗЮМЕ НА РУССКОМ ЯЗЫКЕ:
Значительная часть инновационных планов по внедрению изменений, содержащих в своей основе нововведения, либо не доходит до практической реализации, либо в действительности приносит гораздо меньше пользы, чем планировалось. Одна из причин этих тенденций кроется в отсутствии у руководителя реальных инструментов по планированию, оценке и контролю над инновациями. В статье предлагается механизм стратегического планирования компании, основанный на анализе как внутренних возможностей организации, так и внешних конкурентных сил, поиске путей использования внешних возможностей с учетом специфики компании. Стратегическое планирование опирается на свод правил и процедур, содержащих серию методов, использование которых позволяет руководителям компаний обеспечить быстрое реагирование на изменение внешней конъюнктуры. К таким методам относятся: стратегическое сегментирование; решение проблем в режиме реального времени; диагностика стратегической готовности к работе в условиях будущего; разработка общего плана управления; планирование предпринимательской позиции фирмы; стратегическое преобразование организации. Процесс стратегического планирования представлен в виде замкнутого цикла, состоящего из 9-ти последовательных этапов, каждый из которых представляет собой логическую последовательность мероприятий, обеспечивающих динамику развития системы. Результатом разработанной автором методики стратегического планирования является предложение перехода к «интерактивному стратегическому менеджменту», который в своей концептуальной основе ориентируется на творческий потенциал всего коллектива и изыскание путей его построения на основе оперативного преодоления ускоряющихся изменений, возрастающей организационной сложности и непредсказуемой изменяемости внешнего окружения.
ЭТО ЖЕ АВТОРСКОЕ РЕЗЮМЕ НА АНГЛИЙСКОМ ЯЗЫКЕ:
A considerable part of innovative plans concerning implementation of developments with underlying novelties either do not reach the implementing stage, or in fact yield less benefit than anticipated. One of the reasons of such failures is the fact that the manager lacks real tools for planning, evaluating and controlling innovations. The article brings forward the mechanism for a strategic planning of a company, based on the analysis of both inner company’s resources, and outer competitive strength, as well as on searching ways of using external opportunities with account taken of the company’s specific character. Strategic planning is based on a code of regulations and procedures containing a series of methods, the use of which makes it possible for company’s manager to ensure prompt measures of reaction to outer business environment changes. Such methods include: strategic segmentation; solving problems in real-time mode; diagnostics of strategic readiness to operate in the context of the future; working out a general plan of management; planning of the business position of the firm; strategic transformation of the company. Strategic planning process is presented as a closed cycle consisting of 9 successive stages, each of them represents a logical sequence of measures ensuring the dynamics of system development. The developed by the author strategic planning methods result in the recommendation to proceed to “interactive strategic management” which is conceptually based on the constructive potential of the collective body, on searching ways of its building on the basis of effective overcoming accelerating changes, increasing organizational complexity, and unpredictable changeability of the environment.
Ключевые слова
Ключевые слова выражают основное смысловое содержание статьи, служат ориентиром для читателя и используются для поиска статей в электронных базах. Размещаются после аннотации в количестве 4—8 слов, приводятся на русском и английском языках. Должны отражать дисциплину (область науки, в рамках которой написана статья), тему, цель, объект исследования.
Введение
Введение призвано дать вводную информацию, касающуюся темы статьи, объяснить, с какой целью предпринято исследование. При написании введения автор прежде всего должен заявить общую тему исследования. Далее необходимо раскрыть теоретическую и практическую значимость работы и описать наиболее авторитетные и доступные для читателя публикации по рассматриваемой теме. Во введении автор также обозначает проблемы, не решенные в предыдущих исследованиях, которые призвана решить данная статья.
Во введении в обязательном порядке четко формулируются:
- цель и объект предпринятого автором исследования. Работа должна содержать определенную идею, ключевую мысль, раскрытию которой она посвящена. Чтобы сформулировать цель, необходимо ответить на вопрос: «Что вы хотите создать в итоге проведенного исследования?» Этим итогом могут быть новая методика, классификация, алгоритм, структура, новый вариант известной технологии, методическая разработка и т. д. Формулировка цели любой работы, как правило, начинается с глаголов: выяснить, выявить, сформировать, обосновать, проверить, определить и т. п. Объект — это материал изучения.
- актуальность и новизна. Актуальность темы — степень ее важности в данный момент и в данной ситуации. Это способность результатов работы быть применимыми для решения достаточно значимых научно-практических задач. Новизна — это то, что отличает результат данной работы от результатов, полученных другими авторами.
- исходные гипотезы, если они существуют.
Также в этой части работы читателя при необходимости знакомят со структурой статьи.
После написания введения его необходимо проанализировать по следующим ключевым пунктам:
четко ли сформулированы цели, объект и исходные гипотезы, если они существуют;·
нет ли противоречий;·
указана ли актуальность и новизна работы;·
упомянуты ли основные исследования по данной теме.·
Обзор литературы
Обзор литературы представляет собой теоретическое ядро исследования. Его цель — изучить и оценить существующие работы по данной тематике. Предпочтительным является не просто перечисление предшествующих исследований, но их критический обзор, обобщение основных точек зрения.
Основная часть
Методология
В данном разделе описывается последовательность выполнения исследования и обосновывается выбор используемых методов. Он должен дать возможность читателю оценить правильность этого выбора, надежность и аргументированность полученных результатов. Смысл информации, излагаемой в этом разделе, заключается в том, чтобы другой ученый достаточной квалификации смог воспроизвести исследование, основываясь на приведенных методах. Отсылка к литературным источникам без описания сути метода возможна только при условии его стандартности или в случае написания статьи для узкоспециализированного журнала.
Результаты
В этой части статьи должен быть представлен авторский аналитический, систематизированный статистический материал. Результаты проведенного исследования необходимо описывать достаточно полно, чтобы читатель мог проследить его этапы и оценить обоснованность сделанных автором выводов. По объему эта часть занимает центральное место в научной статье. Это основной раздел, цель которого заключается в том, чтобы при помощи анализа, обобщения и разъяснения данных доказать рабочую гипотезу (гипотезы). Результаты при необходимости подтверждаются иллюстрациями — таблицами, графиками, рисунками, которые представляют исходный материал или доказательства в свернутом виде. Важно, чтобы проиллюстрированная информация не дублировала текст. Представленные в статье результаты желательно сопоставить с предыдущими работами в этой области как автора, так и других исследователей. Такое сравнение дополнительно раскроет новизну проведенной работы, придаст ей объективности.
В зависимости от уровня знаний — теоретического или эмпирического — различают теоретические и эмпирические статьи. Теоретические научные статьи включают результаты исследований, выполненных с помощью таких методов познания, как абстрагирование, синтез, анализ, индукция, дедукция, формализация, идеализация, моделирование. Если статья имеет теоретический характер, чаще всего она строится по следующей схеме: автор вначале приводит основные положения, мысли, которые в дальнейшем будут подвергнуты анализу с последующим выводом. Эмпирические научные статьи, используя ряд теоретических методов, в основном опираются на практические методы измерения, наблюдения, эксперимента и т. п.
Результаты исследования должны быть изложены кратко, при этом содержать достаточно информации для оценки сделанных выводов, также должно быть очевидно, почему для анализа выбраны именно эти данные.
Заключение, выводы
Заключение содержит краткую формулировку результатов исследования. В нем в сжатом виде повторяются главные мысли основной части работы. Всякие повторы излагаемого материала лучше оформлять новыми фразами, новыми формулировками, отличающимися от высказанных в основной части статьи. В этом разделе необходимо сопоставить полученные результаты с обозначенной в начале работы целью. В заключении суммируются результаты осмысления темы, делаются выводы, обобщения и рекомендации, которые вытекают из работы, подчеркивается их практическая значимость, а также определяются основные направления для дальнейшего исследования в этой области. В заключительную часть статьи желательно включить попытки прогноза развития рассмотренных вопросов.
Работа с ключевыми словами русской культуры на уроках русского языка в 5 классе | Статья по русскому языку (5 класс) по теме:
Работа с ключевыми словами русской культуры на уроках русского языка в 5 классе
Сокровищница родного слова хранит плоды глубоких раздумий многих поколений, плоды исторических событий, верования, воззрения, следы прожитого горя и радости. Всю свою духовную жизнь народ бережно сохранил в слове. Язык народа является богатейшим источником знания о быте и нравах русского народа. К сожалению, современный школьник об истории русской культуры, русского народа имеет смутное представление. Поэтому на уроках русского языка я стараюсь сделать так, чтобы ученики обратили внимание на слово, его значение, заглянули в историю, смогли понять, что слово — носитель и хранитель духовной культуры народа. Работу начинаю в 5 классе с изучения раздела «Лексика». С этой целью из большого количества слов я выбираю «главные», ключевые – носители русской культуры. С помощью этих слов «культура входит в ментальный мир человека … и посредством чего … обычный человек, не «творец культурных ценностей» — сам входит в культуру, а в некоторых случаях и влияет на неё» [Степанов 2004: 43].
Ключевых слов, по мнению Ю.С.Степанова, всего сорок-пятьдесят. Центральное место среди них занимают те, которые связаны с морально-нравственными оценками человека: «Истина», «Ложь», «Добро», «Зло», «Свобода», «Милосердие», «Честь». Именно с ними я стараюсь работать на уроке. Кроме того, из числа ключевых я отбираю слова, несущие наряду с культурной и воспитательную функцию: «Родина», «Россия», «Народ». Им я уделяю особое внимание.
Работаем мы так. Сначала учащиеся узнают о значении и смысле слова «Родина», потом – «Россия». Разбираем, когда «Родина» пишется с маленькой буквы, когда – с большой. Предлагаю выписать лексическое значение. Учащиеся отмечают, что Родина – это «отечество, родная страна». Наша страна, в которой живем, — Россия. Кроме того, родиной называют место, где родился, «происхождение, возникновение чего-нибудь». Со словом «родина» составляем словосочетания и предложения. Например, любовь к родине, защита родины, малая родина. Обязательно проводим работу с этимологическим словарем, разбираем происхождение слова, в каком плане оно значимо для русской культуры.
Следующий этап – работа с произведениями устного народного творчества. Предлагаю пятиклассникам вспомнить русские пословицы и поговорки по данной теме. Работаем сначала на уроке. Домашнее задание – подобрать как можно больше пословиц и поговорок о родине. Предлагаю сделать книжку «Пословицы и поговорки о родине». Учащиеся знакомятся со сборником В.И.Даля «Пословицы русского народа». Особое внимание уделяю таким пословицам: «В каком народе живешь, того и обычья держись», «Глупа та птица, которой гнездо свое немило», «Без корня и полынь не растет», «На чужой стороне и весна не красна», «Родимая сторона – мать, чужая – мачеха», «Где кто родится, там и пригодится». Обращаем внимание на пословицы, в которых содержатся знания об обычаях, быте русского народа. На основании рассмотренного обязательно делаем вывод, что для русского человека значит Родина, почему мы должны гордиться своей страной. Последний этап – написать сочинение по пословице.
Дальше продолжаю работу, используя образцы русской речи, представленные в русской художественной литературе прошлого и произведениях современных авторов. Сначала анализируем произведения русских поэтов первой половины XIX века. Учащиеся выписывают примеры в отдельную тетрадь. Анализируя, приходим к выводу, что у слов и словосочетаний, называющих Родину (Родина, Отчизна, Отечество, родной край, страна отцов и т.д.), обобщенно-отвлеченный смысл. Наиболее часто повторяющаяся лексическая группа – это существительные, обозначающие детали сельского пейзажа, называющие жителей сельской местности, элементы их материальной и духовной жизни, явления природы: кров, очаг, дом, хижина, обитель, уголок, лес, ручей и т.д. Рядом с этими существительными выписываем определения-эпитеты: кров, домик, уголок – смиренный, уединенный, неприметный, скромный; хижина – бедная; лес – темный; ручей – прозрачный, серебристый, сверкающий, кристальный. Приводим примеры:
Приди под кров родной,
Под кров уединенный,
Счастливый и простой.
П.Вяземский
О, край моих отцов! О мирное наследство!
Всегда присутственны вы в памяти моей:
И в берегах крутых сверкающий ручей,
И светлые луга, и темные дубравы,
И сельских жителей приветливые нравы.
Е.Баратынский
Делаем вывод, что для русской поэзии первой половины XIX века типично представление родины как места рождения человека и как места жизни и упокоения отцов (предков). Этим объясняется постоянное построение таких словосочетаний, как прах отцов, отеческие могилы, отчий гроб. Каждое слово, словосочетание рассматриваем, приводим примеры употребления этих слов в других значениях, разбираем, говорим ли эти слова сегодня.
Обратимся, например, к произведению В.А.Жуковского:
Там в старину все жило, все цвело,
Там он играл младенцем в колыбели…
Неси ж туда, где наш отец и брат
Спокойным сном в приюте гроба спят…
Тогда явилось все величие народа,
Спасающего трон и святость алтарей,
И тихий гроб отцев, и колыбель детей,
И старцев седины, и младость дев цветущих,
И славу прежних лет, и славу лет грядущих.
Ученики приходят к выводу, что понятие Родины у В.А.Жуковского раскрывается с помощью контрастной лексики (противопоставление): гроб отцов – колыбель детей, старцев седины – младость дев цветущих, слава прежних лет – слава лет грядущих. Работа над произведениями первой половины XIX века сложная, поэтому каждый пример, каждое стихотворение разбираем на уроке.
Ученики 5 класса всегда с удовольствием работают с текстами К.Г.Паустовского, удивительного знатока русского слова. Выбираю отрывки из произведения «Мещерская сторона», «Золотая роза». На уроке читаем отрывок из книги «Золотая роза» («Я большой любитель разбирать слова…»). Записываем выделенные слова: родник, зарождается, родит, родина, народ, родня. Выясняем, почему лесник объединил их. Разбираем значение каждого слова, делаем и словообразовательный разбор. Далее прошу объяснить слова автора: «Родник родит реку, а река льется-течет через всю нашу матушку-землю, через всю родину, кормит народ. Вы глядите, как это складно выходит, — родник, родина, народ. И все эти слова как бы родня между собой…», «Весь многовековой опыт народа, вся поэтическая сторона его характера заключались в этих словах». Как итог работы над текстом предлагаю написать сочинение «Моя родина».
Пятиклассники всегда с удовольствием пытаются разобраться в значениях слова, что хотел сказать автор, фантазируют, выдвигают свои гипотезы. Иначе говоря, с удовольствием работают со словом. Стараются постичь его смысл, заглянуть в историю его возникновения. На каждом таком уроке я наблюдаю, как развивается духовный мир школьников, проявляется интерес к слову, истории русского языка и русского народа. Как приятно видеть, что ученики овладевают богатством русской речи.
Даже небольшое количество часов, отведенных на изучение лексики, позволяет показать учащимся богатство и красоту родного слова, расширяет и углубляет знания учащихся о жизни русского народа, о русской культуре.
Литература
Степанов Ю.С. Константы: Словарь русской культуры. – М., 2004
Клюева Г.Ю., Формирование культуроведческой компетенции учащихся V – VI классов при изучении лексики на уроках русского языка // РЯШ.- 2009.- №6
Twitter-ботов и русские тролли усиливают дебаты о вакцинах
Исходное количество твитов с разбивкой по источникам показано в Таблице C (доступно в качестве дополнения к онлайн-версии этой статьи на http://www.ajph.org). показывает, что аккаунты, идентифицированные NBC News как русские тролли20 или Варолом и др. как изощренные боты25 или источники, загрязняющие контент21 (т. е. учетные записи, распространяющие вредоносное ПО и нежелательный контент), с гораздо большей вероятностью будут писать в Твиттере о вакцинации, чем среднестатистические пользователи Твиттера.Кроме того, аккаунты, которые Конгресс США определяет как российских троллей26, значительно чаще писали в Твиттере о болезнях, которые можно предотвратить с помощью вакцин (например, вирусе Зика), но не обязательно о вакцинах. Наконец, традиционные спам-боты23,24 (разработанные так, чтобы их можно было распознать как ботов) и загрязнители контента значительно реже писали в Твиттере о болезнях, которые можно предотвратить с помощью вакцин, чем средний пользователь Twitter.
Содержание антивакцины
Мы собрали 899 твитов из потока вакцин, отражающих активность известных ботов и троллей.Аннотаторы достигли умеренного согласия по первому раунду аннотации этих твитов (Fleiss κ = 0,48). Кроме того, мы собрали 9895 твитов из потока вакцины, представляющих активность различных пользователей Twitter, также с умеренным начальным соглашением между аннотаторами (Fleiss κ = 0,49). Во всех случаях аннотаторы достигли консенсуса еще через 2 раунда. Мы разделили эти твиты на 3 подмножества: 450 (5%) твитов с оценкой Botometer 20% или ниже, 290 (3%) твитов с оценкой 80% или выше и 7518 (76%) твитов с промежуточной оценкой.В общей сложности 1587 (16%) твитов были связаны с пользователями, чьи оценки не могли быть определены (например, из-за того, что их учетные записи были удалены).
Одна из стратегий, используемых ботами и троллями, заключается в создании нескольких твитов на одни и те же темы с целью переполнения дискурса.17 Таким образом, чтобы лучше понять поведение каждого типа учетной записи, мы изучили общую долю твитов, которые были генерируется уникальными пользователями — возможный индикатор поведения ботов или троллей — для оценки того, проявляли ли аккаунты с более высокими баллами ботов такое поведение.показывает, что учетные записи с промежуточным баллом ботов отправили больше твитов на учетную запись в целом. Точно так же аккаунты с промежуточным баллом публиковали значительно больше поляризованных и нейтральных твитов на аккаунт; тем не менее, их количество твитов о провакцине существенно не отличалось от показателей неботов после учета множественных сравнений. Напротив, учетные записи с высокими показателями ботов публиковали более нейтральные, но не поляризованные твиты для каждой учетной записи.
Количество твитов на уникальную учетную запись, разделенных по настроениям и категориям оценок ботов: 14 июля 2014 г. — 26 сентября 2017 г.
a Незначительно после контроля множественных сравнений с использованием процедуры Холма – Бонферрони.Исходные подсчеты приведены в Таблице D (доступной в качестве дополнения к онлайн-версии этой статьи на http://www.ajph.org).
** P <0,01; *** P <0,001.
показывает пропорции поляризованных и антивакцинных сообщений по типу пользователя. Результаты показывают, что аккаунты с промежуточными баллами ботов публикуют значительно более поляризованный контент, чем сообщения не-ботов. Эти аккаунты и те, чьи оценки ботов не могли быть определены, публиковали антивакцины со значительно большей скоростью, чем неботы.Напротив, известные боты и тролли публиковали сообщения, которые были не более поляризованными, чем сообщения обычных пользователей, не являющихся ботами. Загрязнители контента — злонамеренные аккаунты, которые идентифицируются как продвигающие коммерческий контент и вредоносное ПО, — размещали значительно больше материалов против вакцины. Учетные записи троллей и изощренные боты публиковали примерно одинаковое количество информации о вакцинах и против вакцинации.
ТАБЛИЦА 1—
Пропорции поляризованных и антивакцинных твитов по типам пользователей: 14 июля 2014 г. — 26 сентября 2017 г.
Тип пользователя | поляризованные,% | Антивакцина,% |
Разные пользователи, оценка бота,% | ||
<20 | 31 | 35 |
20–80 | 39 *** | 60 *** |
> 80 | 26 | 49 * , a |
Неизвестно | 37 * , a | 62 *** |
Известные боты и тролли | ||
NBC Русские тролли20 | 20 * , a | 47 |
Контент загрязнители21 | 38 | 60 *** |
Поддельные подписчики22 | 0 | NA |
Традиционные спам-боты23,24 | 3 *** | 0 |
Социальные спам-боты23,24 | 18 ** | 56 * , a |
Сложные боты25 | 28 | 44 |
Список российских троллей в Конгрессе 26 | 39 | 48 |
Качественный анализ #VaccinateUS
Из 253 сообщений, содержащих # 43Vaccinate % были провакцинами, 38% — антивакцинами, а остальные 19% — нейтральными.В то время как большинство ненейтральных хэштегов, относящихся к вакцинам, были четко определены как провакцина (#vaccineswork, #vaxwithme) или противовакцина (#Vaxxed, # b1less, #CDCWhistleblower), с ограниченным использованием противоположной стороной, #VaccinateUS уникален тем, что появляется с очень поляризованные сообщения с обеих сторон, без других ненейтральных хэштегов.
Сообщения, содержащие #VaccinateUS, содержат сочетание грамматических ошибок, неестественного выбора слов и неправильной формулировки. Однако сообщения #VaccinateUS содержат меньше орфографических и пунктуационных ошибок, чем сопоставимые твиты из общего потока вакцины.Сообщения #VaccinateUS также отличаются тем, что они не содержат ссылок на внешний контент, редких @ упоминаний других пользователей и изображений (но иногда используют некоторые смайлики).
Тематически сообщения с #VaccinateUS отражают общий дискурс о вакцинах в Твиттере (рамка на странице 1383). Хотя авторы этих твитов имеют достаточно полное представление о содержании аргументов против вакцинации и против вакцинации, их сообщения отличаются небольшими различиями. Авторы сообщений #VacccinateUS склонны явно связывать как пропагандистские, так и антивакцинные сообщения с политикой США и часто используют эмоциональные призывы к «свободе», «демократии» и «конституционным правам».Напротив, другие твиты из потока вакцин больше сосредоточены на «выборе родителей» и конкретном законодательстве, связанном с вакцинами.
BOX 1
Примеры твитов с #VaccinateUS и соответствующими темами: 14 июля 2014 г. — 26 сентября 2017 г.
Антивакцинная тема | Пример твита |
Свобода выбора / антимонопольная | VaccinateUS обязательные # вакцины нарушают религиозные свободы, защищенные конституцией |
Не могу доверять правительству в отношении вакцин | Знаете ли вы, что существует секретная правительственная база данных о # детях, поврежденных вакцинами? #VaccinateUS |
Фармацевтические компании хотят получать прибыль от вакцин | Фармацевтические компании хотят разрабатывать # вакцины для получения наличных, а не для предотвращения смерти #VaccinateUS |
Вакцины вызывают тяжелые побочные эффекты | #VaccinateUS # Вакцины могут вызывать серьезные, а иногда и смертельные побочные эффекты |
Естественный иммунитет лучше | Естественная инфекция #VaccinateUS почти всегда вызывает лучший иммунитет, чем # вакцины |
Общие теории заговора вакцины | Не принимайте # вакцины.За этим стоят иллюминаты. #VaccinateUS |
Вакцины вызывают аутизм | Знаете ли вы, что # вакцины вызывают аутизм? #VaccinateUS |
Компоненты вакцины опасны | #VaccinateUS # вакцины содержат ртуть! Смертельный яд! |
Болезни не так опасны | #VaccinateUS Большинство болезней, на которые нацелены # вакцины, во многих случаях относительно безвредны, что делает ненужными # вакцины |
Тема провакцины | Пример твита |
Вакцины работают | #VaccinateUS # vaccines save 2.Ежегодно 5 миллионов детей от предотвратимых болезней |
Вакцины должны быть обязательными | Ваши дети — не ваша собственность! Вы должны сделать им прививку #, чтобы защитить их и всех остальных! #VaccinateUS |
Люди, которые не делают прививки, глупы | #VaccinateUS Глупость не исправить. Пусть умрут от кори, а я за # вакцинацию! |
Вакцинация защищает коллективный иммунитет | #VaccinateUS #vaccines защищает общественный иммунитет |
Люди, которые не делают вакцинацию, подвергают риску меня / моих детей | #VaccinateUS Моя свобода заканчивается там, где начинается свобода другого человека.Затем следует # вакцинировать детей, если болезнь опасна для ДРУГИХ детей |
Вакцины не вызывают аутизм | # вакцины вызывают аутизм — Пока, ты мне больше не друг. И попробуйте подумать своим мозгом следующее. #VaccinateUS |
Вы заслуживаете плохих поступков, если не вакцинируете | # вакцины — выбор родителей. Выбор цвета гробика #VaccinateUS |
Альтернативная медицина не работает | Вы все еще лечите своих детей листьями? Нет? И почему вы их не вакцинируете? Это лекарство! #VaccinateUS |
Люди умирали без вакцин | Большинство родителей в викторианскую эпоху регулярно теряли детей из-за болезней, которые можно было предотвратить.# вакцины могут решить эту проблему #VaccinateUS |
Как и другие твиты об антивакцинах, антивакцинные сообщения с #VaccinateUS часто ссылаются на теории заговора. Однако, в то время как теории заговора, как правило, нацелены на самых разных преступников (например, определенные правительственные учреждения, отдельных филантропов или секретные организации), сообщения #VaccinateUS почти исключительно сосредоточены на правительстве США (например, «Сначала наше правительство создает болезни, затем он создает # вакцины.что дальше?! #VaccinateUS »). Как правило, пользователи #VaccinateUS говорят в общих чертах и не могут предоставить уровень детализации, соизмеримый с тем, что содержится в других твитах, связанных с вакцинами. Например, автор может резюмировать аргумент (например, «#VaccinateUS #vaccines вызывают серьезные, а иногда и фатальные побочные эффекты»), тогда как в твитах из потока вакцины обычно используется как можно больше деталей, чтобы звучать убедительно.
Сообщения #VaccinateUS включали несколько отличительных аргументов, которые мы не наблюдали в общей дискуссии о вакцинах.Сюда входили аргументы, связанные с расовым / этническим разделением, обращения к Богу и аргументы на основе защиты животных. Это вызывающие разногласия темы в культуре США, которые мы не видели часто обсуждаемых в других твитах, связанных с вакцинами. Например, «Очевидно, только избранные получают« чистые »# вакцины. А что мы, нормальные люди, получаем ?! #VaccinateUS », по всей видимости, нацелен на социально-экономическую напряженность, существующую в Соединенных Штатах. Напротив, стандартные сообщения об антивакцинах склонны характеризовать вакцины как опасные для всех людей, независимо от социально-экономического статуса.
Сообщения #VaccinateUS также включают несколько сообщений, которые, кажется, предназначены для того, чтобы спровоцировать ответ и продлить спор, в том числе открытые вопросы и комментарии к самой дискуссии (например, «Я верю в # вакцины, почему вы? #VaccinateUS» »). Комментарии также использовались, чтобы побудить других пользователей ответить, в частности, разместив контент, который сторонники вакцинации сочли бы само собой разумеющимся, например: «#VaccinateUS Основные медицинские организации заявляют, что # вакцины безопасны» и «# травмы от вакцинации случаются редко, несмотря на беспокойство родителей. #VaccinateUS.»
Русский тролль-профессионал все расскажет
Все больше и больше сообщений и комментариев в Интернете в России и даже за рубежом создается профессиональными троллями, многие из которых получают зарплату выше средней за продолжение прокремлевского диалога в сети.
Тысячи фейковых аккаунтов в Twitter, Facebook, LiveJournal и vKontakte все больше сосредоточены на войне в Украине. Многие исходят от самой известной в России «фабрики троллей», Центра интернет-исследований, скромного здания на улице Санкт-Петербурга.Петербургская улица Савушкина, которая работает с 24-часовым циклом. В последние недели бывшие сотрудники вышли вперед, чтобы поговорить с RFE / RL о жизни на фабрике, где сотни людей работают шлифованием, 12-часовыми сменами в обмен на 40 000 рублей (700 долларов США) в месяц или больше.
Санкт-Петербургский блогер Марат Буркхард два месяца проработал в Internet Research в отделе, которому было поручено забивать форумы российских муниципальных сайтов прокремлевскими комментариями. В следующем интервью он описывает типичный день и типы заданий, с которыми он столкнулся.
Марат Буркхард
RFE / RL: Марат, вы написали в своем блоге, что время, проведенное в Internet Research, дало вам достаточно материала для целой книги. Почему вы решили писать туда? Развлекательная программа? Авантюризм?
Марат Буркхард: Да, авантюризм — правильное слово. Потому что, на мой взгляд, такой работы больше нигде нет.
RFE / RL: Было ли трудно получить работу?
Буркхард: Да, это было сложно. Сначала нужно написать образцы текстов, а потом они решат, подходите ли вы для работы.Так они отсеивают людей.
RFE / RL: Какие тексты?
Буркхард: Сначала заставляют написать что-нибудь нейтральное — Вегетарианство: за и против. После этого задания становятся более предметными — например, что я думаю о гуманитарных конвоях в Донецке?
RFE / RL: Вам пришлось скрывать свои истинные убеждения?
Буркхард: Да, я прозападный. Для меня это естественно, а для них, конечно, нет. Я ничего не писал о своих взглядах.В противном случае они бы меня не наняли; они бы сразу вышвырнули меня. Они постоянно проводят идеологические проверки всего, что вы пишете. Меня пару раз ловили; У меня были моменты безответственности.
RFE / RL: Вам сразу предложили зарплату в 45000 рублей, или вам постепенно повышали зарплату до того, как вы достигли этого уровня?
Буркхард: Нет, я получил это немедленно — при условии, что я выполнил свою квоту. Это настоящая фабрика. Есть производственные квоты, и за их выполнение вы получаете 45000.Квота составляет 135 комментариев за 12-часовую смену.
RFE / RL: Сколько отделов в Internet Research?
Буркхард: Современное четырехэтажное здание. Есть отдел LiveJournal, отдел новостей, отдел, где создаются всевозможные изображения и демотиваторы (примечание редактора: демотиваторы — это сатирическая графика , , которая, как правило, подрывает их тематику), отдел, где снимают видео. Но я никогда не был в этих отделах.У каждого из них свой офис, столы и компьютеры, и никто не ходит с места на место. Каждый остается на своем месте.
RFE / RL: Сколько человек было в вашем отделе?
Буркхард: Двадцать.
RFE / RL: Вы работали по 12 часов в день?
Буркхард: Да. Были дневные и ночные смены.
RFE / RL: Вам нужно было сидеть в офисе или можно было работать из дома?
Буркхард: Удаленной работы нет.Ночью приходит другая смена. Я работал в дневную смену.
RFE / RL: То есть вы сидите в офисе 12 часов, не выходя на улицу? Почему такие гигантские сдвиги?
Буркхард: Два дня выходной, два выходных. Они считают, что вам нужно работать по 12 часов, а не по восемь.
RFE / RL: Так чем занимался ваш отдел?
Буркхард: Наш отдел комментировал сообщения. У каждого города и села в России есть свой муниципальный сайт с собственным форумом комментариев.Люди писали что-то на форуме, какую-то новость, и нашей задачей было это прокомментировать. Мы сделали это, разделившись на команды по три человека. Один из нас был бы «злодеем», человеком, который не согласен с форумом и критикует власти, чтобы привнести чувство подлинности в то, что мы делаем. Двое других вступают с ним в спор: «Нет, ты не прав, здесь все совершенно правильно». Один из них должен предоставить какую-либо графику или изображение, подходящее к контексту, а другой должен разместить ссылку на некоторый контент, который поддерживает его аргументы.Понимаете? Злодей, картинка, ссылка.
RFE / RL: Итак, вы все трое сидите вместе, договариваясь о том, кто и что будет делать в этом спектакле?
Буркхард: Да, это такой абсурд, который продолжается. Мы не разговариваем слишком много, потому что все заняты. Один комментарий не должен быть меньше 200 символов. Вы должны просто сидеть и печатать и печатать бесконечно. Мы не разговариваем, потому что можем сами видеть, что пишут другие, но на самом деле вам даже не нужно это читать, потому что все это ерунда.Новости пишутся, кто-то комментирует их, но я думаю, что настоящие люди вообще не утруждают себя чтением.
Вот так наша маленькая тройка путешествует по стране, останавливаясь на всех форумах, начиная с Калининграда и заканчивая Владивостоком. Мы создаем иллюзию реальной активности на этих форумах. Пишем что-то, отвечаем друг другу. Есть ключевые слова, теги, которые нужны поисковикам. Нам дают пять ключевых слов — например, «Шойгу», «министр обороны», «российская армия».«Все трое из нас должны следить за тем, чтобы эти ключевые слова появлялись повсюду в наших комментариях. Их нельзя даже спрягать или отклонять. Иногда очень сложно написать, когда вы не можете использовать какие-либо склонения!
Центр интернет-исследований Санкт-Петербурга
А ТИПОВОЕ ЗАДАНИЕ
Тема: Войска НАТО встроены в украинские вооруженные силы
Ключевые слова: новости украины, россия и украина, политика украины, украина, НАТО, ЧВК (частная военная компания)
Задача: Поднять эту тему на 35 муниципальных форумах
Работа начинается после того, как первоначальный пост, написанный троллем из другого отдела, публикуется в социальной сети LiveJournal под именем пользователя flcrbgrjn.В сообщении утверждается, что на стороне украинских солдат воюют иностранные наемники, а ссылается на видео , на котором изображены двое американских солдат в Мариуполе на юго-востоке Украины.
«Киевская хунта регулярно рассуждает в своих СМИ о России, и они беззастенчиво и безрассудно лгут. Они утверждают, что российские вооруженные силы сражаются на территории Украины, но отказываются предоставить какие-либо доказательства (потому что их нет). Но Когда дело доходит до украинских вооруженных сил, американские марионетки, окопавшиеся в Киеве, говорят, что нет никаких доказательств того, что в их ряды пополняются иностранные наемники и западные разведчики — они лгут и даже не краснеют!
Этот пост вскоре появится, согласно алфавитному списку, на городском форуме Астрахани.Затем Злодей-тролль, работающий под именем Yana24, начинает работу тройки, публикуя комментарий, который не соответствует сообщению flcrbgrjn:
«О каких наемниках НАТО вы говорите? Так они снимали там какого-то американца, и что? До сих пор непонятно, что они там делали. Россия, как обычно, обвиняет Украину в том, что она делает сама. Все говорили о вашем давным-давно владеете наемниками, а вы их до сих пор не вытащили! »
Затем Связной Тролль сердито отвечает Злодею, отвергая аргумент Яны24 и ссылаясь на второй отчет о предполагаемом присутствии американских солдат в Мариуполе:
«Вы вообще читали текст? Если вы в курсе темы, вы должны знать, сколько уже было предоставлено доказательств, свидетельствующих о том, что война на Украине продолжается, потому что Запад и Порошенко не хотят добиваться мира. .Они нашли вещи, принадлежавшие западным солдатам, и теперь они сами нашли солдат. Нашли ли они доказательства того, что российские войска находятся на Украине? Или сами войска? Нет! »
На очереди — Картинный тролль, который обвиняет Запад в лицемерии и добавляет демотиватор для дополнительного акцента:
«Запад настолько двуличен: в каждой дискуссии об украинском конфликте Запад обвиняет Россию, даже если она предоставляет украинским вооруженным силам солдат ЧВК, представляющих НАТО.Это политика двойных стандартов! »
Перевод: Украина, вставай! Юго-восток, присядь, не суетись и мирись с этим.
После Астрахани идет Бийск . А оттуда Брянск , Великий Новгород , Владивосток Волгоград , два форума в Воронеже , несколько общероссийских форумов — например Чупакабра — и, в конце, русский алфавит, Чита и Череповец .
Есть еще несколько комментариев, но тема улетает в топ Яндекс.
RFE / RL: Марат, можешь вспомнить самое странное или смешное задание, которое было дано твоей команде?
Буркхард: Самое смешное было, когда президент США Барак Обама жевал жвачку в Индии, а затем выплюнул ее. «Вам нужно написать 135 комментариев по этому поводу и не стесняться того, как вы выражаете себя. Пишите все, что хотите, просто втыкайте в него слово« Обама », а затем покрывайте его ненормативной лексикой.«В задании всегда есть вывод, который вы должны сделать, это уже написано, что Обама — черная обезьяна, которая ничего не знает о культуре. Вы засунете его в древнюю Индию, и он там жует жвачку. ощущение, что они готовы схватиться за любую мелочь. С другой стороны, это не смешно. Это абсурдно и переходит черту.
RFE / RL: Основная задача фабрики — писать на форумах посетителей , в частности форумы идеологических противников России.Кто так делает?
Буркхард: Есть украинское отделение, английское отделение. Они бомбардируют сайты CNN и BBC. У них свой тип целей — The New York Times, а не сайт города Самары. Нам, конечно, немного проще.
«Различные отделы особо не общаются, — говорит Марат Буркхард. «Дружба не поощряется. Система очень репрессивная. Если опоздаешь на минуту, уже штраф в 500 рублей». (файл фото)
RFE / RL: Вы знаете иностранные языки.Разве вам не предлагали должность в одном из иностранных ведомств?
Буркхард: Да. У меня было собеседование на факультете английского языка, но меня начали спрашивать о моих убеждениях, на что я ответил, что я аполитичен, я ничего не знаю, я ни за чем не следую. Видимо, на этом мои перспективы закончились. Чтобы устроиться с ними на работу, я должен был ответить, что следую определенным ходам мыслей. Заработная плата сотрудников со знанием иностранного языка больше 45 000 — это 65 000 и выше.
RFE / RL: А некоторые люди работают в социальных сетях — в частности, в Facebook?
Буркхард: Да, над Facebook работают особые люди. Всего около 40 комнат, в каждой сидит около 20 человек, и у каждого свои задания. Пишут и пишут весь день, и это не до смеха — за смех могут уволить. И поэтому каждый день любые новости делают свое дело — это может быть Обама, может быть [канцлер Германии Ангела] Меркель, может быть Греция, Северная Корея.
Молодые люди, выполняющие эту работу, едва ли способны сформулировать, что важно в этих историях. Даже политолог не может быть знатоком всего мира, а здесь люди должны писать обо всем. И как вы пишете, не имеет значения; можно похвалить или поругать. Вы только что ввели эти ключевые слова.
Затем, чтобы поднять политический контент, они посылают парня, чтобы он рассказал на злободневную тему, чтобы у сотрудников было хоть немного предыстории по этой теме.Но у самого парня крайне низкий уровень понимания, поэтому все это выглядит совершенно абсурдным. Между прочим, нам дали тест на идеологию, на 15-20 вопросов нужно было ответить. Любой, кто допустил пару ошибок, должен сдать экзамен повторно. Но любого, кто просто безнадежен, увольняют.
RFE / RL: Что они спрашивают на экзамене?
Буркхард: Например: «Что Россия хочет, чтобы произошло в Донецкой Народной Республике?» На это очень сложно ответить, и у вас всего два-три слова.Или, например, более простые вопросы типа «Кто такой Псаки?» (Примечание редактора: пресс-секретарь Госдепартамента Джен Псаки является частой мишенью российских троллей.)
RFE / RL: Тема Украины, вероятно, доминирует.
Буркхард: Да, они бросают все, что у них есть, на Украину.
RFE / RL: Как работает ваша тройка, когда задача — хвалить Россию, а не критиковать Украину или Америку?
Буркхард: Мне когда-то приходилось писать, что большинство немцев поддерживает политику Путина.Вот как было сформулировано задание: «Скажите, что большинство немцев поддерживает политику Путина и недовольны политикой Меркель». Откуда они это берут, не знаю, но я должен об этом написать. Забавно писать: «Большинство немцев …»
RFE / RL: У Злодея есть роль в таких заданиях?
Буркхард: Если что-то пропутинское, у Злодея будут сомнения. Например, на православное Рождество Путин пошел на мессу в обычную деревенскую церковь под Воронежем, и все вокруг было светло и приятно.Публикуется история в духе: «Как замечательно, как чудесно, как замечательно, какой он замечательный человек». Но Злодей не согласен: «Ну ладно, Путин поехал в Воронеж, чтобы повысить свою популярность у публики». На что мы отвечаем: «Что с тобой, о какой популярности ты говоришь? Да, он популярен, но ему не нужна популярность, он просто хочет встречаться с обычными людьми». Забавный пример.
Следующее назначение
Тема: Формирование позитивного отношения к внутренней политике Владимира Путина; Президент лично встретил Рождество с простыми россиянами.
Ключевые слова: президент рф, новости путина, политика путина, рождество, владимир путин
Опять же, задание начинается с публикации в аккаунте LiveJournal . Посту о Путине предшествует отрывок из стихотворения Марины Цветаевой «Грешно парить над златоглавой часовней и не молиться в ней», что в данном контексте, кажется, приобретает двоякий смысл.
Рождество объединяет!
Наступает светлый праздник Рождества Христова.И в такой чудесный день, объединяющий всех граждан России — верующий вы или, как говорят, «нецерковный» — на пути к Господу президент России В.П. был, как всегда, с народом! Где еще, как не в провинции, вдали от городской суеты и суеты, можно по-настоящему пережить этот священный день? Так, в этом году Владимир Путин посетил сельскую церковь в честь Пресвятой Богородицы, расположенную под Воронежем в селе Отрадное. И в такой праздник, один из главных праздников в России (да и во всей христианской церкви), в такое непростое время президент был с народом и поздравил всех священнослужителей и верных прихожан!
На форуме Барнаул Link Troll начинает с похвалы и ссылается на на новости 31 декабря.ru, Путин поздравляет Обаму и напоминает ему о принципах взаимного уважения.
«Отличная статья! Кстати, президент России также поздравил американского президента, канцлера Германии и других западных политиков с наступлением Нового года. Его следует похвалить за то, что он выражает свои мирные намерения и проводит нормальную политику — кое-что этого трудно добиться от Барака Обамы ».
Злодейский тролль появляется в ярости:
«А что такого удивительного вы нашли в его рождественском послании ??? Я не понимаю !!! Владимир Путин — обычный человек !! Ну и что, если он президент ?? Если я попаду на телевидение и желаю всем хорошего Рождества, напишете ли вы и обо мне хорошую статью ??? Наконец-то мы нашли, о чем поговорить! »
Картинный тролль публикует фотографию Путина в церкви и возражает:
«Это идиотизм! Путин — наш президент.И действительно здорово, что он пошел в сельскую церковь, чтобы всех поздравить с праздником. Рождество — это чудо. Я завидую прихожанам. Мне бы очень хотелось побывать там в тот великий праздник ».
В другом месте, на форуме Yekaterinburg , злодей-тролль нападает на рождественское появление Путина как на трюк, направленный на то, чтобы отвлечь общественность от огромных экономических проблем страны:
«Подари своему соседу в этом году мешок гречки !! Вот это доброе дело !!! Владимир Путин олицетворяет все, что нас ждет в будущем !! Он просто пошел помолиться за свою задницу и попросить прощения.Он загнал страну прямо в ад, и что теперь ему делать ??? Молитесь, и все! »
Картинный тролль делает суровый выговор, иллюстрированный буколической фотографией с места происшествия:
«Господи, ваш язык! Рождество — праздник благословенный, а вы тут ругаетесь. Это того не стоит. Гречки хватит на всех, наша страна переживет антироссийские санкции, без проблем. Так что поздравляю всех с Светлого праздника и желаю всем мира и добра.Особенно ВАС! »
Таким образом, тройка за день обыскивает 35 форумов.
RFE / RL: Были ли люди когда-либо уволены за идеологические ошибки?
Буркхард: Да, были. Одного человека уволили прямо на глазах. У меня тоже были проблемы. Мультфильмов так много, что однажды я ошибся и поставил карикатуру на Януковича вместо карикатуры на Порошенко. А над Януковичем смеяться нельзя; Янукович — один из хороших парней.Меня сразу позвали на ковер: «Как ты посмел? Ты правда не знал, что это Янукович?» Все это происходит с ужасно серьезными лицами. Там куча менеджеров, которые постоянно следят за всеми и следят за ними.
RFE / RL: А менеджеры кто?
Буркхард: Люди из Internet Research, которые были там долгое время и, очевидно, продвинулись вверх. Заработок у них, кстати, в два раза выше. Мне довелось увидеть зарплату, и я просто ужаснулся — 70 000-80 000 рублей за то, что прочитал ту чушь, которую пишу, и погрозил мне пальцем, если я ошибаюсь.
RFE / RL: Так кто занимается этой работой? Есть ли там люди, которые искренне хотят сразиться с Обамой или Меркель из-за Донецкой Народной Республики?
Буркхард: Да, такие люди действительно есть. Это самое ужасное: во время обеденного перерыва есть что-то вроде кафетерия с торговыми автоматами и кофе, и вы слышите, как люди, которые целый день пишут об этих вещах, вместо того, чтобы пить кофе и говорить о чем-то другом, они начинают неистово пенить изо рта об одном и том же.Еще кое-что нужно доказать. Итак, есть фанатики.
Но основное большинство — это просто молодые люди, которые хотят зарабатывать деньги. Они настолько политически безграмотны, что Путин, Обама … Они не знают разницы. Конечно, все они за Путина, но абсолютно политически безграмотны. «Что бы нам ни говорили, мы напишем об этом, не задавая вопросов, и мы не хотим знать».
RFE / RL: Встречались ли вы с людьми из других отделов?
Буркхард: Различные отделы особо не общаются.Дружба не поощряется. Система очень репрессивная. Если опоздаешь на минуту, уже штраф 500 рублей. Сотрудники находятся под постоянным давлением. За малейшее отклонение взимается штраф. Вы постоянно находитесь под угрозой увольнения, вам постоянно приказывают. Это не очень цивилизованная атмосфера.
RFE / RL: Вас уволили или вы сами решили уйти?
Буркхард: Я решил сам, потому что не могу заниматься абсурдной работой.С точки зрения жизненного опыта я понял, и продолжать не имело никакого смысла — все это абсурд. Я не разделяю эту идеологию, я категорически против, находился во вражеском лагере. Двух месяцев хватило, чтобы понять, как там все делается. Продолжать работать не имело смысла даже из-за денег, потому что это такой тяжелый труд, что — просто забудьте об этом, забудьте о деньгах. Только не заставляй меня больше туда ходить.
Между прочим, всякий раз, когда появляется журналист и пытается войти или что-то спросить, они переходят в состояние повышенной готовности.Все шторы закрыты. Нам всем запрещено выходить на улицу днем. Они очень боятся журналистов.
RFE / RL: Но утечек все еще много. На прошлой неделе три человека дали нам интервью. Это как пародия на роман Оруэлла.
Буркхард: Да, верно, министерство правды. Вы работаете в Министерстве правды, которое является Министерством лжи, и все верят в эту правду. Да, ты прав, это Оруэлл.
Система определения слов для русского языка, основанная на распознавании непрерывной речи с большим словарным запасом и лингвистических знаниях
В статье описаны ключевые концепции системы определения слов для русского языка, основанной на распознавании слитной речи с большим словарным запасом.Описаны основные алгоритмы и настройки системы, в том числе алгоритм изменения произношения, а также представлены результаты экспериментов на реальных телекоммуникационных данных. Приведено описание архитектуры системы и пользовательского интерфейса. Система основана на платформе распознавания речи с открытым исходным кодом CMU Sphinx, а также на лингвистических моделях и алгоритмах, разработанных Speech Drive LLC. Эффективное сочетание методов базовой статистики, реальных данных обучения и интенсивного использования лингвистических знаний привело к качественному результату, применимому к промышленному использованию.
1. Введение
Необходимость понимать тенденции бизнеса, обеспечивать общественную безопасность и повышать качество обслуживания клиентов вызвала устойчивое развитие систем речевой аналитики, которые преобразуют речевые данные в измеримый и доступный для поиска указатель слов, фраз и паралингвистические маркеры. Технология определения ключевых слов составляет существенную часть таких систем. Современные системы определения ключевых слов обычно используют один из трех подходов, а именно поиск по фонетической решетке [1, 2], модели на основе слов [3, 4] и распознавание речи с большим словарным запасом [5].Хотя у каждого из подходов есть свои плюсы и минусы [6], последний начинает проявляться из-за общедоступности базовых алгоритмов, более дешевого оборудования для выполнения интенсивных вычислений, требуемых в LVCSR, и, что наиболее важно, высококачественных результатов.
Совсем недавно был предложен ряд инновационных подходов к обнаружению разговорных терминов, таких как различные комбинации систем распознавания и нормализация оценок, сообщающих о 20% -ном повышении качества обнаружения разговорных терминов (измеряется как ATWV) [7, 8].Применение глубоких нейронных сетей в LVCSR начинает получать широкое распространение [9]. Благодаря программе IARPA Babel, направленной на создание систем, которые могут быть быстро применены к любому человеческому языку, чтобы предоставить аналитикам эффективные возможности поиска для эффективной обработки огромных объемов записанной речи реального мира [10], в последние годы были проведены обширные исследования. разработать технологии для систем определения разговорных терминов для языков с ограниченными ресурсами. Например, [11] описывает подход к обнаружению ключевых слов на кантонском диалекте, основанный на распознавании речи с большим словарным запасом, и показывает положительные результаты применения нейронных сетей для восстановления решетки распознавания.Ссылка [12] содержит подробное описание современных методов, используемых для создания системы определения ключевых слов для 10 языков с ограниченными ресурсами, в основном на ассамском, бенгали, гаитянском креольском, лаосском и зулусском. Акустические модели глубинной нейронной сети используются как в качестве экстрактора признаков для системы HMM на основе GMM, так и для вычисления апостериорных состояний и преобразования их в масштабированные вероятности путем нормализации по апостериорным состояниям. Предлагается увеличение объема данных за счет использования многоязычных узких мест (эта тема также рассматривается в [13]).Наконец, не зависящие от языка и неконтролируемые акустические модели обучаются для языков без обучающих данных. Среднее значение MTWV для этих языков колеблется от 0,22 для зулу до 0,67 для гаитянского креольского. В [14] описано использование рекуррентных нейронных сетей для определения слов в реальном времени на примере английского языка. По сравнению с более распространенными системами на основе текста, этот подход использует устные примеры ключевого слова для построения модели на основе слов, а затем выполняет поиск в речевых данных.В качестве альтернативы гибридным подходам ANN-HMM авторы [15] предлагают основанную на чистом NN систему поиска по ключевым словам для разговорной телефонной речи на вьетнамском и лаосском языках. Для вьетнамцев «чистая» система NN обеспечивает ATWV, сравнимую с таковой для базовой гибридной системы, при этом работая значительно быстрее (коэффициент реального времени 3,4 против 5,3 для гибридной системы).
Поскольку качественное языковое моделирование является неотъемлемой частью любой современной системы определения ключевых слов, сейчас много усилий направлено на улучшение LM.Одна из последних тенденций — использование веб-данных в обучении. Появление Интернета предоставило большое количество данных, которые стали легко доступными для сообщества специалистов по распознаванию речи [16]. Это представляет особый интерес для языков с низким уровнем ресурсов, и среди последних улучшений [17] предлагается подход, позволяющий эффективно справляться с проблемой нормализации и фильтрации веб-данных для обнаружения ключевых слов. Предлагаются два метода: один с использованием ранжирования по степени сложности, а другой с использованием определения слов вне словарного запаса.Это привело к абсолютному улучшению ATWV более чем на 2% по 5 языкам с ограниченными ресурсами. Ссылка [18] охватывает аспект дополнения базовых LM тщательно подобранными веб-данными, показывая, что блоги и субтитры фильмов более актуальны для языкового моделирования разговорной телефонной речи и помогают добиться значительного сокращения ключевых слов вне словарного запаса.
Российские исследования в области распознавания речи соответствуют мировым научным трендам. Однако следует отметить, что чаще всего исследования проводятся для достижения более общей цели — создания систем LVCSR как таковых без особого акцента на обнаружении разговорных терминов.К наиболее известным системам относятся Yandex SpeechKit [19], используемый для распознавания голосовых поисковых запросов через веб и мобильные приложения, систему распознавания речи в реальном времени от Speech Technology Center [20], используемую для расшифровки речи в новостях вещания, систему LVCSR, разработанную СПИИРАН [21, 22], применяемый для распознавания речи в мультимодальных средах, и система распознавания речи НИИ Спецвузавтоматика [23], основанная на глубоких нейронных сетях.
В данной статье представлены результаты текущих исследований, лежащих в основе коммерческого программного обеспечения для анализа речи.Дизайн программного обеспечения следует концепции минимально жизнеспособного продукта, что мотивирует постепенное усложнение технологии по мере развития продукта. Такой подход побудил нас полагаться на общедоступные инструменты с открытым исходным кодом и ряд легкодоступных основанных на знаниях методов, разработанных в ходе наших предыдущих исследований.
В разделах 2 и 3 описывается общая схема применения технологии LVCSR для определения ключевых слов для русской телефонной разговорной речи, включая ключевые параметры системы и описание экспериментов, проводимых для оценки качества и производительности системы.Особое внимание уделяется языковым компонентам, используемым на этапе обучения и проверки. В разделе 4 описана стандартная система анализа речи, разработанная с использованием идей и результатов, обсуждаемых в этой статье.
2. Ключевые параметры системы
Система, описанная в статье, предназначена для использования для поиска по ключевым словам в разговорной речи по телефону. Система предоставляется как в виде SDK для интеграции с системами записи речи, так и в виде отдельного приложения MS Windows.Система создана на базе CMU Sphinx [24]; эта структура была выбрана из-за ее простоты и модели лицензирования, которая позволяет свободно использовать код в коммерческих приложениях. Следуя идее минимально жизнеспособного продукта, мы в основном используем стандартные настройки для всех модулей системы. В акустическом интерфейсе используются 13 MFCC с их производными и ускорением; Акустические модели непрерывной плотности для трифонов обучаются примерно на 200 часах русской речи телефонного качества (8 кГц, 8 бит, моно), записанной 200 носителями языка.HMM с 5 состояниями используются с диагональной ковариационной матрицей, а алгоритм CART (деревья классификации и регрессии) используется для кластеризации акустических моделей в 9000 сенонов, каждый из которых описывается 10-30 гауссианами. Тексты в обучающей базе данных для языковых моделей автоматически транскрибируются морфологическим и контекстным лингвистическим процессором [25]. Применяется набор правил вариации транскрипции. Языковые модели униграммы и биграммы обучаются на сотнях тысяч современных русских электронных книг, широко доступных в Интернете.Декодер использует стандартный алгоритм передачи токенов CMU Sphinx с методами отсечения, широко используемыми в настройке системы, включая максимальную ширину луча, штраф за вставку слова и штраф за акустическую правдоподобие.
Основная новизна системы заключается в широком использовании лингвистических знаний как на этапе обучения, так и на этапах определения разговорного термина. В системе используется лингвистический процессор со встроенной информацией о морфологии русского языка, который помогает генерировать высококачественные транскрипции для любых словоформ и, таким образом, обучать более жизнеспособные акустические модели.Один и тот же процессор используется для генерации различных форм слов, что обеспечивает лучшее обнаружение произносимых терминов на этапе определения. Основанный на правилах алгоритм вариации транскрипции применяется для генерации альтернативных последовательностей фонем. В конечном итоге на этапе моделирования языка тексты автоматически предварительно фильтруются по типу текста, чтобы в учебном корпусе оставались только диалоги.
3. Алгоритмы, связанные с ними проблемы и решения
3.1. Acoustic Front-End
Хотя во всей системе используются стандартные MFCC, потребовались дополнительные усилия, чтобы заставить интерфейс работать для определения ключевых слов в реальном приложении.Сначала аудиофайлы, подлежащие анализу, разбиваются на 10-секундные фрагменты, чтобы разделить процесс декодирования на несколько процессоров. Перекрытие в 1 секунду используется для гарантии того, что ключевое слово не будет усечено между двумя последующими речевыми сегментами. Далее применяется алгоритм синтаксического анализа для объединения результатов частичного декодирования в один файл, чтобы избежать избыточных ложных срабатываний. В планах на будущее использование VAD для разделения аудиопотока на фразы, которые лучше подходят для подхода на основе LVCSR, используемого в этой статье; однако наша текущая реализация VAD показала худшие результаты, отсюда и использование кусков одинаковой длины.
3.2. Акустическое моделирование, преобразование графемы в фонемы и алгоритм вариации транскрипции
Система, обсуждаемая в статье, предназначена для использования в реальной телефонной среде в условиях низкого качества звука. Чтобы удовлетворить это требование, акустическая модель обучается на реальных данных, встречающихся с речью качества телефонного канала в российских телефонных сетях. Используются HMM непрерывной плотности, в результате чего получается репрезентативный набор из 9000 сенонов, каждый из которых описывается GMM с 10–30 компонентами.
В рамках нашего предыдущего исследования [25] был разработан лингвистический процессор, который использует информацию о морфологических характеристиках около 600 000 русских слов (см. Структуру на Рисунке 1) для расшифровки слов и создания форм слов. Процессор анализирует текст и определяет часть речи для каждого слова в предложении; затем определяется словесное ударение и применяется набор заранее запрограммированных контекстных правил преобразования графемы в фонемы для получения канонической («идеальной») транскрипции слова.
В настоящее время в области транскрибирования слов в системах распознавания речи используются статистические преобразователи графемы в фонемы [26, 27]. Были проведены исследования по объединению различных методов, например, в [28] Условные случайные поля и Joint-Multigram Model используются для дополнительного улучшения качества. Были проведены исследования [29, 30] по введению взвешенных преобразователей конечного состояния для определения вероятностей внутрисловных фонетических последовательностей. В целом эти исследования очерчивают ключевые преимущества вероятностного подхода по сравнению с методами, основанными на знаниях, а именно: независимость от языка (легко переносится на новый язык), способность обобщать и обеспечивать транскрипцию новых слов (вне словарного запаса) и необходимость меньшего объема лингвистических данных (и, следовательно, усилий) для обучения преобразователя графемы в фонемы.
С другой стороны, большинство результатов, представленных в цитируемых исследованиях, относятся к языкам, для которых характерно небольшое количество словоформ (например, английский и французский). Между тем русский язык — это язык с высокой степенью флективности, в котором ударение в словах зависит от точной словоформы в парадигме, а высокая частота омонимии также влияет на ударение слов и, таким образом, является источником потенциальных ошибок транскрипции [31]. Это означает, что для обучения качественного вероятностного преобразователя графемы в фонемы для русского языка требуется гораздо больший словарный запас, созданный вручную.Это препятствие вместе с концепцией минимально жизнеспособного продукта, описанной выше, побудило нас установить вероятностное преобразование графемы в фонемы в качестве цели для наших будущих исследований и вместо этого использовать легкодоступный высококачественный лингвистический процессор, основанный на знаниях. Другим важным фактором, который повлиял на этот выбор, является способность устранять неоднозначность омонимии и генерировать словоформы (будет обсуждаться позже).
Ключевым элементом процесса обучения акустической модели является вариация транскрипции.Каждая фраза, используемая для обучения моделей, получает несколько альтернативных транскрипций с применением набора предопределенных лингвистических правил. Затем на этапе обучения обучающий модуль CMU Sphinx выбирает лучшую альтернативу, которая максимизирует ожидания. Эксперименты показали абсолютное увеличение скорости обнаружения ключевых слов на 4% благодаря такой реализации (подробнее об экспериментах см. В разделе 4). На данный момент правила выводятся вручную на основе лингвистических знаний. Список правил затем внедряется в распознаватель, который запускается в наборе обучающих данных, чтобы определить, какие правила обеспечивают улучшение качества и должны храниться в производственной системе.В качестве следующего шага нашего исследования мы планируем разработать достаточный корпус для автоматического обучения этим правилам.
Окончательный список правил вариации транскрипции, выбранных на обучающем наборе, содержит 30 контекстных отображений фонемы в фонемы и графемы в фонемы, основанные как на современных исследованиях русской спонтанной речи [32], так и на собственных экспериментах авторов. с аудиоанализом реальных данных. Основные этапы алгоритма вариации транскрипции описаны ниже (см. Также рисунок 2): (1) Загружается текстовая аннотация обученной базы данных.(2) Если слово отсутствует в лексике (используется в основном для иностранных слов и именованных сущностей), запускается автоматический транскрибер, который использует оцифрованный словарь русского языка, содержащий 600 тысяч слов с морфологической информацией и частью -speech (POS) теггер. В результате этого этапа словесное ударение присваивается правому слогу каждого слова. (3) Автоматическая или каноническая транскрипция генерируется путем применения контекстно-зависимых правил передачи букв на телефон. (4) Вариация произношения выполняется с помощью итеративное применение отдельного набора правил моделирования транскрипции фонема-фонема и графема-фонема к канонической транскрипции.
Хорошо известно, что правила, основанные на знаниях, будучи «лабораторными» по своему происхождению, могут оказаться неадекватными при сопоставлении с реальными данными. Однако это было нашим намерением проверить это важное предположение на нашем тестовом материале. Более того, за последние десятилетия в русской фонетике произошел общий сдвиг от лабораторной речи к полностью спонтанной [32, 33], а правила, которые мы используем, основаны на обширных исследованиях характеристик спонтанной речи.
Правила делятся на две основные группы.Первый содержит правила замены, удаления и вставки, которые применяются к исходной фонетической транскрипции. Вот несколько примеров таких правил: (i) [@] («schwa»), за которым следует согласный, удаляется в безударной позиции после ударного слога. (Ii) [f] удаляется из последовательности согласных [fs] + (любой) глухой согласный. (iii) Аффрикаты [c] и [t ∫ ‘] заменяются фрикативными [s] и [], соответственно (знак j означает, что согласный является палатализованным). (iv) Sonorant [j ] удаляется перед безударной гласной в начале слова.(v) Шумовые остановки (например, [p], [t], [] и []) удаляются в последней позиции после гласных из-за имплозивного произношения (т.е. без всплеска после закрытия артикуляторов).
Вторая группа правил использует как морфологический, так и орфографический уровень языковой репрезентации. Следовательно, это не исправление исходной транскрипции (правила преобразования фонемы в фонемы), а отдельный набор правил преобразования графемы в фонемы. Вот несколько примеров: (i) [@ j @] и [uju] в безударных склонениях прилагательных «–ая» и «–ую» заменяются на [@e] и [u] соответственно.(ii) [@ v @], [ ɨ v @] и [iv @] в безударных наклонениях существительных «–ого» и «–eго» заменяются на [@@], [ ɨ @], и [i @]. (iii) [@ t] в склонении глагола «–ат» заменяется на [ ɨ t].
Для часто используемых слов мы также добавили еще один набор правил, которые обеспечивают упрощенное произношение, характерное для неформальной спонтанной речи. К ним относятся удаление [] и [v] в интервокальной позиции, изменение [] на [] и так далее.
3.3. Языковые модели и выбор соответствующего контента для их обучения
Изначально языковые модели были обучены с использованием нескольких гигабайт пользовательского контента, который можно найти в Интернете, включая общедоступные форумы, социальные сети и чаты.Идея заключалась в том, чтобы такой контент лучше отражал спонтанную речь и, таким образом, обеспечивал более устойчивые результаты поиска ключевых слов. Однако эксперименты показали, что такой лингвистический материал имел существенный недостаток, потому что он содержал огромное количество орфографических ошибок, которые привели к статистическому смещению и появлению неправильных лемм в лексиконе. Поэтому было принято решение полагаться на стандартные и безошибочные тексты, взятые из широкого спектра книг разных жанров, доступных в Интернете.Только книги современных авторов (1990-х годов и позже) были отобраны, чтобы отразить современные черты русской речи. Однако из таких книг были извлечены только диалоги, чтобы гарантировать «живой» стиль общения, характерный для реальной телефонной речи. В результате было использовано 2 ГБ необработанных текстовых данных для обучения моделей языка униграмм и биграмм, содержащих 600 000 лемм на русском языке. LM обучались с использованием инструментария SRILM [34] с применением алгоритма дисконтирования Гуд-Тьюринга.
Текущие исследования в области языкового моделирования сосредоточены на применении глубоких нейронных сетей и высокоуровневого восстановления LM [35].В нашем случае данных для обучения таких моделей недостаточно, что побудило нас перейти к более простым моделям. Как указано в Разделе 3.4, мы не полагаемся на наиболее вероятную последовательность слов в результате распознавания для обнаружения ключевых слов; скорее мы хотим сгенерировать столь же разнообразную и «грубую» решетку на этапе индексации, чтобы гарантировать высокую вероятность обнаружения произносимого термина. Простое моделирование языка биграмм / униграмм вполне подходит для этой цели.
3.4. Декодирование, определение слов и автоматическое создание словоформ
Основная идея использования LVCSR для поиска ключевых слов состоит в преобразовании речевого сигнала в простой текст и последующем поиске слова в этом тексте.Однако из-за разнообразия типов контекста связи в разговорной речи по телефону нецелесообразно использовать лучший результат декодирования как таковой. Скорее, имеет смысл проанализировать полученную решетку распознавания, чтобы найти все возможные узлы с ключевым словом. Следовательно, речь сначала индексируется в решетках распознавания; поиск по ключевым словам выполняется по запросу на более позднем этапе.
Для улучшения результатов поиска мы интенсивно используем лингвистический процессор, описанный выше. Когда слово вводится в качестве поискового запроса, его формы автоматически генерируются путем обращения к морфологическому словарю (см. Рисунок 1), и для слова выводится набор вариантов, которые затем ищутся в решетке и появляются в списке результатов распознавания.Например, когда нужно искать слово «кусок» (русское слово для «кусок»), все слова, содержащие эту последовательность, будут найдены в решетке распознавания; следовательно, пользователь сможет заметить слова «куска», «куском» и т. д. Поскольку русский язык является флективным, для одного слова доступно множество форм. Следовательно, модели языка низкого порядка (униграмма и биграмма), используемые в нашей системе, заставляют распознаватель делать ошибки в окончаниях слов. Описанная выше простая идея помогает избежать ошибок и добиться гораздо лучших результатов.
4. Результаты экспериментов
Система, описанная здесь, предназначена для использования в реальных приложениях для анализа речи телефонного качества. Для тестирования была записана 10-часовая база данных, включающая записи диалогов около 50 спикеров с использованием аппаратного и программного обеспечения ООО «СпРекорд» (http://www.sprecord.ru/). В базе данных выполняется поиск по 1183 различным ключевым словам. Отношение сигнал / шум составляет от 5 до 15 дБ, что отражает неблагоприятные условия реального телефонного канала.
Максимальное взвешенное по сроку значение (MTWV) — это прогнозируемая метрика, соответствующая наилучшему TWV для всех значений порога принятия решения; θ (см. Формулу (1)) и показатели коэффициента реального времени (RTF) (формула (2)) используются для оценки производительности системы; Первый показатель отражает качество распознавания слов, а второй — его скорость. Параметр RTF рассчитан на 1 модуль ЦП с тактовой частотой 3 ГГц. Результаты показаны в таблице 1. — это порог, используемый для определения попадания или промаха, и это вес, который учитывает предполагаемую априорную вероятность термина, а относительная стоимость промахов и ложных тревог равна 0.999 в нашем исследовании. время, затраченное на обработку файла, и продолжительность набора тестов.
|