По транскрипции определить слово: Искать английское слово по его фонетической транскрипции

Содержание

toPhonetics

 


Привет! Мы хотим сделать этот онлайн-переводчик английского текста в транскрипцию самым лучшим в Интернете (подробнее о проекте). Свои пожелания и отзывы оставляйте в комментариях ниже, они обязательно будут учтены. Ответы на часто задаваемые вопросы здесь.

Транскриптор имеет следующие особенности и функции:

  • Британский или американский вариант произношения слов. При выборе британского диалекта, в соответствии с британской фонетикой [r] в конце слова озвучивается, только если следующее слово во фразе начинается с гласного звука.
  • Привычные нам символы международного фонетического алфавита (IPA).
  • Транскрипция текста сохраняет исходный формат предложений, включая знаки препинания и т.п.
  • Возможность отображения транскрипции с учётом слабой позиции слов в предложении, как это происходит в живой связной речи (галочка “Учитывать слабую позицию”).
  • Не найденные слова, набранные в верхнем регистре, интерпретируются как аббревиатуры (транскрипция аббревиатур отображается побуквенно через дефис).
  • Чтобы удобнее было сверяться с оригиналом, возможен параллельный вывод транскрипции в два столбца с исходным английским текстом или подстрочником. Просто укажите нужный вариант под полем ввода.
  • Нужен английский текст песни русскими буквами? Пожалуйста! Рядом с полем ввода есть соответствующая галочка для тех, кто никогда не учил английский (тем не менее, фонетическая транскрипция несложна в освоении и всегда предпочтительнее).
  • В случаях, когда слово может произноситься по-разному, вы можете выбрать из нескольких вариантов транскрипции. Такие слова отображаются в виде ссылок (синим цветом). Если навести на них мышь, то появится список вариантов произношения. Для перебора вариантов в тексте (чтобы потом распечатать или скопировать текст в буфер обмена с правильным произношением) нужно щёлкнуть по слову мышью.
    Имейте в виду, что несколько вариантов транскрипции может отражать как вариации произношения в одном значении, так и произношение разных значений слова. Если вы не уверены, какой вариант нужен в вашем случае, сверьтесь со словарём.
  • Кроме общеупотребительных слов словарная база включает транскрипцию огромного количества географических названий (среди которых названия стран, их столиц, штатов США, графств Англии), а так же национальностей и наиболее популярных имён.
  • Ненайденные слова (показываются красным цветом) регистрируются, и в случае повторения в запросах регулярно добавляются в словарную базу.
  • Если ваш браузер поддерживает синтез речи (Safari – рекомендуется, Chrome), вы можете прослушать транскрибируемый текст. Подробности по ссылке.
  • Вместо кнопки “Показать транскрипцию” можно использовать комбинацию клавиш Ctrl+Enter из поля ввода.
  • Доступны также мобильные версии сервиса для устройств Apple и Андроид.

Если при копировании на свой компьютер символы IPA отображаются у вас некорректно, значит у вас проблема со шрифтами. Прочитайте “Техническое примечание” внизу этой страницы на Википедии. Шрифты с поддержкой IPA можно найти здесь.

Транскрипция русских слов онлайн

Фонетическая транскрипция

С фонетической транскрипцией слова мы все знакомы со школьной скамьи, однако некоторым эти знания пригождаются и в жизни. Поскольку для нас русский язык — родной, то мы используем эти знания крайне редко, и чаще всего, когда кому-то из знакомых, близких нужно объяснить эту тему. Однако очень многие люди по всему миру изучают наш язык, для кого он не является родным. Им на помощь приходят как раз записи, с помощью которых они приобретают понимание по произношению.

Встречается, что мы не можем понять, как же правильно разобрать слово, и тогда к нам на помощь приходят онлайн сервисы по фонетической транскрипции. С ними работать очень легко, а точность данных приятно удивляет, поскольку все происходит очень быстро и четко.

Фонетическая транскрипция

Фонетическая транскрипция — характерный вид записи на бумаге особенности звучания речи.] всегда применяется для того, чтобы обозначить ослабленную фонему, схожую по звучанию с [а]. Такая фонема обычно произносится в самом начале слова, в предударном слоге вместо графем «а» и «о» после твердых согласных: анестезия — [ʌнэстэз’и́ъ]; облить — [ʌбл’и́т’]; авоська — [ʌво́с’къ]; алфавит — [ʌлфʌв’и́т]. В школьной программе применяется — [а].

  • Редуцированный звук при фонетическом разборе обозначается — [ъ] «ъ» — заключенный в скобки. Эта фонема является нечто средним между [ы] и [а], произносящийся во многих безударных слогах, исключением является первоначальный слог находящийся перед ударными и самым началом слова вместо графем «а», «о», «е»: коробка — [кʌро́пкъ], дорого — [до́ръгъ], лампа — [ла́мпъ], рация — [ра́цыъ], кирка — [к’и́ркъ].
  • Фонема между [и] и [э] обозначается как — |иэ], произносящийся в первоначальном слоге, находящимся перед ударными, после мягких согласных вместо графем сия: аквидук — [акв’ид`ук], пелена — [п’ил’ина]. В школьной программе применяется просто [и].
  • Фонема между [ы] и [э] помечается как — |ыэ], произносящийся в первоначальном слоге, находящимся перед ударными, после твердых шипящих и ц: ценник — [ц`эник], шестеренка — [шыст’ир’`онка]. В школьной программе применяется просто [ы].
  • Редуцированная фонема похожая на [и] при фонетическом разборе обозначается — [ь] «ь» — заключенным в скобки. Он произносится во всех слогах, которые находятся без ударения. Не произносится в первоначальном слоге, находящимся перед ударными, и после мягких согласных вместо буквы «е» и «я»: пять — [п’`ат’], депутат — [д’ипут`ат], пятница — [п’`атн’ица].
  • На месте графем «у», «ы», «и», их безударные фонемы обозначаются, как и они сами: ударение — [удар’`эн’ий’э], утконос — [`утканас], пылесос — [пыл’ис`ос], диверсия — [д’ив’`эрс’ий’а], пинок — [п’ин`ок].
  • Согласный мягкий звук обозначается в транскрипции запятой сверху от буквенного знака: льется — [л’й’оца], любовь — [л’уб`оф’], сирота — [с’ирата], антифриз — [ат’ифр’`ис].
  • Черточка над буквой обозначает долгий согласный звук: обожжем — [ʌбʌжо́м], банный — [б`аный’], сонный — [с`оный’].
  • Согласный звук «йот», произносящийся перед ударными гласными помечается в схеме как — [j]: яйца — [j’а́j’цъ], ерь— [j’эр’], ёж — [j’ош]. В школьной программе применяется просто как соответствующая фонема.
  • Смягченный версия звука «йот» произносится во всех других расположениях и обозначается как [и]: бей — [б’`эи’]. В школьной программе просто [и].
  • Транскрипцию не всегда делают полностью на слово, она может обозначать какой-то определенный рассматриваемый момент. Этот способ чаще всего используется в словарях с целью объяснения верного произношения фонем: антихрист — [ан’]тихрист; шаровая — шаро[в`ай’а].

    Основы фонетической транскрипции

    В русском алфавите тридцать три буквы, из которых десять гласных и двадцать одна согласная буква. Буквы называются графемами, у каждой из них существует своя звуковая форма.

    Звуковая форма — фонема. Другие варианты ее написания называются аллофонами.

    Согласные зарождаются при наличии потока воздуха, проходящего сквозь голосовые связки. Он влечёт за собой колебания при прохождении через преграды, а затем появляется чистое звучание (другими словами, тон). Этот тон, проходя через рот и нос,  меняется, проходя через преграды, появляется шум. Все согласные делятся на звонкие (содержащие помимо шума тон) и глухие (содержащие исключительно шум). Они подразделяются также на твердые и мягкие. В общей сложности они образуют 36 согласных фонем, из которых 15 парные, которые в разных случаях могут быть и мягкими, и твердыми, 3 в любой ситуации остаются твердыми («ш», «ж», «ц»), 3 в любой ситуации остаются мягкими («ч», «щ», «й»).

    Гласные зарождаются при наличии потока воздуха, проходящего через голосовые связки. Он вызывает колебания, а затем образуется чистое звучание. В русском языке насчитывают 6 гласных фонем, имеющих собственные разновидности — аллофоны на месте гласного по отношению к ударному слогу.

    В русском языке ударение имеет свободную и подвижную форму. Оно может как бы «бегать» по слогам в зависимости от склонения, числа. А также оно сильное и динамическое, основные гласные произносятся значительно тише, чем ударный слог.

    Гласные в русском языке по отношению к ударному слогу подразделяются на:

    • 3 — ударные;
    • 2 — первоначальном слоге находящимся перед ударными;
    • 1 — более чем первоначальном слоге находящимся перед ударными и заударные.

    Зачем нужна транскрипция?

    Фонетическая транскрипция необходима для выполнения ряда функций:

    • помогает при изучении русского языка в качестве иностранного;
    • помогает понять произносительную норму;
    • обязательна при изучении диалектов;
    • Помогает при выполнении фонетического разбора.

    Транскрипции бывают разные. Одни из них помогают передать норму, а другие настоящее произношение фонем в слове.

    В современном веке с произносительной нормой слова никто не произносит, только ели профессиональные дикторы, обученные в Советском Союзе.

    Школьники используют транскрипцию в качестве основы для фонетического разбора, который является обязательным при изучении школьной программы. Изредка ей пользуются словарники для того, чтобы передать безошибочное произношение.

    Как записать транскрипцию

    При составлении транскрипции важно учитывать следующие моменты:

    1. Вся транскрипция обязательно заключается в специальные скобки [] даже если разбирается целое предложение или часть слова: холодильник — [халад’`ил’н’ик].
    2. Знак ударения выглядит как знак обратного апострофа `, ставится он всегда перед гласной буквой, или над ней: орхидея — [арх’ид’`эй’а].
    3. Мягкий согласный звук обозначается апострофом: теща — [т’`ощ’а].
    4. Долгое звучание помечается либо черточкой сверху, либо двоеточием, хотя иногда он не используется и вовсе: конный — [к`оный’] — [к`он:ый’].
    5. В транскрипции не используют мягкий и твердый знак, так как они только влияют на произнесение слова, но у самих нет звука.
    6. Существуют звуки, не имеющие в транскрипции отражения: [е], [ё], [ю], [я], [ь], [ъ], [ж’], [ш’], [ц’], [й], [ч], [щ].

    Таблица произношения русских гласных и их запись в транскрипции

    Звучание гласных после согласных:

    Графема Звук Варианты
    a | a| [ á]
    o | o| [ ó]
    я | ‘a| [‘ á]
    e | ‘э| [‘э’]
    ё |’ o| [‘ ó]
    э |э| [э’]
    у |у| [ý]
    ю |’у| [‘ý]
    и |’и| [‘и’], [ы]
    ы |ы| [ы]

    Графемы, дающие двойное звучание при расположении рядом с гласными, после «ь», «ъ»:

    Графема Звук Варианты
    я |j|+|a| [já]
    е |j|+|э| [jэ]
    ё |j|+|о| [jо]
    ю |j|+|у| [jу]
    и |j|+|и| [jи]

    Для обозначений звуков используются следующие знаки.

    1. Для того, чтобы было чёткое разграничение букв от звуков, то их разделяют специальными скобками []: [a], [и], [м]. Причем весь транскрибируемый элемент заключают в эти скобки в независимости от того отдельные это буквы, словоформы, словосочетания, предложения, текст: дым — [д`ым], [д`ымст`ой’илсталб`ом].
    2. Вся часть фонем обозначается русскими буквами дополняющиеся определенными знаками.
    3. Согласный «й» обозначается как [j], а для обозначения этой фонемы используется [й]: ябеда — [j❜а́б❜иедъ].
    4. Знак [э] в транскрибации обозначает ударный гласный, соотносящийся на письме с «е» и «э»: бел — [б’`эл], мел — [м’`эл].
    5. Апостроф сверху от графемы всегда обозначает мягкость согласного: яхта — [й’ахта], рулетка — [рул’`этка].
    6. [‾] или [:] — это знаки обозначающие долгое звучание согласного: дрожжи [др`ож:ы].

    Фонетическая транскрипция в пособиях для углублённого изучения русского языка

    1. В пособиях с углубленным изучением используется дополнительные знаки, помогающие обозначать гласные звуки наиболее точно: [Λ], [иэ], [ыэ], [ъ], [ь].
    • Если буквы «а», «о» стоят на первоначальном слоге находящимся перед ударными абсолютном начале слова, то при транскрипции используется [Λ]: онлайн — [ʌнла́j’н], огурец — [ʌгур’э́ц].
    • Вместо букв «е», «я», которые находятся без ударения после мягких согласных произносится гласный, средний между [и] и [э], но ближе к [и], он обозначается [иэ]: нести — [н’иес’т’и́], чеснок — [ч’иесно́к].
    • Вместо буквы «е» после твердых шипящих произносится [ыэ]: житель — [жыэлте́т❜]; жесток — [жыэсто́к], цена — [цыэна́].
    • Звук [ъ] произносится после твердых согласных в не первоначальном слоге находящимся перед ударными, следующим после ударного и обозначается буквами «а», «о», «е»: милова — [мълава́т]; собаковод — [събъкаво́т]; голова — [гълава́].
    • Звук [ь] произносится после мягких согласных в первоначальном слоге находящимся перед ударными, следующим после ударного и обозначается буквами «е», «я», «а»: человек — [чьлаве́к]; очаровать — [ачьрава́т❜]; лесника — [льсника́].
    1. Согласный звук «йот», произносящийся в слоге находящимся перед ударной гласной обозначается в схеме как — [j]: яйца — [j’а́j’цъ], ерь — [j’эр’], ёж — [j’ош].

    В высшей школе углубленного изучения ряд фонетических обозначений еще шире.
    Образец фонетической транскрипции для углублённо изучающих русских язык в школе

    Только стоило маме выйти за ворота, как дети сразу отправились собираться играть во двор.
    [то́л’късто́илъма́м’иевы́j’т’и за во́рътъ // к`акд’э́т’исра́зуʌтпра́в’ил’ис’ съб’ира́цъигра́т’ в`одв`ор //]

    Фонетическая транскрипция в школе

    1. Звуковой разбор слова в обязательном порядке заключается в специальные скобки [].
    2. В транскрипции не пишутся прописные буквы, знаки препинания, совпадающие обычно с запятыми, отмечаются как черточки. // — длинная пауза, / — небольшая, смысловая пауза.
    3. В словах, если присутствует больше одного слога обязательно ставится ударение: лето — [л’`эта]; осень — [`ос’ин’].
    4. Мягкость согласного звука подчеркивается в виде запятой сверху: единица — [й’ид’ин’`ица].
    5. Согласные звуки пишутся своими буквами русского языка за исключением букв «щ», «й».
    • Надстрочные и подстрочные значки ставятся рядом со звуком и обозначают особенности звука.
    • Букву «щ» прописывают в транскрипции звуком [ш]: щука — [ш’у́къ], вещи — [в’э́ш’ и].
    • [ш], [й], [ч] всегда мягкие звуки и у [й], [ч] не принято обозначать дополнительно мягкость в виде запятой сверх, хотя это редко может встречаться.
    • [ж], [ш], [ц] всегда твёрдые звуки, есть исключения: Жюль, жюри, жульен.
    • Буквы «ъ», «ь» не имеют звуков, поэтому их не встретите в транскрипции.
    1. Запись гласных звуков
    • Гласные, находящиеся под ударением, всегда обозначаются буквами: «а», «о», «э», «у», «и», «ы».
    • Буквы «е», «ё», «я», «ю» обозначаются в большинстве случае как парные звуки [йэ], [йо], [йа], [йу]. Дополнением к этому правилу является буква «и», обозначающая после разделительного «ь» парный звук [йи].
    • «у» находящаяся без ударения [у] может встретиться в любом слоге и пишется как соответствующая буква.
    • Гласные, находящееся без ударения [и], [ы], [а] не всегда пишутся на месте таких же букв. Для того чтобы понять, как правильно написать транскрипцию необходимо несколько раз внимательно произнести слово и вслушаться в звук.

    Образец фонетической транскрипции для школы

    Только стоило маме выйти за ворота, как дети сразу отправились собираться играть во двор.
    [т`ол’каст`оилам`ам’э в`ый’т’иза вар`ота // к`ак д’`эт’иср`азуатпр`ав’ил’ис’ саб’ир`ацаигр`ат’ в`одв`ор //]

    Популярные слова

    потом
    , вето
    , дорогу
    , въездной
    , колотье
    , обсахаривать
    , аскетичной
    , атрибуцию
    , безрукавному
    , бурлил
    , владимировичам
    , влипать
    , волочащеюся
    , вылуживаться
    , выхлопотанный
    , голография
    , непредприимчиво
    , патентованных
    , первопричиной
    , перекромсана
    , переоблучивших
    , переподчините
    , пинакотеки
    , позарится
    , поливавшегося
    , привешенною
    , привораживающие
    , придавливало
    , приручать
    , приудержана
    , проковыриваемым
    , прокуроре
    , пропихивающею
    , проплававшего
    , просушивающем
    , протиснуть
    , прочных
    , пухоцвет
    , скомпрометированный
    , уникум

    Английская транскрипция | Английский язык

    Phonetic Symbol   Examples Explanation
    tree [triː],  sea [siː], receive [rɪˈsiːv], we [wiː] Долгий, продолжительный звук: «И-ИИ»
    bit [bɪt], symbol [ˈsɪmbl̩], recall [rɪˈkɔːl], business [ˈbɪznəs] Короткий, низкий звук, что-то между звуками «И-Ы»
    car [kɑː(r)], far [fɑː(r)], garage [gɜˈrɑ:ʒ], heart [hɑː(r)t] Долгий, продолжительный звук: «А-АА»
    sort [ˈsɔ:rt], ball [bɔːl], ought [ˈɔːt], awful [ˈɔːfl̩] Долгий, открытый звук: «О»
    put [ˈpʊt], foot [fʊt], could [kʊd], butcher [ˈbʊtʃə(r)] Короткий звук «У»
    fool [fuːl], rule [ruːl], shoes [ʃuːz], true [truː] Долгий, мягкий звук: «У»
    up [ʌp], but [bʌt], blood [blʌd], love [lʌv] Короткий, резкий звук «A»
    rock [rɒk], impossible [ɪmˈpɑsʌbʌl], body [ˈbɒdi], cough [kɒf] Нечто среднее между «О-А»
    bed [bed], effort [ˈefə(r)t], head [hed], said [ˈsed] Смягчённый звук «Э»
    fear [fɪə(r)], beer [bɪə(r)], here [hɪə(r)] Нечто среднее между «ИЫ» и «ИЭ»
    hair [heə(r)], care [keə(r)], there [ðeə(r)], hare [heə(r)] Похоже на «ЭА»
    tray [treɪ], eight [eɪt], make [meɪk], say [ˈseɪ] Смягчённое «ЭЙ»
    joy [dʒɔɪ], coin [ˈkɔɪn], oyster [ˈɔɪstɜr] Похоже на «ОЙ»
    sky [ˈskaɪ], I [ˈaɪ], bye [ˈbaɪ], die [ˈdaɪ], by [ˈbaɪ] Похоже на «АЙ»
    trousers [ˈtraʊzəz], cow [kaʊ], hour [ˈaʊə(r)], our [ˈaʊə(r)] Смягчённое «АУ»
    joke [dʒəʊk], coat [kəʊt], own [əʊn], go [gəʊ] Смягчённое «ОУ»
    board [bɔː(r)d], tab [tæb], abandon [əˈbændən] Аналог русскому звуку «Б»
    cord [kɔː(r)d school [skuːl], ache [eɪk], ],Kodak [ˈkoˌdæk] Аналог русскому звуку «К»
    grace [ɡreɪs], agree [əˈɡriː], auxiliary [ɔːɡˈzɪliəri] (x = g+z) Аналог русскому звуку «Г»
    fool [fuːl], atmosphere [ˈætməsfɪə(r)],enough [ɪˈnʌf] Аналог русскому звуку «Ф»
    sunday [ˈsʌndeɪ], citizen [ˈsɪtɪzən], east [iːst], scissors [ˈsɪzə(r)z] Очень похож на звук «С»
    zebra [ˈzebrə], scissors [ˈsɪzə(r)z], resign [rɪˈzaɪn] Очень похож на «З»
    mother [ˈmʌðə(r)], lamb [læm] Аналог русскому звуку «М»
    note [nəʊt], intrusion [ɪnˈtruːʒn̩], knowledge [ˈnɒlɪdʒ] Аналог русскому звуку «Н»
    laughter [ˈlɑːftə(r)], illegal [ɪˈliːɡl̩] Смягчённый звук «Л»

    Истинное определение английского слова? — CodeRoad

    Каково было бы лучшее определение английского слова?

    Каковы другие случаи английского слова, кроме \w+ ?
    Некоторые могут включать \w+-\w+ или \w+'\w+ ; некоторые могут исключать такие случаи, как \b[0-9]+\b . Но я не вижу
    общего согласия по этим делам.
    Есть ли у нас формальное определение такого?
    Кто-нибудь из вас может уточнить?

    (Правка: расширьте вопрос, чтобы он не зависел только от регулярных выражений.)

    regex

    nlp

    Поделиться

    Источник


    OTZ    

    11 сентября 2010 в 07:31

    6 ответов


    • Захват английского слова

      У меня есть большой текстовый файл, который содержит много английских слов. Однако он содержит также немецкие и французские слова. Мне нужно запечатлеть в нем все английские слова. Я считаю, что , во-первых, я читаю весь файл с диска и конвертирую его в массив, во-вторых, я сопоставляю все слова…

    • Построение китайско-английского словаря — как определить, какие символы образуют слова?

      Я пытаюсь создать приложение в Rails, которое поможет пользователям читать китайский текст. Если пользователь нажимает на китайский иероглиф, он получает информацию о его произношении и значении. Я заставил это работать, используя базу данных китайско-английского словаря. Однако я не уверен, как…



    6

    Я действительно не думаю, что a regex поможет вам здесь, проблема с английским (или любым другим языком, если на то пошло) текстом-это контекст. Без него вы можете быть уверены, что между границами слов находится текст, число, случайный набор символов и т. д. Для NLP я думаю, что вы будете выбирать подмножество языка и искать конкретные слова, а не пытаться извлечь все ‘Words’ из строки.

    Поделиться


    Lazarus    

    11 сентября 2010 в 07:38



    3

    Лучший способ проверить, является ли слово английским, — это посмотреть его в словаре. Если это есть в словаре английских слов, то это английское слово. Вполне возможно, что слово может быть в английском словаре, а также во французском словаре. Например, ‘me’ — это одновременно французское и английское слово.

    Я уверен, что вы можете найти много загружаемых словарей в интернете. Вы также можете сделать свой собственный. Например, вы можете скачать английскую версию Википедии и предположить, что все найденные там слова являются английскими. Вы можете отфильтровывать числа, а можете и не отфильтровывать.

    Регулярное выражение не скажет вам, является ли слово английским. Например, xyvfg соответствует вашему шаблону \w’, но, конечно, не является английским словом.

    Редактировать:
    Теоретически, используя английскую фонологию, можно было бы определить, произносится ли фонетическая транскрипция слова носителем английского языка. Есть много слов, произносимых носителями английского языка, которые на самом деле не являются английскими словами. При этом можно было бы учесть слова, которые могут появиться в английском языке в будущем. Однако перевод между фонетической транскрипцией и текстом является довольно сложной проблемой, поскольку может быть много различных вариантов написания одной и той же фонетической транскрипции. Я не знаю, делал ли кто-нибудь что-нибудь подобное. Это может быть интересная теоретическая тренировка. Хотя я не уверен, что это было бы очень полезно в реальном мире NLP.

    Поделиться


    Jay Askren    

    13 сентября 2010 в 16:22



    1

    Давайте будем конкретны и попробуем укрепить почву примерами.

    Is 'word' an English word?  YES
    
    49th?  YES
    
    NYSE?  YES
    
    Résumé?  YES
    
    Haight-Ashbury? YES/NO?
    
    good-looking?  YES/NO?
    
    P&G?  YES/NO?
    
    1023?  YES/NO?
    
    304-392-9999?  YES/NO?
    
    3.14?  YES/NO?
    

    Поделиться


    OTZ    

    11 сентября 2010 в 23:51


    • Python-проверьте, является ли строка началом английского слова

      Я играл с различными модулями (например, PyEnchant), и то, что я хочу сделать, это определить, является ли строка началом английского слова. E.g. Smo -> Smoke A x -> x-ray Elx -> NULL Don -> Done Brj -> NULL Bes -> Besiege Nix -> Nixed Но я не уверен, что есть способ сделать…

    • преобразование слов с английского на русский язык в android

      я хочу конвертировать слова с английского на русский .so дайте мне знать, как это возможно в автономном режиме я был бы благодарен, если бы кто-то мог мне помочь. Есть ли способ использовать перевод с английского на русский язык любая помощь доступна заранее спасибо..


    Поделиться


    Tommy Herbert    

    17 сентября 2010 в 20:08



    0

    Истинное английское слово почти никогда не будет содержать акцентов или иностранных символов — так что \w+ может захватить больше, чем вы ищете, хотя есть ряд слов, используемых в английском языке, которые мы заимствовали из других языков — у большинства из нас, вероятно, нет времени или желания утруждать себя акцентированием их, tho’. Я даже поленился написать там ‘though’ полностью — \w+’\w+ этого бы не уловил. В общем, пока ваш \w+ правильно улавливает ваши слова, я не могу придумать никакой другой пунктуации поверх — и’, которая могла бы встретиться в середине слова.

    Поделиться


    Will A    

    11 сентября 2010 в 07:42



    0

    Ваша проблема называется токенизацией слов. Взгляните сюда:

    http://nlp.stanford.edu/IR- book/html/htmledition/tokenization-1.html

    Стэнфорд-очень известная лаборатория. Они производят один из самых эффективных парсеров для английского языка. На этой странице описываются некоторые распространенные проблемы токенизации, такие как

    • Необычный доменный токен: M A S*H, C++, IP адрес …
    • Перенос: совместное обучение, Hewlett-Packard
    • Словосочетание: Сан-Франциско, Лос-Анджелес
    • Специфический синтаксис …
      • Рекламные объявления для air тарифы «San Francisco-Los Angeles»
      • Опущенные пробелы и т. д…

    Проект Penn Treebank также предоставляет простой скрипт sed для токенизации слов «that does a decent enough job on most corpora» здесь .

    Поделиться


    log0    

    18 сентября 2010 в 11:20


    Похожие вопросы:

    Определите трудность английского слова

    Я работаю над игрой, основанной на словах. Моя база данных слов содержит около 10 000 английских слов (отсортированных по алфавиту). Я планирую иметь в игре 5 уровней сложности. Уровень 1 показывает…

    Алгоритм, который генерирует уникальный серийный номер для каждого английского слова

    Для приложения мне нужно сгенерировать уникальные серийные номера для каждого английского слова. Каков был бы наилучший подход? Одним из ограничений является то, что алгоритм генерации серийных…

    Sql база данных английского словаря

    Я делал генератор кроссвордов. Итак,мне нужна база данных с открытым исходным кодом a sql английского словаря(со значениями,синонимами, типом слова) для моего программного обеспечения. Где я могу…

    Захват английского слова

    У меня есть большой текстовый файл, который содержит много английских слов. Однако он содержит также немецкие и французские слова. Мне нужно запечатлеть в нем все английские слова. Я считаю, что ,…

    Построение китайско-английского словаря — как определить, какие символы образуют слова?

    Я пытаюсь создать приложение в Rails, которое поможет пользователям читать китайский текст. Если пользователь нажимает на китайский иероглиф, он получает информацию о его произношении и значении. Я…

    Python-проверьте, является ли строка началом английского слова

    Я играл с различными модулями (например, PyEnchant), и то, что я хочу сделать, это определить, является ли строка началом английского слова. E.g. Smo -> Smoke A x -> x-ray Elx -> NULL Don…

    преобразование слов с английского на русский язык в android

    я хочу конвертировать слова с английского на русский .so дайте мне знать, как это возможно в автономном режиме я был бы благодарен, если бы кто-то мог мне помочь. Есть ли способ использовать перевод…

    Настроить определение слова в Vim?

    Как я могу настроить определение слова в Vim? По умолчанию-это серия персонажей, как _ , [a-zA-Z] считаются как слова. Я хотел бы добавить к этому определению еще несколько символов.

    Oracle: преобразование чисел в слова на другом языке, кроме английского

    Я пытаюсь перевести числа в слова. select to_char(to_date(:number,’j’),’jsp’) from dual; SELECT TO_CHAR (TO_DATE (24834, ‘j’), ‘jsp’) FROM DUAL; //Output: twenty-four thousand eight hundred…

    Неанглийское слово Embedding от английского слова Embedding

    Как я могу сгенерировать неанглийское (французское , испанское , итальянское ) встраивание слов из английского встраивания слов ? Каковы наилучшие способы создания высококачественного встраивания…

    Английская транскрипция для детей: в картинках и упражнениях

    Доброе-доброе-доброе утро, планета!

    Не знаю, как у вас, конечно, но на моей планете английского (под названием Liza’s English) сейчас именно утро. И важную информационно-практическую статью об английской транскрипции я решила-таки написать на бодрую утреннюю голову. Думаю, вы не против). Тогда начнем разбор этой простой, но часто вызывающей много вопросов темы.


    Содержание:

    1. Нужна ли транскрипция?
    2. Для чего ее придумали?
    3. Гласные звуки.
    4. Согласные звуки.
    5. Дифтонги (двойные звуки).
    6. Немного практики.

    И начну я с вопроса:

    А нужна ли английская транскрипция вообще?

    Что вам на это сказать?.. Если в школьной программе по английскому языку ее проходят и заставляют учить, тогда конечно не отвертеться! Если же говорить глобально, то ее отсутствие при изучении английского никак не скажется на результатах и знаниях.

    НО! Так как наши дети все-таки изучают английский язык, то знать о том, что такое транскрипция в нем — это дело чести. Это примерно так же, как важно знать, что в русском языке есть 6 падежей (и этим, кстати, он и отличается от английского и многих других). Но ведь мы можем научиться говорить и писать слова, не задумываясь о том, какой падеж в них нужно использовать… «Иван Родил Девчонку… Ну вы меня поняли, думаю.

    Поэтому мой вердикт — будем изучать! Но быстро и без всяких растягиваний на год! Урок или два — и «английская транскрипция» станет самым приятным словосочетанием на свете…

    Кроме этого, владея способностью расшифровывать английскую транскрипцию, любой школьник и взрослый сможет прочитать и произнести любое, даже самое «страшно-непонятное» слово в английском словаре!!!

    Для чего ее придумали?

    Придумали ее очень-очень давно, при этом сами англичане, для себя —  когда поняли, что сами не всегда могут понять, как читается то или иное слово.

    Дело в том, что в английском языке есть правила чтения, согласно которым можно читать слова правильно. Например, такое правило: «В закрытом слогe английская буква „a“ будет читаться так    (слова bag, laptop )». Но при этом, в этих правилах так много исключений, что их порой и запомнить невозможно (например, к этому правилу возьмем исключение со словом c закрытым слогом task, в котором буква «a» уже читается по-другому).

    Ну вот и придумали такое понятие, как транскрипция, чтобы каждое английское слово можно было прочитать корректно, даже не зная правил, а просто владея набором транскрипционных значков.

    Иногда вы можете увидеть два варианта одного значка, это нормально. Оба из них имеют место быть. Мои аналогии с русскими буквами очень условны. Главное здесь — услышать звук и как можно  точнее его сымитировать.

    Транскрипционные значки для гласных звуков

    [ i ] или [ ı ] звук, похожий на «и», но более отрывистый и твердый.

    [ е ]  звук, похожий на «е», но более отрывистый и твердый.

    [ ӕ ]  звук, похожий на «э», но более широкий.

    [ ɔ ] или [ ɒ ]  звук, похожий на «о», но более отрывистый и открытый.

    [ ∧ ]   звук, похожий на «а», но более отрывистый.

    [ u ] или [ ʋ ] звук, похожий на «у», но более отрывистый.

    [ i: ] звук, похожий на долгую «и».

    [ ɔ: ] звук, похожий на долгую «о».

    [ ɑ: ] звук, похожий на долгую и глубокую «а».

    [ u: ] звук, похожий на долгую «у».

    [ ə: ] или [ɜ:] звук, напоминающий что-то среднее между «о» и «ё».

    В английском языке есть один единственный транскрипционный значок, который обозначает неударный гласный — [ə] . Произносится он очень коротко и невнятно. Часто мы слышим его на конце слов, заканчивающихся на безударные гласные. Teacher, computer…

    Транскрипционные значки для согласных звуков

    [ p ] звук, похожий на «п».

    [ b ] звук, похожий на «б».

    [ t ] звук, похожий на «т».

    [ d ] звук, похожий на «д».

    [ k ] звук, похожий на «к».

    [ g ] звук, похожий на «г».

    [ f ] звук, похожий на «ф».

    [ v ] звук, похожий на «в».

    [ s ] звук, похожий на «с».

    [ z ] звук, похожий на «з».

    [ m ] звук, похожий на «м».

    [ n ] звук, похожий на «н».

    [ l ] звук, похожий на «л».

    [ h ] звук, похожий на воздушную «х».

    [ ʃ ] звук, похожий на «щ».

    [ tʃ ] звук, похожий на «ч».

    [ ʒ ] звук, похожий на «ж».

    [ dʒ ] звук, похожий на «дж».

    [ r ] звук, похожий на «р».

    [ j ] звук, похожий на «й». Смягчает гласные, напр. [ jɒ ] [ je ] [ ju: ]

    [ w ] звук, произносимый губами.

    [ ŋ ] звук, похожий на «н», произносимую в нос.

    [ θ ] глухой межзубной звук.

    [ ð ] звонкий межзубной звук.

    Транскрипционные значки для дифтонгов (двойных звуков)

    [ aı ] или [ ai ] звук, похожий на «ай».

    [ eı ] или [ ei ] звук, похожий на «эй».

    [ ɔı ] или [ ɔi ] звук, похожий на «ой».

    [ aʋ ] или [ au ] звук, похожий на «ау».

    [ əʋ ] или [ ou ] звук, похожий на «оу».

    [ ıə ] или [ iə ] звук, похожий на «иэ».

    [ ʋə ] или [ uə ] звук, похожий на «уэ».

    [ eə ] или [ εə ] звук, похожий на «эа».

    Время практики

    Ну вот мы и рассмотрели с вами все знаки английской транскрипции. Большинство из них ребята и взрослые запоминают довольно легко. Сложности иногда возникают со значками, обозначающими дифтонги или некоторые звуки, совсем не похожие на русские. Но это быстро исправляется, если сразу закрепить все хорошей практикой и упражнениями, чем мы сейчас и займемся.

    Рекомендую купить и пройти онлайн курс Английский с нуля (от небезызвестного сервиса LinguaLeo). Там подробно разбираются буквы и звуки английского языка. Транскрипцию тоже хорошо можно проработать. Регистрируйтесь и пробуйте курс бесплатно. Если понравится, вперед!..

    Упражнение 1

    Первое, что нужно сделать — повторять несколько раз звук, соответствующий определенному знаку английской транскрипции. Идите по порядку (по тому списку, который я дала). Повторяйте один звук по 3-5 раз, пытаясь при этом ассоциировать сложный значок с образом. Например, повторяя звук [ ӕ ], представляйте себе кошечку [ kӕt], шляпу [hӕt]  или любой другой образ, но только пусть этому образу будет соответствовать слово, которое в английском произносится именно с этим звуком. Например, у меня в голове возник образ сумки [bӕg] вот с таким фирменным значком.))

    Ну как? Сложно? Если да, то поделюсь с вами моими идеями касательно самых «несговорчивых» знаков транскрипции. Прошу не судить строго мои корявенькие картинки. Клянусь, в моем воображении они выглядят намного симпатичнее)).

     

     

     

    Значок [ ʋ ] — образ ступни-пятки.

    Слово foot [ fʋt ] .

     

     

     

     

     

    Значок  [ ɜ: ] — образ птицы.

    Слово bird [ bɜ:d ] .

     

     

     

     

     

    Значок [ ʃ ] — образ туфли.

    Слово shoe [ ʃu:] .

     

     

     

     

     

     

    Значок [ tʃ ]  образ цыпленка.

    Слово chick [ tʃık ] .

     

     

     

     

     

    Значок [ dʒ ] — образ страницы в учебнике.

    Слово page [peıdʒ ] .

     

     

     

     

     

    Значок [ j ] — образ галочки, правильного ответа.

    Слово yes [jes] .

     

     

     

     

     

     

    Значок [ ŋ ] — образ длинной и неровной дороги.

    Слово long [lɒŋ] .

     

     

     

     

     

    Значок [ θ ] — образ цифры три.

    Слово  three [θri:] .

     

     

     

     

     

     

    Значок [ ð ] — образ матери с младенцем.

    Слово mother [m∧ðə] .

     

     

     

    Упражнение 2

    • Сейчас будем читать с вами простые слова с разным звуками. Ваша задача — посмотреть на слово, прослушать его произношение, повторить, а потом догадаться, какой транскрипционный значок из представленных ниже соответствует звуку в слове (нужные гласные буквы или сочетания будут подчеркнуты).

         [ ı ]   [ е ]   [ ӕ ]   [ ɒ ]   [ ∧ ]   [ ʋ ]   [ i: ]   [ ɔ: ]   [ ɑ: ]   [ u: ]   [ɜ:]

    bird family cool
    pig butter first
    doll eat sit
    last bed car
    apple clock men
    daughter put clean
    doctor fruit kitchen
    dark girl dinner
    door trolley-bus cap
    foot book ball

     

    • Теперь вы увидите другие слова, которые также нужно будет прослушать и повторить,  а затем выбрать необходимый знак транскрипции из представленных ниже, которому соответствует тот или иной звук (нужные согласные буквы или сочетания будут подчеркнуты в словах).

         [ p ]   [ b ]   [ t ]   [ d ]   [ k ]   [ g ]   [ f ]   [ v ]   [ s ]   [ z ]   [ m ]   [ n ] 

         [ l ]    [ h ]   [ ʃ ]   [ tʃ ]   [ ʒ ]   [ dʒ ]   [ r ]  [ j ]   [ w ]   [ ŋ ]   [ θ ]   [ ð ]   

    between very window
    village street zoo
    thin then teacher
    sugar telephone five
    hundred must night
    middle number present
    black kitten give
    knife horse room
    pink sponge king
    page factory you

     

    • Следующие слова содержат в себе дифтонги. Слушаем, повторяем и выбираем нужный знак транскрипции для подчеркнутых букв и буквосочетаний.

         [ aı ]    [ eı ]    [ ɔı ]    [ aʋ ]   [ əʋ ]    [ ıə ]    [ ʋə ]    [ eə ] 

    fear name behind
    wardrobe chair tone
    poor cake town
    here tour coin
    brown those hare
    July boy table
    trousers yellow bike
    care near so

     

    • Заключительное в этом разделе упражнение на выбор верного варианта транскрипции к слову из двух предложенных. Схема работы та же: слушаем, повторяем, а потом выбираем.

    cup  [ kʌp ] или [ kӕp ]

    twelve [ tvelv ] или  [ twelv ]

    month [ mɑ:nθ ] или  [ mʌnθ ]

    rain [ raın ] или  [ reın ]

    farm [ fɜ:m ] или  [ fɑːm ]

    large [ lɑːʒ ] или  [ lɑːdʒ ]

    spoon [ spuːn ] или  [ spɔ:n ]

    fair [ feə ] или  [ fıə]

    say [ seɪ ] или  [ seə ]

    now [ nəʋ ] или  [ naʊ ]

    June [ tʃ uːn ] или  [ dʒuːn ]

     

    Упражнение 3

    Ну что же, пришло время и самим писать транскрипцию к словам. Я думаю, у вас все получится! День или два — и тема английской транскрипции станет для вас такой легкой, какой она вам даже и не снилась)). Еще раз напомню вам, что безударные слоги часто обозначаются так [ ə ].

    after, box, write, with, open,

    season, shut, round, tall, number,

    shirt, plus, jam, song, yogurt, hate

    Упражнение 4

    Это упражнение состоит в том, чтобы тренироваться читать много английских слов по транскрипции. Для детей самым лучшим вариантом здесь будут карточки с английскими словами и транскрипцией к ним. Некоторые авторы  (например, Носова, Епанова) специально разрабатывают такие карточки — ведь они помогают не только закрепить выученные знаки транскрипции, но и легко пополнить свой словарный запас. Вот такие интересные карточки я нашла в магазине Лабиринт. Здесь самые основные тематики и слова:

    Комплект «Дикие животные»

    Комплект «Фрукты»

    Комплект «Человек»

    Комплект «Профессии»

    Комплект «Школа»

    Комплект «Дом»

     


    Ну вот, я это и сделала, друзья!

    А вы? Справились? Если есть какие-то вопросы, обязательно задавайте мне их. Я постараюсь на них ответить.

    Буду благодарна, если вы поделитесь данными материалами в своих любимых соцсетях. Это будет так называемый небольшой вклад в дальнейшее развитие моего ресурса.

    И еще — справа в сайдбаре моего сайта вы можете найти удобный сервис «Транскрипция онлайн» — в поле вводим любое английское слово и получаем его транскрипцию. Пользуйтесь!

    Кроме этого, приглашаю вас в мою вкусную рассылку (на нее вы можете подписаться в конце этой статьи — после формы подбора репетитора)! Самое полезное и интересное об английском и не только…

     


    Ответы к упражнениям:

    упр.2

    bird  [ɜ:] family  [ ӕ ] cool  [ u: ]
    pig  [ ı ] butter  [ ∧ ] first  [ɜ:]
    doll  [ ɔ: ] eat  [ i: ] sit  [ ı ]
    last  [ ɑ: ] bed  [ е ] car  [ ɑ: ]
    apple [ ӕ ] clock  [ ɒ ] men  [ е ]
    daughter  [ ɔ: ] put  [ ʋ ] clean  [ i: ]
    doctor  [ ɒ ] fruit  [ u: ] kitchen [ ı ]
    dark  [ ɑ: ] girl  [ɜ:] dinner  [ ı ]
    door  [ ɔ: ] trolley-bus [ ∧ ] cap  [ ӕ ]
    foot  [ ʋ ] book  [ ʋ ] ball  [ ɔ: ]

     

    between  [ w ] very  [ v ] window  [ w ]
    village  [ v ] [ dʒ ] street  [ s ] zoo  [ z ]
    thin  [ θ ] then  [ ð ] teacher  [ tʃ ]
    sugar  [ ʃ ] telephone  [ f ] five [ f ]  [ v ]
    hundred  [ d ] must  [ t ] night  [ t ]
    middle  [ l ] number  [ m ] present  [ p ]
    black  [ b ] kitten  [ k ] give  [ g ]
    knife  [ n ] horse  [ h ] room  [ r ]
    pink  [ ŋ ] sponge  [ dʒ ] king  [ ŋ ]
    page  [ dʒ ] factory  [ r ] you  [ j ]

     

    fear  [ ıə ] name  [ eı ] behind  [ aı ]
    wardrobe  [ əʋ ] chair  [ eə ] tone  [ əʋ ]
    poor  [ ʋə ] cake  [ eı ] town  [ aʋ ]
    here  [ ıə ] tour  [ ʋə ] coin  [ ɔı ]
    brown  [ aʋ ] those  [ əʋ ] hare  [ eə ]
    July  [ aı ] boy  [ ɔı ] table  [ eı ]
    trousers  [ aʋ ] yellow  [ əʋ ] bike  [ aı ]
    care  [ eə ] near  [ ıə ] so  [ əʋ ]

     

    [ kʌp ]

    [ twelv ]

    [ mʌnθ ]

    [ reın ]

    [ fɑːm ]

    [ lɑːdʒ ]

    [ spuːn ]

    [ feə ]

    [ seɪ ]

    [ naʊ ]

    [ dʒuːn ]

     

    упр.крат].

    8. Безударные звуки на месте букв у, ы, и обозначаются обычно так же, как и ударные, знаками [у], [ы], [и]: утюг — [ут’ук], рыбак — [рыбак], иди — [ид’й].

    9. Мягкость согласного звука обозначается запятой справа вверху от буквенного знака: лямка — [л’амкъ], рёв — [р’jф], лев — [л’эф], куплю — [купл’у].

    10. Долгота согласного звука обозначается горизонтальной чёрточкой над буквой: ванна — [ванъ],  жужжит — [жужыт].

    11. Знаком [j] обозначается согласный звук «йот», который произносится перед ударными гласными: яма —[ jамъ], ерш — [joрш], ель —[jэл’].

    Слабый вариант этого звука произносится во всех других положениях, обычно обозначается знаком [и] («и неслоговой»): мой – [мои], стая [стаиъ], (В школьной практике в обоих случаях используется знак [й]).

    Транскрипция может быть не только полной, но и выборочной, когда в квадратные скобки заключается не все ее слово а только рассматриваемый элемент — звук или ние звуков. Такой способ транскрибирования использует например, в словарях и справочниках для указания на правильное произношение звуков: бифштекс — бифш[тэ]к шинель — ши[н’э]лъ.

    www.traktat.com

    Фонетический (звуко-буквенный) разбор слова онлайн

    Фонетический (звуко-буквенный) разбор слова онлайн

    Фонетический (звуко-буквенный) разбор слов онлайн. Транскрипция, слоги и цветовые схемы. Справочные материалы.

    Фонетика — раздел науки о языке, в котором изучаются звуки языка, ударение, слог. Освоив их, вы сможете делать фонетический разбор слова.

    Слова с буквой ё обязательно пишите через ё. Фонетические разборы слов «еж» и «ёж» будут разными!

    Фонетический разбор слова — определение количества букв, звуков, ударения в слове, выделение гласных и согласных звуков, их классификация, то есть подробный анализ слова, с точки зрения его правильного произношения. Для проведения анализа необходимо знать, что такое гласные и согласные звуки, и как составляется транскрипция. Если вы не знакомы с этими понятиями, советуем прочитать материалы о звуках русского языка и правила фонетики. Фонетический разбор помогает определить состав слова с точки зрения букв и звуков, поэтому его ещё называют звуко-буквенным разбором.

    Сайт phoneticonline.ru содержит примеры фонетического разбора слов русского языка всех частей речи. Воспользуйтесь формой поиска для просмотра фонетического разбора нужного слова. Разбор слова делается с помощью программы в автоматическом режиме. Советуем использовать фонетический разбор исключительно для самопроверки, так как он может быть неверным либо используемые нами правила могут отличаться от правил вашей учебной программы.

    Будьте внимательны! Фонетический разбор различен для слов с одинаковым написанием и различным ударением: доро́га и дорога́ — различные слова, имеют разные значения, сне́га и снега́ — одно и то же слово, но записано в единственном и множественном числе.
    Часто вместо буквы ё пишут букву е: елочный, трехкомнатная. В фонетическом разборе есть разница между буквами. Для получения правильного разбора слова должны быть записаны через букву ё: ёлочный, трёхкомнатная.

    Смотрите план фонетического разбора с примерами в устной и письменной форме. Примеры также можно найти среди слов, которые проверяли посетители сайта: крупненький, каретка, копуша, томагавк, неплатёж, Русалочке, раздробление, смешу, серединочка, сквернее, Замякина, фразовая, разграничительной, фонетическим, сглаживатель, закадычные, голубеньких, остуженной, беспокоясь, надруб и другие. За всё время посетители запросили более 700 тысяч слов в разных склонениях и формах. Среди них часто запрашиваемых — 197985 слов.

    phoneticonline.ru — фонетический (звуко-буквенный) разбор слов

    определение, произношение, транскрипция, словоформы, примеры

    глагол

    — установить после расчета, исследования, эксперимента, обзора или изучения (син.: Установить, найти, выяснить)
    — форма или влияние; дать направление (син.: влияние, плесень, регулирование, форма)

    опыт часто определяет способность

    — исправить окончательно или авторитетно (син.: установить)
    — решить или исправить определенно (син .: определить, исправить, ограничить, установить, указать)
    — достичь, сделать или прийти к решению о чем-либо (синхр .: решить)
    — зафиксировать в объеме; зафиксировать границы

    дерево определяет границу собственности

    — окончательно урегулировать; прийти к соглашению (син.: урегулировать, отвести, возвести в квадрат)
    — узнать, узнать или определить с уверенностью, обычно путем запроса или других усилий (син.: установить, проверить, узнать, узнать, увидеть , смотреть)

    Дополнительные примеры

    Новая политика будет определена специальной комиссией.

    Спрос на товар определяет его цену.

    Он считает, что личность во многом определяется генетикой.

    Для определения причины смерти будет проведено вскрытие.

    В настоящее время они не могут точно определить положение корабля.

    Ученые определили, что книга написана в конце 16 века.

    Я пытаюсь определить, что и когда произошло.

    Они определяют, следует ли им остаться.

    Они решили немедленно уехать.

    Суд постановил, что налогоплательщик не имеет права на возмещение.

    Мы решили уехать / уезжать рано утром.

    Я решил действовать самостоятельно.

    Я решил, что мне стоит один раз взглянуть в окно каюты.

    Спрос определяет цену.

    Он только определяет действие химической силы.

    Формы слова

    глагол
    I / you / we / they: определить
    he / she / it: определить
    причастие настоящего времени: определить
    прошедшее время: определить
    причастие прошедшего времени: определить

    Транскрипция, произношение и перевод английских слов

    Этот инструмент позволяет вам искать транскрипцию и произношение английских слов.Также есть перевод с английского на другие языки. Чтобы выполнить поиск транскрипции и произношения на английском языке в Интернете, просто введите слова или фразу в поле поиска и нажмите «Поиск» или клавишу ввода на клавиатуре. Все слова имеют два варианта транскрипции и произношения: британский и американский. Для перевода с английского выберите нужный вам язык.

    Что такое фонетическая транскрипция?

    Фонетическая транскрипция — это визуальное представление звуков речи.Обычно он пишется в Международном фонетическом алфавите (IPA), в котором каждый английский звук имеет свой собственный символ. Фонетическая транскрипция обычно приводится в скобках /ˈɪŋ.ɡlɪʃ / или в квадратных скобках [ˈɪŋ.ɡlɪʃ]. Каждый звук в транскрипции пишется отдельно.

    Почему важна фонетическая транскрипция?

    Фонетическая транскрипция очень важна, потому что помогает правильно произносить слова. Это необходимо, особенно для английского языка. Как известно, одна и та же английская буква или комбинации букв могут по-разному произноситься и читаться разными словами.Конечно, есть правила чтения на английском, но есть и исключения. Правописание английского слова не всегда говорит вам, как его произносить или читать. Но если вы умеете читать фонетическую транскрипцию, вы сможете правильно произносить любое английское слово, не слушая его звукового произношения. Этот инструмент Myefe.com поможет найти транскрипцию онлайн и без ошибок читать английские слова.

    Почему нужно заботиться о правильном произношении?

    Произношение важно для изучающих английский язык.Это помогает общаться на английском языке. Если ваше произношение неверно, другие люди могут вас неправильно понять или им будет сложно понять, что вы хотите сказать. На Myefe.com вы можете практиковать свое английское произношение онлайн, слушая, как правильно произносить английские слова.

    Введение в фонетическую транскрипцию | Антимун

    Томаш П. Шинальски

    © Томаш П. Шинальски, Antimoon.com

    Связанные страницы

    Демонстрация фонетической транскрипции

    Словари с фонетической транскрипцией расскажут вам о
    произношение
    слов.В английских словарях фонетическая транскрипция необходима, потому что написание английского слова не
    скажи тебе, как ты должен
    произнести это.

    Фонетические транскрипции обычно пишутся в международном фонетическом алфавите (IPA),
    в котором каждому английскому звуку соответствует свой символ. (Вы можете посмотреть на диаграмму со всеми
    Английские звуки и их символы IPA.)

    Например, фонетическая транскрипция слова на основе IPA
    дом
    это hoʊm , а транскрипция
    приходят
    составляет км .Обратите внимание, что в написании эти слова похожи. Оба они оканчиваются на или . Но их
    фонетические транскрипции разные, потому что они
    выраженный
    по-другому.

    Фонетическая транскрипция обычно приводится в скобках, например:
    / hoʊm / , / km / .
    В словаре это выглядит так:

    (Кстати, не все словари дают
    произношение
    слов.
    Если вы серьезно относитесь к изучению английского языка, вам следует
    купите словарь, в котором есть эта информация.)

    Словесное ударение

    Когда в слове много слогов, один из них всегда
    выраженный
    сильнее. Это называется ударением слов , и
    мы говорим, что это слог с ударением . Например, в слове
    становится , подчеркнуто
    слог
    приходят . Если бы ударный слог был , будет , превратится в .
    выраженный
    нравится .

    Словари подскажут, на каком слоге делается ударение. Самая популярная система — нанесение вертикальной линии.
    ( ˈ ) перед ударным слогом в фонетической транскрипции слова.Например, транскрипция для
    становится
    это / bɪˈkʌm / .

    Если в слове только один слог (примеры: pen , watch ), словари обычно не ставят перед ним ударение ˈ . Так они не пишут
    / ˈpen / — пишут просто / pen / .

    Некоторые словари используют другие системы для выделения словесного ударения. Например, они могут поставить
    ˈ после ударного слога, или они могут подчеркивать ударный слог.

    Демонстрация

    Взгляните на наши
    демонстрация системы фонетической транскрипции.
    Вы можете прочитать транскрипции
    несколько английских слов и одновременно слушайте их произношение.

    Представление различий между британским и американским английским языком

    Многие слова в британском и американском английском произносятся по-разному. Конечно, эти отличия
    должны быть отражены в фонетической транскрипции. Это можно сделать двумя основными способами:

    • Отдельные транскрипции для британского и американского английского, например:

      точка BrE / dɒt / , AmE / dɑːt /
      ферма BrE / fɑːm / , AmE / fɑːrm /
      идти BrE / gəʊ / , AmE / goʊ /
      мама BrE / m / , AmE / mʌðər / (или / mʌðɚ / )

      Эта система используется в словарях для продвинутых учащихся из Лонгмана, Оксфорда и Кембриджа.Проблема с этой системой заключается в том, что вам нужно написать две транскрипции для большинства слов, что занимает много места.

    • Одна «компромиссная» транскрипция для британского и американского английского. Это делается
      в основном используются символы британской фонемы плюс символ ʳ .

      точка / dɒt /
      ферма / фɑːʳм /
      идти / goʊ /
      мама / мкм /

      В этой системе транскрипции короче, но
      читатель должен знать, что в американском английском
      ɒ меняется на ɑ:
      и ʳ меняется на r .Эта система используется, например, в
      Коллинз COBUILD
      Словарь английского языка для продвинутых изучающих,
      , и во многих местах на Antimoon.

    Следует ли вам заботиться о фонетической транскрипции?

    Сегодня почти все хорошие английские словари имеют аудиозаписи. Если вы можете слушать любое английское слово как оно есть
    произносится носителем языка,
    почему вы должны заботиться о фонетической транскрипции? Вот несколько причин:

    • Если вы хотите иметь хорошее английское произношение, вам все равно нужно выучить и практиковать все английские звуки.Если ты собираешься выучить каждый звук
      в таблице звуков английского языка вы можете также выучить его символ — , он не принимает
      столько дополнительных усилий
      .
      Для вас это даже не обязательно должен быть особый проект —
      все, что вам нужно сделать, это обратить внимание на фонетические транскрипции в вашем словаре.
      Так вы постепенно узнаете символы.
    • Предположим, вы нашли слово boot и прослушали его запись *.
      Теоретически, если вы знакомы со звуками английского языка, вы должны уметь замечать
      что boot имеет звук «длинное u» , и скоро , а не звук
      «Короткий u» хороший и книжный .Но на практике вы можете упустить этот факт, особенно если вы новичок или не уделяете достаточно внимания.
      Если вы также прочитаете фонетическую транскрипцию / buːt / и увидите символ (и знаете, что он означает), вероятность того, что
      Вы заметите и запомните правильное произношение .

      Есть еще слова, написание которых может заставить вас услышать то, чего нет. Например,
      многие учащиеся могут «услышать», что панда
      оканчивается на гласную ɑː ,
      что ha w k имеет звук w , и
      та сист е м
      имеет звук e .Во всех таких случаях фонетическая транскрипция может помочь избежать иллюзий.
      (К сожалению, они могут создавать свои собственные иллюзии.)

      Транскрипции также могут избавить вас от галлюцинаций. Позвольте мне объяснить, что я имею в виду.
      Вот английское слово: полковник . А вот и его звуковое произношение.
      Вы заметили что-нибудь необычное в этом слове и его произношении?
      Если вы ничего не заметили, вот подсказка: сколько на нем l , когда вы это говорите?
      Правильно — всего один л .Однако это очень легко упустить, потому что написание полковник
      заставляет вас ожидать двух l ’s. Это ожидание может повлиять на ваше восприятие — когда вы слушаете запись,
      очень легко услышать два l , даже если есть только один!
      Просмотр фонетической транскрипции / ˈkɜːn ə l / может помочь вам заметить
      что первые л , полковник
      молчит.

    • В словарях больше транскрипций, чем записей.Например, транскрипции могут
      показать два способа произнести слово, но запись покажет только один. Если вы умеете читать фонетические транскрипции, вы можете
      получить больше информации из словаря.

    • В Интернете люди используют фонетическую транскрипцию
      по номеру обсудить проблемы с произношением . Если вы хотите присоединиться к дискуссии или задать вопросы, вы должны знать систему транскрипции.
    • Есть ситуаций, когда вы не можете слушать звук — например, на компьютере, который вы используете, нет динамиков,
      вы не хотите беспокоить других людей, вы находитесь в шумной обстановке и не слышите звук,
      у вас есть доступ только к бумажному словарю и т. д.Даже если вы можете использовать аудио, взгляните на транскрипцию
      может быть быстрее, чем нажатие кнопки и прослушивание записи.
    • Если вы создаете свои собственные элементы SRS,
      вы можете добавить фонетические транскрипции легче (и быстрее), чем
      аудиозаписи. См. Также: элементы произношения.

    Короче говоря, вы можете научиться хорошему английскому произношению, не зная символов IPA для английских звуков, но выучить эти символы непросто.
    не так уж сложно, и вы получите взамен несколько приятных преимуществ.

    Если вы собираетесь использовать фонетические транскрипции, вам следует кое-что о них знать.

    Демонстрация фонетической транскрипции | Антимун

    © Томаш П. Шинальски, Antimoon.com

    На этой странице показано, как читать и писать
    фонетические транскрипции английских слов.
    Словари используют фонетическую транскрипцию, чтобы рассказать вам, как следует произносить слова.

    Все транскрипции на этой странице написаны в фонематической системе, используемой в
    большинство словарей для изучающих английский язык.Они используют символы Международного фонетического алфавита (IPA).
    Все произношения написаны «универсальными» (британо-американскими) символами,
    но говорят на американском английском. Например, их расшифровывается как
    / ðeəʳ / , а на записи слышен звук r .

    Для получения дополнительной информации см.
    таблица с английскими звуками и символами IPA.

    Инструкции: Проиграйте образцы звука, послушайте слова и прочтите транскрипции.

    , что ðæt
    сложный ˈdɪfɪk ə л
    вы ju:
    который wɪtʃ
    свои eəʳ
    около baʊt
    фото foʊtoʊ
    должно ʃʊd
    чел. ˈpi: p ə l
    также ˈɔ: lsoʊ
    между bɪˈtwi: n
    много Эмени
    толще ˈθɪkəʳ
    детский taɪld
    слышать hɪəʳ
    система ˈsɪstəm
    группа гр: п
    номер nʌmbəʳ
    однако гаʊˈевəʳ
    другой nʌðəʳ
    снова Ген
    мир w: ʳld
    площадь eəriə
    психология saɪˈkɒlədʒi
    курс kɔ: ʳs
    компания ˈkʌmpəni
    под ˈʌndəʳ
    проблема прɒблəм
    никогда ˈневəʳ
    сервис sɜ: ʳvɪs
    что-то ˈsʌmθɪŋ
    место плей
    точка pɔɪnt
    предоставить прəˈваɪд
    большой лɑ: dʒ
    общий ˈdʒenərəl
    всегда ˈɔ: lweɪz
    вперед некст
    быстрый кВтɪк
    нервный nɜ: ʳvəs
    местный loʊk ə л
    во время ˈdjʊərɪŋ
    хотя ɔ: lˈðoʊ
    кто hu:
    пример gˈzæmp ə л
    скорее ræðəʳ
    социальная soʊʃ ə л
    написать рат
    процентов p sent
    гость жест
    оба boʊθ
    каждые Кеври
    мес мʌnθ
    важный mˈpɔ: ʳt ə nt
    головка хед
    информация ɪnfəʳ ˈmeɪʃ ə n
    вопрос kwestʃ ə n
    бизнес bɪznɪs
    мощность paʊəʳ
    изменить tʃeɪndʒ
    переезд mu: v
    книга байк
    разработка dɪˈveləpmənt
    молодой дʌŋ
    национальный ˈnæʃən ə л
    вода wɔ: təʳ
    пока еще струя
    возможно pəʳ ˈhæps
    до ʌnˈtɪl
    контроль kənˈtroʊl
    включая nˈklu: d
    верю b :li: v
    разрешить laʊ
    стенд st 90nd
    идея aɪˈdi: ə
    символ kærɪktəʳ
    результат rɪˈzʌlt
    бывает hp ə n
    друг друг
    переносить kri
    ужасно ˈɔ: f ə l
    ранний : ʳli
    вид вью:
    сам hmˈself
    ксерокс zɪərɒks
    отчет rɪˈpɔ: ʳt
    политическая ползун ə л
    закон л:
    привидение goʊst
    скромный mɒdɪst
    человек pɜ: ʳs ə n
    один раз женщин
    полиция p 90li: s
    проиграть lu: z
    позиция pəˈzɪʃ ə n
    промышленность ˈɪndəstri
    майор ˈmeɪdʒəʳ
    сборка bɪld
    язык ˈlæŋgwɪdʒ
    международный ɪntəʳ ˈnæʃ ə n ə l
    остальное els
    да jeə
    центр ˈСентəʳ
    достаточно nʌf
    спокойный квадрат: м
    цвет kʌləʳ
    приманка л
    нож naf

    Фонематическая или фонетическая транскрипция

    | Фонетика

    Существует два способа расшифровки речи.Фонематическая транскрипция, также известная как «широкая» транскрипция, включает представление речи с использованием только уникального символа для каждой фонемы языка. Используя символы Митчелла и Дельбриджа, мы могли бы фонематически транскрибировать следующие три слова следующим образом:

    «россыпью» / strun /
    «десятый» / tɛnθ /
    «чистый» / клин /

    Здесь вы можете видеть, что «разбросанный» имеет 5 звуков, а «десятый» и «чистый» — 4 звука, и каждый звук представлен уникально.Обратите внимание, что фонематическая транскрипция помещается между / скобками с косой чертой /. Когда мы транскрибируем фонемно, мы представляем не настоящие звуки, а абстрактные мысленные конструкции. Это категории звуков, которые говорящие понимают как «звуки своего языка». В случае австралийского английского языка фонематическая транскрипция требует использования 44 символов фонемы. Другой способ транскрибировать речь — использовать фонетическую транскрипцию, также иногда известную как «узкая» транскрипция. Это включает представление дополнительных сведений о контекстных вариациях произношения, встречающихся в нормальной речи.Опять же, используя символы Митчелла и Делбриджа, мы могли бы фонетически транскрибировать те же три слова следующим образом:

    «россыпью» [струя: n]
    «десятый» [tʰɛ̃n̪θ]
    «чистый» [kl̥i: n]

    Вот что видно:

    • «усыпанный» имеет долгую гласную, представленную диакритическим знаком двоеточия [:].
    • «десятый» имеет начальную букву [tʰ], обозначенную надстрочным индексом [ʰ]; и гласный носовой, представлен диакритическим тильдой над гласным [ɛ̃], потому что он непосредственно предшествует носовому; и носовая часть фактически сочленяется в межзубном месте сочленения, представленном диакритическим знаком [n̪], потому что он непосредственно предшествует межзубному фрикативу.
    • «чистый» имеет долгую гласную, представленную диакритическим знаком [:]; и безмолвный [l̥], представленный маленьким нижним диакритическим кружком, потому что нормальное голосовое качество [l] подавляется стремлением [k] перед ним.

    Обратите внимание, что фонетическая транскрипция заключена в [квадратные скобки]. Когда мы транскрибируем фонетически, мы представляем не абстрактные мысленные конструкции, а, скорее, реальные звуки с точки зрения их акустических и артикуляционных свойств.Обратите внимание, что носители языка глухи к подобным контекстным вариациям в произношении. Например, из этих фонетических транскрипций вы можете видеть, что звуки «т» фонетически различаются — «т» в слове «разбросано» не имеет придыхания, а «т» в слове «десятая» — без наддува. Точно так же «n» в «разбросанном» означает альвеолярное, а «n» в «десятом» — межзубное. Носители английского языка слышат и [tʰ], и [t] как экземпляры фонемы / t /, и они слышат и [n̪], и [n] как экземпляры фонемы / n /.И фонематическая, и фонетическая транскрипция имеют свои цели. Цель фонематической транскрипции — записать «фонемы как ментальные категории», которые использует говорящий, а не фактические речевые варианты тех фонем, которые создаются в контексте определенного слова. Носитель английского языка усвоил правило, согласно которому «звуки, похожие на / t / всегда с придыханием, когда слово-начальное», они автоматически сделают / t / в «десятом» придыхании. Фонетическая транскрипция, с другой стороны, определяет более тонкие детали того, как на самом деле производятся звуки.Таким образом, человек, не говорящий по-английски, обученный IPA, может взглянуть на фонетическую транскрипцию, например [tʰɛ̃n̪θ], и знать, как ее правильно произносить, не зная правил использования английских фонем. Итак, фонемы — это абстрактные ментальные категории в сознании людей, и эти / категории / реализуются как [реальные звуки] из уст людей. Разговорные варианты каждой фонемы известны как ее аллофоны. Теперь мы можем сказать что-то вроде: Фонема / t / имеет два аллофона [t] и [tʰ].

    Unicode Фонетическая транскрипция

    Эта страница предназначена для того, чтобы помочь вам вставить фонетические символы в текстовый документ.Он предназначен в первую очередь для людей, использующих Word 97 или новее под Windows 98 или новее, с использованием шрифта фонетических символов Unicode, обычно поставляемого Microsoft.

    Информацию о других приложениях Office — Excel, Access, Powerpoint, Outlook, Outlook Express — см. Ниже.

    1. Убедитесь, что у вас есть фонетический шрифт.

    В кластерах UCL это означает шрифт Lucida Sans Unicode .

    Откройте пустой документ в Word.после

    NB . Большинство других шрифтов не содержат фонетических символов.

    2. Найдите нужный фонетический символ

    Есть несколько способов сделать это. Выбирайте самый простой способ.

    1. копировать и вставить
    2. Вставка | Символ
    3. Карта персонажей
    4. Автозамена («Эврика»)
    5. (Word 2002) Alt-x
    6. Фонетическая клавиатура

    (a)

    Скопируйте и вставьте из символов ниже.

    Найдите нужный символ в таблице ниже, затем скопируйте (Ctrl-C) и вставьте (Ctrl-V) его в свой документ. (Вы можете выбрать View | Text Size | Larger, чтобы легче было видеть символы.)

    Символы, необходимые для фонетики английского языка
    æ ɑ ɒ ɔ ə ɜ ɪ ʊ ʌ
    θ ð ŋ ɹ ɫ ʃ ʒ ʍ ʔ
    Метки длины, ударения, диакритические знаки
    (ставьте диакритические знаки ПОСЛЕ буквы, с которой они идут)
    ː ˑ ˈ ˌ Слоговый, без слов → ̩ ̥
    Прочие полезные символы
    ɛ ø œ ɯ ɤ ɨ ʉ ɚ ɝ
    ɵ ɶ ʚ č ǰ š ž ü ö
    ɓ ɕ ɖ ɗ ɟ ɠ ɢ ɣ ɥ
    ɦ ɬ ɭ ɮ ɰ ɱ ɲ ɳ ɴ
    ɸ ɻ ɽ ɾ ʀ ʁ ʂ ʈ ʋ
    ʎ ʐ ʑ ʕ ʘ ʙ ʛ ʜ ʝ
    ʟ ʡ ʢ ʰ ʲ ʳ ʴ ʷ ʸ
    Полезные комбинации букв и диакритических знаков
    ~ ~ ~ ~

    Преимущества: Простота.
    Недостатки: Эту страницу нужно держать на экране. Некоторые символы здесь не показаны.

    (b) Do

    Insert | Символ ,

    и найдите символ в появившемся раскрывающемся списке.

    Преимущества: Easy. Вы даже можете определить горячую клавишу для символа, который вам очень нужен.
    Недостатки: Fiddly. Символы на экране очень маленькие. Некоторые диакритические знаки слишком маленькие, чтобы их можно было различить. (Эта критика не относится к Word 2002, где раскрывающийся список значительно улучшен.)

    (c) Используйте программу

    Character Map ,

    , которую можно запустить из Пуск | Программы | Аксессуары | Системные инструменты | Карта персонажей. Не забудьте выбрать шрифт Lucida Sans Unicode.

    Преимущества: Дает ярлык для каждого символа, помогая вам быть уверенным, что вы выбрали правильный.
    Недостатки: Еще сложнее. Не работает в старых версиях Windows.

    (d) Прочтите статьи

    Eureka и Eureka-IPA

    и создайте ярлыки автозамены, как описано там.Вставить | Символ … Автозамена>

    Преимущества: Отлично, если вам нужно использовать каждый фонетический символ несколько раз. Основывается на (b) выше.
    Недостатки: Настройка занимает некоторое время.

    (e) В Word 2002 введите номер символа в Юникоде и нажмите Alt-x.

    Номер Unicode должен быть в шестнадцатеричной форме; например номер для велярного носа — 014B. (Полный список шестнадцатеричных чисел фонетических символов.)
    Достоинства: легко, если знаешь число.
    Недостатки : нужно знать номер. Не работает с предыдущими версиями Word.

    (f) Используйте фонетическую клавиатуру.

    Вы можете установить виртуальную клавиатуру, позволяющую получать доступ к фонетическим символам с помощью обычных клавиш. Я рекомендую фонетическую клавиатуру Unicode от Марка Хаквейла, которую вы можете бесплатно скачать отсюда. (Только для ПК с Windows.)
    Преимущества: easy, используя прилагаемую диаграмму; не требует знания номеров Unicode.
    Недостатки: нужно переключаться на специальную клавиатуру и выходить из нее.


    Другие моменты, на которые стоит обратить внимание

    Lucida Sans Unicode — это большой шрифт. Если вы смешаете его с другими шрифтами, это может нарушить высоту строки. Поэтому, если вы хотите, чтобы остальные были в формате Times New Roman 12, например, установите для Lucida Sans Unicode размер 10. Для Times 10 используйте Lucida 8.

    В Word вам следует отключить определенные функции автозамены, которые будут в противном случае автоматически вносите нежелательные изменения символов, в частности «исправление» от i до I (поскольку вы можете использовать фонетический символ i отдельно).

    Будьте осторожны с похожими до степени смешения фонетическими символами.

    … лучший способ, кажется,

    • использовать метод 2 (a) выше (для одного символа)
    • для создания документа Word со строкой символов, которую вы хотите, а затем скопировать (ctrl-C) и вставьте (ctrl-V) их в Excel / Powerpoint и т. д .; или
    • для использования виртуальной клавиатуры.

    Это работает с любым приложением с поддержкой Unicode, но, конечно, не с теми, которые не совместимы с Unicode.


    Автор: Джон Уэллс.Моя домашняя страница.

    Страница создана 2002 05 31. Последняя редакция 2007 09 13.

    Механизм частоты ошибок

    слов, транскрипция ASR и проблемы измерения точности

    Индустрия транскрипции сильно изменилась за последние 10 лет. Академические и медицинские фирмы остаются крупнейшими заказчиками транскрипции. Однако другие отрасли, такие как финансовая, юридическая, производственная и образовательная, также составляют значительную часть клиентской базы.

    Программное обеспечение

    для автоматического распознавания речи (ASR) сделало нашу повседневную работу более удобной.Например, Alexa теперь может сказать вам, какой будет погода сегодня.

    Возможно, как и большинство других отраслей, отрасль транскрипции пострадала от ASR. Это программное обеспечение все чаще используется различными игроками, которым требуются расшифровки стенограмм. ASR — дешевое решение для транскрипции. Однако есть большая проблема с точностью транскриптов ASR.

    Согласно исследованию, сравнивающему уровни точности человеческих транскрипционистов и программного обеспечения ASR, человеческие транскрипционисты имели частоту ошибок около 4%, в то время как коммерчески доступное программное обеспечение для транскрипции ASR составляло 12%.

    Вкратце, частота ошибок ASR в три раза выше, чем у людей.

    В 2017 году Google объявил, что его программное обеспечение для распознавания голоса достигло показателя Word Error Rate (WER) около 4,7%. Неужели это возможно?

    Давайте разберемся, как работает ASR и каково его значение для нашей индустрии транскрипции и перевода.

    Что такое механизм частоты ошибок по словам (WER): по определению

    Word Error Rate (WER) — это общий показатель, используемый для сравнения точности расшифровок стенограмм, созданных API-интерфейсами распознавания речи.

    Как рассчитать WER (механизм частоты ошибок по словам)

    Вот простая формула, чтобы понять, как рассчитывается коэффициент ошибок Word (WER):

    1. S обозначает замену,
    2. I означает вставки,
    3. D означает делеции,
    4. N — количество слов в справке (которые были фактически сказаны).

    Что влияет на частоту ошибок в словах?

    Для API распознавания речи, таких как IBM Watson и Google Speech, 25% ошибок в словах — это примерно средний показатель для обычного распознавания речи.Если речевые данные являются более техническими, более «акцентированными», более специфичными для отрасли и более шумными, становится менее вероятным, что общий API распознавания речи (или людей) будет более точным.

    Технический и отраслевой язык

    Человеческие транскрипционисты берут больше за технический и отраслевой язык, и для этого есть причина. Надежное распознавание отраслевых терминов сложно и требует усилий. Из-за этого системы распознавания речи, обученные на «средних» данных, испытывают трудности с более специализированными словами.

    Говоря с разными акцентами и диалектами

    То, что в Дублине считается сильным акцентом, нормально для Нью-Йорка. Такие крупные компании, как Google, Nuance и IBM, создали системы распознавания речи, хорошо знакомые с «общим американским английским» и британским английским языком. Однако они могут быть незнакомы с различными акцентами и диалектами английского языка, на которых говорят в разных городах мира.

    Разрушающий шум

    Шумный звук и фоновый шум нежелательны, но часто встречаются во многих аудиофайлах.Люди редко звонят нам по бизнесу из звуковой студии или с помощью VoIP и традиционных телефонных систем сжимают звук, который срезает многие частоты и добавляет шумовые артефакты.


    Проблемы транскрипции ASR и механизм частоты ошибок слов

    Программное обеспечение

    Enterprise ASR создано для распознавания определенного акцента и ограниченного количества слов. Например, в некоторых крупных компаниях их программное обеспечение ASR может распознавать National Switchboard Corpus, который представляет собой популярную базу данных слов, используемых в телефонных разговорах, которые уже были расшифрованы.

    К сожалению, в реальном мире аудиофайлы разные. Например, в них могут быть говорящие с разными акцентами или говорящие на разных языках.

    Кроме того, большинство программ ASR используют WER для измерения ошибок транскрипции. У этой меры есть свои недостатки, такие как:

    • WER игнорирует важность слов, давая одинаковый балл за каждую ошибку в документе. В реальном мире это неточно, поскольку одни ошибки в расшифровке стенограммы сравниваются с другими.
    • WER игнорирует знаки препинания и обозначения динамиков.
    • Тест игнорирует э-э… и м-м…, дубликаты и фальстарты, которые могут помешать чтению вашей расшифровки стенограммы.

    Последние результаты исследований ASR

    Исследователи из ведущих компаний, таких как Google, Baidu, IBM и Microsoft, стремятся достичь самого низкого уровня ошибок Word в своих механизмах распознавания речи, что дало замечательные результаты.

    Набирая обороты благодаря достижениям в области нейронных сетей и массивных наборов данных, собираемых ими, WER улучшились до такой степени, что стали привлекать заголовки о сопоставлении или даже превышении эффективности человека.

    Исследователи Microsoft, напротив, сообщают, что их механизм ASR имеет WER, равный 5,1%, тогда как для IBM Watson он составляет 5,5%, а Google утверждает, что коэффициент ошибок составляет всего 4,9% (источник информации).

    Однако эти тесты проводились с использованием общего набора аудиозаписей, т.е.е., корпус под названием Switchboard, который состоит из большого количества записей телефонных разговоров по широкому кругу тем. Коммутатор — разумный выбор, поскольку он используется в этой области в течение многих лет и почти повсеместно встречается в современной литературе. Кроме того, проводя тестирование с аудиокорпусом (базой данных аудиофайлов с речью), исследователи могут сравнивать себя и конкурентов. Единственным исключением является Google, так как он использует собственный внутренний корпус тестов (большой структурированный набор текстов).

    Этот тип тестовых проводов ограничен, поскольку заявления о превосходстве человека-транскрипциониста основаны на очень специфическом виде звука. Однако звук не идеален или согласован и имеет множество переменных, и все они могут существенно повлиять на точность транскрипции.


    Достаточно ли WER от ASR Software для вашей отрасли?

    Ссылка на статистику: — Статья, написанная и опубликованная Энди Андереггом на Medium

    Уровень точности транскрипции

    ASR не приближается к точности человеческих транскрипционистов.

    На транскрипцию

    ASR также влияют перекрестные помехи, акценты, фоновый шум в аудио и неизвестные слова. В таких случаях точность будет хуже.

    Если вы хотите использовать ASR для транскрипции, будьте готовы иметь дело с:

    • Неточные записи
      Точная транскрипция важна, особенно в юридической, деловой и медицинской сферах. Например, неточная медицинская выписка может привести к неправильному диагнозу и недопониманию.
      Программное обеспечение ASR производит больше ошибок транскрипции, чем человеческие транскрипционисты. Нередко можно получить совершенно неразборчивую расшифровку стенограммы после использования ASR.
    • Минимальные параметры транскрипции
      В программном обеспечении ASR нет параметров форматирования или расшифровки. В результате вы получите стенограммы, не соответствующие вашим потребностям.
      С другой стороны, люди-транскрипционисты могут создавать дословные или дословные транскрипции.
    • Различные стили речи
      Английский язык широко распространен во многих частях мира.Однако есть существенные различия в произношении и значении разных слов. Люди из разных регионов говорят по-своему, на которые обычно влияют местные диалекты. Обучить программное обеспечение для распознавания голоса, чтобы научиться понимать различные способы разговорной речи по-английски, оказалось довольно сложно.
      Программное обеспечение для транскрипции также борется, когда аудиофайлы имеют фоновый шум. Хотя ИИ невероятно хорош в снижении фоновых шумов в аудиофайлах, он все еще далек от совершенства.Если в вашем файле есть фоновые шумы, не следует ожидать 100% точной расшифровки при использовании программного обеспечения для расшифровки.
    • Неоднозначные словари и омофоны
      Программное обеспечение для транскрипции также с трудом понимает контекст речи. В результате они не могут автоматически обнаруживать недостающие части разговоров в файлах. Неспособность понять контекст также может привести к серьезным ошибкам перевода, которые могут иметь ужасные последствия в различных отраслях.Когда слова произносятся с четкой паузой после каждого слова, программное обеспечение для транскрипции может легко и точно расшифровать содержание. Поэтому программа лучше всего подходит для диктовки, состоящей из коротких предложений.
      Однако в действительности люди говорят более сложным образом. Например, некоторые люди говорят тихо, а другие говорят быстрее, когда они обеспокоены. Инструменты транскрипции борются за создание точных расшифровок в таких контекстах.

    Цена игнорирования качества превышает цену

    Если вы выбрали расшифровку ASR, потому что это дешево, вы получите расшифровки низкого качества, полные ошибок.Такая стенограмма может стоить вам вашего бизнеса, денег и даже клиентов.

    Вот два примера компаний, которым пришлось дорого заплатить за ошибки машинной транскрипции.

    В 2006 году Alitalia Airlines предлагала своим клиентам полеты бизнес-класса по субсидированной цене в 39 долларов по сравнению с их обычной ценой в 3900 долларов. Покупатели не знали, что была сделана ошибка копирования и вставки, и субсидированная цена была ошибкой. К моменту исправления ошибки более 2000 клиентов уже забронировали рейс.Клиенты не приняли отмену купленных билетов, и у авиакомпании не было другого выбора, кроме как снизить цены, что привело к потере более 7,2 миллиона долларов.

    Другая компания, Fidelity Magellan Fund , была вынуждена отменить выплату дивидендов, когда из-за ошибки транскрипции она сообщила о приросте капитала в размере 1,3 миллиарда долларов, а не об убытке на аналогичную сумму. В транскрипции отсутствовал отрицательный знак, в результате чего оценка дивидендов была выше на 2,6 миллиона долларов.

    Транскрипция

    ASR может быть дешевле, чем транскрипция человека. Однако его ошибки могут стоить дорого. Когда вам нужны точные расшифровки, человеческие расшифровки по-прежнему являются лучшим вариантом.


    Итак, что делать?

    Какой путь вперед? Следует ли вам перейти на автоматическую транскрипцию или остаться с надежным поставщиком услуг ручной транскрипции?

    Автоматическая транскрипция выполняется быстро и сэкономит ваше время, когда вы уложитесь в срок.Однако почти во всех случаях расшифровки стенограммы должны быть проверены профессиональными транскрипционистами.

    Обученные транскрипционисты могут точно определить сложную терминологию, акценты, различные диалекты и наличие нескольких говорящих. Тип проекта должен помочь вам определить, какая форма транскрипции лучше всего подходит для вас. Если вы ищете высокоточные стенограммы или работаете в специализированной отрасли, такой как юридическая, академическая или медицинская, то лучшим вариантом будет работа с компанией по транскрипции, специализирующейся на человеческой транскрипции.

    Наше Вам обещание!

    В отличие от наших коллег, которые перешли к автоматизированным технологиям, чтобы получить конкурентное преимущество по затратам и максимизировать прибыль за счет точности, мы стоим на своем, нанимая только человека-транскрипциониста из США, которому мы можем доверять за качество и конфиденциальность.

    Наши клиенты обычно принадлежат к разным нишам, таким как юридические, академические, коммерческие и другие, где качество имеет значение превыше всего.

    Добавить комментарий

    Ваш адрес email не будет опубликован.