Рубрики
История

История синтеза речи: эпоха электрических решений

История речи

История синтеза речи: эпоха электрических решений

В прошлый раз мы рассказывали о механических устройствах для синтеза речи — голосовом тракте Кемпелена и «говорящей голове» Иосифа Фабера. На очереди электрические синтезаторы XX века.

Фото Rock’n Roll Monkey / Unsplash

Первые электрические установки

В 1850 году немецкий физик и врач-физиолог Герман фон Гельмгольц представил свою резонаторную теорию. Он заметил, что у гласных звуков разные резонансные частоты (форманты). Эти форманты образуются при прохождении звуковой волны от голосовых связок к губам. Некоторые волны отражаются от губ говорящего и идут к реципиенту, а часть — возвращается к источнику. Ученый предположил, что голосовой тракт человека можно представить как последовательность резонаторов.

В начале XX века начались попытки реализовать такую модель на основе электрических компонентов. Первый синтезатор такого типа разработал физик Джон Стюарт. Его схема (опубликованная в журнале Nature), включала в себя электрический зуммер для моделирования связок и пару индуктивно-емкостных резонаторов. Они эмулировали физические процессы, происходящие со звуком в горле.

Схема синтезатора, разработанного Джоном Стюартом

Устройство Стюарта могло издавать звуки, состоящие из двух формант. Это — несколько простых гласных, а также дифтонги. Но на этом его возможности заканчивались.

Первый электрический синтезатор, способный воспроизводить речь появился позже — в 1930 годах. Его разработал Гомер Дадли (Homer Dudley) из Bell Laboratories. В то время компания работала над вокодером — инструментом для сжатия речи и экономии частотных ресурсов радиолинии в телефонных сетях. Идея заключалась в том, чтобы вместо голоса абонента передавать его ключевые параметры. На принимающей стороне устанавливался специальный декодер, который по этим параметрам реконструировал и воспроизводил звук. Дадли понял, что с небольшими модификациями вокодер можно превратить в полноценный синтезатор. Так появилась система VODER — Voice Operating Demonstrator.

Устройство представили широкой публике на нью-йоркской всемирной выставке в 1939 году. В конструкцию VODER входили два источника звука: ламповый генератор шума для «глухих» фонем, и осциллятор — для «звонких». Также имелись десять параллельно соединенных полосовых фильтров — они составляли блок управления резонансами. Оператор руководил системой с помощью ручной клавиатуры, браслета на запястье и ножной педали.

Во время демонстраций аппарат говорил на разных языках, пел и отвечал на вопросы с различными интонациями. Но чтобы раскрыть потенциал системы, её оператору требовались годы тренировок.

Вскоре после премьеры VODER началась Вторая мировая война, и Bell Labs пришлось свернуть дальнейшую разработку синтезатора. Однако знания, полученные во время работы над проектом, Гомер Дадли использовал для создания технологии шифрования телефонных разговоров.

Синтезаторы речи на спектрограммах

В 1946 году был изобретен акустический спектрограф. И возникла идея — использовать спектрограммы для управления речевыми синтезаторами. Одним из первых такое устройство представил Л. Шотт (L. Schott), американский инженер из Bell Labs. Он использовал линейный источник света, просвечивающий спектрографические шаблоны с разной степенью прозрачности. Специальные фотоэлементы, установленные напротив лампы, регистрировали изменения уровня освещенности и генерировали управляющие сигналы для полосовых фильтров. Точно такие же фильтры использовал Гомер Дадли для своего VODER.

Фото 120years. net
Другую разработку в этой области представила группа американских ученых во главе с физиком Франклином Купером (Franklin Cooper). Их оптическая система — Pattern Playback — модулировала гармоники основного тона 120 Гц, считывая изображения на движущейся прозрачной ленте. Визуальная информация передавалась осциллятору, превращавшему её в звук.

В каком-то смысле система напоминала советские оптические синтезаторы — «Нивотон» и «Вариофон» — на которых писали музыку для мультфильмов. Однако Pattern Playback был изначально «заточен» под генерацию человеческой речи и умел воспроизводить целые предложения.

Устройства, подобные Pattern Playback и VODER, построили теоретический фундамент для проектирования формантных и артикуляционных синтезаторов. Они стали прототипом современного компьютерного синтеза. О них мы расскажем в следующий раз.

Материалы по теме из нашего «Мира Hi-Fi»:

История аудиотехнологий: синтезаторы и сэмплеры
Траутониум: немецкая волна в истории синтезаторов
Музыка из бумаги и картона: краткая история вариофона и «рисованного звука»
«Машинный звук»: синтезаторы на базе нейросетей
Звук на проволоке: история телеграфона

Фото Rock’n Roll Monkey / Unsplash

История синтеза речи эпоха электрических решений.

Habr. com

15.01.2017 10:57:57

2017-01-15 10:57:57

Источники:

Https://habr. com/ru/company/audiomania/blog/491746/

Купить книгу «Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта», Тревор Кокс | Издательство «КоЛибри», ISBN: 978-5-389-14645-7 » /> » /> .keyword { color: red; } История речи

Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта

Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта

зачем мы говорим. история речи от неандертальцев до искусственного интеллекта

Эта книга – захватывающая история нашей способности говорить. Тревор Кокс, инженер-акустик и ведущий радиопрограмм BBC, крупным планом демонстрирует базовые механизмы речи, подробно рассматривает, как голос определяет личность и выдает ее особенности. Книга переносит нас в прошлое, к истокам человеческого рода, задавая важные вопросы о том, что может угрожать нашей уникальности в будущем. В этом познавательном путешествии мы встретимся со специалистами по вокалу, звукооператорами, нейробиологами и компьютерными программистами, чей опыт и научные исследования дадут более глубокое понимание того, что мы обычно принимаем как должное.

«Книга, полная невероятных озарений… Живая, умная и убедительная история человеческой речи»,The Times

«Блестяще… Кокс знает, как увлечь читателя»,Daily Mail

«Многообразие издаваемых людьми звуков — это не только материя разговора; звуки восходят к основам того, кто мы такие и откуда мы явились. Тревор Кокс, инженер-акустик и ведущий радиопрограмм BBC, демонстрирует это крупным планом…»,Psychology Today

«Кокс — прирожденный рассказчик, и его виртуозно изложенная история даст немало интересных тем для обсуждения»,Publishers Weekly

«Доступное объяснение научных знаний о человеческой ком-муникации… Главный результат чтения этой книги — приятная мысль о том, что лучшие моменты нашего общения состоят в обычных беседах, «банальных повседневных действиях, которые позволяют передавать друг другу знания о том, как выжить и преуспеть». В представленном Коксом исключительно занимательном исследовании того, как мы приобретаем свой голос и понимаем голоса других, есть над чем задуматься»,Kirkus Reviews

«Детальное исследование физиологии голосового аппарата и подробный разбор самых современных теорий эволюции речи ранних гоминини… Книга, которая заставит читателей задуматься о многом»,Booklist

«Захватывающе… Блестяще… Эта книга опирается на самые современные научные исследования и изобилует поразительными статистическими данными»,Daily Mail

«Интересный и поучительный рассказ о нашей способности разговаривать, и столь необходимое разоблачение нашей неспособности делать выводы из того, как говорят другие»,The Spectator

Многообразие издаваемых людьми звуков это не только материя разговора; звуки восходят к основам того, кто мы такие и откуда мы явились.

Azbooka. ru

25.03.2019 7:26:38

2019-03-25 07:26:38

Источники:

Https://azbooka. ru/books/zachem-my-govorim-istoriya-rechi-ot-neandertaltsev-do-iskusstvennogo-intellekta

Книга Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта • Кокс Т. – купить книгу по низкой цене, читать отзывы в • Эксмо-АСТ • ISBN 978-5-389-14645-7, p5509872 » /> » /> .keyword { color: red; } История речи

Кокс Т: Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта

Кокс Т.: Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта

зачем мы говорим. история речи от неандертальцев до искусственного интеллекта - фото 3

Эта книга – захватывающая история нашей способности говорить. Тревор Кокс, инженер-акустик и ведущий радиопрограмм BBC, крупным планом демонстрирует базовые механизмы речи, подробно рассматривает, как голос определяет личность и выдает ее особенности. Книга переносит нас в прошлое, к истокам человеческого рода, задавая важные вопросы о том, что может угрожать нашей уникальности в будущем. В этом познавательном путешествии мы встретимся со специалистами по вокалу, звукооператорами, нейробиологами и компьютерными программистами, чей опыт и научные исследования дадут более глубокое понимание того, что мы обычно принимаем как должное.

Характеристики

Отложить В избранное

    Отзывы 5

Я когда-то училась на лингвиста, поэтому книги на тему человеческого языка и речи меня мало чем могут удивить. Сейчас меня больше интересуют нейронауки и физика. Так вот, Тревор Кокс попал в яблочко! Он не перессказывает прописные лингвистические истины. Этот специалист по акустике рассматривает речь почти что с точки зрения физика. Текст изобилует фактами, цифрами и рассказами об экспериментах, но при этом не слишком сложный. Это очень оригинально и интересно, рекомендую.

История речи от неандертальцев до искусственного интеллекта.

Book24.ru

20.06.2017 3:55:18

2017-06-20 03:55:18

Источники:

Https://book24.ru/product/zachem-my-govorim-istoriya-rechi-ot-neandertaltsev-do-iskusstvennogo-intellekta-5509872/

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *