История речи
История синтеза речи: эпоха электрических решений
В прошлый раз мы рассказывали о механических устройствах для синтеза речи — голосовом тракте Кемпелена и «говорящей голове» Иосифа Фабера. На очереди электрические синтезаторы XX века.
Фото Rock’n Roll Monkey / Unsplash
Первые электрические установки
В 1850 году немецкий физик и врач-физиолог Герман фон Гельмгольц представил свою резонаторную теорию. Он заметил, что у гласных звуков разные резонансные частоты (форманты). Эти форманты образуются при прохождении звуковой волны от голосовых связок к губам. Некоторые волны отражаются от губ говорящего и идут к реципиенту, а часть — возвращается к источнику. Ученый предположил, что голосовой тракт человека можно представить как последовательность резонаторов.
В начале XX века начались попытки реализовать такую модель на основе электрических компонентов. Первый синтезатор такого типа разработал физик Джон Стюарт. Его схема (опубликованная в журнале Nature), включала в себя электрический зуммер для моделирования связок и пару индуктивно-емкостных резонаторов. Они эмулировали физические процессы, происходящие со звуком в горле.
Схема синтезатора, разработанного Джоном Стюартом
Устройство Стюарта могло издавать звуки, состоящие из двух формант. Это — несколько простых гласных, а также дифтонги. Но на этом его возможности заканчивались.
Первый электрический синтезатор, способный воспроизводить речь появился позже — в 1930 годах. Его разработал Гомер Дадли (Homer Dudley) из Bell Laboratories. В то время компания работала над вокодером — инструментом для сжатия речи и экономии частотных ресурсов радиолинии в телефонных сетях. Идея заключалась в том, чтобы вместо голоса абонента передавать его ключевые параметры. На принимающей стороне устанавливался специальный декодер, который по этим параметрам реконструировал и воспроизводил звук. Дадли понял, что с небольшими модификациями вокодер можно превратить в полноценный синтезатор. Так появилась система VODER — Voice Operating Demonstrator.
Устройство представили широкой публике на нью-йоркской всемирной выставке в 1939 году. В конструкцию VODER входили два источника звука: ламповый генератор шума для «глухих» фонем, и осциллятор — для «звонких». Также имелись десять параллельно соединенных полосовых фильтров — они составляли блок управления резонансами. Оператор руководил системой с помощью ручной клавиатуры, браслета на запястье и ножной педали.
Во время демонстраций аппарат говорил на разных языках, пел и отвечал на вопросы с различными интонациями. Но чтобы раскрыть потенциал системы, её оператору требовались годы тренировок.
Вскоре после премьеры VODER началась Вторая мировая война, и Bell Labs пришлось свернуть дальнейшую разработку синтезатора. Однако знания, полученные во время работы над проектом, Гомер Дадли использовал для создания технологии шифрования телефонных разговоров.
Синтезаторы речи на спектрограммах
В 1946 году был изобретен акустический спектрограф. И возникла идея — использовать спектрограммы для управления речевыми синтезаторами. Одним из первых такое устройство представил Л. Шотт (L. Schott), американский инженер из Bell Labs. Он использовал линейный источник света, просвечивающий спектрографические шаблоны с разной степенью прозрачности. Специальные фотоэлементы, установленные напротив лампы, регистрировали изменения уровня освещенности и генерировали управляющие сигналы для полосовых фильтров. Точно такие же фильтры использовал Гомер Дадли для своего VODER.
Фото 120years. net
Другую разработку в этой области представила группа американских ученых во главе с физиком Франклином Купером (Franklin Cooper). Их оптическая система — Pattern Playback — модулировала гармоники основного тона 120 Гц, считывая изображения на движущейся прозрачной ленте. Визуальная информация передавалась осциллятору, превращавшему её в звук.
В каком-то смысле система напоминала советские оптические синтезаторы — «Нивотон» и «Вариофон» — на которых писали музыку для мультфильмов. Однако Pattern Playback был изначально «заточен» под генерацию человеческой речи и умел воспроизводить целые предложения.
Устройства, подобные Pattern Playback и VODER, построили теоретический фундамент для проектирования формантных и артикуляционных синтезаторов. Они стали прототипом современного компьютерного синтеза. О них мы расскажем в следующий раз.
Материалы по теме из нашего «Мира Hi-Fi»:
История аудиотехнологий: синтезаторы и сэмплеры
Траутониум: немецкая волна в истории синтезаторов
Музыка из бумаги и картона: краткая история вариофона и «рисованного звука»
«Машинный звук»: синтезаторы на базе нейросетей
Звук на проволоке: история телеграфона
Фото Rock’n Roll Monkey / Unsplash
История синтеза речи эпоха электрических решений.
15.01.2017 10:57:57
2017-01-15 10:57:57
Источники:
Https://habr. com/ru/company/audiomania/blog/491746/
Купить книгу «Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта», Тревор Кокс | Издательство «КоЛибри», ISBN: 978-5-389-14645-7 » /> » /> .keyword { color: red; }
История речиЗачем мы говорим. История речи от неандертальцев до искусственного интеллекта
Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта
Эта книга – захватывающая история нашей способности говорить. Тревор Кокс, инженер-акустик и ведущий радиопрограмм BBC, крупным планом демонстрирует базовые механизмы речи, подробно рассматривает, как голос определяет личность и выдает ее особенности. Книга переносит нас в прошлое, к истокам человеческого рода, задавая важные вопросы о том, что может угрожать нашей уникальности в будущем. В этом познавательном путешествии мы встретимся со специалистами по вокалу, звукооператорами, нейробиологами и компьютерными программистами, чей опыт и научные исследования дадут более глубокое понимание того, что мы обычно принимаем как должное.
«Книга, полная невероятных озарений… Живая, умная и убедительная история человеческой речи», — The Times
«Блестяще… Кокс знает, как увлечь читателя», — Daily Mail
«Многообразие издаваемых людьми звуков — это не только материя разговора; звуки восходят к основам того, кто мы такие и откуда мы явились. Тревор Кокс, инженер-акустик и ведущий радиопрограмм BBC, демонстрирует это крупным планом…», — Psychology Today
«Кокс — прирожденный рассказчик, и его виртуозно изложенная история даст немало интересных тем для обсуждения», — Publishers Weekly
«Доступное объяснение научных знаний о человеческой ком-муникации… Главный результат чтения этой книги — приятная мысль о том, что лучшие моменты нашего общения состоят в обычных беседах, «банальных повседневных действиях, которые позволяют передавать друг другу знания о том, как выжить и преуспеть». В представленном Коксом исключительно занимательном исследовании того, как мы приобретаем свой голос и понимаем голоса других, есть над чем задуматься», — Kirkus Reviews
«Детальное исследование физиологии голосового аппарата и подробный разбор самых современных теорий эволюции речи ранних гоминини… Книга, которая заставит читателей задуматься о многом», — Booklist
«Захватывающе… Блестяще… Эта книга опирается на самые современные научные исследования и изобилует поразительными статистическими данными», — Daily Mail
«Интересный и поучительный рассказ о нашей способности разговаривать, и столь необходимое разоблачение нашей неспособности делать выводы из того, как говорят другие», — The Spectator
Многообразие издаваемых людьми звуков это не только материя разговора; звуки восходят к основам того, кто мы такие и откуда мы явились.
25.03.2019 7:26:38
2019-03-25 07:26:38
Источники:
Книга Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта • Кокс Т. – купить книгу по низкой цене, читать отзывы в • Эксмо-АСТ • ISBN 978-5-389-14645-7, p5509872 » /> » /> .keyword { color: red; }
История речиКокс Т: Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта
Кокс Т.: Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта
Эта книга – захватывающая история нашей способности говорить. Тревор Кокс, инженер-акустик и ведущий радиопрограмм BBC, крупным планом демонстрирует базовые механизмы речи, подробно рассматривает, как голос определяет личность и выдает ее особенности. Книга переносит нас в прошлое, к истокам человеческого рода, задавая важные вопросы о том, что может угрожать нашей уникальности в будущем. В этом познавательном путешествии мы встретимся со специалистами по вокалу, звукооператорами, нейробиологами и компьютерными программистами, чей опыт и научные исследования дадут более глубокое понимание того, что мы обычно принимаем как должное.
Характеристики
Отложить В избранное
- Отзывы 5
Я когда-то училась на лингвиста, поэтому книги на тему человеческого языка и речи меня мало чем могут удивить. Сейчас меня больше интересуют нейронауки и физика. Так вот, Тревор Кокс попал в яблочко! Он не перессказывает прописные лингвистические истины. Этот специалист по акустике рассматривает речь почти что с точки зрения физика. Текст изобилует фактами, цифрами и рассказами об экспериментах, но при этом не слишком сложный. Это очень оригинально и интересно, рекомендую.
История речи от неандертальцев до искусственного интеллекта.
20.06.2017 3:55:18
2017-06-20 03:55:18