Файлы от каждого участника подкаста (FLAC / AAC). По сути моно. У некоторых два канала с микрофона. У некоторых в левом канале микрофон (это то, что нас интересует), а в правом то, что они слышали (это нужно использовать для выравнивания звуковых дорожек, а потом выбросить). Моменты начала (и окончания) записи на файлах не синхронизированы.
- Добавить файлы в многотрековый проект Adobe Audition.
- Совместить файлы так, чтобы разговор на разных дорожках совпадал.
- Убрать лишние каналы (на которых не запись с микрофона). Там, где в файле оба канала с микрофона, оставить один канал.
- Оставить в каждый момент только одного говорящего. Остальные дорожки заглушить. Иногда мы начинаем говорить одновременно, для таких случаев см. следующий шаг.
- Когда мы говорим одновременно, есть два случая. (5.1) Кто-то начинает говорить, но понимает, что говорит другой, и замолкает. Это заметно по неоконченной фразе. Тогда такое просто удаляется. (5.2) Один человек заканчивает реплику, а второй одновременно начинает свою и продолжает. В таких случаях нужно разнести по времени, чтобы реплики перестали накладываться (удлинив подкаст).
- Длинные паузы (больше примерно 2-3 секунд) схлопнуть.
- Если где-то замечены шумы или другие проблемы со звуком: (7.1) лучше всего — попытаться их убрать; (7.2) если убрать сложно, расставьте в таких местах маркеры.
- Выполнить офлайновое шумоподавление для всех источников (я обычно использовал Noise Reduction 50%, reduce by 12 dB, FFT 8192; можете сделать лучше на своё усмотрение). Запись тишины для каждого источника приложена в отдельных файлах (сразу записать забыли). Нужно сделать качественно, без внесения явных искажений и бульканья в звук.
- Выбрать стек эффектов. Мы хотим довольно агрессивную компрессию (насколько это позволит имеющийся уровень шума) и, по возможности, «эффект присутствия» (опять же зависит от шума). Стек эффектов, который я обычно использовал, описан ниже. Если можете сделаете более удачный вариант, я буду рад. Применять эффекты к самим аудио-данным не нужно!
Dynamic Processing (используемый как noise gate): 1:1 above -48, 2:1 below -74, infinite below -100.
10-band Graphic Equalizer: +5 dB at 2kHz.
Speech Volume Leveler: target -14 dB, leveling amount 30%, target dynamic range 45 dB, compressor threshold -6 dB, boost low signals off, noise gate off.
Hard Limiter: Max -0.1 dB, Boost 0, Look-ahead 7ms, Release 100ms.
Многотрековый проект Audition, который я смогу открыть и редактировать дальше. Либо закачайте zip-файл с ним мне на дропбокс, либо передайте мне результаты работы иным способом (можно через Яндекс.Диск или еще что-то).
Описание настроек шумоподавления, которые вы применяли.