|
| |||||||||||||
|
| |||||||||||||
Восприятие и сжатие звука.Самые распространенные методы сжатия без потерь Huffman, LZW для сжатия аудиофайлов в большинстве случаев не приемлемы. Использование простых методов сжатия, например, сжатие тишины и ADPCM - Adaptive Differential Pulse Code Modulation приводит к потерям. Сжатие стандарта CCITT G.721 -- от 16 до 32 Kbits/sec невозможно из-за того, что в процессе квантования часть информации теряется. Такие системы сжатия как ACE / MACE (компании Apple ), Linear Predictive Coding ( LPC ) и Code Excited Linear Predictor тоже обладают своими минусами. Методы сжатия, основанные на психоаккустике более приемлемые за счет следующего алгоритма кодека: - маскирование - деление сигнала на частотные подполосы Использование одного квантового уровня для нескольких входных значений за счет квантования сигналов в подполосах Самые известные представители - MPEG layers 2, MPEG layer 3 (MP3), AAC (Advanced audio coding). Для более доступного объяснения восприятия звуков стоит немного рассказать о строении уха. Внешнее ухо отвечает за локализацию источника звука в пространстве. Повышенная чувствительность в диапазоне 2kHz обуславливается резонированием внешнего ушного канала в этом диапазоне. Среднее ухо выступает «усилителем звука» за счет того, что в улитке находится жидкость, а снаружи воздух. Внутреннее ухо отвечает за частотный анализ, благодаря своему строению. Попадая в ухо и достигая конечной цели, звук претерпевает изменения. Для иллюстрации всего вышеизложенного можно привести следующие факты: - лучше всего воспринимается звук в диапазоне от 2 до 4 KHz, - самые громкие звуки, способные восприниматься ухом 96 dB - человеческое ухо способно различить изменения частоты начиная с 0,3% на частоте порядка 1kHz. - при различии сигналов по амплитуде менее чем на 1 дб – сигналы трудноразличимы. - ухо способно локализовать звук с точностью до 1 градуса. - Звуки различной частоты распространяются в воздухе с разной скоростью. - Человек не в состоянии заметить внезапное исчезновение высоких частот, если оно не превышает порядка 2ms - с возрастом воспринимаемый частотный диапазон сужается. Надо отметить, что частота во многом влияет на восприятие звука. При частоте до 1,5 кГц, к каждому нервному окончанию может подключится до 3-х нейронов , благодаря этому частотное разрешение улучшается в 3 раза. В определении местонахождения частот выше 1,5кГц, помагает разница амплитуд для правого и левого уха. Благодаря такой особенности возможно применение режимов Joint Stereo - запоминается либо информация для суммы правого и левого каналов и их разница, со значительно меньшей точностью (Mid/Side coding), либо вообще запоминается лишь амплитуда сигнала (Intensity coding). |
|||||||||||||
|
| |||||||||||||