viagra super force

+7(495) 123-XXXX  г. Москва

Выпуски журналов

  • Серия
  • Серия
  • Серия
  • Серия
  • Журнал
  • Журнал
  • Журнал
  • Журнал

Ю.А. Ковалгин,  (Д.т.н., профессор, Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А. Бонч-Бруевича)

Д.Р. Фадеев,  (Аспирант, Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А. Бонч-Бруевича)

Серия «Естественные и Технические науки» # ИЮЛЬ  2016

Компрессия цифровых аудиоданных
Изложены результаты экспериментальных исследований, посвященных оценке качества и эффективности работы психоакустических моделей кодеров с компрессией цифровых аудиоданных. Показаны преимущества психоакустической модели кодера ААС стандарта MPEG-2 ISO/IEC 13818-7 AAC.

Ключевые слова: Компрессия цифровых аудиоданных, оценка качества, психоакустическая модель кодека AAC.

 

Введение

Несмотря на довольно значительный период существования стандартов  MPEG и очевидный прогресс в снижении скорости цифрового потока при кодировании высококачественных звуковых сигналов (ЗС), полноценная оценка эффективности работы психоакустических моделей до сих пор не проводилась. Существует значительное количество работ [1,2,11,12], посвященных исследованию качества компрессии того или иного кодека и  возникающим при этом артефактам.  В то же время особенности работы непосредственно самих психоакустических моделей (ПАМ) и получаемые при этом результаты требуют более детального изучения, особенно в части выделения и распределения бит по субполосам кодирования.

Для исследования ПАМ кодеров с компрессией цифровых аудиоданных с потерями был реализован аппаратно-программный комплекс, позволяющий:

  • подключать  исследуемые  ПАМ;
  • подавать на вход каждой ПАМ тональные сигналы разных частот (для проверки корректности работы) и отрывки реальных звуковых сигналов с возможностью выбора длительности анализируемого фрагмента звукового отрывка;
  • вычислять отношение сигнал-маска, в дБ,  а также среднее, максимальное и минимальное число бит, требуемое исследуемой ПАМ для прозрачного кодирования каждого элемента выборки звукового сигнала;
  • статистически обрабатывать полученные массивы числовых данных;
  • представлять результаты исследований в виде графических зависимостей.

В соответствии с этим экспериментальный программный комплекс содержал следующие основные части:

  • библиотеку звукового материала. В настоящей версии программный комплекс поддерживает формат CD Audio с частотой дискретизации 44100 Гц и разрешением 16 бит/отсчет, режимы работы моно или стерео;
  • библиотеку исследуемых психоакустических моделей (ПАМ); она содержит психоакустические модели кодеров стандартов MPEG-1 [3,11], MPEG-2 [4,11] и MPEG-4 [6,12], а именно ПАМ_1, ПАМ_2 и ПАМ кодера ААС (ПАМ_ААС) [5, 12], а также и ПАМ_ВП, предложенную Г.Г.Рогозинским для кодека, работающего в вейвлетном пространстве [7, 11];
  • блок обработки звукового  материала,  позволяющий выбрать тот или иной звуковой файл из базы (библиотеки) данных, выделить фрагмент для исследования, задавая начальную и конечную точки исследуемого фрагмента отрывка;
  • блок статистической обработки и визуализации результатов вычислений, выполняемых в каждой  исследуемой ПАМ.

Результаты вычислений, выполняемых  в ПАМ, выводятся в форме массива данных, элементами которого являются значения глобального порога маскировки, в дБ, отношения сигнал-маска SNR, дБ, а также и число бит m, требуемых для прозрачного кодирования каждого элементы выборки (отсчета звукового сигнала или коэффициента МДКП) для каждой из полос психоакустического анализа.  

Напомним, что различные психоакустические модели используют разное разделение на полосы психоакустического анализа.  В случае с ПАМ_1 и ПАМ_2, полосы психоакустического анализа соответствуют полосам кодирования (табл.1). Их ширина составляет 698 Гц. В отличие от этого в  ПАМ_ВП и  ПАМ_ААС полосы психоакустического анализа имеют различную ширину (табл.2, 3).

Читать полный текст статьи …


СПИСОК ЛИТЕРАТУРЫ:
1. Bosi M., Goldberg R.E. Introduction to Digital Audio Coding and Standards, Boston: Kluwer Academic Publishers, 2003.
2. Pan D., A tutorial on MPEG/Audio compression, IEEE Multimedia ,1995, vol.2, no.2, pp.60-74.
3. International Standard ISO/IEC 11172-3. Information technology-Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s- Part 3: Audio, 1993-08-01.
4. International Standard ISO/IEC 13818-3. Information technology-Generic coding of moving pictures and associated audio information. Part 3:Audio, 1995-05-15.
5. International Standard ISO/IEC 13818-7. Information technology-Generic coding of pictures and associated audio information. Part 7: Advanced Audio Coding (AAC), 1997 (E).
6. ISO/IEC FCD 14496-3 Subpart 1. Information Technology-Very Lov Bitrate Audio-Visual Coding. Part 3: Audio, 1998-05-10 (ISO/JTC 1/SC 29, N2203).
7. Рогозинский Г.Г. Перцепционное сжатие звука с использованием вейвлетных пакетов. Автореферат диссертации на соискание ученой степени канд.техн. наук //Санкт-Петербургский государственный университет кино и телевидения, 2010, -19 с. http://www.petitcolas.net/fabien/software/mpeg/index.html
8. Зырянов М.В. Повышение эффективности алгоритмов компрессии цифровых аудиоданных на основе учета временной маскировки. Автореферат диссертации на соискание ученой степени кандидата технических наук, СПб.: СПбГУТ, 2007. – 16 с.
9. Ятагама Гамаге Д.П. Повышение эффективности алгоритмов компрессии цифровых данных при кодировании сигналов стереопары. Автореферат диссертации на соискание ученой степени кандидата технических наук, СПб.: СПбГУТ 2005. - 16 с.
10. Аудиотехника: учебник/Ю.А.Ковалгин, Э.И.Вологдин; под ред. проф. Ю.А.Ковалгина. - М.: Горячая линия – Телеком, 2013. – 768 с.
11. Ковалгин Ю.А. Психоакустика и компрессия цифровых аудиоданных. Монография, СПб.: СПбГУТ, 2013.- 300 с.
 



© 
Ю.А. Ковалгин, Д.Р. Фадеев, Журнал "Современная наука: актуальные проблемы теории и практики".
 

 

 

 
SCROLL TO TOP

 Rambler's Top100 @Mail.ru