Псіхаакустыка

Псіхаакустыканавуковая дысцыпліна, якая вывучае псіхалагічныя і фізіялагічныя асаблівасці ўспрымання гуку чалавекам.

У аспекце, асабліва музычным, асноўнымі задачамі псіхаакустыкі з'яўляюцца наступныя:

  • зразумець, як сістэма слыхавога ўспрымання чалавека расшыфроўвае той ці іншы гукавы лад;
  • ўсталяваць асноўныя адпаведнасці паміж фізічнымі стымуламі і слыхавымі адчуваннямі;
  • выявіць, якія менавіта параметры гукавога сігналу з'яўляюцца найбольш значнымі для перадачы семантычнай (сэнсавай) і эстэтычнай (эмацыйнай) інфармацыі.

У многіх прыкладаннях акустыкі і апрацоўкі гукавых сігналаў неабходна ведаць, што людзі чуюць. Гук, які ўтвараюць хвалі ціску паветра, можа быць сапраўды вымераны сучасным абсталяваннем. Аднак зразумець, як гэтыя хвалі прымаюцца і адлюстроўваюцца ў нашым галаўным мозгу - задача не такая простая. Гук - гэта бесперапынны аналагавы сігнал, які (у здагадцы, што малекулы паветра бясконца малыя) можа тэарэтычна пераносіць бясконцую колькасць інфармацыі (бо існуе бясконцую колькасць ваганняў, якія змяшчаюць інфармацыю аб амплітудзе і фазе).

Разуменне працэсаў успрымання дазваляе вучоным і інжынерам засяродзіцца на магчымасцях слыху і не ўлічваць менш важныя магчымасці іншых сістэм. Важна таксама адзначыць, што пытанне «што чалавек чуе» - не толькі пытанне аб фізіялагічных магчымасцях вуха, але шмат у чым таксама пытанне псіхалогіі, выразнасці ўспрымання.

Межы ўспрымання гуку

[правіць | правіць зыходнік]

Чалавечае вуха намінальна чуе гукі ў дыяпазоне ад 16 да 20 000 Гц. Верхняя мяжа мае тэндэнцыю зніжацца з узростам. Большасць дарослых людзей не могуць чуць гук частатой вышэй 16 кГц. Вуха само па сабе не рэагуе на частоты ніжэй 20 Гц, але яны могуць адчувацца праз органы дотыку.

Дыяпазон гучнасці ўспрыманых гукаў велізарны. Але барабанная перапонка ў вуху адчувальная толькі да змены ціску. Узровень ціску гуку прынята вымяраць у дэцыбелах (дб). Ніжні парог чутнасці вызначаны як 0 дб (20 мікрапаскаль), а вызначэнне верхняй мяжы чутнасці адносіцца хутчэй да парога дыскамфорту і далей - да парушэння слыху, кантузіі і г. д. Гэтая мяжа залежыць ад таго, як доўга па часе мы слухаем гук. Вуха здольна пераносіць кароткачасовае павышэнне гучнасці да 120 дб без наступстваў, але доўгачасовае ўспрыманне гукаў гучнасцю больш за 80 дб можа выклікаць страту слыху.[1]

Больш дбайныя даследаванні ніжняй мяжы слыху паказалі, што мінімальны парог, пры якім гук застаецца чутны, залежыць ад частаты. Графік гэтай залежнасці атрымаў назву абсалютны парог чутнасці. У сярэднім, ён мае ўчастак найбольшай адчувальнасці ў дыяпазоне ад 1 кГц да 5 кГц, хоць з узростам адчувальнасць паніжаецца ў дыяпазоне вышэй 2 кГц.

Крывая абсалютнага парога чутнасці з'яўляецца прыватным выпадкам больш агульных - крывых аднолькавай гучнасці, ізафонаў: значэнні гукавога ціску на розных частотах, пры якім чалавек адчувае гукі аднолькава гучнымі. Крывыя былі ўпершыню атрыманы Флетчэрам і Мансанам (H. Fletcher and WA Munson) і апублікаваныя ў 1933 годзе ў працы «Loudness, its definition, measurement and calculation» [2]. Пазней больш дакладныя вымярэння выканалі Робінсан і Датсан (DW Robinson and RS Dadson) [3]. Атрыманыя крывыя значна адрозніваюцца, але гэта не памылка, а розныя ўмовы правядзення вымярэнняў. Флетчар і Мэнсан ў якасці крыніцы гукавых хваляў выкарыстоўвалі навушнікі, а Робінсан і Датсан - франтальна размешчаны дынамік у безэхавам пакоі.

Вымярэння Робінсана і Датсана ляглі ў аснову стандарту ISO 226 ў 1986 г. У 2003 стандарт ISO 226 быў абноўлены з улікам дадзеных, атрыманых у выніку вымярэнняў пры правядзенні 12-ці новых міжнародных даследаванняў.

Існуе таксама спосаб успрымання гуку без удзелу барабаннай перапонкі - так званы мікрахвалевы слыхавы эфект, калі імпульснае або мадуляванае выпраменьванне ў мікрахвалевым дыяпазоне ўздзейнічае на тканіны вакол слімака, прымушаючы чалавека ўспрымаць розныя гукі.[4]

Чалавечы слых шмат у чым падобны да спектральнага аналізатару. Гэта значыць, што вуха распазнае спектральны склад гукавых хваляў без аналізу фазы хвалі. У рэальнасці фазавая інфармацыя распазнаецца і вельмі важная для накіраванага ўспрымання гуку, але гэту функцыю выконваюць адказныя за апрацоўку гуку аддзелы галаўнога мозгу. Розніца паміж фазамі гукавых хваляў, якія прыходзяць на правае і левае вуха, дазваляе вызначаць кірунак на крыніцу гуку, прычым інфармацыя аб рознасці фаз мае першараднае значэнне, у адрозненне ад змены гучнасці гуку, ўспрыманага рознымі вушамі. Эфект фільтрацыі перадаткавых функцый галавы таксама гуляе ў гэтым важную ролю. Чалавечае вуха здольна ў норме ўспрымаць гук ад 10-30 дБ у інтэрвале частот ад 140 да 8000 Гц.

Эфект маскіроўкі

[правіць | правіць зыходнік]

У пэўных выпадках адзін гук можа быць скрыты іншым гукам. Напрыклад, размова побач з чыгуначнымі шляхамі можа быць абсалютна немагчымым, калі міма праязджае цягнік. Гэты эфект завецца маскіроўкай. Кажуць, што слабы гук маскіруецца, калі ён становіцца неадметным у прысутнасці больш за гучнага гуку.

Адрозніваюць некалькі відаў маскіроўкі:

  • Па часе прыходу маскіровачнага і замаскаванага гуку:
    • адначасовае маскіраванне
    • часовае (неадначасовае) маскіраванне
  • Па тыпу маскіровачнага і замаскаванага гукаў:
    • чыстага тона чыстым тонам рознай частаты
    • чыстага тоны шумам
    • прамовы чыстымі тонамі
    • прамовы манатонным шумам
    • прамовы імпульснымі гукамі і т. п.

Адначасовая маскіроўка

[правіць | правіць зыходнік]

Любыя два гукі пры адначасовым праслухоўванні аказваюць уплыў на ўспрыманне адноснай гучнасці паміж імі. Больш гучны гук зніжае ўспрыманне больш слабога, аж да знікнення яго чутнасці. Чым бліжэй частата замаскаванага гуку да частаты маскіровачнага, тым мацней ён будзе хавацца. Эфект маскіроўкі не аднолькавы пры зняцці замаскаванага гуку ніжэй або вышэй па частаце адносна маскіровачнага. Нізкачастотны гук маскіруе высокачастотныя. Пры гэтым важна адзначыць, што высокачастотныя гукі не могуць маскіраваць нізкачастотныя.

Часовая маскіроўка

[правіць | правіць зыходнік]

Гэтая з'ява падобна на частотнай маскіроўкі, але тут адбываецца маскіроўка ў часе. Пры спыненні падачы маскіровачнага гуку замаскаваны некаторы час працягвае быць нячутным. У звычайных умовах эфект ад часовай маскіроўкі доўжыцца значна менш. Час маскіроўкі залежыць ад частаты і амплітуды сігналу і можа дасягаць 100 мс.

У выпадку, калі маскіруючы тон з'яўляецца па часе пазней замаскаванага, эфект называюць пост-маскіроўкай. Калі маскіруючы тон з'яўляецца раней замаскаванага (магчымы і такі выпадак), эфект называюць пре-маскіроўкай.

Постстымульнае стамленне

[правіць | правіць зыходнік]

Нярэдка пасля ўздзеяння гучных гукаў высокай інтэнсіўнасці ў чалавека рэзка зніжаецца слыхавая адчувальнасць. Аднаўленне звычайных парогаў можа працягвацца да 16 гадзін. Гэты працэс называецца «часовы зрух парога слыхавы адчувальнасці» або «постстымульнае стамленне». Зрух парога пачынае з'яўляцца пры ўзроўні гукавога ціску вышэй 75 дб і адпаведна павялічваецца пры павышэнні ўзроўню сігналу. Прычым найбольшы ўплыў на зрух парога адчувальнасці аказваюць высокачастотныя складнікі сігналу.

Часам чалавек можа чуць гукі ў нізкачастотнай вобласці, хоць у рэальнасці гукаў такі частоты не было. Так адбываецца з-за таго, што ваганні базылярнай мембраны ў вуху не з'яўляюцца лінейнымі і ў ёй могуць узнікаць ваганні з рознасныя частатой паміж дзвюма больш высокачастотнымі.

Гэты эфект выкарыстоўваецца ў некаторых камерцыйных гукавых сістэмах, каб пашырыць вобласць прайграваных нізкіх частот, калі немагчыма адэкватна прайграць такія частоты наўпрост, напрыклад, у навушніках. Пры доўгім праслухоўванні гэта можа быць шкодна для слыху.

Псіхаакустыка ў праграмным забеспячэнні

[правіць | правіць зыходнік]

Псіхакустычныя мадэлі слыху дазваляюць з высокай якасцю вырабляць кампрэсію сігналу з стратай інфармацыі (калі адноўлены сігнал не супадае з зыходным), за кошт таго, што дазваляюць дакладна апісаць, што можна бяспечна выдаліць з зыходнага сігналу - гэта значыць без значнага пагаршэння якасці гуку. На першы погляд можа здацца, што наўрад ці гэта дазволіць забяспечыць моцны сціск сігналу, аднак праграмы, якія выкарыстоўваюць псіхакустычныя мадэлі, дазваляюць дамагчыся змяншэння аб'ёмаў файлаў з музыкай у 10-12 разоў, і пры гэтым розніца ў якасці будзе не вельмі значная.

Да такіх відаў кампрэсіі адносяцца ўсе сучасныя фарматы сціску гуку з стратамі:

  • MP3 (практычна тое ж самае што і Musicam (выкарыстоўваецца для лічбавага аудыёвяшчання ў некаторых краінах, у адрозненне ад mp3 (Mpeg 1 Layer 3) лічыцца больш прафесійным алгарытмам сціску (кодэкам). Таксама вядомы як MPEG-1 Layer 2 і MP2)
  • Ogg Vorbis
  • WMA
  • AAC
  • Musepack
  • ATRAC выкарыстоўваецца ў фармаце MiniDisc і ў некаторых партатыўных MP3-плэерах Sony

Зноскі

  1. Изменения от интенсивного производственного шума - Профессиональные заболевания органа слуха, связанные с воздействием интенсивного производственного шума - Врачебно-трудовая …. Архівавана з першакрыніцы 11 лютага 2013. Праверана 4 лютага 2013.
  2. Fletcher H., Munson W. A. Loudness, its definition, measurement and calculation // J.Acoust. Soc Am.5, 82-108 (1933)
  3. Robinson D. W., Dadson R. S. A re-determination of the equal-loudness relations for pure tones // Br. J. Appl. Phys. 7, 166—181, 1956)
  4. Тигранян Р. Э., Шорохов В. В. Физические основы слухового эффекта СВЧ / Ответственный редактор — д-р физ.-мат наук проф. Л. П. Каюшин. — Пущино: ОНТИ Пущинского научного центра АН СССР, 1990. — 131 с. — 370 экз.