اسپکتروگرام: پردازش صوت با استفاده از روش های پردازش تصویر

اسپکتروگرام: پردازش صوت با استفاده از روش های پردازش تصویر

اسپکتروگرام نمایشی از طیف فرکانسی صوت یا دیگر سیگنالهایی است که نسبت به زمان تغییرات زیادی دارند. اسپکتروگرام معمولا با نام های دیگری مثل Voiceprints یا voicegrams نیز مورد استفاده قرار می گیرد. از اسپکتروگرام می توان برای شناسایی کلمات گفته شده به صورت آوایی و تحلیل آواهای مختلف حیوانات استفاده کرد. یکی از کاربردهای بسیار مهم اسپکتروگرام، تحلیل صوت با استفاده از روشهای پردازش تصویر می باشد. چون در این روش، صوت به صورت تصویر مدل سازی می شود.در شکل زیر، یک اسپکتروگرام از کلمات گفته شده ی “Ninetheenth century” نمایش داده شده است.

(منبع تصویر: https://en.wikipedia.org/wiki/Spectrogram)

اسپکتروگرام معمولا با یکی از دو روش زیر ساخته می شود:

  1. تقریب زدن به صورت یک بانک فیلتری( مجموعه ای از فیلتر های میان گذر)
  2. استفاده از تبدیل فوریه در حوزه ی زمان

روش اول معمولا در پردازش های آنالوگ مورد استفاده قرار می گیرد و سیگنال ورودی را به باندهای فرکانسی مختلف تبدیل می کند. اندازه ی دامنه ی خروجی هرکدام از فیلترها، یک ترنسدیوسر که اسپکتروگرام را به صورت یک تصویر برروی کاغذ ذخیره میکند، را کنترل می نماید.  عموما دستگاههای طیف سنج آزمایشگاهها از این روش برای به دست آوردن اسپکتروگرام استفاده می کنند

روش دوم در پردازش های دیجیتال مورد بهره برداری قرار می گیرد. و از تبدیل فوریه در حوزه ی زمان بهره می برد. نرم افزارهایی مثل متلب برای به دست آوردن اسپکتروگرام از این روش استفاده می کنند.

برای تهیه ی اسپکتروگرام در محیط نرم افزار متلب، دستور آماده ای وجود دارد که توضیحات این دستور از طریق لینک زیر قابل دسترسی است:

https://www.mathworks.com/help/signal/ref/spectrogram.html

 

بدون دیدگاه

ارسال یک نظر

نظر
نام
ایمیل
وبسایت