شبکه عصبی با تأخیر زمانی (TDNN)[۱] یک معماری شبکه عصبی مصنوعی چندلایه است که هدف آن ۱) ردهبندی الگوها با جابهجایی-ناوردا (به انگلیسی: shift-invariance) و ۲) بافت مدل (به انگلیسی: model context) در هر لایه از شبکه است.
ردهبندی جابهجایی-ناوردا به این معنی است که ردهبند (به انگلیسی: classification) قبل از ردهبندی نیازی به تقسیمبندی صریح ندارد؛ بنابراین، برای ردهبندی الگوی زمانی (به انگلیسی: temporal pattern) (مانند گفتار)، TDNN از تعیین نقاط شروع و پایان صداها قبل از ردهبندی آنها اجتناب میکند.
برای مدلسازی بافتی در یک TDNN، هر واحد عصبی در هر لایه نه تنها از فعالسازی ها/ویژگیها در لایه زیر، بلکه از یک الگوی خروجی واحد و بافت آن ورودی دریافت میکند. برای سیگنالهای زمانی هر واحد به عنوان ورودی الگوهای فعالسازی را در طول زمان از واحدهای زیر دریافت میکند. با استفاده از ردهبندی دو-بُعدی (تصاویر، الگوهای بسامد-زمانی)، TDNN را میتوان با جابهجایی-ناوردا در فضای مختصات آموزش داد و از تقسیمبندی پَرسون (دقیق) (به انگلیسی: precise) در فضای مختصات جلوگیری میکند.
TDNN در اواخر دهه ۱۹۸۰ معرفی شد و برای ردهبندی واجها برای تشخیص گفتار خودکار در سیگنالهای گفتاری که تعیین خودکار بخشهای پَرسون یا محدوده ویژگیها دشوار یا غیرممکن بود، اعمال شد. از آنجا که TDNN واجها و ویژگیهای آکوستیک/آوایی زیرین آنها را تشخیص میدهد، مستقل از موقعیت در زمان، کارایی را نسبت به ردهبندی ایستایی بهبود میبخشد.[۱][۲] همچنین برای سیگنالهای دو-بُعدی (الگوهای بسامد-زمان در گفتار،[۳] و الگوی فضای مختصات در OCR[۴]) استفاده شد.
در سال ۱۹۹۰، یاماگوچی و همکاران. مفهوم حداکثر جمعآوری را معرفی کرد. آنها این کار را با ترکیب TDNNها با حداکثر جمعآوری به منظور تحقق بخشیدن به یک سیستم تشخیص کلمه مجزاشده مستقل از گوینده انجام دادند.[۵]
شبکه عصبی پیچشی – یک شبکه عصبی کانولوشن که در آن کانولوشن در امتداد محور زمان از داده انجام میشود بسیار شبیه به یک TDNN است.
شبکه عصبی بازگشتی – یک شبکه عصبی بازگشتی همچنین دادهٔ زمانی را مدیریت میکند، البته به شیوهای متفاوت. به جای ورودی متغیر با زمان، RNNها لایههای پنهان داخلی را برای ردیابی ورودیهای گذشته (و در مورد RNNهای دو-جهته، آینده) نگهداری میکنند.