Die Faltung, auch Konvolution (von lateinischconvolvere „zusammenrollen“), beschreibt in der Analysis einen mathematischen Operator, der für zwei Funktionen und eine dritte Funktion liefert.
Anschaulich bedeutet die Faltung , dass jeder Wert von durch das mit gewichtete Mittel der ihn umgebenden Werte ersetzt wird. Genauer wird für den Mittelwert der Funktionswert mit gewichtet. Die resultierende „Überlagerung“ zwischen und gespiegelten und verschobenen Versionen von (man spricht auch von einer „Verschmierung“ von ) kann z. B. verwendet werden, um einen gleitenden Durchschnitt zu bilden.
Die Kreuzkorrelationsfunktion ist identisch mit der komplex konjugierten Faltung . Insbesondere im Fachgebiet Maschinelles Lernen, wo man mit Convolutional Neural Networks arbeitet, wird aufgrund dieser Identität meistens die Kreuzkorrelation verwendet, diese aber als Faltung bezeichnet, weil sie leichter zu implementieren ist.[1]
Um die Definition möglichst allgemein zu halten, schränkt man den Raum der zulässigen Funktionen zunächst nicht ein und fordert stattdessen, dass das Integral für fast alle Werte von wohldefiniert ist. Eine äquivalente Definition ergibt sich durch die Kommutativität der Faltung.
Im Fall eines beschränkten Definitionsbereichs setzt man und auf den gesamten Raum fort, um die Faltung ausführen zu können. Hierzu gibt es je nach Anwendung mehrere Ansätze.
Fortsetzung durch Null
Man setzt die Funktionen per Definition außerhalb des Definitionsbereiches durch die Nullfunktion fort: .
Periodische Fortsetzung
Man setzt die Funktionen außerhalb des Definitionsbereiches periodisch fort und verwendet die für periodische Funktionen definierte Faltung.
Im Allgemeinen ist die Faltung für derart fortgesetzte Funktionen nicht mehr wohldefiniert. Eine oft auftretende Ausnahme bilden stetige Funktionen mit kompaktem Träger, die durch Null zu einer integrierbaren Funktion in fortsetzbar sind.
Eine anschauliche Deutung der eindimensionalen Faltung ist die Gewichtung einer von der Zeit abhängigen Funktion mit einer anderen. Der Funktionswert der Gewichtsfunktion an einer Stelle gibt an, wie stark der um zurückliegende Wert der gewichteten Funktion, also , in den Wert der Ergebnisfunktion zum Zeitpunkt eingeht.
Die Faltung ist ein geeignetes Modell zur Beschreibung zahlreicher physikalischer Vorgänge.
Eine Methode, eine Funktion zu „glätten“, besteht darin, sie mit einem so genannten Glättungskern zu falten. Die entstehende Funktion ist glatt (unendlich oft stetig differenzierbar), ihr Träger ist nur etwas größer als der von , und die Abweichung in der L1-Norm lässt sich durch eine vorgegebene positive Konstante beschränken.
Ein -dimensionaler Glättungskern oder Mollifier ist eine unendlich oft stetig differenzierbare Funktion , die nichtnegativ ist, ihren Träger in der abgeschlossenen Einheitskugel hat und das Integral 1, durch entsprechende Wahl einer Konstanten , besitzt.
Ein Beispiel ist der Glättungskern
wobei eine Normierungskonstante ist, also so gewählt wird, dass das Integral von 1 ergibt.
Aus dieser Funktion kann man weitere Glättungskerne bilden, indem man für setzt:
wobei für .
Die sich ergebenden Glättungskerne für und sind im Folgenden dargestellt:
Durch Faltung von (rot dargestellt) mit dem Glättungskern entsteht eine glatte Funktion (blau dargestellt) mit kompaktem Träger, die von f in der L1-Norm um etwa 0,4 abweicht, d. h.
.
Bei der Faltung mit für e kleiner 1/2 erhält man glatte Funktionen, die in der Integralnorm noch dichter bei f liegen.
Wird eine Normalverteilung mit dem Mittelwert und der Standardabweichung gefaltet mit einer zweiten Normalverteilung mit den Parametern und , so ergibt sich wieder eine Normalverteilung mit dem Mittelwert und der Standardabweichung .
Beweis
Damit lässt sich die Gaußsche Fehleraddition (Fehlerfortplanzungsgesetz) begründen:
Gegeben seien zwei Stäbe mit fehlerbehafteten Längen und . Will man nun wissen, wie lang der zusammengesetzte Stab ist, dann kann man die beiden Stäbe als zufallsverteiltes Ensemble betrachten. Das heißt, die Messungen von Stab 1 und Stab 2 unterliegen jeweils einer Streuung, welche der Normalverteilung folgt. Es kann z. B. sein, dass Stab 1 in Wirklichkeit lang ist. Dieses Ereignis tritt mit einer bestimmten Wahrscheinlichkeit auf, die man aus dem Streumaß der Normalverteilung um den Mittelwert ablesen kann. Für dieses Ereignis ist dann die Gesamtlänge der beiden Stäbe normalverteilt, und zwar mit der Normalverteilung des 2. Stabes multipliziert mit der Wahrscheinlichkeit, dass der 1. Stab lang ist. Geht man dies für alle Stablängen für Stab 1 durch und addiert die Verteilungen des zusammengesetzten Stabes, dann entspricht dies der im Beweis angegebenen Integration, welche äquivalent zu einer Faltung ist. Der zusammengesetzte Stab ist also auch normalverteilt und lang.
Die Faltung von -Funktionen erfüllt zusammen mit der Addition fast alle Axiome eines kommutativen Rings mit Ausnahme dessen, dass diese Struktur kein neutrales Element besitzt. Man spricht scherzhaft auch von einem „Rng“, weil das i für "Identität" fehlt. Im Detail gelten also die folgenden Eigenschaften:
Dabei ist die distributionelle Ableitung von . Falls (total) differenzierbar ist, so stimmen distributionelle Ableitung und (totale) Ableitung überein. Zwei interessante Beispiele dazu sind:
, wobei die Ableitung der Delta-Distribution ist. Die Ableitung lässt sich also als Faltungsoperator auffassen.
, wobei die Sprungfunktion ist, ergibt eine Stammfunktion für .
Sei und mit und . Dann ist die Faltung eine beschränktestetige Funktion auf . Ist , so verschwindet die Faltung im Unendlichen, ist also eine -Funktion. Diese Aussage ist ebenfalls richtig, wenn eine reelle Hardy-Funktion ist und in BMO liegt.
In der digitalen Signalverarbeitung und der digitalen Bildverarbeitung hat man es meist mit diskreten Funktionen zu tun, die miteinander gefaltet werden sollen. In diesem Fall tritt an die Stelle des Integrals eine Summe und man spricht von der zeitdiskreten Faltung.
Seien Funktionen mit dem diskreten Definitionsbereich . Dann ist die diskrete Faltung definiert durch
.
Der Summationsbereich ist der gesamte Definitionsbereich beider Funktionen. Im Fall eines beschränkten Definitionsbereichs werden und meist durch Nullen fortgesetzt.
Ist der Definitionsbereich endlich, so können die beiden Funktionen auch als Vektoren , respektive verstanden werden. Die Faltung ist dann gegeben als Matrix-Vektor-Produkt:
Wenn man die Spalten von unter und über den Elementen von periodisch fortsetzt, statt mit Nullen zu ergänzen, wird zu einer zyklischen Matrix, und man erhält die zyklische Faltung.
Das Produkt zweier Polynome und ist zum Beispiel die diskrete Faltung ihrer mit Nullen fortgesetzten Koeffizientenfolgen. Die dabei auftretenden unendlichen Reihen haben stets nur endlich viele Summanden, die ungleich Null sind.
Analog definiert man das Produkt zweier formaler Laurentreihen mit endlichem Hauptteil.
Ein in Bezug auf die Rechenleistung effizienter Algorithmus für die Berechnung der diskreten Faltung ist die Schnelle Faltung, die sich ihrerseits auf die Schnelle Fourier-Transformation (FFT) zur effizienten Berechnung der diskreten Fourier-Transformation stützt.
Die beiden Faltungsbegriffe können gemeinsam beschrieben und verallgemeinert werden durch einen allgemeinen Faltungsbegriff für komplexwertige m-integrierbare Funktionen auf einer geeigneten topologischen GruppeG mit einem Maßm (z. B. einer lokalkompakten hausdorffschen topologischen Gruppe mit einem Haar-Maß):
Dieser Faltungsbegriff spielt eine zentrale Rolle in der Darstellungstheorie dieser Gruppen, deren wichtigste Vertreter die Lie-Gruppen bilden. Die Algebra der integrierbaren Funktionen mit dem Faltungsprodukt ist für kompakte Gruppen das Analogon zum Gruppenring einer endlichen Gruppe. Weiterführende Themen sind:
Für eine endliche Gruppe mit wird die Menge mit der Addition und der skalaren Multiplikation ein -Vektorraum, isomorph zu Mit der Faltung
wird dann zu einer Algebra, genannt die Faltungsalgebra.
Die Faltungsalgebra besitzt eine Basis indiziert mit den Gruppenelementen wobei
Mit der Faltung gilt:
Wir definieren eine Abbildung zwischen und indem wir für Basiselemente definieren: und linear fortsetzen. Diese Abbildung ist offensichtlich bijektiv. Man erkennt an obiger Gleichung für die Faltung zweier Basiselemente aus dass die Multiplikation in der in entspricht. Damit sind die Faltungsalgebra und die Gruppenalgebra als Algebren isomorph.
Mit der Involution wird zu einer -Algebra. Es gilt
Eine Darstellung einer Gruppe setzt fort zu einem -Algebrenhomomorphismus durch
Da als -Algebrenhomomorphismus insbesondere multiplikativ ist, erhalten wir Falls unitär ist, gilt außerdem Die Definition einer unitären Darstellung findet sich im Kapitel Eigenschaften der Faltung. Dort wird auch gezeigt, dass wir eine lineare Darstellung ohne Einschränkung als unitär annehmen können.
Im Rahmen der Faltungsalgebra kann man auf Gruppen eine Fouriertransformation durchführen. In der Harmonischen Analyse wird gezeigt, dass diese Definition mit der Definition der Fouriertransformation auf konsistent ist.
Sei eine Darstellung, dann definiert man die Fouriertransformierte durch die Formel
In der Bildbearbeitung und in der Bildverarbeitung wird die diskrete Faltung eingesetzt, um entweder störende Einflüsse wie Rauschen zu beheben oder Bildinformationen wie z. B. Kanten zu extrahieren (Kantendetektion). Dabei kommen der Aufgabenstellung angepasste Faltungsmatrizen zum Einsatz, die als Operatorvorschrift für den Glättungskern zu verstehen sind.
Bei einem linearen, zeitinvarianten Übertragungsglied ergibt sich die Antwort auf eine Anregung durch Faltung der Anregungsfunktion mit der Impulsantwort des Übertragungsglieds. Beispielsweise stellt die lineare Filterung eines elektronischen Signals die Faltung der Original-Funktion mit der Impulsantwort dar.
In der Akustik (Musik) wird die Faltung (unter Zuhilfenahme der FFT = schnelle Fouriertransformation) auch zur digitalen Erzeugung von Hall und Echos und zur Anpassung von Klangeigenschaften verwendet. Dazu wird die Impulsantwort des Raumes, dessen Klangcharakteristik man übernehmen möchte, mit dem Signal, das man beeinflussen möchte, gefaltet.
In der Ingenieurmathematik und der Signalverarbeitung werden Eingangssignale (äußere Einflüsse) mit der Impulsantwort (Reaktion des betrachteten Systems auf einen Diracimpuls als Signaleingang, auch Gewichtsfunktion) gefaltet, um die Antwort eines LTI-Systems auf beliebige Eingangssignale zu berechnen. Die Impulsantwort ist nicht zu verwechseln mit der Sprungantwort. Erstere beschreibt die Gesamtheit aus System und einem Dirac-Impuls als Eingangs-Testfunktion, letztere die Gesamtheit aus System und einer Sprungfunktion als Eingangs-Testfunktion. Die Berechnungen finden meist nicht im Zeitbereich, sondern im Frequenzbereich statt. Dazu müssen sowohl vom Signal als auch von der das Systemverhalten beschreibenden Impulsantwort Spektralfunktionen im Frequenzbereich vorliegen, oder ggf. aus dem Zeitbereich per Fouriertransformation oder einseitiger Laplacetransformation dorthin transformiert werden. Die entsprechende Spektralfunktion der Impulsantwort wird Frequenzgang oder Übertragungsfunktion genannt.
In der numerischen Mathematik erhält man durch Faltung der Boxfunktion mit die B-Spline-Basisfunktion für den Vektorraum der stückweisen Polynome vom Grad k.
In der Computeralgebra kann die Faltung für eine effiziente Berechnung der Multiplikation vielstelliger Zahlen eingesetzt werden, da die Multiplikation im Wesentlichen eine Faltung mit nachfolgendem Übertrag darstellt. Die Komplexität dieses Vorgehens ist mit nahe linear, während das „Schulverfahren“ quadratischen Aufwand hat, wobei die Zahl der Stellen ist. Dies lohnt sich trotz des zusätzlichen Aufwands, der hierbei für die Fouriertransformation (und deren Umkehrung) erforderlich ist.
In der Hydrologie verwendet man die Faltung, um den durch ein Niederschlags-Abfluss-Ereignis produzierten Abfluss in einem Einzugsgebiet bei vorgegebener Menge und Dauer des Niederschlages zu berechnen. Dazu wird der sogenannte „Unit-Hydrograph“ (Einheits-Abflussganglinie) – die Abflussganglinie auf einen Einheitsniederschlag von vorgegebener Dauer – mit der zeitlichen Funktion des Niederschlages gefaltet.
In der Reflexionsseismik wird eine seismische Spur als Faltung von Impedanzkontrasten der geologischen Schichtgrenzen und dem Ausgangssignal (Wavelet) betrachtet. Der Vorgang zur Wiederherstellung der unverzerrten Schichtgrenzen im Seismogramm ist die Dekonvolution.
↑Ian Goodfellow, Yoshua Bengio und Aaron Courville: Deep Learning. Hrsg.: MIT Press. S.329 (deeplearningbook.org).
↑Allgemeiner kann auch für ein und vorausgesetzt werden. Vgl. Herbert Amann, Joachim Escher: Analysis III. 1. Auflage. Birkhäuser-Verlag, Basel/Boston/Berlin 2001, ISBN 3-7643-6613-3, Abschnitt 7.1.
↑Beweis mittels Einsetzen der inversen Fouriertransformierten. Z. B. wie in Fouriertransformation für Fußgänger, Tilman Butz, Ausgabe 7, Springer DE, 2011, ISBN 978-3-8348-8295-0, S. 53, Google Books