Aihemalli[1][2][3], aihemallinnus[4][2][3] tai topiikkimalli[1][5] on koneoppimisessa ja luonnollisen kielen käsittelyssä tietynlainen tilastollinen malli tekstikokoelmassa esiintyvien abstraktien aiheiden tai ”topiikkien” löytämiseksi[2][3][5]. Aihemallinnus on paljon käytetty tekstinlouhintatyökalu, jolla etsitään piileviä semanttisia rakenteita tekstimassasta.
Jos jokin teksti (aihemallinnuksessa puhutaan yleensä dokumenteista) koskee tiettyä aihetta, tiettyjä sanoja voi odottaa esiintyvän useammin tai harvemmin: "koira" ja "luu" esiintyvät useammin koiria koskevissa teksteissä, "kissa" ja ”miau” esiintyvät kissoja koskevissa teksteissä ja ”ei” ja ”on” esiintyvät suunnilleen yhtä paljon molemmissa. Yhdessä tekstissä käsitellään tyypillisesti useita aiheita eri suhteissa: esimerkiksi tekstissä, jossa 10 % koskee kissoja ja 90 % koiria, koirasanoja olisi luultavasti noin 9 kertaa enemmän kuin kissasanoja.
Aihemallinnustekniikoiden tuottamat ”aiheet” ovat samankaltaisten sanojen klustereita. Aihemalli tiivistää tämän ajatuksen matemaattiseen viitekehykseen, jonka avulla voidaan tutkia tekstikokoelmia ja selvittää kunkin tekstin sanajakaumien perusteella, mitä aiheita siinä mahdollisesti on ja miten aiheet ovat tekstissä jakautuneet.
Informaatioaikakaudella päivittäin kohtaamamme kirjallisen materiaalin määrä ylittää käsittelykykymme. Aihemallit voivat auttaa järjestämään ja ymmärtämään suuria tekstikokoelmia. Alun perin tekstinlouhintatyökaluksi kehitettyjä aihemalleja on käytetty rakenteiden havaitsemiseen myös muusta tiedosta, kuten geneettisestä tiedosta, kuvista ja verkoista. Niillä on myös sovelluksia muilla aloilla, kuten bioinformatiikassa[6] ja tietokonenäössä[7].