Extrakce informací (anglicky information extraction; IE) je typ vyhledávání informací, jehož cílem je automaticky vypsat strukturované nebo polostrukturované informace z nestrukturovaných strojově čitelných dokumentů.
Typickým příkladem IE je skenování sérii dokumentů napsaných v přirozeném jazyce a se získanými informacemi zaplnění databáze. Aktuální přístup k IE využívá techniky zpracování přirozeného jazyka, ta těží na velmi omezených oblastech. Například Message Understanding Conference (MUC) je mítinkově založená konference, která se soustředí na oblasti v minulosti:
Typické podúkoly IE jsou:
V tomto článku byl použit překlad textu z článku Information extraction na anglické Wikipedii.