Talegenkendelse

Populært sagt er talegenkendelse det modsatte af talesyntese, det vil sige, at talegenkendelse betegner interaktionen mellem menneske og maskine som "tale-til-skreven tekst/kode", mens talesyntese betegner processen "skreven tekst-til-tale".

Talegenkendelsen opdeles typisk i to typer: Automatisk talegenkendelse og generel diktering. Førstnævnte relaterer sig til kommandostyret genkendelse af f.eks. tal (f.eks. overførsel mellem bankkonti) eller foruddefinerede navne (f.eks. bynavne ved billetbestilling). Den sidstnævnte skal i bredeste forstand kunne genkende en hvilken som helst sætning eller indtalt besked.

I grænseområdet mellem disse to typer ligger den domænespecifikke diktering, f.eks. medicinsk diktering, som eksempelvis anvendes i forbindelse med EPJ-systemer, hvor man har udvalgt et (lingvistisk) begrænset område/domæne for at optimere genkendelsesprocenten i et system.

Generel diktering kan bruges som hjælpemiddel til personer, der har svært ved at stave som for eksempel ordblinde. Diktering er i dag tilgængelig for stort set alle på for eksempel smartphone og computer[1].

I Danmark implementerer virksomheden Omilon kommercielle systemer med talegenkendelse i sundhedssektoren.[2] Dictus er en anden virksomhed der leverer dansk taleteknologi. Deres talegenkender har været anvendt ved ordblindhed.[3]

Eksterne henvisninger

[redigér | rediger kildetekst]
  1. ^ Artikel omkring de forskellige muligheder for diktering til ordblinde og andre med staveproblemer.
  2. ^ Per Lundvald (8. september 2022), "»Menneskelig adfærd viser, om den teknologiske løsning er den rette«", IngeniørenWikidata Q122585587
  3. ^ Lene Aamand Sørensen (19. februar 2008), "Dictus skriver for ordblinde Frederik", Århus StiftstidendeWikidata Q122585762