Beim Einsatz von statistischen Modellen etwa eignet sich die Lemmatisierung eines sehr kleinen Textkorpus’ manchmal dazu, die Frequenz einzelner Lexeme zu erhöhen und dadurch das statistische Rauschen zu verringern.
de.wikipedia.org Polyseme und homonyme lexikalische Zeichen erweisen sich auch als Problem bei der Indexierung innerhalb der Dokumentation, wo durch einzelne, definierbare Schlagwörter (Lemmatisierung) ein Sachverhalt erschlossen werden soll.
de.wikipedia.org Die eingesetzten linguistischen Verfahren sind: Lemmatisierung, also das Erkennen von Grundformen, die Kompositazerlegung, die Generierung von Wortvarianten, das Erzeugen von Synonymen und die Wortableitungen.
de.wikipedia.org Zusätzlich bietet die Standardsuche die Option der automatischen Erweiterung der Suchbegriffe auf andere Wortformen (Lemmatisierung).
de.wikipedia.org Als Erstes wird eine Lemmatisierung der einzelnen Begriffe durchgeführt, womit zu jedem Begriff dessen Grundform identifiziert wird (Häuser → Haus, Vögel → Vogel, gingen → gehen).
de.wikipedia.org