Es gibt viele Werkzeuge, mit denen Sie bauen könnten:
Was Schlüsselwörter angeht, gibt es grundlegende Tools wie Porter-Stemmers, die in den meisten Programmiersprachen verfügbar sind, und viele weitere Optionen für bestimmte Sprachen.
Zum Beispiel gibt es NLTK (Natural Language Toolkit) - ein Python-Textklassifizierungssystem -, das Sie zum Beispiel für das Tag-of-Speech-Tagging verwenden können ( http://nltk.org/ ).
Außerdem gibt es verschiedene Text-Mining-Pakete, die Sie beispielsweise in R: http://tm.r-forge.r-project.org/ verwenden können (siehe auch folgende Folien: http://www.zinkov.com/posts) /2010-10-21-slides_from_larug/tm_slides.pdf ).
Wenn Sie einen genaueren Überblick über die Art der Textanalyse geben können, die Sie sich vorstellen, wäre es einfacher, bestimmte Pakete vorzuschlagen, die möglicherweise relevant sind.