Campus WelsTechnik & Angewandte Naturwissenschaften

TextSTAT

Arbeitssprachen: Deutsch, Englisch, und weitere
Verfügbarkeit: offline
Hersteller: Freie Universität Berlin
Kosten: kostenfrei

TextSTAT ist ein Textanalysewerkzeug, welches erstellte TextSTAT-Korpora, vorbereitete HTML-Dateien und Text-Dateien analysieren kann. Die analysierbaren Sprachen sind Englisch, Deutsch, Niederländisch, Portugiesisch, Spanisch, Katalanisch, Galizisch, Französisch, Italienisch, Finnisch (Suomi), Polnisch und Tschechisch. Das Programm erstellt Worthäufigkeitslisten und erkennt Wortübereinstimmungen innerhalb der Dateien. Mit regulären Ausdrücken können Sie sehr komplexe Suchabfragen erstellen und die Ergebnisse in den gewünschten Ordnern als Text-Datei abgelegen.

Besonderheit: TextSTAT hat einen eigenen Web-Spider, mit dessen Hilfe eine beliebige Anzahl von Seiten einer bestimmen Website zu einem Textkorpus zusammengestellt werden kann. Dazu muss ein eigenes TextSTAT-Korpus anlegt werden, damit das Programm die Daten einlesen und analysieren kann.

Link zum Download: http://neon.niederlandistik.fu-berlin.de/de/textstat/