Web-Harvesting3 Einträge

<< zurück zu Sprachtechnologie-Werkzeuge

Web-Harvesting bezeichnet eine Technologie, die gezielt Informationen aus dem Web sammelt. Die Daten werden als Abbild einzelner Webseiten in maschinenlesbaren Formaten aufbereitet. Die abgefragten Daten können beliebig weiterverarbeitet werden, beispielsweise mit Werkzeugen für Terminologieextraktion oder Textanalyse.

BootCat

BootCat ist ein Textanalysewerkzeug, welches Texte und Bezeichnungen aus dem Web sammelt und diese in einem Textkorpus zusammenstellt.
mehr >>

SpiderLing

SpiderLing, sammelt die Texte von Webseiten, die für die Erstellung von Textkorpora nützlich sind.
mehr >>

WebSpider

WebSpider durchsucht Webseiten automatisch nach Stichwörtern, Links, Grafiken und Audiodateien und speichert diese lokal im gewünschten Ordner in einem übersichtlichen Strukturbaum ab.
mehr >>