Web-Harvesting3 Einträge
<< zurück zu Sprachtechnologie-Werkzeuge
Web-Harvesting bezeichnet eine Technologie, die gezielt Informationen aus dem Web sammelt. Die Daten werden als Abbild einzelner Webseiten in maschinenlesbaren Formaten aufbereitet. Die abgefragten Daten können beliebig weiterverarbeitet werden, beispielsweise mit Werkzeugen für Terminologieextraktion oder Textanalyse.
BootCat
BootCat ist ein Textanalysewerkzeug, welches Texte und Bezeichnungen aus dem Web sammelt und diese in einem Textkorpus zusammenstellt.
mehr >>
SpiderLing
SpiderLing, sammelt die Texte von Webseiten, die für die Erstellung von Textkorpora nützlich sind.
mehr >>