Category Archives: How To

How to: Webscraping mit Kimono

  • Gregor Weichbrodt
  • ·
  • 2015-03-23

Bei 0x0a entstehen viele Texte, die als Ausgangsmaterial große Textdatensätze, sogenannte Korpora, verwenden. Ein Korpus kann mit der Methode des „Webscraping“ auf einfachen Weg selbst erstellt werden. Für Chicken Infinite – eine Kochanleitung auf 532 Seiten – wurde ein Textkorpus aus Kochrezepten aus dem Internet zusammengetragen. Benutzt wurde hierbei der Webscraper Kimono, den ich heute vorstelle. Kimono von kimonolabs bietet eine benutzerfreundliche Möglichkeit, Webseiteninhalte […]