Anfangs nur zu Dokumentationszwecken ließ 0x0a (Gregor Weichbrodt und Hannes Bajohr) diese Kommentare durch ein Scraping-Script regelmäßig von der Pegida facebook Seite sammeln. Seit Dezember 2014 ist bis heute ein 282.596 Kommentare und 7.751.654 Wortformen umfassendes Textkorpus der Pegida-Sprache entstanden.
AnalyzePegidaKorpus IPython Notebook
SeeDataSource: Die Sprache Pegidas
CC-BY 2.0 Lizenz