R Loop over IDs - r

I'd like to run pairwise_count in a loop and my input looks like the table in the image. Each ID stands for a text and the rows contains the sentences of the text.
My idea of a for loop doesn't work. Has someone maybe an idea, how that loop could run?
This is my input
library(dplyr)
library(tidytext)
library(widyr)
rm_main = function(data)
{
korpus <- data_frame(id =data$id, text = data$text)
print(korpus)
woerter <- korpus %>%
unnest_tokens(word, text)%>%
group_by(id)%>%
count(word)
print(woerter)
woerter <- as.data.frame(woerter)
cooccurre <- korpus %>%
for( i in unique(id))
{
unnest_tokens(word, text)%>%
pairwise_count(word, i)
}
print(cooccurre)
cooccurre <- as.data.frame(cooccurre)
return(list(woerter, cooccurre))
}
My script input (data) looks like this table:
id text Title query_key
1.0 ? Vier Lehrer haben geklagt, am Mittwoch verhandelt das Bundesverfassungsgericht. SPIEGEL ONLINE - Aktuelle Nachrichten sentences
1.0 . Jobwechsel zur Konkurrenz: So lässt sich eine Bewerbung geheim halten Falscher Raketenalarm auf Hawaii: Auch diese Job-Pannen sorgten für Chaos Missbrauchsskandal im US-Turnen Ein schrecklicher Ort Auch Superstar Simone Biles war Opfer im Missbrauchsskandal des US-Kunstturnens. SPIEGEL ONLINE - Aktuelle Nachrichten sentences
1.0 . Grundsteuer vor dem Verfassungsgericht Unter jedem Dach droht ein Ach Seit Jahrzehnten bekommt die Politik keine Reform der völlig veralteten Grundsteuer hin. SPIEGEL ONLINE - Aktuelle Nachrichten sentences
1.0 . Für Hausbesitzer und Mieter könnte das massive Steuererhöhungen bedeuten. SPIEGEL ONLINE - Aktuelle Nachrichten sentences
1.0 . Nun zeigt sich: Die Ergebnisse dieser wissenschaftlichen Methode werden immer ungenauer. SPIEGEL ONLINE - Aktuelle Nachrichten sentences
2.0 . Und einer ist immer hellgrün. Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE sentences
2.0 . Zu Schuljahresbeginn werden in Baden-Württemberg an staatlichen und privaten Schulen von den Klassenlehrern Versicherungspolicen an die Schüler verteilt. Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE sentences
2.0 . Die einen sind hellgrün, die anderen rosa. Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE sentences
2.0 . Die Versicherung kostet nicht viel, nur einen Euro pro Schuljahr. Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE sentences
2.0 . Wie der Mutter aus Esslingen geht es Hunderttausenden Eltern in Baden-Württemberg. Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE sentences
3.0 ? Hier finden Sie mehr Informationen . Bogner: Wolfgang Reitzle wird Aufsichtsratschef - SPIEGEL ONLINE sentences
3.0 . Sie haben einen anderen Browser? Bogner: Wolfgang Reitzle wird Aufsichtsratschef - SPIEGEL ONLINE sentences
3.0 . Nun besetzt das Münchner Modeunternehmen auch seinen Aufsichtsrat neu. Bogner: Wolfgang Reitzle wird Aufsichtsratschef - SPIEGEL ONLINE sentences
3.0 . Mittwoch, 17. Bogner: Wolfgang Reitzle wird Aufsichtsratschef - SPIEGEL ONLINE sentences
3.0 . An die Spitze des Gremiums hat Firmeninhaber Willy Bogner den Aufsichtsratsvorsitzenden des Industriegase-Konzerns Linde, Wolfgang Reitzle, berufen. Bogner: Wolfgang Reitzle wird Aufsichtsratschef - SPIEGEL ONLINE sentences
3.0 . Sie haben einen anderen Browser? Bogner: Wolfgang Reitzle wird Aufsichtsratschef - SPIEGEL ONLINE sentences
4.0 . Da liegt es für die Koalitionssondierer nahe, die Steuern kräftig zu senken. CDU, CSU und SPD: Vorsicht vor zu großzügigen Steuergeschenken! - SPIEGEL ONLINE sentences
4.0 . Ein Kommentar von Stefan Kaiser Jahrgang 1976. CDU, CSU und SPD: Vorsicht vor zu großzügigen Steuergeschenken! - SPIEGEL ONLINE sentences
4.0 . Ausbildung an der Berliner Journalisten-Schule. CDU, CSU und SPD: Vorsicht vor zu großzügigen Steuergeschenken! - SPIEGEL ONLINE sentences
4.0 . Seit Juni 2011 Redakteur im Wirtschaftsressort von SPIEGEL ONLINE, seit Mai 2014 Reporter. CDU, CSU und SPD: Vorsicht vor zu großzügigen Steuergeschenken! - SPIEGEL ONLINE sentences
4.0 . Mehr Artikel von Stefan Kaiser Donnerstag, 11. CDU, CSU und SPD: Vorsicht vor zu großzügigen Steuergeschenken! - SPIEGEL ONLINE sentences
5.0 . Die meisten Herzerkrankungen sind vermeidbar - und zwar ganz leicht. thema-herz-gesundheit -Video - SPIEGEL ONLINE sentences
5.0 . SPIEGEL TV Thema: Wie hilfreich sind Diäten? thema-herz-gesundheit -Video - SPIEGEL ONLINE sentences
5.0 ? Eingestürztes Kölner Stadtarchiv: Prozess versucht Schuldfrage zu klären 'Drecksloch'-Affäre um Donald Trump: US-Senator Booker platzt der Kragen Der Kampf um die Große Koalition in NRW: 'Mund-zu-Mund-Beatmung der Parteispitze' Trump-Satirevideo: Ein 'Shithole' schlägt zurück Rekordwinter in den USA: Eisige Landschaften Himmelskörper: Meteor rast über Michigan hinweg Britisches Unterhaus: Abgeordneter verschläft Brexit-Debatte Risse in Tribüne: Porto-Fans stürmen den Platz Ein Jahr Trump: Die Gewinner im Trump-Staat Texas Mexiko: Längste Unterwasserhöhle der Welt entdeckt Slacklining in Nazaré: Balanceakt vor Riesenwellen thema-herz-gesundheit -Video - SPIEGEL ONLINE 09. thema-herz-gesundheit -Video - SPIEGEL ONLINE sentences
5.0 . Die meisten Herzerkrankungen sind vermeidbar - und zwar ganz leicht. thema-herz-gesundheit -Video - SPIEGEL ONLINE sentences
5.0 . SPIEGEL TV Thema: Wie hilfreich sind Diäten? thema-herz-gesundheit -Video - SPIEGEL ONLINE sentences
6.0 . Zum Beispiel durch üppige Suppen und Eintöpfe wie den spanischen Cocido de Garbanzos. Rezept für spanischen Eintopf: Cocido de Garbanzos - SPIEGEL ONLINE sentences
6.0 . Jahrgang 1960, lebt in Hamburg und kocht länger, als er für Geld schreibt: Seit seinem 16. Rezept für spanischen Eintopf: Cocido de Garbanzos - SPIEGEL ONLINE sentences
6.0 . Als furchtloser Esser mag der hauptberufliche Musikkritiker im Grunde alles, solange es mit Liebe und Verstand aus frischen Zutaten gekocht wird. Rezept für spanischen Eintopf: Cocido de Garbanzos - SPIEGEL ONLINE sentences
6.0 . Wo man hinkommt, gibt es jedenfalls erst mal einen Teller Suppe: In Polen einen Bigosch mit Sauerkraut, Pilzen und allerlei Schweinernem; weiter östlich in der Ukraine oder Russland sind es die Eintöpfe auf der Basis von Roten Beten, Kohl oder Salzgurken - Borschtsch, Schtschi und Soljanka. Rezept für spanischen Eintopf: Cocido de Garbanzos - SPIEGEL ONLINE sentences
6.0 . Die Cajun-Küche Louisianas ist erfüllt vom Schmackofatzgeruch des Jambalaya mit Huhn und Garnelen, in Belgien blubbert derweil ein wallonischer Hochepot, in den Alpen von Bayern bis Slowenien liebt man den Ritschert mit Rauchfleisch und sättigenden Graupen und Hülsenfrüchten, während beim Irish Stew noch der älteste und ansonsten unessbare Hammel durch stundenlanges Kochen halbwegs kaubar wird. Rezept für spanischen Eintopf: Cocido de Garbanzos - SPIEGEL ONLINE sentences
416.0 . Wie viele andere Ackerwildkräuter wird es durch die intensivere landwirtschaftliche Nutzung verdrängt. Pflanzenatlas: Wo Farne und Kräuter in Deutschland sprießen - SPIEGEL ONLINE sentences
416.0 . Das Inventar der Pflanzenverbreitung ist laut BfN nicht nur als Druckwerk, sondern auch als Datenbank wichtig. Pflanzenatlas: Wo Farne und Kräuter in Deutschland sprießen - SPIEGEL ONLINE sentences
416.0 . Tausende meist ehrenamtliche Pflanzenexperten erfassten die Daten in mehrjähriger Kartierungsarbeit in der Natur und in Siedlungsgebieten. Pflanzenatlas: Wo Farne und Kräuter in Deutschland sprießen - SPIEGEL ONLINE sentences
416.0 . Sie seien aufgrund ihrer Strukturvielfalt sehr artenreich, hätten aber auch einen sehr hohen Anteil pflanzlicher Neueinwanderer, sagte Jessel. Pflanzenatlas: Wo Farne und Kräuter in Deutschland sprießen - SPIEGEL ONLINE sentences
416.0 . Wie heißt du denn, meine Schöne? Pflanzenatlas: Wo Farne und Kräuter in Deutschland sprießen - SPIEGEL ONLINE sentences
1368.0 . Kann es eine bessere Empfehlung für das Amt des bayerischen Ministerpräsidenten geben? CSU-Machtkampf: Markus Söder ist der beste Nachfolger Horst Seehofers - SPIEGEL ONLINE sentences
1368.0 . Nach dem Mauerfall für den SPIEGEL in Leipzig, dann in Berlin und New York, wo er vier Jahre als Wirtschaftskorrespondent arbeitete; seit 2005, pünktlich zum langen Abschied von Rot-Grün, wieder in Berlin. CSU-Machtkampf: Markus Söder ist der beste Nachfolger Horst Seehofers - SPIEGEL ONLINE sentences
1368.0 . Ich bin froh, dass es die CSU gibt. CSU-Machtkampf: Markus Söder ist der beste Nachfolger Horst Seehofers - SPIEGEL ONLINE sentences
1368.0 ? Gegen die CSU sind sogar die Grünen, die sich auf ihre Unangepasstheit mächtig was einbilden, ein anämischer Verein. CSU-Machtkampf: Markus Söder ist der beste Nachfolger Horst Seehofers - SPIEGEL ONLINE sentences
1368.0 . Es ist dann die Aufgabe der Kollegen vor Ort, also von Leuten wie mir, die neuesten Entwicklungen im bayerischen Erbfolgekrieg darzulegen. CSU-Machtkampf: Markus Söder ist der beste Nachfolger Horst Seehofers - SPIEGEL ONLINE sentences
2014.0 . So landet die sizilianische Naturlandzitrone unerkannt auch bei Aldi. Bio oder regional: Welche Lebensmittel sind nachhaltiger? - SPIEGEL ONLINE sentences
2014.0 ? Muss so billiges Gemüse nicht unter ähnlich industriellen Bedingungen erzeugt werden wie konventionelle Massenware? Bio oder regional: Welche Lebensmittel sind nachhaltiger? - SPIEGEL ONLINE sentences
2014.0 ? Seit Jahren stagniert der Anteil ökologischer Anbauflächen in Deutschland trotz boomender Nachfrage nach Biobst und -Gemüse. Bio oder regional: Welche Lebensmittel sind nachhaltiger? - SPIEGEL ONLINE sentences
2014.0 . Immer häufiger kommt das Gemüse auch aus Weltregionen, in denen es natürlicherweise gar nicht wächst: Kartoffeln aus Wüstenländern wie Ägypten oder Israel, Gurken vom Rand der Sahara, Tomaten aus Gewächshäusern an der trockenen Südküste Spaniens. Bio oder regional: Welche Lebensmittel sind nachhaltiger? - SPIEGEL ONLINE sentences
regards
Tobias

I worked a bit on my script and now it looks like this:
library(loopr)
library(dplyr)
library(knitr)
library(stringr)
library(widyr)
library(tidytext)
input <- read.csv(file ="/home/knecht/Script input1.csv", stringsAsFactors=FALSE)
print(input)
example <- data_frame(id =input$id, text = input$text)
print(example)
test <- example %>%
group_by(id)%>%
mutate(linenumber = row_number(),
article = cumsum(str_detect(text, regex("^Artikel [\\divxlc]", ignore_case = TRUE))))%>%
ungroup()
print(test)
for(i in unique(id)){
wortpaar <- test%>%
unnest_tokens(word, text)%>%
pairwise_count(word, id)
}
print(wortpaar)
Is it possible to group the co-occurrences for each id like: id, item1, item2, n ?
This is a part of the content of my input file:
Title,query_key,text,id
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Wegen dessen Steuerreform muss das Unternehmen in den USA wohl 38 Milliarden Dollar zahlen.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Kabel, DSL, Mobilnetz: Internet viel langsamer als versprochen Absturz der Digitalwährung: Bitcoin fällt unter 10.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,"? Sprengfotograf: Jedes Bild ein Knaller The Blight House: Trump's Presidency Sinks Below Rock Bottom FC Barcelona Star Lionel Messi: Tax Troubles, an Audit and a 100-Million-Euro Contract Pollution Quiz: Where the Air Is Dirtiest SPD vor Parteitag Das große Zählen und Zittern Martin Schulz auf GroKo-Tour: Nach NRW wirbt der SPD-Chef auch in Bayern für die Große Koalition.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Und am Ende?,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Von Max Holscher und Christian Teevs mehr.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Eine Frage dürfte dabei besonders spannend werden - welche Gremien wird die AfD leiten?,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Wen es wie hart trifft - und wie Sie selbst nachmessen können.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,"? Erschießen, vergiften, aushungern: Jäger sollen großflächig Wildschweine töten, damit sich die Afrikanische Schweinepest nicht nach Deutschland ausbreitet.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Von Johanna Sagmeister mehr.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Außerdem: die Top-News, Trump im Reality-Check und Harald Schmidt im Schnee-Stau.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". SPIEGEL DAILY, täglich um 17 Uhr.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Die hatte Präsident Trump im 'Shithole'-Skandal verteidigt.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Neue Regeln auf YouTube Für One-Hit-Wonder gibt's kein Geld mehr Es wird schwerer, auf YouTube Geld zu verdienen: Unter dem Druck der Werbebranche ändert Google seine Regeln.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Von Markus Böhm mehr.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Jetzt stehen fünf Personen vor Gericht: Wie viel Schuld tragen sie an dem Unglück?,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Das sagen Betroffene.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,"? Vordenker der Neuen Rechten Die Offenbarung des Jean Raspail 1973 veröffentlichte ein Franzose einen Zukunftsroman, der von einem Flüchtlingsansturm handelt, einem Schiffsunglück und einem Papst namens Benedikt.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Von Alexander Smoltczyk mehr.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Altkanzler-Witwe Maike Kohl-Richter 'Ich gelte als Monster' Nach dem Tod von Helmut Kohl eskalierte der Streit zwischen den Hinterbliebenen des Altkanzlers.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Ihre Vorwürfe klingen bitter.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Im letzten Spiel der Vorrunde gab es gegen Mazedonien erneut ein Unentschieden.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Nach Remis gegen Deutschland: Handball-Verband weist Einspruch Sloweniens ab Angelique Kerber bei Australian Open Mehr Finesse dank Fissette Nach einem beispiellosen Absturz in der Weltrangliste hat Angelique Kerber zu alter Stärke zurückgefunden.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Von Bastian Midasch mehr.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. US-Konkurrentin Tonya Harding räumte später Mitschuld ein und hofft nun auf Vergebung - dank Hollywood.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Fotostrecke: Die Prinzessin und die Eishexe Basketball brutal: 'The Punch' - fast zu Tode geprügelt Berlin Fashion Week Sieht jut aus Fashion Week in Berlin.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Von Philipp Löwe mehr.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Hier ist das Video.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Produkttest Große Schnauze, nichts dahinter Die Selbstoptimierung kennt keine Grenzen: Ein Mundstück verspricht ein strafferes, schmaleres Gesicht bereits nach kurzem Tragen.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Produkttest: Straff mit Stoffmaske - geht das?,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Hier können Sie einen Blick in die Luxusvilla werfen.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Sascha Lobo: der Debatten-Podcast #21.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Britisches Unterhaus Abgeordneter verschläft Brexit-Debatte Missbrauchsskandal im US-Turnen: Opfer sagen gegen Teamarzt Nassar aus Trump-Satirevideo: Ein 'Shithole' schlägt zurück Slacklining in Nazaré: Balanceakt vor (und in) Riesenwellen Ein Jahr Trump: Die Gewinner im Trump-Staat Texas Jusos gegen Schulz: 'Nie, nie, nie wieder GroKo!",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Vielleicht sollte sie sich auf eine ihrer Grundideen besinnen: die Folgen der Maschine gesellschaftlich zu bewältigen.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Das verkündet das Model auf Instagram - und berichtet von ihren Gründen.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Neuzugang im Londoner Zoo Ein Okapi namens Meghan Meghan ist bildhübsch, topfit und wurde innerhalb kürzester Zeit zum Star.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Wäre da nicht das gestreifte Hinterteil.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Prozess in Dresden: Bundesanwaltschaft fordert lange Haftstrafen für 'Gruppe Freital' Missbrauchsfall bei Freiburg: 'Die Richter haben sich überschätzt' Rekordwinter in den USA: Eisige Landschaften Himmelskörper: Meteor rast über Michigan hinweg Gegenbilder: Neueste Werke des Künstlers Thomas Demand Tarnnamen von Ex-Agent Werner Mauss = Richard Nelson = Claus Möllner Seit mehr als 30 Jahren arbeitet Werner Mauss nicht mehr als Geheimagent für das Bundeskriminalamt.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". GroKo-Debatte in der SPD Die Vorzeige-Demokraten Man kann sich über die SPD prima lustig machen in diesen Tagen: Seht, wie sie sich wieder zerlegen!",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Ein Kommentar von Florian Gathmann mehr.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Vor dem Oberlandesgericht Düsseldorf äußert ein Gutachter Zweifel am Vorgehen der Behörde.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Finanzindustrie EU-Bürgerbeauftragte fordert Draghis Austritt aus Lobby-Forum Zwischen Finanzindustrie und Notenbank soll eine klare Trennung her.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Zeitungsbericht: Britische Supermärkte produzieren eine Million Tonnen Plastikmüll jährlich Sportmodefirma: Reitzle wird Aufsichtsratschef bei Bogner Pyeongchang 2018 Nord- und Südkorea stellen gemeinsames Team für Olympia Südkorea hat bestätigt, dass Nordkorea der Bildung einer gemeinsamen Damen-Eishockeymannschaft zustimmt.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Missbrauchsskandal im US-Turnen Opfer sagen unter Tränen gegen Nassar aus Ein schwerer Tag für die Opfer: Vor Gericht haben Turnerinnen unter Tränen ausgesagt, die von dem Teamarzt Larry Nassar missbraucht worden sind.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Abstimmung: EU-Parlament will Elektrofischerei weiter einschränken Pumpspeicher: Tüftler machen Gefällekraftwerk ohne Gefälle möglich Wachsende Population: Wölfin 'Naya' aus Mecklenburg läuft bis nach Brüssel '4 Blocks' Rapper Gzuz ist bei der zweiten Staffel dabei Ende Januar ist Drehstart, nun werden erste Details zur zweiten Staffel der gefeierten deutschen Gangster-Serie '4 Blocks' bekannt.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Alec Baldwin über Kritik an Woody Allen 'Unfair und traurig' Immer mehr Schauspieler wenden sich wegen des Vorwurfs des Kindesmissbrauchs von Woody Allen ab.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Fernsehjahr 2017: 'Babylon Berlin', 'Hindafing' und '4 Blocks' für Grimme-Preis nominiert Regisseur von 'Police Academy': Hugh Wilson ist tot Studenten im Heidelberger Nachtleben Bloß keinen 'warmen Erpel' trinken Spätestens um 4 Uhr morgens ist in Heidelberg Schluss mit Party: Es gilt eine strenge Sperrstunde.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Ost-West-Austausch Warum Schüler aus NRW nach Sachsen fahren - und umgekehrt Ist fast 30 Jahre nach der Wende noch ein Schüleraustausch zwischen Ost- und Westdeutschland nötig?,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Manche Schulen halten trotzdem daran fest.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Baden-Württemberg: Das Versicherungsgeschäft mit den Schülern Ostbeauftragte der Bundesregierung: Gleicke lehnt Ost-West-Schüleraustausch ab Für US-Markt Chinesischer Konzern nennt Automarke 'Trumpchi' um Ein chinesischer Konzern will eine Automarke auf den US-Markt bringen.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Malaysia: Yabba, dabba, doo - der Sultan fährt das Auto von Fred Feuerstein Winfried Kretschmann: Ein Ministerpräsident redet übers Blech Autogramm Ford Ecosport: Gut durchgeliftet Sterberisiko Jeder Vierte stirbt an einer Herzkrankheit Die größten Gefahren für das Leben drohen den Deutschen durch Infarkte, Organschwächen und koronare Herzkrankheiten.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Tech-Neuheiten in Bildern: 50 Gadgets von der CES 2018 Strafbare Inhalte: Staatssekretär Kelber warnt soziale Netzwerke Horrormeister John Carpenter zum 70.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Jetzt wird der Meister des Horrors 70 Jahre alt.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Gamal Abdel Nasser Der letzte Pharao Gamal Abdel Nasser wäre heute 100 Jahre alt geworden.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Honeckers letzte Reise ins Exil: Der Passagier auf Platz 13A Selbsttötung von Ramón Sampedro: Das Recht zu sterben Befristete Verträge rechtens Torwart Heinz Müller verliert Prozess vor Bundesarbeitsgericht Fußballprofis verdienen oft Millionen und sind doch prekär beschäftigt, mit Fristverträgen.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Bundesverfassungsgericht Kippt das Streikverbot für Lehrer?,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. So steht es im Grundgesetz.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,"? Vier Lehrer haben geklagt, am Mittwoch verhandelt das Bundesverfassungsgericht.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Jobwechsel zur Konkurrenz: So lässt sich eine Bewerbung geheim halten Falscher Raketenalarm auf Hawaii: Auch diese Job-Pannen sorgten für Chaos Missbrauchsskandal im US-Turnen Ein schrecklicher Ort Auch Superstar Simone Biles war Opfer im Missbrauchsskandal des US-Kunstturnens.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Grundsteuer vor dem Verfassungsgericht Unter jedem Dach droht ein Ach Seit Jahrzehnten bekommt die Politik keine Reform der völlig veralteten Grundsteuer hin.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Für Hausbesitzer und Mieter könnte das massive Steuererhöhungen bedeuten.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Nun zeigt sich: Die Ergebnisse dieser wissenschaftlichen Methode werden immer ungenauer.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Wie reagiert man am besten?,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Viele der Looks werden Sie bald in den Schaufenstern der Geschäfte sehen.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Von Haute Couture zur Haute Cuisine: Schmeckt's Schwein besser, wenn Gucci kocht?",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Dafür muss er manchmal schummeln.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Vielleicht sollte sie sich auf eine ihrer Grundideen besinnen: die Folgen der Maschine gesellschaftlich zu bewältigen.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Die IT-Sicherheitsfirma Kaspersky Lab hat eine solche Malware nun entdeckt.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Tech-Neuheiten in Bildern: 50 Gadgets von der CES 2018 Strafbare Inhalte: Staatssekretär Kelber warnt soziale Netzwerke Horrormeister John Carpenter zum 70.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". Mode: Diese Jogginghosen wollen wir jetzt sofort anziehen Geheimnisse eines Kochs: 'Es wird gesoffen, gebrüllt, gekokst' Irans Spione in Deutschland Im Auftrag der Mullahs Wie ein Geheimdienst-General in Teheran sein internationales Agenten-Netzwerk steuert - und was seine Leute in der Bundesrepublik treiben.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,". SPIEGEL DAILY, täglich um 17 Uhr.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,? Sudoku: Der Logik-Klassiker für jeden Tag Kenken: Das Sudoku mit plus und mal Zu den Cartoons des Monats Steinhoff: Wie die US-Bankelite sich die Finger an Steinhoff verbrannte Alternativen zur 'Sardinenbüchse' S-Klasse: Diese Autos müssten selbst für Winfried Kretschmann groß genug sein Bitcoin stürzt Richtung 9000 Dollar: Krypto Absturz geht weiter Bitte deaktivieren Sie Ihren Adblocker!,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Wählen Sie die Option „Deaktivieren auf: spiegel.,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Vielen Dank!,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,"? Bitte prüfen Sie, ob Sie ähnliche Erweiterungen, Do-not-Track-Funktionen oder den Inkognito-Modus aktiviert haben, die ebenfalls Werbung unterdrücken.",1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,? Hier finden Sie mehr Informationen .,1.0
SPIEGEL ONLINE - Aktuelle Nachrichten,sentences,. Sie haben einen anderen Browser?,1.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Verbraucherschützer sind alarmiert.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Sie kannte das schon.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Und einer ist immer hellgrün.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Zu Schuljahresbeginn werden in Baden-Württemberg an staatlichen und privaten Schulen von den Klassenlehrern Versicherungspolicen an die Schüler verteilt.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Die einen sind hellgrün, die anderen rosa.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Die Versicherung kostet nicht viel, nur einen Euro pro Schuljahr.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Wie der Mutter aus Esslingen geht es Hunderttausenden Eltern in Baden-Württemberg.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Manche füllen auch eine der Zusatzversicherungen aus für Garderobe (ein Euro), Fahrrad (sechs Euro), Musikinstrumente (sechs Euro) und für Internatsschüler (sechs bis sieben Euro).",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. In der Regel zahlt die gesetzliche Versicherung Dabei ist eine Schülerzusatzversicherung nach Ansichten von Branchenkennern kaum notwendig.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Und die meisten Familien haben auch schon Haftpflichtversicherungen.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Bei den 167.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Die kennen sie, weil sie dort einen Euro einzahlen müssen.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Die Schule sollte seiner Ansicht nach ein geschützter und werbefreier Ort sein: 'Dort sollten keine solchen Geschäfte stattfinden.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,"? Google, Lego, Apple im Klassenraum: Die wollen doch nur helfen - oder?",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Sie widerspreche einer Verwaltungsvorschrift vom September 2002 zur 'Werbung für wirtschaftliche, politische, weltanschauliche und sonstige Interessen' an baden-württembergischen Schulen, so Breun-Goerke.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. In anderen Bundesländern kennt man solche Geschäfte in Schulen nicht.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Dabei ist es das gar nicht', erklärt Peter Grieble von der Verbraucherzentrale Baden-Württemberg.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Das Angebot sei lückenhaft und decke nur einen sehr kleinen Ausschnitt ab.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Vorwürfe, die die Versicherer zurückweisen.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Er hatte sich bei seinem Schulleiter darüber beschwert, auch noch als Versicherungsmakler agieren zu müssen.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Notfalls müsse man bei den Schülern, die keine Police abgeben wollten, eben Druck machen.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Verbraucherschützer kritisieren solche Praktiken schon lange.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Kritisch sehen die Verbraucherschützer auch, dass es keinerlei Beratung beim Verkauf der Versicherungen gebe.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Die 'Mitwirkung der Lehrkräfte', sekundiert auch das Ministerium, falle 'kaum ins Gewicht'.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Sie müssen lediglich die Policen an die Schulen senden.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Die Schulverwaltungen überweisen die Beiträge an die Konzerne.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Bei einem bis acht Euro Einnahmen pro Schüler kämen Millionen für den Versicherer zusammen, ist sich Ralph Audörsch sicher.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Er ist in den Schulen seiner drei Kinder im Alter zwischen 8 und 18 Jahren Elternvertreter und wettert im Internet gegen die Verträge.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Während die WGV auch hierzu die Auskunft verweigert, gibt die BGV an, man bearbeite pro Schuljahr 'mehrere tausend Schadensfälle'.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Werbeaktion im Unterricht: Zweitklässler singen während der Schulzeit bei Rewe (22.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Diskutieren Sie über diesen Artikel ''Denen wurde gesagt: Wenn ihr da nicht dabei seid, dann dürft ihr zu keinem Ausflug mehr mitfahren', erzählt Juliane S.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Aber auch [.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Aber auch das der Eltern, die ganz kritiklos unterschreiben.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Sicher kann man sich über die Sinnhaftigkeit einer zusätzlichen Unfallversicherung bei Vorhandensein der gesetzlichen Unfallversicherung [.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Sicher kann man sich über die Sinnhaftigkeit einer zusätzlichen Unfallversicherung bei Vorhandensein der gesetzlichen Unfallversicherung streiten bzw.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Aber alleine die Instrumentenversicherung (6,- EUR pro Jahr) ist für alle Schüler sinnvoll, die ein Instrument mit zur Schule bringen, und das ist bei einer Vielzahl der Schüler der Fall.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Ich selber kenne zahlreiche Fälle, in denen Schäden wie Instrumentenreparatur oder Garderobenklau unbürokratisch und kulant geregelt wurden.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Die Behauptung des Versicherungsagenten, es hätte keine einzige Regulierung gegegen, ist schlichtweg Blödsinn.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Die reine Information, dass es solche Zusatzversicherungen gibt, ist aber m.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Zitat: Die Konzerne halten dagegen, das sei wegen der Geringfügigkeit der Police von einem Euro gar nicht notwendig.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Die 'Mitwirkung der Lehrkräfte', sekundiert auch das Ministerium, falle 'kaum ins Gewicht'.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Meiner Meinung nach ist die Mitwirkung der Lehrkräfte geradezu essentiell: wer sonst als die Lehrer kennt die Schüler, kann diese überzeugen, verfügt zudem noch über die Adressen dieser Zielgruppen und ist bereit, den ersten Schritt in dieser Akquise zu übernehmen?",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Das dadurch gewonnene Adress- und Datenmaterial ist das eigentliche 'Gold' für die Versicherer.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Eine Beratung ist nicht notwendig?,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Ansonsten ist eine Beratung über Art und Umfang der [.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Ansonsten ist eine Beratung über Art und Umfang der Versicherung Pflicht.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Im schlimmsten Fall kündigt der Kunde eine vorhandene besser ausgestatte Versicherung (oder schließt sie gar nicht ab), weil er glaubt, das eine ausreichende Versicherung besteht.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Makler, Versicherungsberater, Vermittler werden zu umfangreicher Dokumentation gezwungen und haften für die Richtigkeit Ihrer Empfehlung und hier werden Versicherungsverträge einfach so klammheimlich unters Volk gebracht?",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Wenn die Versicherung keine Gewinne machen würde dann würde sie die Versicherung gar nicht anbieten.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Wie einfältig müssen doch manche echt sein.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Das SPON-Forum: So wollen wir debattieren Alle Rechte vorbehalten Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH Die Homepage wurde aktualisiert.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Bitte deaktivieren Sie Ihren Adblocker!,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Vielen Dank!,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,"? Bitte prüfen Sie, ob Sie ähnliche Erweiterungen, Do-not-Track-Funktionen oder den Inkognito-Modus aktiviert haben, die ebenfalls Werbung unterdrücken.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,? Hier finden Sie mehr Informationen .,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Sie haben einen anderen Browser?,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Verbraucherschützer sind alarmiert.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Sie kannte das schon.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Und einer ist immer hellgrün.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Zu Schuljahresbeginn werden in Baden-Württemberg an staatlichen und privaten Schulen von den Klassenlehrern Versicherungspolicen an die Schüler verteilt.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Die einen sind hellgrün, die anderen rosa.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Die Versicherung kostet nicht viel, nur einen Euro pro Schuljahr.",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,. Wie der Mutter aus Esslingen geht es Hunderttausenden Eltern in Baden-Württemberg.,2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL ONLINE,sentences,". Manche füllen auch eine der Zusatzversicherungen aus für Garderobe (ein Euro), Fahrrad (sechs Euro), Musikinstrumente (sechs Euro) und für Internatsschüler (sechs bis sieben Euro).",2.0
Baden-Württemberg: Lehrer verteilen Angebote für unnötige Zusatzversicherungen - SPIEGEL
kind regards
Tobias

Related

Selecting sentences keyword-based but tokenizing into words with spacyr

I analyse political speeches and would like first parse them into sentences using spacyr. Then I would like to not only select sentences that contain certain keywords but also the ones before and after. Lastly, these texts should be tokenized into words for the following steps of quantitative text analysis.
data <- c(" frau bundesminister! österreich braucht auch in zukunft eine leistungsfähige und umweltfreundliche verkehrsinfrastruktur. es geht darum, schiene und straße gleichermaßen auszubauen, es geht darum, dass die öbb ihre hausaufgaben wahrnehmen und auch die asfinag. für uns ist ganz wichtig, dass gerade bei der asfinag unpolitisch gearbeitet wird. hinsichtlich der führung haben wir klar gemacht, dass eine verfassungsrichterin als aufsichtsratsmitglied unvereinbar ist, da der verfassungsgerichtshof regelmäßig mit verfahren in straßenverkehrsangelegenheiten befasst ist. was werden sie unternehmen, frau bundesminister, um die unabhängigkeit der rechtsprechung des verfassungsgerichtshofes, die durch die bestellung eines von ihnen politisch abhängigen verfassungsrichters höchst gefährdet ist, wiederherzustellen?")
court_tks <- spacy_tokenize(data$text,
what = "sentence",
remove_punct = TRUE,
remove_symbols = TRUE,
remove_numbers = TRUE) %>%
tokens() %>%
tokens_select(c("*verfassungsgericht*", "*vfgh*"))
This is my current code, which tokenizes in sentences and selects the sentences that contain the keywords, but I don't know how to also select the sentences before and after and tokenize into words not sentences in the end.

Umwandlung Shapefiles von LST120 zu LST100 mit Hilfe der HeTA2010.gsb bei QGIS [closed]

Closed. This question is not written in English. It is not currently accepting answers.
Stack Overflow is an English-only site. The author must be able to communicate in English to understand and engage with any comments and/or answers their question receives. Don't translate this post for the author; machine translations can be inaccurate, and even human translations can alter the intended meaning of the post.
Closed 4 days ago.
Improve this question
Ich würde gerne Daten, die noch im Gauss-Krüger Ellipsoid (EPSG:31467) projiziert sind, in UTM (EPSG:25832) umwandeln im Bereich Hessen. Also von Lagestatus 100 auf 120. Mit QGIS lässt sich aber nur ein ATKIS Gitternetz für Baden Württemberg angezeigt. Das für Hessen ist ausgegraut und sucht nach einer Datei (Heta2010.gsb) die nicht auf dem System installiert ist.
Ich habe die Datei nun in einem Archiv heruntergeladen und installiert. Die Transformation lässt sich jetzt auswählen aber spuckt anschließend folgende Fehlermeldung aus:
Kann Projekttransformation zwischen EPSG:25832 und EPSG:31467 nicht verwenden
Diese Projekt gibt eine voreingestellte Transformation zwischen EPSG:31467 - DHDN / 3-degree Gauss-Kruger zone 3 und EPSG:25832 - ETRS89 / UTM zone 32N an, die auf diesem System nicht verfügbar ist.
Diese Transformation erfordert die Gitterdatei "HeTa2010.gsb", die nicht auf dem System verfügbar ist.
Die in diesem Projekt zur Verwendung angegebene Operation ist:
+proj=pipeline +step +inv +proj=tmerc +lat_0=0 +lon_0=9 +k=1 +x_0=3500000 +y_0=0 +ellps=bessel +step +proj=hgridshift +grids=HeTa2010.gsb +step +proj=utm +zone=32 +ellps=GRS80
Wenn ich nun die Gitternetzdatei aus dem Verzeichnis installieren möchte gibt es folgende Fehlermeldung:
Konnte HeTa2010.gsb nicht nach HeTa2010.gsb kopieren. Bitte die Zugriffsrechte überprüfen und nocheinmal versuchen.
Hat jemand eine Idee wie das zu lösen wäre oder einen alternativen Ansatz parat?

Scrape <ul> with corresponding <p> tag

I have the following html snipped:
<div class="main--content">
<p> <strong>Ihre Aufgaben:</strong> </p>
<ul>
<li>Zentraler Ansprechpartner für den gesamten Mitarbeiterlebenszyklus
</li>
<li>Partnerschaft mit den Geschäftsbereichen, um innovative Lösungen für die Mitarbeitererfahrung zu implementieren und zu entwickeln
</li>
<li>Beratung zur Nachfolgeregelung, Analyse der Talentpyramide und Aufbauempfehlungen
</li>
<li>Unterstützung der Führungseffektivität durch die Bereitstellung von Analyseberichten und die Nutzung der aktuellen HR-Strategie
</li> <li>Evaluierung von HR-Richtlinien und -Prozessen
</li>
<li>Erstellen und Entwickeln neuer Aktivitäten zur Verbesserung des Mitarbeiterengagements
</li>
<li>Sicherstellen, dass der HRBP-Bereich eng mit den Geschäfts- und HR-Stakeholdern verbunden ist
</li>
<li>Tätigkeit als Moderator und innovatives Teammitglied bei der Umsetzung globaler HR-Projekte
</li>
</ul>
<p>Ihr Profil:</p>
<ul>
<li>Kaufmännische Ausbildung mit Weiterbildung als Eidg. Dipl. HR-Fachfrau/mann
</li>
<li>Mehrjährige Berufserfahrung in einer ähnlichen Funktion
</li>
<li>Effektive Präsentations- und Kommunikationsfähigkeiten
</li>
</ul>
</div>
I want to extract the title, in this case whatever is written in the p tag and the corresponding list elements.
I can get the p and ul elements from this, but I am not able to dynamically give the structure.
I work with rvest
Following chunk returns the list elements:
tmp %>% rvest::html_elements("ul > li")
[1] <li>Zentraler Ansprechpartner für den gesamten Mitarbeiterlebenszyklus</li>
[2] <li>Partnerschaft mit den Geschäftsbereichen, um innovative Lösungen für die Mitarbeitererfahrung zu implementieren und zu entwickeln</li>
And the titles:
tmp %>% rvest::html_elements("p")
[6] <p> <strong>Ihre Aufgaben:</strong> </p>
[7] <p>Ihr Profil:</p>
Is there a way to extract the list to a dataframe or list?
library(rvest)
library(purrr)
doc <- minimal_html('<div class="main--content">
<p> <strong>Ihre Aufgaben:</strong> </p>
<ul>
<li>Zentraler Ansprechpartner für den gesamten Mitarbeiterlebenszyklus
</li>
<li>Partnerschaft mit den Geschäftsbereichen, um innovative Lösungen für die Mitarbeitererfahrung zu implementieren und zu entwickeln
</li>
<li>Beratung zur Nachfolgeregelung, Analyse der Talentpyramide und Aufbauempfehlungen
</li>
<li>Unterstützung der Führungseffektivität durch die Bereitstellung von Analyseberichten und die Nutzung der aktuellen HR-Strategie
</li> <li>Evaluierung von HR-Richtlinien und -Prozessen
</li>
<li>Erstellen und Entwickeln neuer Aktivitäten zur Verbesserung des Mitarbeiterengagements
</li>
<li>Sicherstellen, dass der HRBP-Bereich eng mit den Geschäfts- und HR-Stakeholdern verbunden ist
</li>
<li>Tätigkeit als Moderator und innovatives Teammitglied bei der Umsetzung globaler HR-Projekte
</li>
</ul>
<p>Ihr Profil:</p>
<ul>
<li>Kaufmännische Ausbildung mit Weiterbildung als Eidg. Dipl. HR-Fachfrau/mann
</li>
<li>Mehrjährige Berufserfahrung in einer ähnlichen Funktion
</li>
<li>Effektive Präsentations- und Kommunikationsfähigkeiten
</li>
</ul>
</div>')
## get all p and ul elements
p_and_ul <- doc %>% html_elements("p,ul")
## which of these elements are p elements?
is_p <- p_and_ul %>% html_element("li") %>% is.na()
## for each ul element get the li children
all_li <- map(p_and_ul[!is_p], ~ html_elements(.x, "li"))
## put all results togteher
res <- vector("list", length(p_and_ul))
res[is_p] <- map_chr(p_and_ul[is_p], as.character)
res[!is_p] <- map(all_li, as.character)
unlist(res)
# [1] "<p> <strong>Ihre Aufgaben:</strong> </p>"
# [2] "<li>Zentraler Ansprechpartner für den gesamten Mitarbeiterlebenszyklus\n </li>"
# [3] "<li>Partnerschaft mit den Geschäftsbereichen, um innovative Lösungen für die Mitarbeitererfahrung zu implementieren und zu entwickeln\n </li>"
# [4] "<li>Beratung zur Nachfolgeregelung, Analyse der Talentpyramide und Aufbauempfehlungen\n </li>"
# [5] "<li>Unterstützung der Führungseffektivität durch die Bereitstellung von Analyseberichten und die Nutzung der aktuellen HR-Strategie\n </li>"
# [6] "<li>Evaluierung von HR-Richtlinien und -Prozessen\n </li>"
# [7] "<li>Erstellen und Entwickeln neuer Aktivitäten zur Verbesserung des Mitarbeiterengagements\n </li>"
# [8] "<li>Sicherstellen, dass der HRBP-Bereich eng mit den Geschäfts- und HR-Stakeholdern verbunden ist\n </li>"
# [9] "<li>Tätigkeit als Moderator und innovatives Teammitglied bei der Umsetzung globaler HR-Projekte\n </li>"
# [10] "<p>Ihr Profil:</p>"
# [11] "<li>Kaufmännische Ausbildung mit Weiterbildung als Eidg. Dipl. HR-Fachfrau/mann\n </li>"
# [12] "<li>Mehrjährige Berufserfahrung in einer ähnlichen Funktion\n </li>"
# [13] "<li>Effektive Präsentations- und Kommunikationsfähigkeiten\n </li>"

multiple xml files from directory to character strings in R

I have seen several similar questions, but none that addressed specifically my problem:
given a novel in xml file (this is a very small cut from the start and the end)
<?xml version="1.0" encoding="UTF-8"?>
<?xml-model href="https://github.com/COST-ELTEC/Schemas/raw/master/eltec-0.rng" type="application/xml"schematypens="http://relaxng.org/ns/structure/1.0"?>
<?xml-model href="https://github.com/COST-ELTEC/Schemas/raw/master/eltec-0.rng" type="application/xml"schematypens="http://purl.oclc.org/dsdl/schematron"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xml:id="CHE-DEU011" xml:lang="de">
<teiHeader>
<fileDesc>
<titleStmt>
<title>Pilatus. Eine Erzählung aus den Bergen: ELTeC ausgabe</title>
<author ref="https://en.wikipedia.org/wiki/Heinrich_Federer">Federer, Heinrich (1866-1928)</author>
<respStmt>
<resp>ELTeC conversion</resp>
<name>Priska Rüegg</name>
</respStmt>
</titleStmt>
<extent>
<measure unit="pages">360</measure>
<measure unit="words">79740</measure>
</extent>
<publicationStmt>
<publisher ref="https://distant-reading.net">COST Action "Distant Reading for European Literary History" (CA16204)
</publisher>
<distributor ref="https://zenodo.org/communities/eltec/">Zenodo.org</distributor>
<date when="2020"/>
<availability>
<licence target="https://creativecommons.org/licenses/by/4.0/"/>
</availability>
</publicationStmt>
<sourceDesc>
<bibl type="digitalSource">
<ref target="https://archive.org/details/pilatuseineerz00fedeuoft/page/n3/mode/2up"/>
<respStmt><resp>Scan</resp>
<name>archive</name></respStmt></bibl>
<bibl type="firstEdition">
<title>Pilatus. Eine Erzählung aus den Bergen</title>
<author>Federer, Heinrich</author>
<publisher>G. Grote`sche Verlagsbuchhandlung</publisher>
<pubPlace>Berlin</pubPlace>
<date>1912</date>
</bibl></sourceDesc>
</fileDesc>
<encodingDesc n="eltec-0">
<p></p>
</encodingDesc>
<profileDesc>
<langUsage>
<language ident="de">German</language>
</langUsage>
<textDesc>
<authorGender xmlns="http://distantreading.net/eltec/ns" key="M"></authorGender>
<size xmlns="http://distantreading.net/eltec/ns" key="medium"></size>
<reprintCount xmlns="http://distantreading.net/eltec/ns" key="low"></reprintCount>
<timeSlot xmlns="http://distantreading.net/eltec/ns" key="T4"></timeSlot>
</textDesc>
</profileDesc>
<revisionDesc>
<change when="2020-10-27"> I created the document. The Scan is used only to check page beginnings, paragraphs, chapters and heads.</change>
<change when="2020-11-08">I revised the document. I put "–" instead of "+"; I put "!" instead of "]". I checked the headers. In the original the chapter number 23 appears twice. I encoded a header appearing on two lines as two succesive headers as element p is not allowed.</change>
</revisionDesc>
</teiHeader>
<text>
<body>
<pb n="1"/>
<div type="liminal">
<p>Ich will hier die Geschichte des Marx Omlis erzählen.
Er ist frühauf ein Schlingel und daneben Hirt
und Jäger und Bergführer und sonst noch viel Unruhiges gewesen. In seinem Leben gibt es leichte und
schwere Kapitel und mit so bunten Gesichtern, daß man
zweifeln könnte, ob es immer der nämliche Held sei.
Aber immer schauen die gleichen Berge herein mit
langen, grauen Felsenleibern und Silberhüten auf dem
Kopf. Und immer leuchten die gleichen grünen Alpen
aus ihrem Schoß herauf und schellt und brüllt es vom
gleichen braunscheckigen Vieh um all die niedrigen Stadel
und ihre alten, steinbeschwerten Schindeldächer. Vor
allem aber dräut aus jedem Blatt immer der gleiche
wilde und schöne Kopf des Pilatus gen Himmel. Und
am Pilatus klebt und hängt das Leben des Marx Omlis
fest. Von ihm hat er sich nicht losmachen können, so
weit er auch floh. Der graue, alte Berg spielt die
Hauptrolle in seinem Leben. Er war sein Freund und
Feind, ist seine Wiege und sein Grabstein geworden.
~ Ich will mich sammeln und alles sachte und gelassen meinen lieben, besinnlichen Lesern auskramen.</p></div>
<div type="chapter">
<head>I.</head>
<p>Unser Gebirgsstädtchen hat ein Gymnasium mit
sehr weisen Lehrern, sehr tiefen Tintengeschirren und
sehr langen Sommerferien. Aber das beste von allem
sind doch die breiten, großscheibigen Fensterreihen rundum am Haus gewesen. Da drang ein unsäglich reiner,
am Horn in der andern Hand, alles hübsch nebeneinander gebettet, Mensch und Tier und Fels und
Schnee. Und weil diese Buben noch so frisch und jung
sind und darum vor dem Tod noch einen heiligen Respekt haben, so ziehen sie vor dem schönen, langen, stillen
Mann und seinem zierlichen Tier ihre Filzhüte ab und
sagen fromm: „Herr, gib ihnen die ewige Ruhe !“</p></div>
</body>
</text>
</TEI>
of which I am only interested in the "text" (body of the book), I managed to extract it from a single file with the following code:
library(XML)
library(tidyverse)
test <- "files/Federer1912_Pilatus.xml"
xmldoc <- xmlParse(test)
rootNode <- xmlRoot(xmldoc)
# rootNode[1]
data <- xmlSApply(rootNode,function(x) xmlSApply(x, xmlValue))
cd.catalog <- data.frame(t(data),row.names=NULL)
federer_1912_pilatus <- cd.catalog$text
federer_1912_pilatus <- federer_1912_pilatus[["text"]]
Is there a way to loop this operation for each of the many xml files in a specific folder, called "files"?
And eventually would it be possible to put all the extracted strings directly in a data.frame with two variables: one for the "book_name" - in which for example "federer_1912_pilatus" will appear for the text above - and one for the "text" itself?
This could be achieved like so:
Put your code in a function which takes a filename as an argument
Use list.files to get a vector of all xml files in your directory
Use e.g. lapply to loop over the files, which will return a list of your texts.
get_text <- function(fn) {
xmldoc <- xmlParse(fn)
rootNode <- xmlRoot(xmldoc)
# rootNode[1]
data <- xmlSApply(rootNode,function(x) xmlSApply(x, xmlValue))
cd.catalog <- data.frame(t(data),row.names=NULL)
x <- cd.catalog$text
x[["text"]]
}
xml_files <- list.files(path = "files", pattern = "\\.xml", full.names = TRUE)
lapply(xml_files, get_text)
EDIT Instead of looping via lapply you could make use of purrr::safely and purrr::map. This does not solve the issue with the corrupted xml files but takes care of the error. The following code will return a list res with the results for non-corrupted files and a list of the corrupted files:
get_text_safe <- purrr::safely(get_text)
texts <- purrr::map(xml_files, get_text_safe)
texts <- purrr::transpose(texts)
# Error
id_error <- map_lgl(texts$result, ~ is.null(.x))
# Results for files which are fine
res <- texts$result[!id_error]
fn_error <- xml_files[id_error]
fn_error

R/Tesseract for multiple columns: How can I recognize different parts of a text?

I have scans of some thousand pages of an old swiss computer magazine and am going to make it public as a part of my Masters Thesis. But first I want to do an OCR with R/Tesseract on all the pages and then maybe play around with quanteda.
At this point, I am running a loop that converts the pages to pdf and png, reads ocr and creats a txt file from it. This works pretty well and all the files are converted.
However, as I'm working with a magazine all the pages are structured differently. I have advertising, single columns multiple columns, etc. I cannot make Tesseract recognize the columns and even if it gives me the parting lines (which it does sometimes) I cannot figure out how to structure it the right way.
I'm using this for the OCR:
file <- images_test %>%
image_convert(type = 'Grayscale') %>%
image_write(format = 'png')
text <- tesseract::ocr(file, engine = tesseract("deu"))
write(text, file = txtpfad)
And my results look like this:
RUND UM DEN IBM-PC 2 IN Ir ne Bytes pro Sektor. Mit der Datenüber- Gruppe von schnellen Arbeitsplatz- estate von 250 Kbits/Sekunde ISSCO
Software rechnern besteht eine separate können die 10 MB in acht
Minuten f d DE Be Sr aufgezeichnet oder rückgelesen wer- nfo: ultitec
: an . (streaming mode/Einmaldurch- au em neuen Bar 66, 3000 Bern 22,
Tel. 4 lauf). Die drei weiteren Modelle des C . Produktprogrammes
(Irwin 120, 125 IBM RT P und 325) haben pro Datenkassette .. = sogar
eine Kapazität von 20 MB. Die erhältlich einzelnen Einheiten
unterscheiden AT A a l sich jeweils in der Uebertragungsge- von pica
schwindigkeit, der Gerätegrösse und Die Freigabe der 32-Bit Work- in
der Art des Aufbaus (Einbau- oder | station von IBM (amerikanische Die
Personal Computer der AT Peripherie-Gerät) Bezeichnung: IBM RT PC)
erfolg- | Serie von APICAL erfüllen alle Die beiden Einbaumodelle
(Irwin | te erst kürzlich. Schon meldet | Anforderungen, die heute an
ei- 120 und 125) werden wiederum di- | MULTITEC, dass die auf Gross- |
nen IBM-AT Kompatiblen gestellt rekt an den im PC eingebauten Flop- |
rechnern und Minicomputern | werden. Und mehr. Sie sind nicht
py-Kontroller angeschlossen. Da die | verbreiteten Grafik-Software- |
nur kompatibel, sondern, wie Datentransferrate dieser beiden Ge- |
Pakete DISSPLA, TELL-A-GRAF, | es sich für einen Rechner der räte bei
500 Kbits/Sekunde liegt, | TELLAPLAN und CUECHART | Spitzenklasse
gehört, obendrein werden die 20 MB in nur knapp neun | jetzt auch auf
(...)
Found a solution. Tesseract has A LOT of options I have never heard of before. You have to set up your engine the right way first.
deu <- tesseract(language = "deu", options = list(tessedit_pageseg_mode = 1))
text <- ocr(file,engine = deu)
There is still a potential for improvement but it looks a lot better now.

Resources