Neue Anwendung kann Twitter Bots in jeder Sprache erkennen

0

Dank der erfolgreichen Zusammenarbeit zwischen Sprachwissenschaftlern und Spezialisten für maschinelles Lernen kann eine neue Anwendung, die von Forschern der University of Eastern Finland und der Linnaeus University in Schweden entwickelt wurde, Twitter-Bots unabhängig von der verwendeten Sprache erkennen.

In den letzten Jahren haben große Datenmengen aus verschiedenen Social Media-Anwendungen das Web zu einem benutzergenerierten Informationsspeicher in immer mehr Bereichen gemacht. Durch den relativ einfachen Zugriff auf Tweets und deren Metadaten ist Twitter zu einer beliebten Datenquelle für die Untersuchung einer Reihe von Phänomenen geworden. Dazu gehören beispielsweise verschiedene politische Kampagnen, soziale und politische Umbrüche, Twitter als Instrument der Notfallkommunikation und die Nutzung von Social Media Daten zur Vorhersage von Börsenkursen.

Die Forschung unter Verwendung von Daten aus Social Media Daten wird jedoch oft durch das Vorhandensein von Bots verzerrt. Bots sind nicht-personenbezogene und automatisierte Konten, die Inhalte in sozialen Online-Netzwerken veröffentlichen. Die Popularität von Twitter als Instrument in der öffentlichen Debatte hat dazu geführt, dass es zu einem idealen Ziel von Spammern und automatisierten Skripten geworden ist. Es wurde geschätzt, dass etwa 5 bis 10 Prozent aller Benutzer Bots sind und dass diese Konten etwa 20 bis 25 Prozent aller geposteten Tweets generieren.

Forscher der digitalen Geisteswissenschaften an der University of Eastern Finland und der Linnaeus University in Schweden haben eine neue Anwendung entwickelt, die auf maschinelles Lernen zur Erkennung von Twitter-Bots setzt. Die Anwendung ist in der Lage, autogen erzeugte Tweets unabhängig von der verwendeten Sprache zu erkennen. Die Forscher erfassten insgesamt 15.000 Tweets in Finnisch, Schwedisch und Englisch zur Analyse. Finnisch und Schwedisch wurden hauptsächlich für das Training verwendet, während Tweets in englischer Sprache verwendet wurden, um die sprachliche Unabhängigkeit der Anwendung zu bewerten. Die Anwendung ist leicht und ermöglicht es, große Datenmengen schnell und relativ effizient zu klassifizieren.

“Dies erhöht die Qualität der Daten – und zeichnet ein genaueres Bild der Realität”, sagt der Professor für Englisch Mikko Laitinen von der Universität Ostfinnland.

Laut Professor Laitinen sind Bots relativ harmlos, während Trolle Schaden anrichten, wenn sie gefälschte Nachrichten verbreiten und erfundene Geschichten erfinden. Aus diesem Grund besteht Bedarf an immer fortschrittlicheren Tools für das Social Media Monitoring.

“Das ist ein komplexes Thema und erfordert interdisziplinäre Ansätze. So arbeiten wir Linguisten beispielsweise mit Spezialisten für maschinelles Lernen zusammen. Diese Art von Arbeit erfordert auch Entschlossenheit und Investitionen in Forschungsinfrastrukturen, die als Plattform für Forscher aus verschiedenen Bereichen zur Zusammenarbeit dienen.”

Laut Professor Laitinen ist es für Forscher unerlässlich, Zugang zu Social Media Daten zu haben.

“Derzeit sind Daten Eigentum amerikanischer Technologiekonzerne und eine Quelle ihrer Einnahmen. Damit Forscher Zugang zu diesen Daten erhalten, ist eine Zusammenarbeit auf nationaler und internationaler Ebene und insbesondere die Beteiligung der EU erforderlich.”

Share.

Leave A Reply