Erkennen gefälschter Nachrichten mithilfe eines Algorithmus

Veröffentlicht am:

Aktualisiert:

Forscher der Universität von Michigan haben kürzlich hat einen Algorithmus entwickelt das kann gefälschte Nachrichten besser als Menschen identifizieren. Der Algorithmus verwendet linguistische Hinweise, um zwischen sachlichen und ungenauen Geschichten zu unterscheiden.

Der Algorithmus könnte von großen Nachrichtensammlern und sozialen Medien wie Google News und Facebook verwendet werden, um Fehlinformationen zu erkennen und zu bekämpfen.

Kampf gegen gefälschte Nachrichten

Nach der 2016-Wahl wurde „Fake News“ als ein politisches Schlagwort viele spekulierten Die auf Facebook verbreiteten Nachrichtengeschichten beeinflussten die Wahlergebnisse.

Nachrichten, die falsche oder fragwürdige Informationen melden, haben sich in den vergangenen Jahren auf Social-Media-Sites verbreitet. Diese Geschichten, die entweder als Klick-Köder oder mit der Absicht erstellt wurden, die öffentliche Meinung zu beeinflussen, haben Kontroversen in der Politik ausgelöst und große Probleme für Social-Media-Plattformen verursacht, die sich damit abmühen, die riesigen Datenmengen und Nachrichten auf ihren Websites zu regulieren.

Seit der Wahl zu 2016 hat Facebook Maßnahmen ergriffen, um die Verbreitung falscher Inhalte auf ihren Plattformen zu bekämpfen. Sie haben versucht, prominente Benutzer zu verbieten, wie der rechte Kommentator Alex Jones, arbeiten mit Third-Party-Fact-Checker und Benutzern erlauben, ungenaue Geschichten zu melden.

Diese Bemühungen hatten bis zu diesem Punkt nur begrenzten Erfolg, was die Notwendigkeit neuer Strategien für den Eintritt in die Herde erhöhte. Ein Algorithmus, der gefälschte Nachrichten automatisch und genau identifizieren kann, bietet ein ansprechendes Werkzeug.

"In letzter Zeit hat die Forschungsgemeinschaft erhebliche Anstrengungen unternommen, um dieses Problem anzugehen", sagte er Rada Mihalcea, Professor für Elektrotechnik und Informatik bei UM und leitender Forscher des Projekts.

"Die meisten Arbeiten, einschließlich der jüngsten Herausforderungen im Zusammenhang mit gefälschten Nachrichten, konzentrierten sich jedoch auf das Verständnis der Haltung sowie auf die Überprüfung von Behauptungen und Fakten."

"Soweit ich weiß, ist dies das erste System, das die automatische Identifizierung von gefälschten Nachrichten in ihrer Gesamtheit und wie sie normalerweise online erscheinen, behandelt", fuhr sie fort.

Andere Forschungen sind begrenzter gewesen, suchen nach Klick-Köder, oder lernen die Unterscheidung zwischen satirischen und realen Nachrichten, nach Mihalcea.

Momentan verlassen sich gefälschte Nachrichtenseiten hauptsächlich auf menschliche Faktenprüfer, was Zeit kostet. Mit dem überwältigenden Zustrom von Nachrichten, die online veröffentlicht werden, bedeutet dies, dass die meisten falschen Geschichten nicht aufgefangen werden, und wenn sie es sind, wurden sie bereits von genügend Leuten gelesen, um einen Eindruck zu hinterlassen.

Die automatische Verifizierung könnte Nachrichtensammlern und Social-Media-Sites helfen, gefälschte Nachrichten früher und vielleicht genauer zu finden als menschliche Aufsichtsbehörden.

Mihalcea sagte, dass der Algorithmus ihres Teams sowohl von Nutzern als auch von Social-Media-Sites verwendet werden könnte, um Geschichten zu kennzeichnen und zwischen vertrauenswürdigen und nicht vertrauenswürdigen Medien zu unterscheiden. Es hat sich bereits gezeigt, dass gefälschte Nachrichten mit einer Erfolgsrate von 76-Prozent identifiziert werden können. Dies ist eine signifikante Fehlerquote, die jedoch höher ist als die menschliche Erfolgsrate von 70-Prozent.

Wie funktioniert es?

Der neue Algorithmus verwendet einen ziemlich einzigartigen Ansatz zur Identifizierung gefälschter Nachrichten. Es verwendet eine sprachliche Analyse, dh, es untersucht quantifizierbare Merkmale des Schreibstils und des Inhalts jedes Artikels, von seiner grammatikalischen Struktur über die Verwendung der Zeichensetzung bis hin zur Komplexität seiner Sprache.

"Wir haben zunächst einen Datensatz mit gefälschten und legitimen Nachrichten gesammelt, anhand dessen die Merkmale gefälschter Nachrichten ermittelt werden können", sagte Mihalcea. „Wir repräsentieren die Daten mit einer Reihe von Merkmalen - Wortfolgen, Interpunktion, Wortkategorien, syntaktische Beziehungen und andere.

„Zum Beispiel könnte ein solches Merkmal eine Zahl sein, die die Häufigkeit widerspiegelt, mit der wir das Wort 'Geschichte' sehen, ein anderes könnte die Häufigkeit sein, mit der wir Wörter in einer Subjekt-Verb-Beziehung sehen, und so weiter. Diese Vertreter werden dann in den Lernalgorithmus eingespeist, der schließlich entscheidet, wie sie für die endgültige Klassifizierung gewichtet werden. “

Mihalcea erklärte, dass diese Hinweise oft anders sind als die, nach denen Menschen suchen. Zum Beispiel identifiziert der Algorithmus bestimmte Schlüsselwörter, die Genauigkeit oder Ungenauigkeit bedeuten, nach denen Menschen nicht instinktiv suchen.

"In dieser und anderen Forschungen, die wir über Täuschung durchgeführt haben, haben wir zum Beispiel festgestellt, dass die Verwendung des Wortes 'Ich' mit der Wahrheit verbunden ist", sagte sie. „Ein Algorithmus kann leicht zählen, wie oft ich gesagt wurde, um den Unterschied zu finden.

"Die Leute zählen jedoch nicht auf natürliche Weise, und obwohl es leicht sein mag, würde es sie vom eigentlichen Verständnis des Textes ablenken."

Um einen Algorithmus zur Erkennung von Täuschungsmanövern zu trainieren, müssen eine Vielzahl von linguistischen Hinweisen identifiziert werden, die aus einer Vielzahl von gefälschten Nachrichten stammen. Dies stellt eine Herausforderung dar, da falsche Nachrichten schnell erscheinen und verschwinden, in vielen Genres vorkommen und oft mit Satire verwechselt werden können.

Das Team mied dieses Problem, indem es eigene gefälschte Nachrichtenquellen entwarf. Sie stellten externe Autoren ein, um echte Nachrichten zu nehmen und sie zu Fälschungen umzubauen. Die Autoren wurden mit dem Crowdsourcing-Internet-Marktplatz Amazon Mechanical Turk rekrutiert.

Mihalcea merkte an, dass dieser Prozess konsistent ist mit dem, wie gefälschte Nachrichten in der realen Welt entstehen.

Am Ende des Prozesses hatte das Team eine Reihe von echten und falschen 500-Nachrichten, um den Algorithmus zu füttern. Nachdem der Algorithmus eine linguistische Analyse dieser Objekte durchgeführt hatte, testeten sie diese mit echten und gefälschten Nachrichten aus dem Internet.

Der Algorithmus kann derzeit betrügerische Geschichten mit einer 76-Prozentrate identifizieren, was gut ist, aber es gibt Raum für Verbesserungen.

Mihalcea stellte fest, dass es Anzeichen dafür gibt, dass das Füttern des Algorithmus mit mehr Daten den Algorithmus effektiver machen kann. Sie zeichneten die Leistung des Algorithmus als Funktion der eingegebenen Datenmenge auf und erstellten eine „Lernkurve“, mit der sie feststellen konnten, ob der Algorithmus nach einer bestimmten Datenmenge nicht mehr lernt.

"Was wir beobachtet haben, ist, dass mehr Daten wahrscheinlich zu einer Leistungssteigerung führen. Ein logischer nächster Schritt wäre es, mehr gefälschte und legitime Nachrichten zu sammeln, um die Effektivität des Algorithmus zu verbessern", sagte sie.

Die Arbeit des Teams bei der Entwicklung des Algorithmus spielt eine zentrale Rolle in der Politik- und Mediengeschichte. Fast die Hälfte der Amerikaner Holen Sie ihre Nachrichten hauptsächlich onlineund über zwei Drittel sagen, dass sie bekommen zumindest einige ihrer Neuigkeiten durch soziale Medien.

Aber das Internet bleibt eine weitgehend unregulierte Informationsquelle.

"Das Internet - einschließlich der sozialen Medien - spielt in der heutigen Gesellschaft eine große Rolle, da es eine wichtige Informationsquelle ist, die die Menschen zur Entscheidungsfindung nutzen", sagte Mihalcea.

„Betrachten Sie zum Beispiel die jüngsten politischen Ereignisse oder die Diskussionen um Impfungen und so weiter. In diesem Umfeld, in dem jeder „Neuigkeiten“ veröffentlichen kann, ist es wichtig, dass die Menschen über ein Mittel verfügen, um zwischen vertrauenswürdigen und nicht vertrauenswürdigen Produkten zu unterscheiden. “

KOSTENLOSE 6-monatige Testversion

Dann genießen Sie Amazon Prime zum halben Preis – 50 % Rabatt!

TUN KI – Ihr Bildungsassistent

TUN AI

Ich bin hier, um Ihnen bei Stipendien, Hochschulsuche, Online-Kursen, finanzieller Unterstützung, Auswahl von Hauptfächern, Hochschulzulassungen und Studientipps zu helfen!

Die University Network