Während die meisten Unternehmen darauf abzielen, die Aufmerksamkeit ihrer Benutzer zu monopolisieren, versuchen wir bei CityFALCON, die Aufmerksamkeitslast zu reduzieren, damit Benutzer effizienter und effektiver an den Märkten teilnehmen können. Das Gruppieren ähnlicher Geschichten bringt uns einen Schritt in diese Richtung, sodass Benutzer weniger Zeit mit der Sorgfaltspflicht und mehr Zeit damit verbringen, Entscheidungen zu treffen, mit Freunden und Familie zusammen zu sein und ihren Hobbys nachzugehen.
Jedes Mal, wenn ein großes Ereignis stattfindet, leuchten sowohl traditionelle als auch soziale Medien mit Berichten, Tweets und Posts über die Ereignisse auf. Bei internationalen Fällen werden diese in der Regel auch mehrsprachig veröffentlicht. Die meisten Berichterstattungen, besonders wenn es um Neuigkeiten geht, können Stummelartikel sein, die sehr ähnliche, grundlegende Tatsachen enthalten. Mit fortschreitender Zeit kommen mehr Informationen heraus und die Informationsmenge wird größer, was dazu führt, dass Nachrichtenquellen in ihren Einstellungen leicht voneinander abweichen. Die zugrunde liegende Botschaft auf allen Nachrichtenplattformen bleibt jedoch tendenziell sehr ähnlich – vorausgesetzt, es werden keine gefälschten Nachrichten präsentiert.
Diese Konformität kann wertvolle Recherche- und Due-Diligence-Zeit verschwenden, da die Geschichten dieselben Informationen wiederholen. Mit der Gruppierung ähnlicher Geschichten beseitigt CityFALCON die Notwendigkeit, mehrere ähnliche Interpretationen desselben Problems zu durchsuchen.
Andererseits befürchten einige Marktteilnehmer, subtile oder verdeckte Schlüsselunterschiede zu verpassen, die zu einer besseren Anlageentscheidung führen könnten. Solche Teilnehmer suchen nach allen verfügbaren ähnlichen Inhalten, um das Problem besser zu verstehen (auch in anderen Sprachen), und dieser Ansatz wird jedem dringend empfohlen, der vor einer finanziellen oder geschäftlichen Entscheidung steht.
Das Gruppieren ähnlicher Geschichten hilft diesen Benutzern, indem es all diese Inhalte an einem einzigen Ort zusammenfasst, sodass mehrere Instanzen ähnlicher Informationen gleichzeitig an einem einzigen Ort gefunden werden können. Dadurch wird verhindert, dass wichtige Unterschiede übersehen werden, indem der Newsfeed willkürlich nach ähnlichen Inhalten durchsucht wird. Wenn mehrere Sprachen beteiligt sind, erfasst und gruppiert CityFALCON außerdem mehrsprachige Inhalte.
Aussehen und Vorteile der Gruppierung ähnlicher Geschichten
Ähnliche Geschichten erscheinen auf allen CityFALCON-Lieferkanälen: den mobilen Apps, der Website und der API. In früheren Iterationen unserer Plattform belegten alle Geschichten ihre eigenen Geschichtenkarten, jede Geschichte oder jeder Tweet eine eigene Zeile mit allen zugehörigen Informationen. Bei sehr populären Themen oder wenn wichtige Eilmeldungen auftraten, könnte der Feed mit Nachrichtenartikel nach Nachrichtenartikel (und definitiv Tweet nach Tweet) überschwemmt werden, die dasselbe berichten.
„Ähnliche Geschichten“ fasst all diese einzelnen Karten mit ähnlichen Inhalten zu einer einzigen Karte mit einer repräsentativen Überschrift zusammen. Der ähnliche Inhalt wird auf dieselbe Karte gedruckt, um einen schnellen Zugriff auf das Skimming zu ermöglichen, ohne jedoch so viel Platz zu beanspruchen.
Die Kuration von Inhalten – die Aufzeichnung, ob Sie Geschichten mögen, nicht mögen oder irrelevant finden – kann jetzt auch für alle ähnlichen Inhalte in einer einzigen Aktion durchgeführt werden. Curation hilft unseren Maschinen, Ihre Bedürfnisse besser zu verstehen, um die Relevanz der Ihnen bereitgestellten Inhalte zu erhöhen. Mit dieser Ein-Klick-Aktion für mehrere Geschichten können Sie den Algorithmen helfen, schneller zu lernen. Wenn Sie Geschichten einzeln kuratieren möchten, müssen Sie ähnliche Inhalte aufheben.
In diesem Zusammenhang können Sie mit dem Kurationstool „Ausblenden“ alle ähnlichen Inhalte ausblenden, um zur nächsten Idee überzugehen, ohne ständig auf Informationen zu stoßen, die Sie bereits verinnerlicht haben.
Der Standard-Newsfeed auf CityFALCON komprimiert jetzt ähnliche Inhalte in Karten wie dieser. Wenn Sie zur alten Ansicht zurückkehren möchten, schalten Sie einfach den Kippschalter für aus Ähnliche Inhalte gruppieren. Dadurch wird jede Story gezwungen, im Feed auf einer eigenen Karte dargestellt zu werden.
Um zu sehen nur Die repräsentativste Geschichte – das heißt, alle ähnlichen Inhalte verbergen, die am unteren Rand der gruppierten Karte gesammelt wurden – können Sie deaktivieren Ähnliche Inhalte im Feed anzeigen. Dies ist nützlich, um die Nachrichten zu durchsuchen, ohne durch das Lesen zu vieler ähnlicher Schlagzeilen abgelenkt zu werden, die Ihre Aufmerksamkeit erregen könnten. Beachten Sie, dass dadurch alle Inhalte ausgeblendet werden, die als „ähnlich“ gekennzeichnet sind, mit Ausnahme des repräsentativsten Inhalts, der die Karte überschreibt.
Kurz gesagt, wenn Sie die Nachrichten überfliegen und über viele verschiedene Themen lesen möchten, schalten Sie ab Ähnliche Inhalte im Feed anzeigen. Wenn Sie tiefer eintauchen oder einfach nur andere Schlagzeilen für ihre leicht unterschiedlichen Interpretationen von Ereignissen behalten möchten, lassen Sie beide Optionen für ähnliche Inhalte aktiviert.
Wie machen wir es
Um Geschichten zu gruppieren, analysieren unsere Algorithmen jeden Geschichtentitel, die Metabeschreibung und, falls als Volltextartikel auf unserer Plattform verfügbar, die Geschichte selbst. Wir analysieren auch Tweets. Mit all diesen Informationen vektorisieren wir dann die Inhalte und platzieren Storys und Tweets in Clustern. Als Nächstes wählen wir unter Verwendung derselben Analysedaten, aber eines anderen NLP-Algorithmus (Natural Language Processing), die repräsentativste Geschichte für diese Gruppe aus. Wenn es immer noch zu viele Geschichten gibt, wird der Vorgang des Clusterings und der Auswahl eines Vertreters wiederholt.
Schließlich werden den Benutzern die repräsentativsten Geschichten als Überschrift der Karte angezeigt, und die Geschichten im Cluster werden als ähnliche Geschichten präsentiert. Unsere maschinell lernenden NLP-Modelle bieten einen erheblichen Mehrwert gegenüber einigen etablierten Anbietern wie Google News und ermöglichen es uns, unabhängig von der Sprache des Inhalts zu gruppieren und zu vergleichen. Wenn es also mehrere Sprachen gibt, die dasselbe Thema diskutieren, gruppiert CityFALCON diese zusammen, solange wir die Sprache für die Gruppierung unterstützen. Ab Juni 2020 umfasst diese Unterstützung 16 Sprachen, mit bis zu 93 bis Ende des Jahres.
Clusterbildung und Informationsverlust
Der Einsatz von Technologie zur Verdichtung linguistischer Informationen in einem kleineren Satz wirft einige allgemeine Fragen auf. Wie genau ist es? Woher weiß ich, dass die Cluster wirklich „ähnlich“ sind? Verdichtet dieser Ansatz die Informationen zu sehr, sodass mir wichtige Informationen entgehen?
Beginnen wir mit der Genauigkeit. Zumindest für die Sprachen, die Sie sprechen, ist es einfach zu bestätigen, dass der Inhalt als gekennzeichnet ist ähnlich ist wirklich ähnlich. Sie können die Schlagzeilen immer noch lesen und sofort überprüfen, ob sie ähnlich sind oder nicht. Während maschinelles Lernen bedeutet, dass die Genauigkeit nicht 100% entspricht, haben wir diese Funktion erst veröffentlicht, nachdem Tests, Training und Verfeinerung zu praktischer Genauigkeit geführt haben. Selbst Menschen sind nicht in der Lage, 100%-genau zu sein – und Menschen können nicht 1 Million Geschichten und Tweets pro Tag lesen, um Ähnlichkeiten zu finden, wie es unsere Algorithmen können. Obwohl die Genauigkeit vielleicht nicht 100% ist, ist sie für den praktischen Gebrauch ausreichend hoch. Wenn Sie extreme Ungenauigkeiten bemerken, teilen Sie uns dies bitte mit, damit wir unsere Systeme verbessern können.
Genauso wie bei der Genauigkeit ist es leicht zu überprüfen, ob die Clusterings wirklich ähnlich sind, da die Schlagzeilen zur Überprüfung vorgelegt werden.
Schließlich, solange die anderen Geschichten im Newsfeed unter der angezeigt werden Ähnliche Inhalte Header verpassen User keine wichtigen Feinheiten in der Formulierung von Headlines und Stories, da der Inhalt direkt verifiziert werden kann. Wenn Sie also in ein Thema eintauchen möchten, behalten Sie die Ähnliche Inhalte im Feed anzeigen Option eingeschaltet. Dies wird dringend empfohlen, bevor Sie eine Investitions- oder Geschäftsentscheidung treffen. Andernfalls, wenn Sie einfach nur scannen möchten, was heute passiert, ist das Verpassen der Feinheiten in der Schlagzeilenformulierung kein Problem, und Sie können das deaktivieren Ähnliche Inhalte im Feed anzeigen Schalter.
Entwickelt für Skalierbarkeit und Leistung
Similar Stories ist ein enorm rechenintensives Unterfangen. An Tagen mit hoher Aktivität verarbeiten wir möglicherweise Millionen von Inhalten in der CityFALCON-Pipeline, während wir selbst in langsameren Zeiten regelmäßig bis zu einer Million pro Tag verarbeiten. Nach der Aggregation und Verarbeitung müssen alle diese Inhalte mit allen Inhalten verglichen werden, die wir bereits verarbeitet und aus vergangenen Tagen gespeichert haben, um Ähnlichkeiten festzustellen. Der Vergleichsprozess vektorisiert viele Dimensionen jedes Inhaltsstücks und vergleicht dann den Inhalt Dimension für Dimension und vektorübergreifend. Der resultierende Berechnungsbedarf ist überwältigend.
Diese Berechnungsanforderungen machten einige populäre Sprachen wie Java und Python zu umständlich, um die riesigen Datenströme zu bewältigen. Aus diesem Grund haben wir unsere Komponente zur Gruppierung ähnlicher Geschichten in C++ geschrieben, einer starken Sprache für Leistung und geringen Overhead. Je geringer der Overhead, desto schneller und effizienter die Verarbeitung – und in diesem Szenario brauchten wir jeden Effizienzvorteil, den wir erzielen konnten. Darüber hinaus macht die Flexibilität, die Ressourcennutzung in C++ zu steuern, es ideal für eine strenge Kontrolle der Rechen- und Ressourcenkosten, insbesondere der Speichernutzung.
Nach einiger Forschungs- und Entwicklungsarbeit haben wir eine hocheffiziente Version produziert, die den Benutzern das liefert, was sie brauchen, und unsere Verarbeitungskosten überschaubar hält.
Wenn das System skaliert, stellt die Verwendung von C++ mit geringem Overhead sicher, dass die Skalierbarkeit nicht beeinträchtigt wird, sodass alle CityFALCON-Clients, von leistungsstarken API-Benutzern bis hin zu Verbraucherbenutzern mit geringem Volumen, eine reibungslose und genaue Bereitstellung von Inhalten erleben.
Reduzieren Sie noch heute Ihre Recherchezeit
Wir gehen davon aus, dass die meisten Benutzer von dieser Funktion profitieren werden, daher aktivieren wir sie standardmäßig. Testen Sie die neue Funktion zu wirklich beliebten Themen wie diesen hier Watchlist, die beliebte Aktien hervorhebt. Genießen Sie dann mehr Zeit, um Geschäfte zu machen, mit Freunden und Familie zusammen zu sein oder Ihre Zeit anderweitig zu nutzen, als sich durch nahezu identische Inhalte in Bezug auf Ihre Investitionen zu wühlen.
Schreibe einen Kommentar