Si bien la mayoría de las empresas apuntan a monopolizar la atención de sus usuarios, en CityFALCON intentamos reducir la carga de atención para que los usuarios puedan participar de manera más eficiente y efectiva en los mercados. La agrupación de historias similares nos da un paso en esa dirección, de modo que los usuarios pueden dedicar menos tiempo a la diligencia debida y más tiempo a tomar decisiones, estar con amigos y familiares y dedicar sus pasatiempos.
Cada vez que ocurre un evento importante, tanto las redes sociales tradicionales como las sociales se iluminan con informes, tweets y publicaciones sobre los acontecimientos. En los casos internacionales, estos también suelen publicarse en varios idiomas. La mayoría de los informes, especialmente cuando las noticias son de última hora, pueden ser artículos cortos que dicen hechos básicos muy similares. A medida que pasa el tiempo, sale más información y la cantidad de información se expande, lo que hace que las fuentes de noticias difieran ligeramente en sus tomas. Sin embargo, el mensaje subyacente en las plataformas de noticias tiende a ser muy similar, suponiendo que no se presenten noticias falsas.
Esta conformidad puede hacer perder un tiempo valioso de investigación y diligencia debida porque las historias repiten la misma información. Con la agrupación de historias similares, CityFALCON elimina la necesidad de buscar múltiples interpretaciones similares del mismo problema.
Por otro lado, algunos participantes del mercado temen perderse diferencias clave sutiles u oscuras que podrían conducir a una mejor decisión de inversión. Dichos participantes buscan todo el contenido similar disponible para comprender mejor el problema (incluido el que está en otros idiomas), y este enfoque es muy recomendable para cualquiera que esté a punto de tomar una decisión financiera o comercial.
La agrupación de historias similares ayuda a estos usuarios al agrupar todo ese contenido en un solo lugar, por lo que se pueden encontrar múltiples instancias de información similar a la vez en una sola ubicación. Esto evita que se pasen por alto diferencias importantes al buscar al azar contenido similar en el servicio de noticias. Además, cuando hay varios idiomas involucrados, CityFALCON captura y agrupa el contenido multilingüe.
Apariencia y beneficios de la agrupación de historias similares
Aparecen historias similares en todos los canales de entrega de CityFALCON: las aplicaciones móviles, el sitio web y la API. En iteraciones anteriores de nuestra plataforma, todas las historias ocupaban sus propias tarjetas de historias, cada historia o Tweet tenía su propia línea con toda la información asociada. Con temas muy populares o cuando ocurrieron importantes eventos de noticias de última hora, el feed podría inundarse con artículo de noticias tras artículo de noticias (y definitivamente Tweet tras Tweet) que informan lo mismo.
Similar Stories condensa todas esas tarjetas individuales que contienen contenido similar en una sola tarjeta con un título representativo. El contenido similar se imprime en la misma tarjeta para un acceso rápido al skimming pero sin ocupar tanto espacio.
La curación de contenido (grabar si le gusta, no le gusta o encuentra historias irrelevantes) ahora también se puede realizar para todo el contenido similar en una sola acción. La curación ayuda a nuestras máquinas a comprender mejor sus necesidades para aumentar la relevancia del contenido que se le ofrece. Con esta acción de un solo clic para múltiples historias, puede ayudar a que los algoritmos aprendan más rápido. Si desea seleccionar historias individualmente, deberá desagrupar contenido similar.
En este contexto, la herramienta de curación "ocultar" le permite ocultar todo el contenido similar para que pueda pasar a la siguiente idea sin encontrar constantemente información que ya ha interiorizado.
El servicio de noticias predeterminado en CityFALCON ahora condensa contenido similar en tarjetas como esta. Si desea volver a la vista anterior, simplemente apague el interruptor de palanca para Agrupar contenido similar. Esto obligará a que cada historia se presente en su propia tarjeta individual en el feed.
Para ver solamente la historia más representativa, es decir, ocultar todo el contenido similar recopilado en la parte inferior de la tarjeta agrupada, puede desactivar Mostrar contenido similar en el feed. Esto es útil para escanear las noticias sin distraerse leyendo demasiados titulares similares que podrían llamar su atención. Tenga en cuenta que esto oculta cualquier contenido etiquetado como "similar", excepto el contenido más representativo, que encabezará la tarjeta.
En resumen, si desea hojear las noticias y leer sobre muchos temas diferentes, desactive Mostrar contenido similar en el feed. Si desea profundizar más o simplemente desea mantener otros titulares para sus interpretaciones ligeramente diferentes de los eventos, mantenga activadas ambas opciones para contenido similar.
Cómo lo hacemos
Para agrupar historias, nuestros algoritmos analizan el título de cada historia, la meta descripción y, si está disponible como un artículo de texto completo en nuestra plataforma, la historia en sí. También analizamos Tweets. Luego, con toda esta información, vectorizamos el contenido y colocamos las historias y los Tweets en grupos. A continuación, utilizando los mismos datos de análisis pero un algoritmo de procesamiento del lenguaje natural (NLP) diferente, elegimos la historia más representativa para ese grupo. Si todavía hay demasiadas historias, se repite el proceso de agrupación y elección de un representante.
Finalmente, las historias más representativas se sirven a los usuarios como la historia principal de la tarjeta y las del grupo se presentan como historias similares. Al agregar un valor significativo sobre algunos titulares como Google News, nuestros modelos de PNL de aprendizaje automático nos permiten agrupar y comparar independientemente del idioma del contenido. Entonces, si hay varios idiomas que discuten el mismo tema, CityFALCON los agrupará, siempre que admitamos el idioma para la agrupación. A junio de 2020, este soporte cubre 16 idiomas, con hasta 93 para fin de año.
Agrupación y pérdida de información
El uso de la tecnología para condensar información lingüística en un conjunto más pequeño plantea algunas preguntas comunes. ¿Qué tan precisa es? ¿Cómo sé que las agrupaciones son realmente "similares"? ¿Este enfoque condensa demasiado la información para que me pierda información importante?
Empecemos por la precisión. Al menos para los idiomas que habla, es fácil confirmar que el contenido marcado como similar es realmente similar. Aún puede leer los titulares y puede verificar instantáneamente si es similar o no. Si bien el aprendizaje automático significa que la precisión no será 100%, solo lanzamos esta función después de que las pruebas, la capacitación y el refinamiento condujeron a una precisión práctica. Incluso los humanos son incapaces de ser 100% precisos, y los humanos no pueden leer 1 millón de historias y tweets al día para encontrar similitudes como lo hacen nuestros algoritmos. Entonces, si bien la precisión puede no ser 100%, es lo suficientemente alta para un uso práctico. Si observa inexactitudes extremas, háganoslo saber para que podamos mejorar nuestros sistemas.
De la misma manera que para la precisión, es fácil verificar que los agrupamientos sean realmente similares, ya que los titulares se presentan para su inspección.
Finalmente, siempre que las otras historias se muestren en el servicio de noticias bajo el Contenido similar header, los usuarios no perderán sutilezas importantes en la redacción de titulares e historias, porque el contenido se puede verificar directamente. Por lo tanto, si desea profundizar en un tema, mantenga el Mostrar contenido similar en el feed opción activada. Esto es muy recomendable antes de tomar una decisión comercial o de inversión. De lo contrario, si solo desea escanear lo que está sucediendo hoy, omitir las sutilezas en la redacción del título no será un problema, y puede desactivar el Mostrar contenido similar en el feed cambiar.
Construido para escalabilidad y rendimiento
Similar Stories es una empresa que requiere una gran cantidad de recursos informáticos. En días de alta actividad, podemos procesar millones de piezas de contenido en la canalización de CityFALCON, mientras que incluso durante tiempos más lentos procesamos regularmente hasta un millón por día. Después de la agregación y el procesamiento, todo ese contenido debe compararse con todo el contenido que ya hemos procesado y almacenado desde hace días para determinar la similitud. El proceso de comparación vectoriza muchas dimensiones de cada pieza de contenido y luego compara el contenido dimensión por dimensión y entre vectores. La necesidad de cálculo resultante es asombrosa.
Este requisito de cálculo hizo que algunos lenguajes populares como Java y Python fueran demasiado engorrosos para manejar los enormes flujos de datos. Por esa razón, escribimos nuestro componente Agrupación de historias similares en C ++, un lenguaje sólido para el rendimiento y la sobrecarga baja. Cuanto menor sea la sobrecarga, más rápido y más eficiente será el procesamiento, y en este escenario, necesitábamos cualquier ventaja de eficiencia que pudiéramos obtener. Además, la flexibilidad para el uso directo de recursos en C ++ lo hace ideal para controlar estrictamente los costos de recursos y computación, particularmente el uso de memoria.
Después de bastante trabajo de I + D, producimos una versión altamente eficiente que ofrece a los usuarios lo que necesitan y mantiene nuestros costos de procesamiento manejables.
A medida que el sistema se amplía, el uso de C ++ de baja sobrecarga garantiza que la escalabilidad no se vea comprometida, por lo que todos los clientes de CityFALCON, desde los usuarios de API de alta potencia hasta los consumidores de bajo volumen, experimentan una entrega de contenido precisa y fluida.
Reduzca su tiempo de investigación hoy
Esperamos que la mayoría de los usuarios se beneficien de esta función, por lo que la activamos de forma predeterminada. Pruebe la nueva función en temas muy populares, como los de este lista de seguimiento destacando acciones populares. Luego, disfrute de más tiempo para hacer negocios, estar con amigos y familiares, o buscar otros usos de su tiempo que no sea el de leer contenido casi idéntico con respecto a sus inversiones.
Deja una respuesta