Academia OSINT

Las principales formas de acceder a los datos de Twitter

1. API estándar de Twitter

La interfaz de programación de aplicaciones estándar (API) de Twitter es el punto de entrada más común a los datos de Twitter.Hay una gama de API disponibles públicamente que los investigadores pueden elegir, que a menudo proporcionan acceso gratuito pero limitado a los datos.De estos, la API de transmisión y la API de búsqueda son dos de las opciones más comunes.

La API de transmisión devuelve un flujo en tiempo real de datos de tweets.

Actualmente hay dos subopciones para elegir: transmisión filtrada y transmisión muestreada.La transmisión filtrada permite a los investigadores realizar un filtrado y tamizado personalizados en millones de tweets en un momento dado, y estos investigadores desarrollan reglas de filtrado que permiten solicitudes de hasta 400 palabras clave diferentes, 5,000 identidades de usuarios y 25 ubicaciones geográficas.Por defecto, cada flujo de filtro por hora devuelve el 1% de los tweets que cumplen con los criterios de filtrado.Por ejemplo, si el investigador quiere usar la API de la corriente de filtro para recolectar todos los tweets que contienen el hashtag #Twitterapi y el número de tweets coincidentes por ese hashtag es menor que el límite superior, entonces el investigador podrá obtener todos los tweets que contienen quesujeto hashtag.De lo contrario, el investigador obtiene una muestra parcial de tweets que contiene el hashtag #Twitterapi.

En comparación, las transmisiones de muestreo pueden devolver un conjunto de datos muestreado aleatoriamente de todos los tweets recién publicados en tiempo real (Pfeffer et al., 2018) sin tener que soportar las limitaciones de las reglas de filtrado.Las corrientes de muestreo pueden ser una mejor opción cuando los investigadores no tienen un tema específico de interés y solo quieren comprender la temperatura actual de todas las conversaciones en la plataforma de Twitter.

La API de búsqueda es otro portal ampliamente utilizado para acceder a los datos de Twitter.

Puede devolver tweets históricos que coincidan con las reglas establecidas por el usuario.La versión estándar de la API de búsqueda permite a los investigadores acceder a una muestra gratuita de tweets publicados por usuarios de Twitter en los últimos 7 días.Por lo tanto, la versión estándar de la API de búsqueda es una buena opción para los investigadores que solo necesitan datos de tweets históricos de la semana pasada o están dispuestos a recopilar datos de tweets cada dos semanas para realizar un seguimiento de los cambios.Sin embargo, si un proyecto de investigación requiere datos históricos de tweets durante un período de tiempo más largo, o si la cantidad de datos excede el límite de muestreo de la especificación gratuita, los investigadores deberán considerar suscribirse a una versión pagada más avanzada.

Twitter API

2. plataformas de terceros

El mercado para el aprovisionamiento de los datos de las redes sociales ha estado creciendo rápidamente.Las plataformas de datos de terceros también pueden considerarse para investigadores que prefieren una interfaz interactiva fácil de usar y pueden pagar el costo adicional.Sistema de inteligencia de KnowlesysProporciona una interfaz más fácil de usar que la API de Twitter disponible públicamente para ayudar a los usuarios a filtrar datos, descargar e informes agregados.Especialmente para los investigadores que no están familiarizados con el lenguaje API, necesitan menos costo de aprendizaje.Además, el sistema de inteligencia Knowlesys también proporciona acceso a datos de las redes sociales que no sean Twitter, como Facebook, Instagram, YouTube, Tiktok, etc., así como sitios web tradicionales y Web Dark.

3. Compartir identificaciones de Twitter

Además de usar API o comprar servicios de terceros, aprovechar las ID de tweets compartidas por otros equipos de investigación es otra forma de recopilar datos de Twitter.Los investigadores a veces siguen el espíritu de la ciencia abierta para compartir conjuntos de datos.Twitter tiene instrucciones específicas para que los investigadores compartan conjuntos de datos públicamente.Los conjuntos de datos de Twitter que cumplan con los términos de intercambio de datos abiertos se pueden encontrar en varios sitios web especializados, como el catálogo de docnow.Por ejemplo, el catálogo de Docnow.Después de obtener ID de tweets, los investigadores también pueden restaurar el contenido completo de los tweets con relativa facilidad utilizando herramientas como Rebydrator (Coakley & Steinert-Threlkeld, n.d.) o paquetes como RTweet (Kearney et al., N.D.).



¿Sabes cómo encontrar la primera cuenta en Twitter para publicar el hashtag de inteligencia artificial?
¿Cómo hacer mejores investigaciones de inteligencia de código abierto en Twitter?
¿Cómo analizar las cuentas y perfiles de los usuarios de Twitter?
¿Cómo analizar las palabras clave en Twitter?
¿Cómo extraer imágenes de Twitter?
Análisis del comportamiento de los adultos estadounidenses en Twitter