Académie OSINT

Les principales façons d'accéder aux données Twitter

1. API standard Twitter

L'interface de programmation d'application standard de Twitter (API) est le point d'entrée le plus courant sur les données Twitter.Il existe une gamme d'API accessible au public parmi lesquelles les chercheurs peuvent choisir, qui offrent souvent un accès gratuit mais limité aux données.Parmi ceux-ci, l'API de streaming et l'API de recherche sont deux des choix les plus courants.

L'API de streaming renvoie un flux en temps réel de données de tweet.

Il y a actuellement deux sous-options parmi lesquelles choisir: Stream filtré et flux échantillonné.Le flux filtré permet aux chercheurs d'effectuer un filtrage personnalisé et de tamiser des millions de tweets à tout moment, et ces chercheurs développent des règles de filtrage qui permettent des demandes pour jusqu'à 400 mots clés différents, 5 000 identités d'utilisateurs et 25 emplacements géographiques.Par défaut, chaque flux de filtre horaire renvoie 1% des tweets qui répondent aux critères de filtrage.Par exemple, si le chercheur souhaite utiliser l'API Filter Stream pour collecter tous les tweets contenant le hashtag #twitterapi et le nombre de tweets correspondant à ce hashtag est inférieur à la limite supérieure, le chercheur sera en mesure d'obtenir tous les tweets contenant cettehashtag sujet.Sinon, le chercheur obtient un échantillon partiel de tweets contenant le hashtag #twitterapi.

En comparaison, les flux d'échantillonnage sont en mesure de renvoyer un ensemble de données échantillonné au hasard de tous les tweets nouvellement publiés en temps réel (Pfeffer et al., 2018) sans avoir à supporter les limites des règles de filtrage.Les flux d'échantillonnage peuvent être une meilleure option lorsque les chercheurs n'ont pas de sujet d'intérêt spécifique et souhaitent simplement comprendre la température actuelle de toutes les conversations sur la plate-forme Twitter.

L'API de recherche est un autre portail largement utilisé pour accéder aux données Twitter.

Il peut retourner des tweets historiques qui correspondent aux règles définies par l'utilisateur.La version standard de l'API de recherche permet aux chercheurs d'accéder à un échantillon gratuit de tweets publiés par les utilisateurs de Twitter au cours des 7 derniers jours.Par conséquent, la version standard de l'API de recherche est un bon choix pour les chercheurs qui n'ont besoin que de données historiques de tweet de la semaine dernière ou sont prêtes à collecter des données de tweet toutes les deux semaines pour suivre les changements.Cependant, si un projet de recherche nécessite des données de tweet historiques sur une période plus longue, ou si la quantité de données dépasse la limite d'échantillonnage des spécifications gratuites, les chercheurs devront envisager de s'abonner à une version plus avancée.

Twitter API

2. plates-formes tierces

Le marché de l'approvisionnement des données sur les réseaux sociaux a augmenté rapidement.Les plateformes de données tierces peuvent également être prises en compte pour les chercheurs qui préfèrent une interface interactive conviviale et peuvent se permettre le coût supplémentaire.Système d'intelligence KnowlesysFournit une interface plus conviviale que l'API Twitter accessible au public pour aider les utilisateurs à filtrer les données, à télécharger et à agréger les rapports.Surtout pour les chercheurs qui ne connaissent pas la langue API, ils ont besoin de moins de coûts d'apprentissage.De plus, Knowlesys Intelligence System donne également accès aux données des médias sociaux autres que Twitter, comme Facebook, Instagram, YouTube, Tiktok, etc., ainsi que les sites Web traditionnels et Dark Web.

3. Partage des identifiants Twitter

En plus d'utiliser des API ou d'acheter des services tiers, tirer parti des identifiants de tweet partagés par d'autres équipes de recherche est une autre façon de collecter des données Twitter.Les chercheurs suivent parfois l'esprit de la science ouverte pour partager des ensembles de données.Twitter a des instructions spécifiques aux chercheurs pour partager les ensembles de données publiquement.Les ensembles de données Twitter qui répondent aux termes du partage de données ouvert peuvent être trouvés sur un certain nombre de sites Web spécialisés, tels que le catalogue Docnow.Par exemple, le catalogue Docnow.Après avoir obtenu des identifiants de tweet, les chercheurs peuvent également restaurer le contenu complet des tweets avec une facilité relative à l'aide d'outils tels que Rebydrator (Coakley & Steinert-Threlkeld, s.d.) ou des packages tels que RTWEET (Kearney et al., n.d.).



Savez-vous comment trouver le premier compte sur Twitter pour publier le hashtag de l'intelligence artificielle?
Comment faire de meilleures enquêtes de renseignement open source sur Twitter?
Comment analyser les comptes et les profils des utilisateurs de Twitter?
Comment analyser les mots clés sur Twitter?
Comment extraire des images de Twitter?
Analyse du comportement des adultes américains sur Twitter