As principais maneiras de acessar os dados do Twitter
1. APIs padrão do Twitter
A interface de programação de aplicativos padrão do Twitter (API) é o ponto de entrada mais comum para os dados do Twitter.Há uma variedade de APIs disponíveis ao público que os pesquisadores podem escolher, que geralmente fornecem acesso gratuito, mas limitado aos dados.Destes, a API de streaming e a API de pesquisa são duas das escolhas mais comuns.
A API de streaming retorna um fluxo em tempo real de dados de tweet.
Atualmente, existem duas sub-opções para escolher: fluxo filtrado e fluxo amostrado.O fluxo filtrado permite que os pesquisadores realizem filtragem e peneiração personalizados em milhões de tweets a qualquer momento, e esses pesquisadores desenvolvem regras de filtragem que permitem solicitações de até 400 palavras -chave diferentes, 5.000 identidades de usuário e 25 locais geográficos.Por padrão, cada fluxo de filtro por hora retorna 1% dos tweets que atendem aos critérios de filtragem.Por exemplo, se o pesquisador quiser usar a API do fluxo de filtro para coletar todos os tweets que contêm a hashtag #twitterapi e o número de tweets correspondidos por que a hashtag é menor que o limite superior, o pesquisador poderá obter todos os tweets que contêm queHashtag de sujeito.Caso contrário, o pesquisador obtém uma amostra parcial de tweets contendo a hashtag #twitterapi.
Em comparação, os fluxos de amostragem podem retornar um conjunto de dados amostrado aleatoriamente de todos os tweets publicados recém -publicados em tempo real (Pfeffer et al., 2018) sem ter que suportar as limitações das regras de filtragem.Os fluxos de amostragem podem ser uma opção melhor quando os pesquisadores não têm um tópico de interesse específico e apenas querem entender a temperatura atual de todas as conversas na plataforma do Twitter.
A API de pesquisa é outro portal amplamente usado para acessar dados do Twitter.
Ele pode retornar tweets históricos que correspondem às regras definidas pelo usuário.A versão padrão da API de pesquisa permite que os pesquisadores acessem uma amostra gratuita de tweets publicados pelos usuários do Twitter nos últimos 7 dias.Portanto, a versão padrão da API de pesquisa é uma boa opção para pesquisadores que precisam apenas de dados históricos de tweet da semana passada ou estão dispostos a coletar dados de tweet a cada duas semanas para acompanhar as alterações.No entanto, se um projeto de pesquisa exigir dados históricos de tweets por um período mais longo, ou se a quantidade de dados exceder o limite de amostragem da especificação livre, os pesquisadores precisarão considerar assinar uma versão paga mais avançada.
2. Plataformas de terceiros
O mercado para o provisionamento de dados de mídia social tem crescido rapidamente.As plataformas de dados de terceiros também podem ser consideradas para pesquisadores que preferem uma interface interativa fácil de usar e podem pagar o custo adicional.Sistema de inteligência de KnowlesysFornece uma interface mais amigável do que a API do Twitter disponível ao público para ajudar os usuários a filtrar dados, baixar e agregar relatórios.Especialmente para pesquisadores que não estão familiarizados com o idioma da API, eles precisam de menos custo de aprendizado.Além disso, o Knowlesys Intelligence System também fornece acesso a dados de mídias sociais que não sejam o Twitter, como Facebook, Instagram, YouTube, Tiktok, etc., além de sites tradicionais e Web Dark.
3. Compartilhando IDs do Twitter
Além de usar APIs ou comprar serviços de terceiros, alavancar os IDs de tweet compartilhados por outras equipes de pesquisa é outra maneira de coletar dados do Twitter.Os pesquisadores às vezes seguem o espírito da ciência aberta para compartilhar conjuntos de dados.O Twitter tem instruções específicas para os pesquisadores compartilharem publicamente conjuntos de dados.Os conjuntos de dados do Twitter que atendem aos termos do compartilhamento de dados abertos podem ser encontrados em vários sites especializados, como o catálogo Docnow.Por exemplo, o catálogo Docnow.Após obter IDs de tweet, os pesquisadores também podem restaurar o conteúdo completo de tweets com relativa facilidade usando ferramentas como o Rebydrator (Coakley & Steinert-Threlkeld, n.d.) ou pacotes como RTweet (Kearney et al., N.D.).