الطرق الرئيسية للوصول إلى بيانات Twitter
1. تويتر واجهات برمجة التطبيقات القياسية
واجهة برمجة التطبيق القياسية لـ Twitter (API) هي نقطة الإدخال الأكثر شيوعًا لبيانات Twitter.هناك مجموعة من واجهات برمجة التطبيقات المتاحة للجمهور التي يمكن للباحثين الاختيار من بينها ، والتي غالباً ما توفر وصولًا مجانيًا ولكن محدود إلى البيانات.من بين هؤلاء ، تعد واجهة برمجة تطبيقات التدفق وواجهة برمجة التطبيقات للبحث اثنان من الخيارات الأكثر شيوعًا.
تُرجع واجهة برمجة تطبيقات البث في الوقت الفعلي لدفق بيانات التغريد.
يوجد حاليًا خياران فرعيان للاختيار من بينها: تيار تم ترشيحه وأخذ عينات من الدفق.يسمح الدفق المصفى للباحثين بإجراء التصفية المخصصة والغربلة على ملايين التغريدات في أي وقت معين ، ويقوم هؤلاء الباحثون بتطوير قواعد تصفية تسمح بطلبات ما يصل إلى 400 كلمة رئيسية مختلفة ، و 5000 هوية مستخدم ، و 25 موقعًا جغرافيًا.بشكل افتراضي ، يعيد كل دفق مرشح كل ساعة 1 ٪ من التغريدات التي تلبي معايير التصفية.على سبيل المثال ، إذا أراد الباحث استخدام واجهة برمجة تطبيقات دفق الفلتر لجمع جميع التغريدات التي تحتوي على علامة التجزئة #twitterapi وعدد التغريدات التي تطابقها هذا الهاشتاج ، فسيكون الباحث قادرًا على الحصول على جميع التغريدات التي تحتوي على ذلكموضوع الهاشتاج.خلاف ذلك ، يحصل الباحث على عينة جزئية من التغريدات التي تحتوي على علامة التجزئة #twitterapi.
بالمقارنة ، يمكن لتيارات أخذ العينات بإرجاع مجموعة بيانات تم أخذ عينات منها بشكل عشوائي لجميع التغريدات المنشورة حديثًا في الوقت الفعلي (Pfeffer et al. ، 2018) دون الحاجة إلى تحمل قيود قواعد التصفية.يمكن أن تكون تدفقات أخذ العينات خيارًا أفضل عندما لا يكون للباحثين موضوعًا محددًا ذا أهمية ويريدون فقط فهم درجة الحرارة الحالية لجميع المحادثات على منصة Twitter.
API Search هو بوابة أخرى تستخدم على نطاق واسع للوصول إلى بيانات Twitter.
يمكنه إرجاع التغريدات التاريخية التي تطابق القواعد التي حددها المستخدم.يتيح الإصدار القياسي من API Search للباحثين الوصول إلى عينة مجانية من التغريدات التي نشرها مستخدمو Twitter في الأيام السبعة الماضية.لذلك ، فإن الإصدار القياسي من API Search هو خيار جيد للباحثين الذين يحتاجون فقط إلى بيانات تغريدة تاريخية من الأسبوع الماضي أو على استعداد لجمع بيانات التغريد كل أسبوع لتتبع التغييرات.ومع ذلك ، إذا كان مشروع البحث يتطلب بيانات تغريدة تاريخية على مدار فترة زمنية أطول ، أو إذا تجاوز مقدار البيانات حد أخذ العينات للمواصفات المجانية ، فسوف يحتاج الباحثون إلى التفكير في الاشتراك في إصدار مدفوع أكثر تقدماً.
2. منصات الطرف الثالث
كان سوق توفير بيانات وسائل التواصل الاجتماعي ينمو بسرعة.يمكن أيضًا النظر في منصات بيانات الطرف الثالث للباحثين الذين يفضلون واجهة تفاعلية سهلة الاستخدام ويمكنهم تحمل تكلفة إضافية.نظام الذكاء Knowlesysيوفر واجهة سهلة الاستخدام أكثر من واجهة برمجة تطبيقات Twitter المتاحة للجمهور لمساعدة المستخدمين على تصفية البيانات وتنزيلها وتجميعها.خاصة بالنسبة للباحثين الذين ليسوا على دراية بلغة واجهة برمجة التطبيقات ، فإنهم بحاجة إلى تكلفة تعليمية أقل.علاوة على ذلك ، يوفر نظام Intelligence في Knowlesys إمكانية الوصول إلى البيانات من وسائل التواصل الاجتماعي بخلاف Twitter ، مثل Facebook و Instagram و YouTube و Tiktok ، وما إلى ذلك ، بالإضافة إلى مواقع الويب التقليدية والويب المظلم.
3. مشاركة معرفات Twitter
بالإضافة إلى استخدام واجهات برمجة التطبيقات أو شراء خدمات الطرف الثالث ، فإن الاستفادة من معرفات التغريدة التي تشاركها فرق البحث الأخرى هي وسيلة أخرى لجمع بيانات Twitter.يتبع الباحثون أحيانًا روح العلوم المفتوحة لمشاركة مجموعات البيانات.لدى Twitter تعليمات محددة للباحثين لمشاركة مجموعات البيانات علنًا.يمكن العثور على مجموعات بيانات Twitter التي تلبي شروط مشاركة البيانات المفتوحة على عدد من المواقع المتخصصة ، مثل كتالوج Docnow.على سبيل المثال ، كتالوج Docnow.بعد الحصول على معرفات تغريدة ، يمكن للباحثين أيضًا استعادة المحتوى الكامل للتغريدات بسهولة نسبية باستخدام أدوات مثل RebyDrator (Coakley & Steinert-Trelkeld ، N.D.) أو حزم مثل RTWEET (Kearney et al. ، N.D.).