Selanjutnya melalui pengumpulan data dari tiga platform media sosial, anotasi manual oleh 17 anotator dari perwakilan kelompok minoritas, pemodelan dengan pembelajaran mesin, dan visualisasi data.
Riset ini mengelompokkan ujaran kebencian dalam enam kategori, yakni serangan terhadap identitas, hinaan, ancaman/hasutan, kata-kata kotor, seksual/vulgar, dan lainnya.
“Sebuah teks, apalagi yang panjang, dapat mengandung lebih dari satu kategori ujaran kebencian sehingga peneliti menghitung semua kemungkinan kategori yang ada dalam satu teks,” beber dia.
Hasilnya, kategori serangan terhadap identitas mendominasi bentuk ujaran kebencian sebanyak 123.968, hinaan 104.664, kata-kata kotor 42.267, ancaman/hasutan 39.153 teks, seksual/vulgar 3.528 teks, dan lainnya 5.665 teks.
Serangan terbanyak menimpa kelompok Yahudi sebanyak 90.911 teks. Kemudian kelompok disabilitas sebanyak 4.6278 teks, Tionghoa 9.563 teks, LGBTIQ 7.262 teks, lainnya 5.587 teks, Kristen dan Katolik 4.755 teks, Syiah 1.214 teks, dan Ahmadiyah 55 teks.
Ujaran kebencian terbanyak ditujukan terhadap kelompok Yahudi karena peristiwa serangan Israel di Gaza.
Adapun, kelompok disabilitas menunjukkan percakapan intens tentang buta hukum, tuli terhadap suara rakyat, yang menekankan konteks kecacatan hukum dan kecacatan demokrasi.
Unggahan ujaran kebencian terbanyak muncul di X sebanyak 120,381 unggahan atau 66,1 persen. Kemudian Facebook sebanyak 56,780 teks atau 31,18 persen, dan Instagram 4,472 teks atau 2,46 persen.
Unggahan yang mengandung ujaran kebencian di Facebook dibagikan sebanyak 4 juta kali dengan jumlah komentar sebanyak 15 juta.
Di Instagram, unggahan yang mengandung ujaran kebencian disukai (love) oleh 181 juta orang dan dibagikan sebanyak 9 juta kali.
Di X, cuitan unggahan kebencian dilihat sebanyak 51 miliar kali, menjangkau 5 miliar pengguna, dan dibagikan sebanyak 6 juta kali.
Pada ketiga platforms, analisis mengambil data teks (tweet, reply, dan quote tweet) di X dengan cara mengekstrak data melalui platform Brandwatch dengan sampling rate 38 persen.
Ada juga data teks dari deskripsi unggahan melalui Facebook Page, Facebook Groups, dan Instagram dengan mengekstrak data lewat platform CrowdTangle.
Data retweet di X tidak diambil untuk menghindari masuknya data yang diamplifikasi oleh buzzer atau bots.
“Adapun, data komentar pada Facebook dan Instagram tidak diambil karena tidak memungkinkan untuk diambil secarang langsung dan bersamaan,” ujar Derry.