Kolombia diguncang oleh protes, konfrontasi bersenjata, dan tuduhan penyalahgunaan kekuasaan oleh polisi pada awal tahun ini. Para jurnalis berlomba-lomba mengikuti dan melaporkan perkembangan terbaru mengenai berbagai peristiwa tersebut. Beberapa media independen dan organisasi hak asasi manusia berusaha melampaui berita harian. Mereka mulai membuat database sendiri dengan mencatat setiap kematian yang terkait dengan demonstrasi. Setiap tudingan penyalahgunaan kekuasaan, kekerasan, dan penahanan pengunjuk rasa tak ketinggalan ikut dicatat.
Salah satu database tersebut dirancang oleh Rutas del Conflicto — Rute Konflik — media digital yang terlatih melakukan investigasi dan jurnalisme data untuk meliput konflik bersenjata di Kolombia. Media tersebut mulai meliput kekerasan terkait demonstrasi — yang dimulai dari usulan reformasi pajak tetapi berubah menjadi protes anti-pemerintah yang lebih umum — pada awal tahun ini. Pembuatan database dipimpin oleh Jurnalis Óscar Parra. Jurnalis, mahasiswa jurnalistik, pengembang web, hingga disainer grafis dilibatkan.
Tim mengumpulkan dan mengonfirmasi informasi dari peristiwa sehari-hari, berita, laporan organisasi masyarakat sipil, dan wawancara dengan saksi serta kerabat korban. Database kekerasan yang terverifikasi berhasil dibuat. Berbekal database, mereka mulai memetakan peristiwa dan mengeksplorasi siapa saja korbannya. Tim juga menganalisa detil di sekitar kematian dan mengungkap bagaimana brutalitas polisi terjadi berulang kali.
Database terkait demonstrasi bukan proyek pertama Parra. Rutas del Conflicto diluncurkan pada 2012 ketika dia meliput proses peradilan terhadap paramiliter yang dilibatkan dalam perang Kolombia melawan Pasukan Pemberontak Bersenjata Kolombia, FARC.
Parra menyadari bahwa rincian tentang pembantaian warga sipil dan kombatan kerapkali terungkap dalam proses pengadilan “Jadi, saya pikir akan lebih baik untuk mengelompokkan semua informasi itu dalam database dan mencoba membuat perangkat pemetaan berdasarkan periode tertentu,” katanya.
Berbekal pengetahuannya sebagai system engineer dan hasratnya pada jurnalisme investigasi, Parra melatih sekelompok siswa. Ia juga mencari sumber pendanaan untuk pengembangan Rutas del Conflicto tahap pertama. Kerja keras timnya diganjar Penghargaan Jurnalisme Data 2017 untuk kategori situs web jurnalisme data terbaik.
Keberhasilan Rutas del Conflicto direplikasi. Dalam proyek selanjutnya, tim mengumpulkan, mengatur, dan memproses data tentang terkait konflik lahan di Kolombia. Mereka mencatat para korban konflik yang dihilangkan secara paksa di sungai-sungai di seluruh negeri.
Membuat database sendiri jadi strategi ruang redaksi ketika berhadapan dengan minimnya dan tidak dapat diandalkannya data resmi dari pemerintah. Langkah ini berguna untuk melakukan liputan investigasi atau memverifikasi berbagai sumber informasi.
“Tidak memiliki data bukanlah alasan untuk tidak menceritakan kisah yang Anda yakini berguna bagi publik,” kata Romina Colman, pakar jurnalisme data Argentina.
Mebuat database sendiri juga bisa dilakukan ketika jurnalis menemukan informasi dalam berbagai format. Mulai laporan PDF, catatan kertas yang berantakan, wawancara dan pengamatan reporter, file yang dipindai, dokumen tulisan tangan, hingga arsip lama. Semua sumber tersebut dapat diubah menjadi database yang dapat diolah, dengan keahlian yang tepat.
Trend ini saya pelajari pada tahun 2009. Ketika itu, saya membantu anggota GIJN, Consejo de Redacción (CdR) untuk membuat database untuk menyelidiki pejabat publik dan korupsi. Perangkat untuk mengekstrak data dari dokumen masih langka ketika itu. Jurnalisme data juga baru mulai muncul di Kolombia. Hambatan lainnya adalah sedikit sekali informasi berformat digital dari pemerintah yang bisa kami olah.
Kami mulai menyalin ratusan dokumen yang berisi pernyataan para pejabat publik mengenai konflik kepentingan dan sumber dana kampanye mereka. Informasi lain yang relevan dari 20 sumber resmi ikut ditambahkan. Butuh beberapa tahun untuk menyelesaikan database tersebut. Kerja panjang tersebut memperoleh hasil sepadan. Majalah investigasi terkemuka Semana sebagai contoh, menggunakan database untuk membongkar praktik lancung redistribusi lahan yang dilakukan politikus.
Ketika manajemen dan analisis data mulai berkembang sebagai teknik jurnalisme pada 2011, Kolombia bergabung dengan Open Government Partnership. Hal tersebut memungkinkan saya dan tim untuk terus membuat database sebagai bahan liputan. Banyak hal baru berhasil diungkap. Salah satunya adalah kongkalingkong pengawas keuangan lokal dengan orang-orang yang mestinya mereka awasi seperti walikota dan gubernur. Kami juga menganalisa siapa para pendonor kampanye presiden dan kongres pada tahun 2018. Beberapa data yang digunakan adalah kontrak publik, daftar perusahaan, dan data historis mengenai pejabat publik di tingkat lokal.
Jurnalis telah membuat database sendiri sejak tahun 1980-an. Namun, perkembangan teknologi yang terjadi beberapa tahun belakangan membuat data lebih mudah diakses dan diolah. Jurnalis yang mendapatkan pelatihan jurnalisme data juga semakin banyak. Mereka berkolaborasi dengan para ahli pemrograman agar database bisa dibuat dan diakses untuk tujuan jurnalistik.
Trend tersebut menjalar ke berbagai negara. Ada database soal aset yang disita dari penjahat di Italia; database kasus kematian akibat penggunaan taser (alat kejut listrik) oleh polisi di Amerika Serikat; dan database berisi 2.460 kasus kekerasan terhadap pembela lingkungan di Amerika Latin yang merupakan hasil kolaborasi jurnalis di 12 negara.
Banyak dari database tersebut menjadi jantung dari liputan investigasi. Beberapa di antaranya bahkan menyabet penghargaan Internasional seperti Sigma Award 2020 yang didapat OCCRP melalui liputan Troika Laundromat. Mereka menggunakan teknologi teranyar untuk mengekstrak data dari 1,3 juta transaksi perbankan yang dilakukan ratusan bank. Liputan tersebut membongkar siasat oligark dan politikus Rusia yang secara diam-diam mencuci uang haram dan menghindari pajak dengan menginvestasikannya di luar negeri.
Berbagai proyek tersebut masyhur karena berhasil mengumpulkan data yang sebelumnya tak tersedia untuk publik atau menyusun data yang sebelumnya terpencar. Kisah-kisah besar dipublikasikan dengan menggunakan database tersebut.
Namun, tak perlu berkecil hati. Jurnalis investigasi juga dapat membuat database dalam skala yang lebih kecil dan tetap memiliki dampak besar. Kamu bisa menggunakan tips di bawah ini untuk melakukannya.
- Persiapan
- Eksplorasi. Perhatikan baik-baik apakah kamu bisa mengidentifikasi pola tertentu dalam data. Jika kamu membuat database dengan menggunakan informasi dari wawancara dan reportase lapangan, analisa kasus atau kisah serupa untuk menemukan benang merah. Berkonsultasi dengan ahli yang menguasai topik tertentu bakal berguna dalam tahap ini.
- Ruang lingkup. Beberapa hal yang perlu diperhatikan adalah periode data, kategori yang bakal digunakan dan kategori yang tak digunakan. Pertimbangkan sumber daya yang kamu miliki — waktu, tim, dana, dan teknologi — agar kamu bisa menentukan seberapa banyak informasi yang dimasukkan dalam database.
- Pertanyaan. Buatlah daftar pertanyaan yang hendak kamu jawab melalui liputan. Hal ini bisa membantumu mendisain database.
- Kerja Tim. Melibatkan anggota tim saat persiapan database membuat tahap ini lebih mudah dilakukan dan kerja tim lebih kuat. Proyek kolaboratif Land of Resistants yang menelisik kekerasan terhadap komunitas pejuang lingkungan di Amerika Latin mempersiapkan databasenya saat lokakarya.
2. Disain dan Pembuatan
- Mulai dengan menentukan variabel yang dipakai untuk tiap kolom: kasus, orang, lokasi, produk, kejadian, negara, transaksi, dsb.
- Tentukan apa saja yang bisa masuk dalam kolom tersebut. Sebagai contoh, kolom orang bisa diisi dengan nama, nomer identitas, umur, lokasi, pekerjaan, dsb.
- Untuk setiap baris database, tentukan satu kolom sebagai kunci. Informasi yang dimasukkan ke dalamnya mesti berbeda untuk tiap baris dan salah satu yang lazim digunakan adalah nomer. Aspek ini penting diperhatikan karena penting untuk identifikasi serta verifikasi dan penggabungan dua atau lebih dataset.
- Keseragaman penting. Pastikan bahwa angka diketik sebagai angka, tanggal ditulis dalam format yang benar, dan kategori selalu dieja dengan cara yang sama. Sebisa mungkin, gunakan input berbentuk multi-opsi daripada pertanyaan terbuka.
- Gunakan beberapa kolom untuk mengidentifikasi orang yang memasukkan informasi dan sumber asli data (jangan lupa tautkan ke sumber tersebut). Hal ini bakal berguna saat kamu memeriksa ulang database.
- Hanya masukkan informasi yang relevan dengan penyelidikan.
- Databasemu mungkin membutuhkan lebih dari satu tabel. Hal ini tergantung pada kerumitan dan hubungan antara tabel.
- Buatlah disain database yang mudah digunakan. Setiap orang yang memasukkan informasi dalam database mesti paham dengan kolom dan baris sehingga tak salah dalam memasukkan informasi.
- Buat database yang terukur agar apabila ada data terkait di masa depan, kamu dapat memperbarui database ini.
3. Periksa, periksa, dan periksa
- Lakukan percobaan. Masukkan beberapa informasi untuk memeriksa apakah database berfungsi dan bisa digunakan dalam liputanmu. Kalkulasikan rerata waktu yang dibutuhkan untuk mengisi, memeriksa, dan mengkonfirmasi seluruh informasi dalam sebaris database. Hal itu berguna untuk memperkirakan waktu yang dibutuhkan untuk memasukkan seluruh informasi ke dalam database.
- Buat daftar berisi “bagaimana jika” untuk menganalisa kemungkinan munculnya kesalahan skenario dan cara penyelesaiannya.
- Evaluasi keandalan (reliabilitas) dan konsistensi beberapa kolom terpenting. Adakalnya kamu menemukan dua sumber yang mengatakan hal berbeda mengenai satu hal yang sama, umumnya tanggal atau jumlah. Pertimbangkan untuk menggunakan kedua sumber tersebut daripada menentukan mana yang benar dan menghapus salah satunya.
4. Pengisian
- Aplikasikan semua hal yang didapat saat pemeriksaan untuk melatih para enumerator. Pastikan kalau semua memiliki pandangan yang sama menggenai konsep dan kategori yang ada dalam database.
- Gunakan perangkat yang memungkinkan kolaborasi sehingga akses terhadap database tak hanya bergantung pada satu orang.
- Pisahkan data berdasarkan kategori yang dibuat pada tahap disain. Hal ini berguna untuk mengatur siapa mengisi apa dan menghindari terjadinya duplikasi data.
- Jika kamu harus menambang data dari situs web atau dokumen, fokuskan usaha pada hal-hal paling relevan dengan investigasi yang bakal digarap. Troika project misalnya, menentukan kalau tujuan dari transaksi sebagai kunci.
- Apabila database yang mesti digarap terlalu besar, pertimbangkan untuk merekrut tenaga profesional atau lembaga lain.
5. Audit dan pemeriksaan
- Membuat database hanyalah langkah awal investigasi. Sebelum menganalisa data dan mengambil kesimpulan, kamu perlu mengonfirmasikannya dengan sumber informasi, entah itu dokumen atau tokoh utama dalam cerita. “Kami membawa data ke kota tempat pembantaian terjadi sehingga para penyintas dapat memperbaiki kesalahan yang mungkin timbul,” jelas Parra mengenai salah satu liputannya di proyek Rutas del Conflicto.
- Tentukan metode audit. Kamu bisa memeriksa semua informasi yang diinput dalam database atau menggunakan metode acak — tentunya dengan penentuan jumlah sampel yang bisa mencerminkan populasi data. Database mesti diperiksa oleh orang yang tidak memasukkan informasi.
- Tentukan kesalahan yang mesti dicari melalui audit. Bentuk-bentuk kesalahan yang umum terjadi adalah kesalahan ketik, angka, tanggal, duplikasi, dan input yang tak memenuhi kriteria yang sudah ditentukan.
- Dua metode yang bisa dipakai ketika melakukan audit angka adalah menjumlahkan dan membandingkannya dengan nilai yang ada di dokumen asli. Kamu juga bisa menggunakan fitur pengurutan untuk menemukan angka yang janggal (entah terlalu besar atau terlalu kecil).
- Database hanya bisa dipublikasikan apabila telah melalui proses pemeriksaan fakta, audit data, konfrontasi dengan sumber, dan tinjauan hukum.
Perangkat lunak
Kamu tak perlu menjadi ahli komputer untuk membuat sebuah database. Libatkan orang dengan keahlian tersebut dalam tim dan bekerja sama lah dalam kemitraan. Untuk membuat database, ada beberapa perangkat lunak yang bisa dipakai.
- Aplikasi membuat formulir yang membantu jurnalis mengisi database: Google Forms, Node.js, Django, atau Flask.
- Penyimpanan: MongoDB Atlas atau Google Firebase.
- Menstrukturkan dan memproses data: Python (yang bisa dihubungkan dengan perangkat penyimpanan di atas), PostgreSQL, ELK Stack, dan Filemaker.
- Untuk mengekstrak dan mengonversi data berformat pdf: Wondershare Pdf Converter Pro, Google Documents basic converter, iLovePDF, Smallpdf, Tabula, atau Import.io.
- Tentu saja kamu bisa setiap saat mengunduh data dari sistem database dan menggunakan Excel atau Google Spreadsheets. Dua perangkat tersebut bisa jadi pilihan terbaik untuk proyek berskala kecil.
Tips dan rekomendasi
- Keamanan penting. Gunakan komunikasi terenkripsi, selalu memiliki salinan data, dan pertimbangkan keamanan personalmu.
- Belajar menggunakan Excel. Namun, jangan tutup kemungkinan bekerja sama dengan saintis data dan pengembang.
- Perhatikan kemungkinan penggunaan perangkat yang memudahkan pekerjaan. Kamu bisa menggunakan perangkat untuk menambang data, formulir daring untuk mengisi database, pengonversi PDF, pemindari dengan fitur OCR, dan pemroses teks. OCCRP membuat Aleph, platform yang mengerjakan hampir semua hal tersebut.
- Proyek ini biasanya membutuhkan tim yang besar. Oleh sebab itu, pilih seseorang untuk menjadi pemimpin proyek dan pertimbangkan rekomendasi untuk melakukan kolaborasi.
- Transparan terhadap audiens mengenai metodologi dan sumber yang dipakai apabila hal tersebut dianggap aman. Tunjukkan sampel dokumen asli yang menjadi sumber informasi databasemu.
- Beritahu kontak yang dapat dihubungi ketika melakukan investigasi. Dengan cara tersebut, pembaca bisa bertanya atau menunjukkan kesalahan yang mungkin muncul dalam database.
Bacaan terkait:
- Menyelidiki Pencucian Uang yang Dilakukan Kelompok Kejahatan Terorganisir
- Cara Pemenang Pulitzer Menyelidiki Pusat Detensi Xinjiang
- Tunawisma Dalam Jurnalisme Data
Miriam Forero Aziza dalah jurnalis lepas asal Kolombia. Liputannya dipublikasikan di Vice, Colombiacheck, dan El Espectador. Miriam juga punya pengalaman lebih dari sepuluh tahun dalam kolaborasi investigasi, analisa data, dan visualisasi. Dia juga masuk dalam tim penulis Iberoamerican Data Journalism Handbook. Saat ini dia menjabat sebagi Latin America Data Editor di Organized Crime and Corruption Reporting Project (OCCRP)
Tulisan ini adalah saduran Tips for Building a Database for Investigations yang diterbitkan Global Investigative Journalism Network (GIJN). Penyebarluasan tulisan ini berada di bawah lisensi Creative Commons Attribution-NonCommercial 4.0 International. Jaring bekerjasama dengan GIJN untuk mengalihbahasakan dan mempublikasikan secara berkala artikel-artikel GIJN untuk pengembangan kapasitas jurnalisme investigasi di Indonesia. Untuk menerbitkan ulang tulisan ini, Anda bisa menghubungi [email protected].