Wayback Machine si Pengarsip Halaman

Wayback Machine adalah salah satu perangkat sumber terbuka yang menjadi favorit banyak jurnalis investigasi tahun lalu. Perangkat ini dikembangkan oleh Internet Archive, perpustakaan nirlaba yang tahun ini merayakan ulang tahun ke-25. Sedikit informasi: saat ini Wayback Machine mengarsipkan lebih dari 1 miliar URL per harinya, dengan jumlah URL yang telah disimpan mencapai lebih dari 547 miliar.

Dengan catatan macam itu, perangkat ini telah banyak digunakan secara gratis oleh jurnalis, periset, pemeriksa fakta, aktivis, hingga publik secara umum. Ribuan artikel mengenai Wayback Machine sudah ditulis. Para jurnalis investigasi juga menjadikannya sebagai salah satu perangkat favorit tahun lalu. Berikut aktivitas yang bisa dilakukan oleh perangkat ini:

 

Mengarsipkan URL

Adakalanya kamu memublikasikan artikel yang di dalamnya terdapat referensi ke sebuah laman. Di kemudian hari, ketika laman tersebut dihapus oleh penggunanya, artikelmu bakal terganggu. Kini, hal tersebut bisa dihindari.

Puluhan juta URL diarsipkan setiap hari oleh pengguna dengan menggunakan fitur “Save Page Now” dari Wayback Machine. Siapa pun dapat mengirimkan URL dan jika masuk dengan akun gratis, kamu juga bisa mengarsipkan “tautan keluar” — tautan eksternal dalam laman asli yang kamu ambil — dan mendapatkan laporan ikhtisar tentang proses pengambilan ini melalui email. Fitur berguna lainnya adalah pengguna bisa mengunduh URL yang diambil dalam format WACZ, lalu meninjau/memprosesnya dengan alatmu sendiri.

Fitur Save Page Now juga dapat melakukan pengarsipan Twitter secara otomatis. Kamu misalnya, bisa dengan mudah mengarsipkan hingga 3.200 Tweet terbaru dari profil Twitter manapun hanya dengan memasukkan URL dan mencentang opsi yang relevan.

Sedikit gambaran tehnikal mengenai cara kerja fitur ini: jika kamu punya daftar URL yang ingin diarsipkan, masukkan daftar tersebut ke kolom A Google Sheet. Setelah itu, kirim ke layanan “Save Page Now” Google Sheet yang bisa diakses di tautan ini. Apabila langkah tersebut telah dilakukan, maka kolom B akan secara otomatis menghasilkan kode status; kolom C menghasilkan URL yang diarsipkan; dan kolom D akan menandai apabila URL yang hendak diarsipkan sudah diarsipkan oleh pengguna lain.

Langkah lain yang bisa dilakukan adalah mengirimkan sebuah URL ke alamat surel [email protected]. Apabila kamu ingin mengarsipkan outlinks yang ada di URL tersebut, serta “capture outlinks” di subjek surel. Ketika proses selesai, konfirmasi akan terkirim ke alamat surelmu.

Terakhir, jika kamu terbiasa menggunakan API, Wayback Machine memungkinkan integrasi dengan alur kerja perangkat lunak. Dengan langkah tersebut, otomatisasi kerja dimungkinkan ketika kamu membuat sebuah aplikasi. Salah satu contohnya adalah yang dilakukan Meedan, lembaga nirlaba yang berbasis di San Fransisco, Amerika Serikat yang mengintegrasikannya dengan perangkat lunak untuk mendukung praktik jurnalistik.

 

Membandingkan Arsip

Adakalanya pengelola mengubah situs web mereka. Untuk membandingkan versi baru dengan versi sebelumnya, kamu bisa menggunakan fitur “Changes”. Langkahnya adalah: masukkan URL yang sudah diarsipkan ke fitur search yang ada di laman muka Wayback Machine, lalu pilih “Change”.

Berbagai versi situs web yang sudah diarsipkan bakal muncul di layar. Pilih dua URL yang muncul dan dua versi situs web secara otomatis akan tampil bersisian. Perbedaan kedua versi tersebut ditandai dengan warna kuning dan biru. Tangkapan layar di bawah menunjukkan bagaimana perangkat ini digunakan untuk mengetahui usaha seorang Blogger asal Inggris dan penasihat politik untuk menulis ulang sejarah.

Fitur “Changes” di Wayback Machine merekam bagaimana Dominic Cummings, mantan kepala penasihat perdana menteri Inggris, menambahkan unggahan blog aslinya secara diam-diam (berwarna biru, kanan). Gambar: Tangkapan layar
Fitur “Changes” di Wayback Machine merekam bagaimana Dominic Cummings, mantan kepala penasihat perdana menteri Inggris, menambahkan unggahan blog aslinya secara diam-diam (berwarna biru, kanan). Gambar: Tangkapan layar

 

Mencari arsip secara mendalam

Anda dapat menggunakan URLs option pada Wayback Machine untuk mencari sub-URL dari URL apapun yang diambil dengan menggunakan kata kunci dan/atau mime-type. Hasil pencarian kemudian dapat disaring dan diurutkan sesuai dengan kebutuhanmu.

File dan koleksi situs web tertentu juga telah diindeks oleh kami. Wayback Machine menawarkan antarmuka untuk pencarian teks menyeluruh terhadap koleksi tersebut. Lihat “Collection Searcg” di bagian bawah beranda Wayback Machine untuk melakukan hal ini. Beberapa situs web yang sudah hilang dan kami arsipkan adalah poetry.com , Russian Independent Media , dan koleksi berisi 749 juta file berformat PDF . Cara lain untuk mengakses layanan ini adalah melalui halaman beranda Internet Archive . Jika kamu ingin kami mengindeks koleksi materi arsip tertentu (misalnya mencocokkan berbagai pola URL), silakan hubungi kami di [email protected].

 

Menggunakan API

Selain API yang mendukung pengarsipan dengan menggunakan fitur “Save Page Now”, ada juga API yang bisa digunakan untuk mengetahui apakah URL tertentu sudah pernah diarsipkan. Keterangan lebih lanjut mengenai hal ini bisa diakses di tautan ini.

Wayback tak memberi batasan pada frekuensi penggunaan API. Namun, adakalanya kami menerapkan beberapa langkah pembatasan. Apabila mengalami masalah dengan penggunaan perangkat ini, kamu bisa mengirimkan surel atau DM ke Twitter. Mendukung jurnalis adalah prioritas utama kami.

 

Memberikan konteks

Konteks dan asal-muasal sangat penting untuk memahami arsip dengan lebih menyeluruh. Lantaran itu, kami menambahkan fitur konteks yang bisa dipakai pengguna ketika halaman situs web yang diarsipkan sudah dihapus atau dibuat oleh organisasi penelitian yang sudah dikenal.

Wayback Machine menyertakan header kuning yang tertaut ke penggunaan eksternal halaman yang diarsipkan, dan dilengkapi tab “About this capture” untuk memberikan konteks historis tambahan tentang halaman tersebut. Gambar: Tangkapan layar
Wayback Machine menyertakan header kuning yang tertaut ke penggunaan eksternal halaman yang diarsipkan, dan dilengkapi tab “About this capture” untuk memberikan konteks historis tambahan tentang halaman tersebut. Gambar: Tangkapan layar

Asal dari  setiap laman yang diarsipkan merupakan hal penting untuk memahami laman tersebut. Sebagai contoh, apakah gambar dari laman diarsipkan pada waktu yang sama dengan elemen lain di laman tersebut? Informasi itu bisa didapat dengan mengeklik tautan “About this capture” di pojok kanan atas setiap tampilan laman yang diarsipkan.

Perhatian yang kami berikan pada integritas arsip dan tranparansi soal asal laman memberikan kepercayaan diri pada pengguna ketika menggunakan Wayback Machine. Hal itu dibuktikan dengan pengakuan pengadilan di berbagai belahan dunia terhadap laman yang diarsipkan di situs web kami.

Kamu bisa mengontak kami apabila ingin menambahkan konteks pada arsip yang kamu buat.

 

Ekstensi peramban

Wayback Machine juga memiliki ekstensi yang bisa dipasang di peramban seperti Safari, Firefox, dan Chrome. Untuk aplikasi telepon pintar, perangkat ini tersedia di iOS dan Android. Kemitraan juga dijalin dengan peramban Brave, untuk memudahkan penggunaan Wayback Machine.

Jangan lupa untuk memberikan masukan bagi pengembangan perangkat ini melalui surel atau DM di Twitter. Pertanyaan, permintaan, laporan bug, dan cerita sukses juga bisa kamu kirimkan kepada kami.

Untuk mendapatkan perkembangan terbaru mengenai perangkat ini dan berbagai layanan Internet Archive lainnya, kamu bisa mengikuti akun kami di Twitter dan membaca unggahan di blog.

 

Layanan lain

Selain Wayback Machine, Internet Archives juga menyediakan berbagai koleksi. Ada lebih dari 25 juta jurnal ilmiah dengan akses terbuka; hampir 30 juta buku elektronik yang bisa ditinjau, dipinjam, atau diunduh; dan berita televisi berdurasi total lebih dari jutaan jam.

Untuk mendapatkan informasi terbaru soal proyek dan layanan dari Inetrnet Archive, kamu bisa mengikuti akun Twitter kami di @internetarchive dan @waybackmachine. Ada juga unggahan blog yang bisa dibaca. (Mark Graham: penerjemah: Kholikul Alim)


Mark Graham telah mengelola Wayback Machine selama lebih dari lima tahun. Sebelumnya, dia adalah Senior Vice President di NBC News Digital. Graham juga membantu menjalankan layanan surel AS-Soviet; memulai proyek untuk membangun antarmuka berbasis web pertama untuk sistem diskusi daring; dan membantu menjalankan iVillage, layanan daring untuk perempuan.

Tulisan ini pertama kali dipublikasikan oleh Global Investigative Journalism Network (GIJN) dengan judul Tips for Using the Internet Archive’s Wayback Machine in Your Next Investigation. Penyebarluasan tulisan ini berada di bawah lisensi Creative Commons Attribution-NonCommercial 4.0 International. Jaring bekerjasama dengan GIJN untuk mengalihbahasakan dan memublikasikan secara berkala artikel-artikel GIJN untuk pengembangan kapasitas jurnalisme di Indonesia. Untuk memublikasikan ulang tulisan ini secara gratis, Anda bisa menghubungi [email protected].

Berlangganan Kabar Terbaru dari Kami

GRATIS, cukup daftarkan emailmu disini.