|
Pendahuluan
|
Universitas Bengkulu merupakan institusi ilmiah yang mempunyai
kompetensi tinggi untuk memiliki sistem komputasi yang
cepat dengan kapasitas yang besar guna melayani pengolahan data
yang dilakukan oleh citivitas akademikanya. Namun dengan
kemampuan anggarannya sering sangat terbatas sehingga tidak
memungkinkan untuk menyediakan komputer yang sesuai untuk
memenuhi kebutuhan tersebut. seperti PC terkini, mainframe atau
super komputer. Sebagai alternatifnya adalah mengoptimalkan
komputer-komputer yang ada (PC) melalui suatu sistem yang dapat
memberdayakan komputer tersebut sehingga paling tidak
dapat mendekati spesifikasi mainframe . Sistem yang dipandang
sangat sesuai adalah sistem klaster PC (PC cluster).
|
Klaster PC pada dasarnya adalah sistem penyatuan beberapa PC
atau server ke dalam satu kesatuan komputasi. Masing-masing PC
tersebut akan merupakan unit kerja yang bekerja secara
integral dengan PC-PC yang lain dalam menjalankan suatu tugas
secara paralel. Dengan demikian beban untuk masing-masing PC
akan menjadi jauh berkurang, dan konsekuensinya lower end PC
dapat diberdayakan untuk mengerjakan tugas yang memerlukan
komputasi intensif. |
Dari
segi investasi, klaster PC jauh lebih murah dibanding dengan
upgrading guna mengikuti perkembangan teknologi PC yang
berkembang begitu cepat. Hal ini karena klaster dapat dibangun
dari PC-PC yang sudah ada, berapapun jumlahnya dan hanya satu
unit perangkat peripheral yang terdiri dari sebuah monitor,
sebuah video card, dan sebuah keyboard. Namun,
setiap PC anggota klaster merupakan sistem yang lengkap
sehingga dapat digunakan untuk berbagai keperluan lainnya.
Dengan demikian pada saat tidak digunakan untuk keperluan
komputasi intensif masing-masing mesin masih dapat digunakan
untuk keperluan lain sehingga tidak terjadi kesia-siaan.
|
Penghematan biaya investasi juga berasal perangkat lunaknya
(software). Sistem ini didukung oleh program-program yang
berlisensi publik (General Public Licence), baik untuk
sistem operasi (OS) maupun untuk program aplikasinnya, yang
dapat diperoleh secara mudah dan dimanfaatkan secara cuma-cuma
|
Dengan
terbangunnya klaster PC tersebut, maka ke depan berbagai permasalahan komputasi dapat dikurangi,
terutama yang terkait dengan pengolahan data berskala
besar. Termasuk didalamnya adalah pengolahan data statistik
hasil-hasil penelitian, data induk (database), dan data citra
yang selama ini banyak mengalami hambatan. Bagi Universitas
Bengkulu, komputasi untuk analisis data statisitik merupakan kebutuhan
yang paling perlu mendapat perhatian pada saat ini. Hal ini
karena di satu sisi semaikin
banyak penelitian dosen maupun mahasiswa yang memerlukan analisis
data, sedang disisi
lain perangkat komputasi yang tersedia terbatas kapasistas
processing-nya. Oleh karena itu, pengembangan sistem klaster PC
menjadi sangat relevan.
|
|
Metode |
Peneltitian dilaksanakan di Laboratorium Agronomi Universitas
Bengkulu mulai bulan Juni 2004 sampai Oktober 2004.
Beberapa tahapan ditempuh untuk membangun sistem klaster yang
melibatkan setting perangkat keras dan perangkat lunak.hingga
analisis data menggunakan sistem tersebut
|
Klaster dibangun dengan dari sebuah PC yang bertindak sebagai
master dan tiga PC yang bertindak sebagai slaves.
Master yang digunakan memiliki spessifikasi prosesor
Intel® Pentium 4
1.8 Ghz
dengan memory 128 Mhz. Satu slave di antaranya memiliki
prosesor Intel® Pentium III 501 Mhz dengan memory 128
Mhz dan dua slave lainnya
Intel® Pentium III 668 Mhz dengan memory 128 Mhz.
Masing-masing PC memiliki kartu jaringan (LAN Card) berjenis
fast Ethernet dengan spesifikasi Realtek 8139 PCI 100 Mbps.
Melalui LAN card tersebut, masing-masing PC dihubungkan dengan
kabel UTP kategori 5 dan konektor RJ45.
Distribusi data diatur dengan switch yang memiliki bandwidth
10/100 Mbps. |
Operating sistem (OS) yang digunakan adalah LINUX Mandrake 9.2
dengan kernel 2.4.22-36. OS ini dipilih karena fasilitas GUI (Graphic
User Interface), paralel programming, internet, dan didukung
oleh berbagai program aplikasi. Kelebihan utama OS ini adalah
tersedia sebagai program yang open source sehingga dapat
peroleh secara cuma-cuma.
|
Instalasi Linux Mandrake diawali dengan setting pada BIOS pada
setiap PC agar booting dapat dilakukan melalui CD ROM dan
selanjutnya instalasi dilakukan dengan memanfaatkan menu-menu
yang tersedia. Dari menu-menu tersebut, dipilih kelompok paket (package
group) yang sesuai dengan kebutuhan untuk pengolahan data
secara klaster maupun stand alone.
|
Dalam konfigurasi jaringan, setiap PC mendapat alamat IP (internet
protocol) yang unik berdasarkan standar yang ditetapkan
oleh IANA (Internet Assigned Numbers Authority) untuk
menghindari konflik antar PC (Tabel 1).
Mengingat jumlah PC yang terlibat dalam jaringan kurang
dari 8, maka berdasarkan RFC1597 untuk jaringan pribadi,
sistem klaster yang dibangun ini dapat diaketegorikan dalam
jaringan kelas C dengan
rentang IP adress 192.168.0.0 sampai 192.168.255.255 |
Fasilitas remote shell diinstalasikan pada klaster agar
layanan remote login (rlogin) dan remote shell (rsh)
dapat dilakukan tanpa password.
Dalam hal ini home directory di setiap anggota
klaster akan menyimpan file rhost yang bersisi daftar anggota
yang diijinkan untuk diakses. Dengan demikian, login
dan pemindahan layanan kerja dapat dilakukan secara otomatis
tanpa memerlukan password lagi |
Massage
Passing Inteface (MPI) yang digunakan adalah LAM 7.0.6/MPI 2
C++/ROMIO (The LAM/MPI Open System Lab., 2004). Instalasi
software tersebut dilakukan dengan mengekstrak file lam-mpi.tar.gz. pada directory usr/local.
Dengan tersistalasi nya MPI ini maka
pembagian kerja antar anggota klaster dapat dilakukan.
LAM MPI dipilih sebagai massage passing (MP) karena
software ini sangat kompatibel dengan program aplikasi statistik
yang digunakan.
|
R Version
1.9.1 (The R Foundation for Statistical Computing, 2004) dipilih
sebagai program pengolah data secara statistik karena selain
sifatnya yang open source dari
situs publik dengan dokumentasi yang sangat memadai dan
mempunyai kemampuan untuk mengolah data dalam skala besar.
Bahkan, menurut
Tierney (2003), R mendapat ACM Software System Award 1999 dan
secara de facto
merupakan standard untuk komputasi dalam penelitian statistik.
Selain itu, R dapat dijalankan secara paralel melalui
sistem klaster yang dibangun karena dilengkapi interface, yakni
Rmpi, serta mudah
dipelajari.
|
HPL yang merupakan varian LINPACK (Linear Package)
digunakan sebagai benchmark klaster. Software ini dipasang
pada seluruh anggota klaster untuk mengukur
performa klaster dalam parameter Gflop (Giga
floating points operation per second). Hasil pengukuran
tersebut kemudian dibandingkan dengan rujukan yang tersedia
pada situs http://www.netlib.org/benchmark/hpl/results.html. |
Seluruh kegiatan yang terjadi di dalam klaster dipantau dengan
Ganglia Cluster Toolkit Version 2.5.5 (Ganglia Development Team,
2004). Software ini
menampilkan tingkat pemakaian memory dan waktu prosesing
baik secara global maupun dari masing-masing anggota klaster
|
Klaster diuji
kemampuannya untuk mejalankan pengolahan data secara
numeris, baik dalam bentuk operasi sederhana berupa perkalian
matriks maupun analisis data secara statistik dengan menggunakan
R.
Efisiensi klaster diukur dengan membandingkan waktu yang
dibutuhkan oleh satu PC (serial processing) dengan
kalster (parallel processing) dalam menyelesaikan suatu
operasi pengolahan data yang ditugaskan (running time).
|
Operasi matriks dilakukan dalam bentuk perkalian matriks
simetri dengan vektor yang memiliki dimensi 25 x 25 (baris x
kolom) hingga 2000 x 2000. Untuk analisis statistik pengujian
dilakukan dengan teknis analisis varian untuk ragam tunggal (univariate/Anova)
dan ragam ganda (multivarite/Manova),
dan analisis korelasi Pearson untuk mendapatkan
koefisein korelasi sederhana dan matriks kovarian. Data untuk
analisis statistik tersebut diperoleh melalui penggunaan
random number generator yang tersedia dalam R. Analisis
melibatkan 8 variabel yang masing memiliki ukuran data (N)
berkisar antara 50 hingga 3200 titik data. Baik Anova
maupun Manova dilakukan berdasarkan model Rancangan Acak
Lengkap dengan 5 ulangan. |
Kemampuan Master dalam membaca data (data loading) dari
file data agar
dapat tersedia bagai anggota klaster untuk dianalisis
juga dicatat. Dalam
hal ini kecepatan
dan sisa memory yang tersedia selama data loading
menjadi tolok ukurnya. Untuk keperluan tersebut, perintah diberikan kepada master
untuk membaca data berkisar antara 4 juta hingga 8 juta titik
data. |
|
|
|
Next
|