Update 23/11/05                                                                Alamat Redaksi ::: Laboratorium Ilmu Tanah (Gedung H) Faperta UNIB Jl. WR. Soepratman Telp.(0736)21170 Ext.218 Bengkulu 38371A

 
Info Linux
 
Halaman ini akan tampil lebih baik melalui browser IE dgn resolusi 800 x 600 pixels

An open-source XML/HTML browser which is implementing full Level 2 DOM support

Topologi jaringan
Pantauan Ganglia
Efisiensi Pengolahan data Numeris dalam Analisis Data secara Paralel dengan Klaster PC 

Bambang Gonggo M., Mohammad Chozin

Fakultas Pertanian Universitas Bengkulu

bgonggo@yahoo.com

(Hibah Pekerti, Dikti, 2004-2005)

Pendahuluan
     Universitas Bengkulu merupakan institusi ilmiah yang mempunyai kompetensi tinggi untuk memiliki sistem  komputasi yang cepat dengan kapasitas yang besar guna melayani pengolahan data yang dilakukan oleh citivitas akademikanya. Namun dengan kemampuan anggarannya sering sangat terbatas sehingga tidak memungkinkan untuk menyediakan komputer yang sesuai untuk memenuhi kebutuhan tersebut. seperti PC terkini, mainframe atau super komputer. Sebagai alternatifnya adalah mengoptimalkan komputer-komputer yang ada (PC) melalui suatu sistem yang dapat  memberdayakan komputer tersebut sehingga paling tidak dapat mendekati spesifikasi mainframe . Sistem yang dipandang sangat sesuai adalah sistem klaster PC (PC cluster).
     Klaster PC pada dasarnya adalah sistem penyatuan beberapa PC atau server ke dalam satu kesatuan komputasi. Masing-masing PC tersebut akan merupakan unit kerja yang bekerja secara integral dengan PC-PC yang lain dalam menjalankan suatu tugas secara paralel. Dengan demikian beban untuk masing-masing PC akan menjadi jauh berkurang, dan konsekuensinya lower end PC dapat diberdayakan untuk mengerjakan tugas yang memerlukan komputasi intensif.
     Dari segi investasi, klaster PC jauh lebih murah dibanding dengan upgrading guna mengikuti perkembangan teknologi PC yang berkembang begitu cepat. Hal ini karena klaster dapat dibangun dari PC-PC yang sudah ada, berapapun jumlahnya dan hanya satu unit perangkat peripheral yang terdiri dari sebuah monitor, sebuah video card, dan sebuah keyboard. Namun,  setiap PC anggota klaster merupakan sistem yang lengkap sehingga dapat digunakan untuk berbagai keperluan lainnya. Dengan demikian pada saat tidak digunakan untuk keperluan komputasi intensif masing-masing mesin masih dapat digunakan untuk keperluan lain sehingga tidak terjadi kesia-siaan.
     Penghematan biaya investasi juga berasal perangkat lunaknya (software). Sistem ini didukung oleh program-program yang  berlisensi publik (General Public Licence), baik untuk sistem operasi (OS) maupun untuk program aplikasinnya, yang dapat diperoleh secara mudah dan dimanfaatkan secara cuma-cuma
    Dengan terbangunnya klaster PC tersebut, maka ke depan  berbagai permasalahan komputasi dapat dikurangi,  terutama yang terkait dengan pengolahan data berskala besar. Termasuk didalamnya adalah pengolahan data statistik hasil-hasil penelitian, data induk (database), dan data citra yang selama ini banyak mengalami hambatan. Bagi Universitas Bengkulu,  komputasi untuk analisis data statisitik merupakan kebutuhan yang paling perlu mendapat perhatian pada saat ini. Hal ini karena di satu sisi  semaikin banyak  penelitian dosen maupun mahasiswa yang memerlukan analisis data, sedang  disisi lain perangkat komputasi yang tersedia terbatas kapasistas processing-nya. Oleh karena itu, pengembangan sistem klaster PC menjadi sangat relevan.
Metode
     Peneltitian dilaksanakan di Laboratorium Agronomi Universitas Bengkulu mulai bulan Juni 2004 sampai  Oktober 2004. Beberapa tahapan ditempuh untuk membangun sistem klaster yang melibatkan setting perangkat keras dan perangkat lunak.hingga analisis data menggunakan sistem tersebut
     Klaster dibangun dengan dari sebuah PC yang bertindak sebagai master dan tiga PC yang bertindak sebagai slaves.  Master yang digunakan memiliki spessifikasi prosesor Intel® Pentium 4  1.8 Ghz  dengan memory 128 Mhz. Satu slave di antaranya memiliki  prosesor Intel® Pentium III 501 Mhz dengan memory 128 Mhz dan dua slave lainnya  Intel® Pentium III 668 Mhz dengan memory 128 Mhz. Masing-masing PC memiliki kartu jaringan (LAN Card) berjenis fast Ethernet dengan spesifikasi Realtek 8139 PCI 100 Mbps. Melalui LAN card tersebut, masing-masing PC dihubungkan dengan kabel UTP kategori 5 dan konektor RJ45.  Distribusi data diatur dengan switch yang memiliki bandwidth 10/100 Mbps.
     Operating sistem (OS) yang digunakan adalah LINUX Mandrake 9.2 dengan kernel 2.4.22-36. OS ini dipilih karena fasilitas GUI (Graphic User Interface), paralel programming, internet, dan didukung oleh berbagai program aplikasi. Kelebihan utama OS ini adalah tersedia sebagai program yang open source sehingga dapat peroleh secara cuma-cuma.
     Instalasi Linux Mandrake diawali dengan setting pada BIOS pada setiap PC agar booting dapat dilakukan melalui CD ROM dan selanjutnya instalasi dilakukan dengan memanfaatkan menu-menu yang tersedia. Dari menu-menu tersebut, dipilih kelompok paket (package group) yang sesuai dengan kebutuhan untuk pengolahan data secara klaster maupun stand alone.

     Dalam konfigurasi jaringan, setiap PC mendapat alamat IP (internet protocol) yang unik berdasarkan standar yang ditetapkan oleh IANA (Internet Assigned Numbers Authority) untuk menghindari konflik antar PC (Tabel 1).  Mengingat jumlah PC yang terlibat dalam jaringan kurang dari 8, maka berdasarkan RFC1597 untuk jaringan pribadi, sistem klaster yang dibangun ini dapat diaketegorikan dalam jaringan kelas C  dengan rentang IP adress 192.168.0.0 sampai 192.168.255.255

     Fasilitas remote shell diinstalasikan pada klaster agar layanan remote login (rlogin) dan remote shell (rsh) dapat dilakukan tanpa password.  Dalam hal ini home directory di setiap anggota klaster akan menyimpan file rhost yang bersisi daftar anggota yang diijinkan untuk diakses. Dengan demikian, login dan pemindahan layanan kerja dapat dilakukan secara otomatis tanpa memerlukan password lagi
    Massage Passing Inteface (MPI) yang digunakan adalah LAM 7.0.6/MPI 2 C++/ROMIO (The LAM/MPI Open System Lab., 2004). Instalasi software tersebut dilakukan dengan mengekstrak file lam-mpi.tar.gz.  pada directory   usr/local. Dengan tersistalasi nya MPI ini maka  pembagian kerja antar anggota klaster dapat dilakukan. LAM MPI dipilih sebagai massage passing (MP) karena software ini sangat kompatibel dengan program aplikasi statistik yang digunakan.
    R Version 1.9.1 (The R Foundation for Statistical Computing, 2004) dipilih sebagai program pengolah data secara statistik karena selain sifatnya yang open source  dari situs publik dengan dokumentasi yang sangat memadai dan mempunyai kemampuan untuk mengolah data dalam skala besar. Bahkan,  menurut Tierney (2003), R mendapat ACM Software System Award 1999 dan secara de facto merupakan standard untuk komputasi dalam penelitian statistik.  Selain itu, R dapat dijalankan secara paralel melalui sistem klaster yang dibangun karena dilengkapi interface, yakni Rmpi,  serta mudah dipelajari.
     HPL yang merupakan varian LINPACK (Linear Package) digunakan sebagai benchmark klaster. Software ini dipasang pada seluruh anggota klaster untuk mengukur  performa klaster dalam parameter Gflop (Giga floating points operation per second). Hasil pengukuran tersebut kemudian dibandingkan dengan rujukan yang tersedia pada situs http://www.netlib.org/benchmark/hpl/results.html.
    Seluruh kegiatan yang terjadi di dalam klaster dipantau dengan Ganglia Cluster Toolkit Version 2.5.5 (Ganglia Development Team, 2004). Software ini  menampilkan tingkat pemakaian memory dan waktu prosesing baik secara global maupun dari masing-masing anggota klaster
     Klaster diuji  kemampuannya untuk mejalankan pengolahan data secara numeris, baik dalam bentuk operasi sederhana berupa perkalian matriks maupun analisis data secara statistik dengan menggunakan R.  Efisiensi klaster diukur dengan membandingkan waktu yang dibutuhkan oleh satu PC (serial processing) dengan kalster (parallel processing) dalam menyelesaikan suatu operasi pengolahan data yang ditugaskan (running time). 
    Operasi matriks dilakukan dalam bentuk perkalian matriks simetri dengan vektor yang memiliki dimensi 25 x 25 (baris x kolom) hingga 2000 x 2000. Untuk analisis statistik pengujian dilakukan dengan teknis analisis varian untuk ragam tunggal (univariate/Anova) dan ragam ganda (multivarite/Manova),  dan analisis korelasi Pearson untuk mendapatkan koefisein korelasi sederhana dan matriks kovarian. Data untuk analisis statistik tersebut diperoleh melalui penggunaan random number generator yang tersedia dalam R. Analisis melibatkan 8 variabel yang masing memiliki ukuran data (N)  berkisar antara 50 hingga 3200 titik data. Baik Anova maupun Manova dilakukan berdasarkan model Rancangan Acak Lengkap dengan 5 ulangan.

     Kemampuan Master dalam membaca data (data loading) dari file data  agar dapat tersedia bagai anggota klaster untuk dianalisis  juga dicatat.  Dalam hal  ini kecepatan dan sisa memory yang tersedia selama data loading menjadi tolok ukurnya.  Untuk keperluan tersebut, perintah diberikan kepada master untuk membaca data berkisar antara 4 juta hingga 8 juta titik data.


Next

 

Hak Cipta © 2003 pada TIM e-Jurnal