Kamis, 14 April 2011

Bahan kuliah Inven 2010

BAB I
DASAR-DASAR STATISTIK

1.1.Rata-rata dan standart deviasi
Dalam analisis ekologi, peneliti berusaha untuk mengumpulkan informasi phenomena alam yang menyangkut populasi, habitat, dan ekosistim.  Peneliti akan mengumpulkan informasi yang berupa data kuantitatif, dan yang kemudian dapat digunakan untuk interpretasi atau menerangkan gejala ekologi.   Informasi yang sempurna hanya dapat dikumpulkan dengan melakukan pengukuran dan pemantauan secara menyeluruh tentang sesuatu objek di dalam kawasan tertentu.   Akan tetapi hal tersebut hampir mustahil dilakukan.  Sebagai contoh kita ingin menduga berapa volume kayu dalam kawasan hutan seluas 1000 ha.  Satu-satunya cara kita bisa yakin 100 % besarnya volume kayu tersebut dilakukan dengan melakukan pengukuran semua pohon di dalam kawasan hutan tersebut.  Tentunya hal ini sangat sulit dilakukan.  Pengambilan data dengan mengukur parameter yang diteliti terhadap setiap individu di dalam seluruh kawasan atau yang dikenal sebagai sensus merupakan tindakan yang sangat ideal.  Data yang dihasilkan merupakan data yang sangat bagus,  ditinjau dari sisi ketepatan dan ketelitian, karena tidak ada satupun individu yang terlewat dalam pengukuran.  Namun demikian metode sensus jarang sekali dilakukan, karena jumlah individu yang harus diukur sangat banyak, memerlukan waktu yang lama, biaya yang mahal, dan sumberdaya manusia yang banyak.    Metode sensus baru akan dilakukan kalau kita mempunyai tujuan khusus atau mengganggap suatu parameter tertentu sangat penting.   Sebagai contoh sensus penduduk, atau sensus jumlah pohon yang akan ditebang.
Kendala- kendala di atas menyebabkan peneliti hanya mengumpulkan data dari sebagian populasi atau yang dikenal dengan sampling atau pencuplikan.  Sebagai ganti metode sensus,  kita hanya mengukur sebagian dari individu,  dan menggunakan hasil pengukuran untuk menduga nilai dari objek peneliti.   Dalam kasus pendugaan volume kayu di atas, peneliti tidak mengukur semua pohon, tetapi hanya sebagian saja dan menggunakan data yang dikumpulkan untuk menduga  nilai volume semua pohon.  Di berbagai buku statistik, data keseluruhan tentang suatu objek yang akan diteliti disebut populasi statistik (statistical population).  sedangkan sebagian populasi (subset) dikenal sebagai contoh statistik (statistical sampling) (Brower et al. 1997)

Dalam  statistik sederhana kita akan menjumpai nilai yang hampir secara pasti akan muncul dalam setiap analisis, yaitu nilai rata-rata ( ) dan standart deviasi (sd) atau standart eror.   Kedua elemen ini sebaiknya selalu disajikan bersamaan, karena kedua nilai akan memberikan informasi tentang karakter dari parameter yang diteliti.  Nilai rata-rata adalah penduga kecenderungan nilai dari suatu parameter yang diukur (Brower et al. 1997).  Nilai rata-rata merupakan jumlah nilai dibagi dengan jumlah data yang diukur dari parameter yang diteliti.   Secara umum nilai rata-rata dapat digambarkan sebagai berikut:

= ( 1+ 2+ 3 ……+ n) / n
i       = nilai  pada individu  ke i
n          = jumlah individu yang diamati

Sepanjang individu dipilih secara acak (Random) dari seluruh populasi, maka nilai  rata-rata sampling merupakan penduga yang baik dari nilai rata-rata total populasi.  Pengertian acak  adalah setiap individu mempunyai kesempatan yang sama untuk dipilih dan diamati, dan pengamatan satu individu tidak mempengaruhi kesempatan individu lainnya untuk  diamati (independent) (Brower et al 1997).  Jika suatu individu atau sebagian individu punya kesempatan yang lebih untuk diamati karena alasan tertentu, maka proses samplingnya bias.   Sebagai contoh dari sampling bias adalah jika kita mengukur pohon yang berada di dekat jalan atau di daerah yang datar saja, karena alasan kemudahan.
Karakter dari sekumpulan data akan lebih informatif, jika nilai rata-rata dilengkapi dengan nilai sebaran dan variasi data pengukuran.  Salah satu cara untuk mengetahui bagaimana sebaran data adalah kisaran atau range.  Kisaran dapat diekspresikan dengan menulis nilai terbesar atau terkecil atau selisih ke dua nilai tersebut (Brower et al 1997).  Nilai kisaran  saja, masih belum cukup bagus untuk dapat digunakan untuk menyimpulkan tentang suatu karakter parameter yang diamati.  Jumlah data, nilai rata-rata, dan kisaran dapat sama, walaupun berasal dari dua kelompok data yang berbeda (Tabel 1.1).  Oleh karena itu, untuk lebih mendalam memahami sebaran data, nilai –nilai di atas  selalu dilengkapi dengan varian sample (sample variance).  Varian sample (S2) tidak lain adalah  penyimpangan atau deviasi masing-masing data dari nilai rata-ratanya. 
Sum of square (SS) = ∑( xi - )2
                         SS  =  xi2- (xi)2/n
                          S2   = SS/DF
DF =degree of freedom (derajat bebas) = n-1
Standart deviasi (stdev) =
contoh perhitungan: 
Data yang terdiri dari: 5, 4, 6, 3, 2, maka rata-rata adalah (5+4+6+3+2)/5 =20/5 =4; SS = (5-4)2+(4-4)2+(6-4)2+(3-4)2+(2-4)2= 20; S2= 20/(5-1) = 5; stdev= 2.236
          
Tabel 1:  Nilai rata-rata diameter pohon (cm)  hasil dua pengukuran berbeda
No
Pengukuran 1
Pengukuran 2
1
70
79
2
75
78
3
71
79
4
67
79
5
79
69
6
73
65
7
75
75
8
77
67
9
72
68



Total
659
659
Rata-rata
73,22 cm
73,22 cm
Range
67-79 cm, 12 cm
67-79 cm, 12 cm
Varian
13.69 cm2
34.69 cm2
Stdev
3,70 cm
5,89 cm

Para peneliti biasanya lebih suka menggunakan standart deviasi ( S )atau standart error sebagai indikator variasi data, karena standart deviasi mempunyai unit satuan sama dengan data aslinya (Brower et al. 1977).  Standart error merupakan estimasi standart deviasi yang nilainya dihitung dari sebagian populasi (sample).  Sedangkan standart deviasi sering diartikan sebagai simpangan dari nilai rata-rata yang didasarkan kepada seluruh populasi.   Sepanjang proses pengambilan sampel tidak bias (unbias), nilai standart error sama dengan standart deviasi (……….).   Nilai standart deviasi (stdev) merupakan akar dari variant.  Nilai standart deviasi  ini sangat penting untuk mengetahui bagaimana sebaran nilai atau data yang kita miliki.  Setiap peneliti berharap nilai standart deviasi sangat kecil atau mendekati nilai rata-rata. Semakin kecil nilai standart deviasi semakin kecil pula nilai simpangannya terhadap nilai rata-rata.  Dengan demikian, makin teliti pengukuran kita.


 
A
B
C
        
Gambar 1.1: Distribusi data disekitar nilai rata-rata.
Satu unit penyimpangan  atau standart deviasi  baik  ke arah kiri (negatif standart deviasi maupun ke arah kanan atau positif standart deviasi dari nilai rata-rata atau daerah A (lihat gambar 1) mencakup kira-kira 68 % dari seluruh data yang diamati.   Sedangkan dua unit penyimpangan standart deviasi  atau daerah B mempunyai 95 % data .   Hampir semua data atau 99 % terwakili jika terjadi penyimpangan 3 unit standart deviasi.  Jika kurva data yang kita punyai lebih lebar, maka dibutuhkan lebih besar nilai standart deviasi untuk mencakup 68 % data yang telah kita amati, demikian sebaliknya.
Simpangan terhadap nilai rata-rata sering juga diekspresikan dengan membandingkan standart deviasi dengan nilai rata-ratanya.  Hal ini sering disebut dengan koeffisien variasi (coefficient of variation).
Coefficient of variation (COV) = (S/  x 100 %
1.2.Ketepatan (acurate) dan ketelitian (precision)
Pendekatan pencuplikan atau sampling selalu menimbulkan persoalan seberapa jauh nilai dari data yang dikumpulkan secara sampling dengan nilai sesungguhnya (true value) dari total populasi.  Biasanya hal ini ditentukan oleh proses pengambilan sampling seperti teknik pengukuran,  alat yang digunakan tidak peka, atau cara pengambilan sampling yang bias atau tidak acak.  Ada dua istilah yang terkait dengan hal tersebut di atas; Ketepatan (accuracy), dan Ketelitian (Precision).  Ketepatan merujuk kepada kedekatan nilai dari sampling dengan nilai yang sesungguhnya.  Sebagai contoh suatu ketepatan pengukuran tentang volume kayu dicerminkan dengan nilai yang paling dekat dengan nilai sesungguhnya (Gb 1.2 A dan C).  Jika nilai pengukuran semakin jauh dari nilai sesungguhnya, maka pengukuran tersebut semakin tidak tepat (Gb 1.2 B dan D).    





Teliti
Tepat
Tidak teliti
Tidak Tepat
A
B
C


D


  

Gambar 1.2 : Visualisasi ketepatan (accuracy) dan ketelitian (precise). Lingkaran merah di tengah mencerminkan nilai sesungguhnya.  Segitiga hitam adalah hasil pengukuran dari 5 pengukuran.

Ketelitian merujuk kepada kedekatan nilai masing-masing pengukuran.  Jika nilai setiap pengukuran hampir sama, maka pengukuran tersebut digolongkan teliti (Gb 1.2 A dan B).   Sedangkan jika hasil nilai suatu pengukuran selalu jauh dengan nilai pengukuran yang lain, maka pengukuran tersebut tidak teliti.  Pengukuran teliti boleh jadi jauh dengan nilai sesungguhnya (Gb. 1.2 B).   Sebagai contoh pengukuran kelembaban udara dengan alat pengukur digital, akan mendapatkan hasil pengukuran yang sangat teliti.   Tetapi karena nilai yang tertera di alat tidak terkalibrasikan, maka hasilnya bisa jauh dari nilai sesungguhnya.   Kesalahan instrument pengukur ini menyebabkan nilai pengukuran tidak tepat, tetapi teliti (Gb 1.2 B).   Sebaliknya, jika instrumentnya terkalibrasi bagus, tetapi jika cara pengukuran ceroboh, maka akan menghasilkan nilai yang tepat tetapi tidak teliti (Gb 1.2 C).



1.3.Interval kepercayaan (confidence of interval)
Sejak awal, permasalah dari nilai rata-rata yang kita ambil dari sebagian population atau sampling adalah seberapa dekat nilai tersebut  dengan nilai  rata-rata sesungguhnya  dari seluruh populasi.   Salah satu cara untuk mendekati hal ini adalah dengan menghitung standrat error (standard error) atau standart deviasi dari rata-rata (standard deviation of means) dan interval kepercayaan (confidence of interval) (Brower et al. 1997).   Konsep standart eror muncul karena sampling yang berulang dari populasi yang sama akan menghasilkan nilai rata-rata yang berbeda.   Variasi dari nilai rata-rata sampel  dapat diekspreasikan dengan standart eror adalah:
                                                S  =
Jadi standart eror dari diameter pohon (tabel 1.1)  untuk pengukuran 1 dan 2 adalah    = 1.23 atau  =1.96. 
Standart eror dapat digunakan untuk menghitung interval kepercayaan (Confidence interval ).  Interval kepercayaan adalah  interval dimana nilai rata-rata sesungguhnya (  berada dalam taraf kepercayaan tertentu.  Secara umum interval kepercayaan dapat digambarkan dengan rumus.
                                     =  t S   dengan interval kepercayaan sebesar ( 1- )
                    = nilai rata-rata sampel
S                   = standart eror
t                       = nilai yang didapatkan dalam tabel Student’s t, pada derajat bebas
   (DF)=n-1, dan tingkat signifikansi ( tertentu.



Jika nilai t pada DF =9-1=8 dan  = 5% atau 0.05 adalah 2.26 (Lihat tabel Student’s t), standart eror untuk pengukuran 1 adalah 1.23.    Maka nilai rata-rata populasi adalah
   = 73,22 cm  2.26 X 1.23 
   = 73,22 cm 2,78  cm untuk interval kepercayaan (100%-5%) =95%

Kesimpulan yang kita dapatkan dari perhitungan di atas adalah nilai sesungguhnya rata-rata populasi berada dalam kisaran antara  batas bawah 70.44 cm dengan batas atas sebesar 75.99 cm.  Kita ingat bahwa nilai di atas berasal dari sampling atau sebagaian dari populasi.  Oleh karena itu, ada kemungkinan kesimpulan yang kita ambil dari perhitungan di atas salah.  Besarnya  kemungkinan salah ini dicerminkan oleh nilai .  Maka jika nilai   sebesar 5 %, maka ada 5 % kemungkinan nilai rata-rata yang kita dapatkan salah.  Dengan kata lain jika kita melakukan 100 kali sampling secara random dari suatu populasi,  maka ada 5 nilai rata-ratanya  lebih kecil dari 70.44 cm  atau lebih besar dari 75.99  cm atau berada di luar interval tersebut.
1.4.Normalitas
Seorang peneliti ekologi sering menghadapi dua kelompok data yaitu; data yang mempunyai sebaran normal dan data dengan sebaran yang tidak mengikuti pola normal (non-normal).    Sifat  sebaran di atas menentukan metode statistik yang digunakan. Kebanyakan metode statistik yang dipakai bidang ekologi menyaratkan bahwa data yang kita kumpulkan mempunyai sebaran normal. Sebaran normal (normal distribution) secara gampang digambarkan sebagai bentuk seperti lonceng (bell-shaped) yang relatif simetrik bila datanya disebarkan dalam grafik x-y (Gb 1).   Namun jika pola sebaran data tidak mengikuti pola normal, maka penggunaan method statistik yang mensyaratkan sebaran normal tidaklah tepat.  Brower at al (1997)  data yang mempunyai sebaran non normal dapat berupa:
1.      Data yang perbanding atau persentase.  Sebagai contoh: persentase penutupan tajuk pohon; dan persentase air dalam air.
2.      Data yang dikumpulkan dengan satuan tertentu seperti :kerapatan pohon (jumlah pohon per plot, jumlah serangga air per milimeter air, jumlah ikan per jaring)
Walaupun begitu data non-normal sesungguhnya dapat dianalisis dengan metode statistik yang menyaratkan distribusi normal dengan melakukan transformasi data.   Transformasi dikerjakan dengan mengubah data asli  melalui logaritma, akar kuadrat atau dengan perhitungan lainnya.  Data hasil tranformasi inilah yang digunakan untuk analisis.
Selain ke dua kelompok data di atas, kita sebetulnya dihadapkan  permasalahan apakah data kita betul-betul mempunyai pola sebaran normal.  Peyimpangan relatif sedikit dari pola sebaran normal sesungguhnya tidak mempunyai pengaruh yang banyak terhadap kesimpulan yang diambil dari hasil analisis.  Persoalannya kita tidak mengetahui sejauh mana penyimpangan pola yang masih dianggap normal atau yang telah masuk ke dalam pola sebaran non-normal.  
Sebetulnya banyak sekali test yang digunakan untuk menguji normalitas.  Pada dasarnya uji normalitas dapat digolongkan menjadi dua kelompok besar.  Pendekatan grafis atau gambar dan metode numerikal.   Kelompok yang pertamaing a stem-and-leaf plot, scatterplot, box-plot, histogram, probability-probability (P-P) plot, and quantile-quantile (Q-Q) plot. Sedangkan metod  numerikal antara lain adalah the Shapiro-Wilk, Shapiro-Francia, and Skewness-Kurtosis tests.
Salah satu metode untuk uji normalitas yang cukup mudah adalah uji normalitas W/S .  Uji ini sangat sederhana dan hanya memerlukan perhitungan range (W) dan standart deviasi (S).  Hasil perhitungan q = W/S kemudian dibandingkan dengan q tabel.  Sesungguhnya q tabel untuk taraf kepercayaan tertentu ( adalah   range.  Jika q hitung masuk di dalam range q tabel maka data yang kita miliki mempunyai sebaran normal.


Ho        : Sebaran data kerapatan pohon / m2 mempunyai pola normal
Ha        : sebaran data tersebut berbeda dengan sebaran normal
W         : range
S          : Standart deviasi

plot
kerapatan pohon/m2
1
15,23
2
16,34
3
15,78
4
15,54
5
16,02
6
14,98
7
14,32
8
14,74
9
15,45
10
15,34
w
2,02
s
0,599874




   


q = 2.02/0.599 = 3.37


Nilai  mencerminkan tingkat kemungkinan kesimpulan yang kita tarik adalah salah.   Nilai  = 5 % ,



BAB II
SAMPLING

Sampling merupakan pendekatan yang digunakan untuk menyimpulkan karakter sebuah populasi dari parameter tertentu dengan hanya melakukan pengukuran atau observasi sebagian dari populasi.   Sampling dilakukan karena kita hampir mustahil untuk mengamati setiap individu  atau seluruh populasi yang ada di alam.  Pengamatan semua objek secara menyeluruh atau census tentu saja menimbulkan kendala dalam biaya,  waktu, dan teknis.  Sebagai contoh;  sebuah pabrik keramik ingin mengetahui daya tahan keramik terhadap retak atau pecah.  Tentu saja hal ini tidak dapat  dilakukan dengan memecahkan semua produk keramik, tetapi dilakukan dengan mengambil beberapa keramik dan kemudian dilakukan test untuk mengetahui ketahanan terhadap retak. Contoh lain kita ingin menduga berapa volume kayu dalam hutan seluas 1000 ha.  Tentunya kita akan sulit mengukur semua pohon dalam luasan di atas.   Oleh karena itu, kita hanya mengukur sebagian pohon, dengan harapan nilai yang kita dapatkan bisa digunakan untuk memperkirakan volume kayu di tegakan hutan tersebut.  
 Persoalan klasik yang timbul dari sampling tersebut adalah seberapa bagus sampling yang kita lakukan sehingga mendekati nilai populasi sesungguhnya.   Untuk mengatasi persoalan ini kita harus menentukan berapa besar jumlah sampling cukup dan bagaimana kita melakukan samplingnya.
2.1. Penentuan Jumlah Plot
2.1.1   Kurva species-area
Dalam menentukan jumlah sampling kita dihadapkan kepada pertanyaan berapa banyak sampling yang dianggap cukup.  Kriteria jumlah sample yang cukup adalah : 1) Jumlah sample tersebut  dapat mencakup sejumlah individu yang dapat mewakili komunitas suatu hutan, dan (2) Jumlah sampling yang kita buat masih masuk akal ditinjau dari segi biaya,  waktu, dan tenaga.
Di dalam ekologi tumbuhan untuk mengetahui jumlah sample yang tepat dapat dilakukan dengan menggunakan kurva species-area.  Sebetulnya istilah ini menjadi terkenal saat dua ilmuwan muda  Robert H. MacArthur dan  Edward O. Wilson (1963) memperkenalkan istilah kurva spesies-area untuk menerangkan hubungan exponensial antara jumlah jenis dan luas area di suatu tempat secara matematis.  Dalam perkembangannya teori ini digunakan untuk merancang suatu kawasan konservasi, atau seberapa luasan minimum dari suatu ekosistim yang dapat menampung sejumlah tertentu jenis.
Kurva species area mencerminkan hubungan komulatif luas area dengan komulatif jumlah jenis yang dijumpai.  Kurva ini dibangun dengan membuat kurva x-y dari komulatif jumlah jenis dengan komulatif jumlah atau luas sample.  Dari kurva tersebut secara umum dapat digambarkan bahwa semakin luas komulatif daerah kajian, semakin banyak jenis yang dijumpai.  Pola ini akan sampai suatu titik dimana pertambahan luas, tidak lagi memperlihatkan pertambahan jumlah jenis.   Titik atau luasan ini merupakan luasan atau jumlah sample minimal yang dibutuhkan di suatu ekosistim.
Tabel 2.1: Data jumlah jenis pohon dan sample. Satu unit sampel seluas 10 m2.
Jumlah
Sampel
Luas komulatif
Sampel
Jumlah jenis
Dijumpai
Jenis baru
Komulatif
Jenis baru
1
10
15
15
15
2
20
16
4
19
3
30
14
3
22
4
40
15
4
26
5
60
16
3
29
6
70
17
2
31
7
80
15
1
32
8
90
14
1
33
9
100
15
1
34
10
110
14
0
34
11
120
13
0
34








Grafik  2.1. Kurva spesies-area.  Kurva menggambarkan bahwa di titik komulatif luas plot 100 m2 atau  9 plot telah menunjukkan bahwa penambahan luas tidak lagi menambah jenis baru.  


Tabel 2.1 merupakan data yang dikumpulkan dari suatu hutan.  Di setiap plot yang berukuran 10 m2 semua pohon yang berdiameter lebih 10 cm diidentifikasi jenisnya.  Di plot pertama dijumpai 15 jenis pohon.  Di plot ke dua dijumpai 16 jenis pohon, tetapi hanya 4 jenis baru yang tidak dijumpai di plot 1, sehingga total komulatif adalah 19 jenis. Di plot ke tiga ditemukan 14 jenis pohon, tiga diantaranya merupakan jenis baru yang tidak ditemukan di plot pertama dan kedua.   Jadi total komulatifnya adalah 22 jenis.  Demikian seterusnya sampai plot ke 11.    Data ini diolah dan menjadi kurva species-area seperti Gambar 2.1.  Gambar 2.1. memperlihatkan bahwa kurva mulai datar pada luas komulatif 100 m2 atau plot ke 9 , yang berarti penambahan luas sampel tidak lagi ada penambahan jenis baru di luasan tersebut.   Kurva tersebut juga menunjukkan bahwa 9 sampel plot adalah jumlah yang cukup untuk mencakup keragaman dan komposisi komunitas hutan. 

Brower dkk (1997) mengingatkan bahwa kurva spesies area sangat dipengaruhi oleh luas per unit plot.  Jika terlalu kecil unit plotnya, maka dibutuhkan banyak sampel plot, demikian sebaliknya.  Di daerah tropika kekayaan jenis dapat ditentukan oleh jenis tanah, geomorphologi, fase pertumbuhan, dan sejarah gangguan hutan (Whitmore 19..).  Oleh karena itu, peletakan plot untuk membuat kurva species area harus hati-hati, dan akan lebih baik kalau peletakan plot dilakukan  digunakan di areal yang relatif homogen.  Habitat dan komunitas yang berbeda mempunyai kurva spesies area yang berbeda pula.

Metode peletakan sampel plot ada tiga macam yaitu: a). Berdempetan (contiguous grid); dan b). Reguler berjarak (regular spaced); c)  Bersarang (nested) (Gambar 2.2).   Dalam peletakan plot untuk membuat kurva species area perlu diperhatikan bahwa habitat, areak, dan karakter vegetasi harus sedapat mungkin mewakili ekosistim atau hutan yang  akan dilakukan survey, sehingga penentuan jumlah sampel plot menjadi relatif tepat.  Dalam kaitan dengan hal ini maka pengalaman dan pengetahuan peneliti sangat menentukan.

Metode peletakan plot berdempetan dan reguler berjarak mempunyai perhitungan dan cara yang sama dengan perhitungan pada tabel 2.1 dan Gambar 2.1.  Sedangkan pada metode bersarang agak sedikit berbeda.   Pada metode ini, plot pertama adalah plot dengan luas yang paling kecil, dan kemudian di dalam plot ini diidentifikasi jenisnya.  Seperti di dua metode yang lainnya, species yang baru dan lama ditemukan di plot sebelumnya perlu dicatat (Tabel 2.2)  Plot kedua adalah plot dengan luas 2 kali plot pertama, dan seterusnya.  Pada intinya plot selanjutnya mempunyai luas dua kali lipat dengan plot sebelumnya.    Perhitungan dan analisis grafik secara lengkap dapat dilihat di tabel 2.2 dan Gambar 2.3.




B
A






C







Gambar 2.2.  Tiga model peletakan sampel plot dalam metode kurva species area. A. Berdempetan atau contiguous grid , dimana masing-masing plot diletakkan saling berdempetan satu dengan lainnya.  B. Reguler berjarak (regular spaced), dimana masing-masing plot diletakkan dengan jarak yang sama satu dengan yang lain.  C.  Bersarang (nested ), dimana plot yang berukuran lebih kecil menjadi bagian dari plot yang berukuran lebih besar (Scheider 2003)




Tabel 2.2.  Data yang dikumpulkan berdasarkan metode bersarang
No
Ukuran
Plot (m2)
Jenis
Dijumpai
Komulatif
Jenis
jenis baru
Pertambah
Jenis (%)
1
1x1
10
10
10
    100,00
2
1x2
17
15
5
 50,00
3
2x2
15
18
3
20,00
4
2x4
16
22
4
22,22
5
4x4
14
24
2
 9,09
6
4x8
13
25
1
 4,17
7
8x8
13
26
1
4,00











Gambar 2.3.  Kurva species area yang menggambarkan hubungan komulatif luas sampel dengan jumlah komulatif jenis (A), dan persen pertambahan jenis baru (B), dan berdasarkan data yang diambil dengan metode bersarang (Tabel 2.2).


Di beberapa buku ekologi disebutkan bahwa jika kenaikan komulatif luas plot, hanya menaikkan jumlah jenis kurang dari 10 %, maka jumlah plot dianggap cukup.   Gambar 2.3 menunjukkan dua kurva species area yang dibangun dengann komulatif jumlah jenis baru dan persentase jenis baru.   Kedua-keduanya menunjukkan pola yang sama, dimana pada setelah suatu titik atau luas komulatif sampel plot terlampaui, maka penambahan luas plot tidak lagi mempengaruhi perubahan jenis baru.

Perlu diketahui luas satu unit plot tergantung dengan phisiognomi vegetasi yang akan diobservasi.  Padang rumput, tumbuhan bawah, dan tumbuhan herbal biasanya menggunakan plot dengan ukuran 1 x 1 m.   Di bidang kehutanan, luasan unit plot tergantung kepada tingkat pertumbuhan pohon.  Untuk analisis vegetasi tingkat semai sampai dengan tingki anakan sampai 1 m, ahli kehutanan biasanya menggunakan ukuran plot 1 x 1 m. Untuk tingkat sapihan sampai dengan tiang (diameter setinggi dada=dbh > 5-10 cm), plot yang digunakan berukuran 5x5 m.  Sedangkan untuk tingkat pohon (dbh > 10 cm), plot yang digunakan berukuran 10 x 10 m.

Total luas plot yang digunakan untuk melakukan sampling dapat dipakai untuk menghitung intensitas sampling.  Intensitas sampling adalah proporsi atau persentase luas atau jumlah sampling yang kita pakai dibandingkan dengan luas total areal yang kita sampling atau jumlah total populasi pohon.

2.1.2. Kurva kinerja (performance curve)

Kurva species area biasanya digunakan untuk melakukan analisis vegetasi, dimana kekayaan atau keragaman jenis merupakan data yang sangat penting.   Jika data tentang jenis tidak merupakan hal penting, maka untuk menentukan jumlah total atau total luas plot digunakan pendekatan Kurva kinerja (Performance curve).   Kurva Kinerja merupakan variasi dari kurva species area, dan menggambarkan hubungan antara komulatif jumlah plot dengan rata-rata nilai parameter ekologi.  Parameter ekologi dapat berupa jumlah pohon atau biomasa.  Prinsip dari Kurva Kinerja mirip dengan kurva species area.  Jika jumlah plot sedikit, maka kita akan mendapatkan nilai rata-rata parameter yang sangat bervariasi dari satu plot sampel ke plot sampel lainnya.  Semakin banyak sampel plot yang digunakan, semakin kecil variasi nilai rata-ratanya.  Jumlah atau luas sampel plot dianggap cukup, jika variasi nilainya kecil sekali, sehingga nilai rata rata komulatifnya tidak lagi sensitif terhadap perubahan jumlah plot (Brower 1993).

Tabel 2.3. Data jumlah pohon per plot (10x10) dan nilai komulatif rata-rata
                 jumlah pohon/plot. 

No plot
Jumlah pohon
Komulatif  rata-rata jumlah pohon
1
15
15,00
2
21
18,00
3
16
17,33
4
17
17,25
5
9
15,60
6
20
16,33
7
8
15,14
8
5
13,86
9
12
13,67
10
13
13,60













Grafik 2.4. Kurva kinerja yang menghubungan antara jumlah plot dan komulatif jumlah pohon per plot.

Komulatif rata-rata dihitung dengan jumlah pohon sampai ke plot i, dibagi dengan i.  Sebagai contoh: komulatif rata-rata sampai ke plot ke 3 adalah  (15+12+16)/3 = 17.33).
Grafik 2.4 menunjukkan bahwa setelah sampel plot ke 8, nilai komulatif rata-rata relatif stabil walaupun ada penambahan jumlah plot.  Hal ini menunjukkan bahwa plot berjumlah 8 dianggap cukup.

2.2. Metode Sampling
Setelah kita mendapatkan jumlah plot atau pohon yang cukup untuk melakukan analisis vegetasi, sebuah analisis untuk mengetahui struktur dan komposisi, maka langkah selanjutnya adalah bagaimana meletakkan masing-masing plot atau memilih individu untuk diamati.  Pada dasarnya banyak variasi yang dapat digunakan dalam melaksanakan sampling,  dari yang sederhana sampai dengan yang rumit.   Yang harus diingat adalah sampling harus dilandasi bahwa hasilnya tidak subyektif dan mengandung kesalahan sampling (sampling error) yang sekecil mungkin atau bias(Simon 1993) .

2.2.1. Sampling acak sederhana (Simple random sampling)
Prinsip dasar Sampling acak sederhana dalam satu set n unit sampel plot, tiap tiap plot mempunyai kesempatan yang sama untuk dipilih.  Sebagai contoh kalau kita mempunyai 100 pohon yang harus diukur diameternya atau kita mempunyai 100 orang yang harus kita tanyai tentang pilihannya dari ke tiga capres,  maka tiap-tiap pohon atau penduduk mempunyai kesempatan yang sama untuk dipilih sebagai sampel, tanpa melihat  ukuran atau latar belakang pendidikan.
Cara pemilihan sampel dapat dilakukan dengan cara lotre  atau dengan menggunakan tabel ramdon.  Cara yang paling mudah adalah dengan menggunakan lotre.  Cara ini dilakukan dengan memberikan nomor di setiap plot atau setiap pohon, lalu nomornya diundi.  Nomor yang keluar dianggap sebagai plot yang terpilih.  Jika nomor yang terpilih dikembalikan dan diikutkan kembali untuk dipilih maka cara ini disebut sampling acak dengan pemulihan (random sampling with replacement).  Oleh karena itu cara ini memungkinkan plot atau pohon yang terpilih akan terpilih kembali.  Akan tetapi jika nomor yang telah diundi tidak dikembalikan lagi, maka cara ini disebut dengan sampling acak tanpa pemulihan (random sampling without replacement) (Simon 1993).   Cara pengacakan dengan lotre paling efisien dan mudah dilaksanakan hanya bila melibatkan jumlah plot atau pohon yang sedikit.  Jika melibatkan jumlah sampling cara ini dianggap tidak effisien.  Nilai rata-rata dan standart deviasi mengikuti rumus yang ada di bab 1.
2.2.2. Sampling sistematik
Teknik sampling ini dilakukan bila sampel yang diambil secara sistematik dan secara sengaja direncanakan terlebih dahulu.  Secara sistematik dapat berarti sampel plot, sebagai contoh, ditentukan dengan jarak tertentu, dapat selang 10 m, 20 m, atau 100 m, tergantung dengan tingkat ketelitian yang diinginkan dan tergantung kondisi tegakan yang ada. Teknik ini masih menggunakan dasar perhitungan sampling secara acak.  Akan tetapi dalam pelaksanaannya jauh lebih mudah.   Simon (1993) menyebutkan bahwa teknik sampling ini berusaha menyebarkan  sampling plot yang ada secara merata, sehingga hasil perkiraannya akan menjadi lebih tepat.  Teknik ini juga memberikan kemudahan dalam perencanaan dan pelaksanaannya, lebih effisien baik waktu, biaya, dan tenaga.    Namun beliau juga menyatakan bahwa penggunaan teknik ini, jangan sampai berimpitan dengan pola keteraturan vegetasi yang ada di lapangan, karena akan memberikan nilai yang bias.  Beberapa peneliti survey juga menganjurkan menggunakan teknik ini lebih baik dilakukan jika objek penelitian mempunyai sifat homogen. 
Dalam pelaksanaannya, peneliti harus lebih dahulu menentukan target populasi yang akan diamati,  kemudian membuat perencanaan sampling,  memberi tanda atau nomor masing-masing plot.   Jika dalam teknik random sederhana setiap plot harus dipilih secara acak, dalam teknik ini hanya plot pertama yang dipilih secara random, plot selanjutnya dipilih secara sistematik dengan interval yang sama.

1
2
3
4
5
6
7
8
9
10
1



12

10

11


2










3



6

4

9


4










5



5

A

3


6










7



7

2

8


8










9



13

14

15


10


















Gambar 2.1 : Seratus plot berukuran10x10 m dalam suatu tegakan hutan (1 ha).   Angka di samping kiri dan atas digunakan untuk menentukan letak plot berdasarkan koordinat (x, y).

Sebagai contoh: Kita ingin mengetahui volume kayu (m3) dalam suatu tegakan seluas 1 ha, secara cepat dengan teknik sampling sistimatik.  Maka langkah pertama adalah membuat  100 plot yang masing-masing mempunyai luas 10x10m.  Masing-masing plot  dibuat koordinat tersendiri.  Koordinat ini  digunakan sebagai dasar penentuan plot awal secara random.  Plot yang akan kita ukur sebanyak 15 buah.   Setelah melalui proses random, plot yang terpilih mempunyai koordinat (6,5).  Oleh karena itu, 14 plot lainnya dipilih plot yang masing-masing berjarak 10 m dari plot lainnya (lihat gambar 2.1).  Adapun hasil perhitungan volume kayu masing-masing plot dapat dilihat di tabel  2.4.
Tabel 2.4.  Hasil perhitungan volume (m3) untuk plot yang terpilih.
Plot
Volume (m3)
X
X2
A
14
196
2
15
225
3
12
144
4
13
169
5
7
49
6
9
81
7
14
196
8
17
289
9
15
225
10
12
144
11
14
196
12
8
64
13
9
81
14
16
256
15
18
324
Jumlah
193
2639
(X)2
37249





Rata-rata (   )                                  = 193/15 =12.87
Varian   (S2)                                         =( ∑ X2 -  (X)2/n ) / n     = (2639-37249/15) : 15  = 11.12
Standart deviasi (S)                         = √ S2 = √ 11.12 =3.33
Varian rata-rata ( S2x )               = S2/n (N-n)/N
N = Jumlah sampel plot =15;  N         = Total plot =100
                                                = (11.12/15) x (100-15)/100  = 0.63
Standart eror (            Sx)                    = S2x = 0.63 = 0.79
Interval kepercayaan (CI)       =   ± t 0.05 Sx
t0.05 = α = 0.05; derajat bebas =n-1    = 2.042
Interval kepercayaan (CI)       = 12.87 ± 2.042 x 0.79
                                                =12.87 ± 1.61
                                                = 11.26 s/d 14.48
                                               






2.2.3. Sampling berlapis (Stratified sampling)
Tidak jarang  dalam melakukan survey hutan, kita dihadapkan kepada heterogenitas yang tinggi dari suatu kawasan hutan.   Lebih-lebih di daerah tropika, jenis tanah, lingkungan, gangguan hutan, dan sejarah pengelolaann hutan akan sangat mempengaruhi keragaman populasi.  Jenis tanah yang banyak mengandung silikat, sebagai contoh, akan membentuk formasi hutan kerangas (heath forest), yang mempunyai atribut ekologi yang jauh berbeda dengan hutan yang dibangun dari jenis tanah podzolik.    Demikian juga hutan yang secara periodik mengalami gangguan (forest disturbance) akan mempunyai atribut ekologi yang sangat berbeda dengan hutan sangat jarang terganggu.  Jika  kawasan hutan yang akan kita survey tersusun dari mosaic hutan yang berbeda dengan satu dengan lainnya, maka kawasan tersebut tidak lagi seragam, sangat beragam dari satu tempat ke tempat lain.  Sehingga kalau kita menggunakan teknik sampling terdahulu akan mendapatkan masih dengan tingkat kecermatan yang rendah.
 Sampling bertingkat (stratified sampling) akan lebih cocok untuk digunakan dalam keadaan kawasan hutan yang terdiri dari mozaik yang heterogen.   Langkah pertama dari teknik ini adalah membagi kawasan menjadi beberapa kelompok, dimana masing-masing kelompok mempunyai sifat yang relatif homogen atau keragaman yang paling kecil.  Kelompok ini disebut stratum atau sub-populasi.  Jumlah stratum sangat tergantung dengan tingkat ketelitian yang kita inginkan.  Pada prinsipnya, semakin banyak stratum, hasil yang kita harapkan semakin teliti (Simon 1993).
Langkah kedua adalah menentukan jumlah total sampel plot yang akan digunakan untuk survey vegetasi.  langkah ini kemudian diikuti dengan menentukan jumlah sample plot di masing-masing stratum atau sub-populasi.   Oleh Simon (1993), penentuan jumlah sampel plot di dalam masing-masing stratum dapat dilakukan secara proporsional ataupun secara optimal. Jika mengunakan cara proporsional, maka jumlah sampel plot di dalam masing stratum ditentukan sesuai perbanding ukuran stratum dengan populasinya.   Sebagai contoh; kita akan melakukan survey volume kayu di hutan seluas 5000 ha.  Kawasan ini terdiri dari hutan alam, hutan muda bekas tebangan, dan hutan rawa masing-masing seluas 2500 ha, 2000 ha, dan 500 ha.   Jika kita merencanakan ada 480 plot, maka sub populasi hutan rawa ada 240 plot ((2500 ha/5000 ha) x 480 plot),  hutan bekas tebangan ada 192 plot, dan hutan rawa sebanyak 78 plot.  Sedangkan jika menggunakan cara optimal, maka penentuan jumlah sampel plot berdasarkan tingkat peranan dan prioritas tujuan survey (Simon 1993).  Jika tujuan survey adalah  ingin melihat regenerasi hutan dengan melihat jumlah anakan, maka sampel plot di masing-masing subpopulasi bisa sama sebesar 160 plot.  
Langkah terakhir dari metode ini adalah pemilihan sampel plot di dalam masing-masing stratum. Pemilihan sampel plot dilakukan karena tidak semua plot yang ada di masing-masing subpopulasi akan diukur paramenternya.  Pemilihan sampel dapat dilakukan secara random maupun secara sistematik.
 

 


 



Gambar 2.1 : Kawasan hutan dengan tiga formasi hutan yang berbeda. Ni adalah subpopulasi i atau jumlah total plot yang ada di subpopulasi i, sedangkan ni adalah jumlah sampel plot terpilih dari masing-masing subpopulasi.



Tabel 2.5. Hasil perhitungan volume tiga formasi hutan yang berbeda. Luas masing-masing jenis hutan adalah 4.5 ha (N1), 3.0 ha (N2), dan 2.5 ha (N3). Total jumlah plot di masing-masing plot sebanyak 45, 30, dan 25 plot (N).  Total sampel plot sebanyak 30 plot.  Berdasarkan perhitungan proporsional maka jumlah sample plot di N1, N2, dan N3 masing-masing sebanyak 13, 9, dan 8 plot (n).
 Plot
Volume (m3)

N1
N2
N3
1
11
2
25
2
15
2
29
3
13
4
30
4
14
7
31
5
17
6
27
6
12
9
28
7
17
5
28
8
11
6
24
9
13
9

10
14


11
16


12
14


13
9


nij
13
9
8
Ni
45
30
25
∑ Xij
176
80
222
∑ X2ij
2452
332
6200
i
13,54
5,56
27,75
N * i
609,30
166,80
693,75
S2i
5,77
6,78
5,64
Ni* S2i
259,65
203,4
141

Rata-rata seluruh populasi     T       = ( ∑ Ni   I ) / ∑Ni
                                                                T          = (609.30+166.80+693.75)/100 =14.67 m3
Varian harga rata-rata seluruh populasi:      
                                                S2X        = (1/nN) (Ni* S2i ) - (1/N2) ( Ni* S2i)  
S2X        = [(1/30x100)*(259,65+203,4+141)]- [(1/1002)*(259,65+203,4+141)] = 0.1409 m3

Standart error rata-rata seluruh populasi  (S X ) = √ S2X  = √ 0.1409 = 0.375 m3
Nilai total                                T  = Ni   I
                                                                                                T  = (609.30+166.80+693.75) = 1469.85 m3
Varian total                                         ST2= [ (N/n) * ( Ni* S2i  ) ] – ( Ni* S2i  )
                                                                 = [(100/30)*(259,65+203,4+141)]- (259,65+203,4+141)
                                                     = 37,54264




 






 

Gambar 2.4.  Proses penentuan sampel dengan cara sampling bertingkat (Multi stage sampling untuk kawasan hutan seluas 10 ha (a), yang dibagi menjadi 10 plot, masing-masing dengan luas 1 ha. Tiap unit ini dianggap tingkat pertama atau unit primer (M).  Tiap unit primer dibagi menjadi 25 plot unit sekunder (N), dengan luas masing-masing 400 m2. 


                                               = i / m
Sβ2                     = ( i - )/ (M-1)  (varian antar unit)
Sα2                            = (∑∑ ( i)2 )/ (M*(N-1) (varian dalam unit)
Sx2                      =  * Sβ2/m) *    *  Sα2






Primer
No plot
xij
sum xi
mean xi
mean xi-x
kuadrat F
xij-mean xi
sum (H)
A
13
15




-12.8
163.84

9
24




-3.8
14.44

24
43




15.2
231.04

8
21




-6.8
46.24

12
36
139
27.8
7
49
8.2
67.24
B
19
18




-0.8
0.64

6
16




-2.8
7.84

8
16




-2.8
7.84

14
21




2.2
4.84

25
23
94
18.8
-2
4
4.2
17.64
c
9
29




13.2
174.24

11
12




-3.8
14.44

22
12




-3.8
14.44

4
18




2.2
4.84

7
8
79
15.8
-5
25
-7.8
60.84
sum

312
312
62.4
0
78
8.2
374.84
average

20.8

20.8
0.2544














Varian antar unit
sb
8.66666667














varian dalam unit
sa
1.56183333














Varian mean
0.168447














CLUSTER SAMPLING

It is sometimes expensive to spread your sample across the population as a whole. For example, travel can become expensive if you are using interviewers to travel between people spread all over the country. To reduce costs you may choose a cluster sampling technique.

Cluster sampling divides the population into groups, or clusters. A number of clusters are selected randomly to represent the population, and then all units within selected clusters are included in the sample. No units from non-selected clusters are included in the sample. They are represented by those from selected clusters. This differs from stratified sampling, where some units are selected from each group.

Examples of clusters may be factories, schools and geographic areas such as electoral sub-divisions. The selected clusters are then used to represent the population.

·         Suppose an organisation wishes to find out which sports Year 11 students are participating in across Australia. It would be too costly and take too long to survey every student, or even some students from every school. Instead, 100 schools are randomly selected from all over Australia.

These schools are considered to be clusters. Then, every Year 11 student in these 100 schools is surveyed. In effect, students in the sample of 100 schools represent all Year 11 students in Australia.
Cluster sampling has several advantages: reduced costs, simplified field work and administration is more convenient. Instead of having a sample scattered over the entire coverage area, the sample is more localised in relatively few centres (clusters).

Cluster sampling’s disadvantage is that less accurate results are often obtained due to higher sampling error (see section Information - Problems with Using) than for simple random sampling with the same sample size. In the above example, you might expect to get more accurate estimates from randomly selecting students across all schools than from randomly selecting 100 schools and taking every student in those chosen.


MULTI-STAGE SAMPLING

Multi-stage sampling is like cluster sampling, but involves selecting a sample within each chosen cluster, rather than including all units in the cluster. Thus, multi-stage sampling involves selecting a sample in at least two stages. In the first stage, large groups or clusters are selected. These clusters are designed to contain more population units than are required for the final sample.

In the second stage, population units are chosen from selected clusters to derive a final sample. If more than two stages are used, the process of choosing population units within clusters continues until the final sample is achieved.

·         An example of multi-stage sampling is where, firstly, electoral sub-divisions (clusters) are sampled from a city or state. Secondly, blocks of houses are selected from within the electoral sub-divisions and, thirdly, individual houses are selected from within the selected blocks of houses.
The advantages of multi-stage sampling are convenience, economy and efficiency. Multi-stage sampling does not require a complete list of members in the target population, which greatly reduces sample preparation cost. The list of members is required only for those clusters used in the final stage. The main disadvantage of multi-stage sampling is the same as for cluster sampling: lower accuracy due to higher sampling error (see section Information - Problems with Using).