๐ฌ Tentang Model Korelasi v2.1
Kalkulator ini menggunakan MODEL KORELASI yang memperhitungkan hubungan statistik antar variabel.
Berbeda dengan model independen sederhana (P ร P ร P ร ...), model ini menggunakan probabilitas kondisional untuk hasil lebih akurat.
Mengapa model korelasi lebih akurat? Karena variabel demografis saling berkaitan:
pemuda lebih mungkin jomblo, orang berpendapatan tinggi lebih jarang merokok, suku tertentu
cenderung memeluk agama tertentu, dll. Model independen mengabaikan hubungan ini dan sering
menghasilkan estimasi yang terlalu rendah atau terlalu tinggi.
๐ Formula Utama
P(total | lokasi, usiaMax) =
ฮฃsukuโS ฮฃusiaโA, usiaโคusiaMax [
P(suku | lokasi) ร
P(usia) ร declining-slope weight ร
P(agama โ R | suku) ร
P(status โ M | usia) ร
P(gaji โฅ X | usia, lokasi) ร
P(tinggi โฅ Y | suku, lokasi)
]
ร P(berat โค Z)
ร P(tidak merokok | gaji, lokasi)
Keterangan: S = set suku yang dipilih, A = bracket usia yang memenuhi kriteria (โค usiaMax),
R = set agama yang dipilih, M = set status yang dipilih, X = gaji minimum, Y = tinggi minimum, Z = berat maksimum.
โก Perbaikan v2.1: Perhitungan status dan gaji sekarang hanya memperhitungkan bracket usia yang termasuk (โค usiaMax),
bukan rata-rata semua bracket. Contoh: jika usiaMax=18, maka status "jomblo" = 85% (rate untuk 18-24), bukan 26% (rata-rata semua usia).
๐ฅ Populasi Dasar
Total: 100,720,711 pria dewasa (usia 18+) di Indonesia
Sumber: UN World Population Prospects 2024 Revision - Indonesia male population by 5-year age groups
๐
Distribusi Usia (UN WPP 2024)
| Bracket |
Populasi |
Persentase |
Kumulatif |
Decline Rate |
| 18-24 tahun | 16.12 juta | 16.0% | 16.0% | 0.5%/th |
| 25-29 tahun | 11.28 juta | 11.2% | 27.2% | 0.6%/th |
| 30-34 tahun | 10.88 juta | 10.8% | 38.0% | 0.8%/th |
| 35-39 tahun | 10.58 juta | 10.5% | 48.5% | 1.0%/th |
| 40-44 tahun | 10.58 juta | 10.5% | 59.0% | 1.2%/th |
| 45-49 tahun | 9.77 juta | 9.7% | 68.7% | 1.5%/th |
| 50-54 tahun | 8.76 juta | 8.7% | 77.4% | 2.0%/th |
| 55-59 tahun | 7.55 juta | 7.5% | 84.9% | 2.5%/th |
| 60+ tahun | 15.21 juta | 15.1% | 100.0% | 4.5%/th |
Implementasi: Untuk usia maksimum di tengah bracket, menggunakan declining-slope interpolation
berbasis mortality rate. Dalam setiap bracket, usia lebih muda memiliki bobot lebih tinggi karena lebih banyak yang survive.
Contoh: Untuk bracket 35-39 dengan decline rate 1%/tahun:
โข Usia 35: bobot 20.4% dari bracket
โข Usia 36: bobot 20.2% (ร 0.99)
โข Usia 37: bobot 20.0% (ร 0.99ยฒ)
โข dst... (geometric series yang di-normalize)
๐ Korelasi 1: Usia โ Status Pernikahan
Probabilitas status pernikahan sangat bergantung pada usia. Pemuda lebih mungkin jomblo,
sedangkan pria paruh baya lebih mungkin sudah menikah. Duda meningkat seiring usia (perceraian + kematian pasangan).
| Usia |
Jomblo |
Menikah |
Duda |
Total |
| 18-24 | 85% | 14% | 1% | 100% |
| 25-29 | 52% | 46% | 2% | 100% |
| 30-34 | 23% | 74% | 3% | 100% |
| 35-39 | 12% | 84% | 4% | 100% |
| 40-44 | 8% | 87% | 5% | 100% |
| 45-49 | 6% | 88% | 6% | 100% |
| 50-54 | 5% | 87% | 8% | 100% |
| 55-59 | 4% | 85% | 11% | 100% |
| 60+ | 3% | 80% | 17% | 100% |
Sumber: BPS Susenas 2023 - Tabel Status Perkawinan menurut Kelompok Umur dan Jenis Kelamin
P(status โ M | usia) = ฮฃsโM AGE_STATUS_JOINT[usia][s]
๐ Tampilan "Detail Probabilitas": Persentase status yang ditampilkan adalah rata-rata hanya untuk bracket usia yang termasuk (โค usiaMax),
bukan rata-rata nasional. Jika usiaMax=24, maka "Jomblo 85%" karena hanya bracket 18-24 yang dihitung.
๐ Korelasi 2: Suku โ Agama
Korelasi sangat kuat antara suku dan agama di Indonesia. Ini adalah salah satu faktor terpenting
yang membedakan model korelasi dari model independen.
| Suku |
Islam |
Kristen |
Katolik |
Hindu |
Buddha |
Konghucu |
| Jawa (40.2%) | 96.7% | 1.8% | 1.0% | 0.3% | 0.1% | 0.1% |
| Sunda (15.5%) | 98.5% | 0.8% | 0.4% | 0.1% | 0.1% | 0.1% |
| Batak (3.6%) | 28.0% | 52.0% | 19.0% | 0.3% | 0.5% | 0.2% |
| Madura (3.0%) | 99.5% | 0.2% | 0.1% | 0.1% | 0.1% | 0.0% |
| Betawi (2.9%) | 98.0% | 1.0% | 0.5% | 0.2% | 0.2% | 0.1% |
| Minangkabau (2.7%) | 99.5% | 0.2% | 0.1% | 0.1% | 0.1% | 0.0% |
| Bugis (2.7%) | 98.5% | 0.8% | 0.4% | 0.1% | 0.1% | 0.1% |
| Melayu (2.3%) | 99.0% | 0.5% | 0.3% | 0.1% | 0.1% | 0.0% |
| Bali (1.7%) | 6.5% | 1.5% | 1.0% | 90.5% | 0.3% | 0.2% |
| Tionghoa (2.5%) | 5.0% | 32.0% | 12.0% | 0.5% | 40.0% | 10.5% |
| Lainnya (22.9%) | 65.0% | 20.0% | 8.0% | 3.0% | 2.5% | 1.5% |
Sumber: BPS Sensus Penduduk 2010 cross-tabulation, Long Form SP2020, Academic research on ethnic-religious distribution
P(agama โ R | suku) = ฮฃrโR SUKU_RELIGION_JOINT[suku][r]
โ ๏ธ Implikasi: Jika kamu pilih "hanya Kristen" + "hanya Jawa", peluang turun drastis (1.8% ร 40.2% = 0.72% dari total).
Tapi jika pilih "hanya Kristen" + "hanya Batak", peluang jauh lebih tinggi (52% ร 3.6% = 1.87%).
๐ Korelasi 3: Usia โ Pendapatan (Income Lifecycle Curve)
Pendapatan mengikuti kurva U-terbalik (inverted-U lifecycle curve). Pemuda berpenghasilan rendah,
peak di usia 40-49, lalu menurun menjelang pensiun.
| Usia |
Multiplier |
Penjelasan |
| 18-24 | 0.45ร | Entry level, fresh graduate, intern |
| 25-29 | 0.75ร | Early career, masih junior |
| 30-34 | 0.95ร | Mid career, mulai establish |
| 35-39 | 1.15ร | Senior roles, manager level |
| 40-44 | 1.30ร | Peak earning - Director, business owner |
| 45-49 | 1.25ร | Still peak, max seniority |
| 50-54 | 1.10ร | Starting decline, some early retirement |
| 55-59 | 0.90ร | Pre-retirement, reduced hours |
| 60+ | 0.55ร | Retirement, pension, part-time |
Sumber: BPS Sakernas 2024 - Rata-rata Upah/Gaji menurut Kelompok Umur, Standard economic lifecycle theory
adjusted_logMean = base_logMean + ln(AGE_INCOME_MULTIPLIER[usia])
P(gaji โฅ X | usia, lokasi) = (1 - zero%) ร [wโ ร (1 - ฮฆ_log(X; ฮผโ_adj, ฯโ)) + wโ ร (1 - ฮฆ_log(X; ฮผโ_adj, ฯโ))]
โ ๏ธ Implikasi: Pemuda usia 25 dengan gaji 20jt+ sangat langka (~0.5%),
tapi pria usia 45 dengan gaji 20jt+ lebih common (~5%). Filter "maks 30 tahun" + "min 20jt" sangat membatasi!
๐ Tampilan "Detail Probabilitas": Persentase gaji yang ditampilkan adalah rata-rata hanya untuk bracket usia yang termasuk (โค usiaMax).
Jika usiaMax=24, maka multiplier 0.45ร digunakan, menghasilkan probabilitas gaji tinggi yang jauh lebih rendah.
๐ฐ Model Distribusi Gaji (Mixture of Log-Normals)
Distribusi gaji di Indonesia bersifat bimodal - ada dua "puncak" yang berbeda
untuk sektor informal dan formal. Model menggunakan mixture of two log-normal distributions.
| Parameter |
Informal (56%) |
Formal (44%) |
Catatan |
| Weight (w) | 0.56 | 0.44 | BPS Sakernas 2024 |
| Log Mean (ฮผ) | 0.7885 | 1.8718 | ln(median dalam juta) |
| Log SD (ฯ) | 0.75 | 0.80 | Formal lebih spread (ada pengusaha) |
| Median | Rp 2.2 juta | Rp 6.5 juta | e^ฮผ |
| Mean | Rp 2.9 juta | Rp 9.5 juta | e^(ฮผ+ฯยฒ/2) |
Zero Income: 6% (pengangguran, mahasiswa full-time, tidak bekerja)
๐ Probabilitas Kumulatif (Nasional, prime age 35-44):
| Gaji โฅ |
3jt |
5jt |
10jt |
15jt |
20jt |
30jt |
50jt |
| % |
52.3% |
33.2% |
13.4% |
6.4% |
3.4% |
1.2% |
0.22% |
Definisi: Gaji bersih bulanan setelah PPh21 & BPJS, tidak termasuk THR/bonus tahunan
๐ Korelasi 4: Suku โ Tinggi Badan
Tinggi badan berbeda antar suku karena faktor genetik dan nutrisi regional.
Model menggunakan distribusi normal terpisah untuk setiap suku.
| Suku |
Mean (ฮผ) |
SD (ฯ) |
P(โฅ170cm) |
P(โฅ175cm) |
| Tionghoa | 169.0 cm | 7.0 | 44.3% | 19.6% |
| Batak | 168.5 cm | 7.5 | 42.1% | 19.4% |
| Betawi | 166.0 cm | 7.3 | 29.3% | 10.9% |
| Lainnya | 166.0 cm | 7.5 | 29.7% | 11.5% |
| Jawa | 165.5 cm | 7.2 | 26.6% | 9.4% |
| Bugis, Melayu | 165.5 cm | 7.1-7.2 | 26.4% | 9.1% |
| Minangkabau | 165.0 cm | 7.0 | 23.8% | 7.7% |
| Sunda | 164.5 cm | 7.0 | 21.6% | 6.7% |
| Bali | 164.0 cm | 6.9 | 19.2% | 5.6% |
| Madura | 163.5 cm | 6.8 | 17.0% | 4.5% |
Sumber: RAND IFLS (Indonesian Family Life Survey), Regional anthropometric studies
P(tinggi โฅ Y | suku, lokasi) = 1 - ฮฆ((Y - ฮผ_suku - adj_lokasi) / ฯ_suku)
Dimana ฮฆ = Standard Normal CDF
๐ Korelasi 5: Pendapatan โ Merokok
Korelasi negatif: pendapatan tinggi โ pendidikan tinggi โ awareness kesehatan โ merokok lebih sedikit.
Indonesia memiliki salah satu tingkat merokok pria tertinggi di dunia (59.7% nasional).
| Bracket Gaji |
% Perokok |
% Non-Perokok |
| Zero/tidak bekerja | 59.7% | 40.3% |
| < 5 juta | 58.0% | 42.0% |
| 5-10 juta | 50.0% | 50.0% |
| 10-15 juta | 42.0% | 58.0% |
| 15-25 juta | 35.0% | 65.0% |
| > 25 juta | 25.0% | 75.0% |
Sumber: WHO Global Tobacco Report 2024, GATS Indonesia 2021, Education-income-smoking correlation studies
P(non-smoker | gaji, lokasi) = (1 - baseSmokingRate(gaji)) ร smokingMult(lokasi)
baseSmokingRate: lookup table berdasarkan bracket gaji
โ๏ธ Model Berat Badan (BMI-derived)
Berat badan dimodelkan via BMI karena lebih reliable. Asumsi: BMI ~ Normal(22.5, 3.5ยฒ).
| Parameter |
Nilai |
Sumber |
| BMI Mean | 22.5 | WHO Indonesia, IFLS |
| BMI SD | 3.5 | IFLS anthropometric data |
| Reference Height | 166 cm | National average |
| Implied Weight Mean | 62.0 kg | = 22.5 ร 1.66ยฒ |
| Implied Weight SD | 9.6 kg | = 3.5 ร 1.66ยฒ |
Probabilitas Kumulatif:
| Berat โค |
55kg |
60kg |
65kg |
70kg |
75kg |
80kg |
90kg |
| % |
23.4% |
41.7% |
61.0% |
79.7% |
90.8% |
96.9% |
99.8% |
impliedBmiMax = weightMax / (refHeight/100)ยฒ
P(berat โค Z) = ฮฆ((impliedBmiMax - BMI_mean) / BMI_sd)
๐ Penyesuaian Lokasi (9 Wilayah)
Setiap lokasi memiliki parameter berbeda untuk pendapatan, tinggi badan, dan merokok.
Komposisi suku juga berbeda per kota.
| Lokasi |
Populasi |
Median Formal |
Tinggi + |
Smoking ร |
Suku Dominan |
| Nasional | 100.7 jt | 6.5 jt | +0 cm | 1.00ร | Jawa 40%, Sunda 16% |
| Jakarta | 4.2 jt | 11 jt | +3 cm | 0.75ร | Jawa 36%, Betawi 28% |
| Jabodetabek | 12.5 jt | 9 jt | +2.5 cm | 0.80ร | Jawa 32%, Sunda 28% |
| Surabaya | 1.15 jt | 8 jt | +2 cm | 0.85ร | Jawa 84%, Madura 8% |
| Bandung | 1 jt | 7 jt | +1.5 cm | 0.88ร | Sunda 80%, Jawa 12% |
| Medan | 900 rb | 6.5 jt | +2 cm | 0.82ร | Batak 34%, Jawa 33%, Tionghoa 11% |
| Semarang | 650 rb | 6.5 jt | +1.5 cm | 0.90ร | Jawa 92% |
| Makassar | 600 rb | 6 jt | +1 cm | 0.92ร | Bugis 42%, Lainnya 35% |
| Urban Total | 28 jt | 7.5 jt | +2 cm | 0.85ร | Mixed |
Height adjustment: Urban advantage due to better nutrition. Smoking multiplier: Urban areas have lower smoking rates.
โ
Perbaikan Model v2.1
Versi 2.1 memperbaiki dua bug penting dari versi sebelumnya:
- Bug #1 - Usia Max diabaikan untuk Status/Gaji:
Sebelumnya, probabilitas status dan gaji dihitung sebagai rata-rata SEMUA bracket usia,
mengabaikan filter usiaMax. Sekarang hanya bracket yang termasuk (โค usiaMax) yang dihitung.
Dampak: Dengan usiaMax=18, status "jomblo" sekarang 85% (benar), bukan 26% (salah).
- Bug #2 - Interpolasi Linear vs Declining-Slope:
Sebelumnya menggunakan interpolasi linear dalam bracket (setiap tahun bobot sama).
Sekarang menggunakan declining-slope interpolation berbasis mortality rate -
usia lebih muda dalam bracket memiliki bobot lebih tinggi.
Dampak: Akurasi lebih baik untuk usia 60+ (error turun dari ~7% ke ~2%).
Decline Rates per Bracket:
18-24: 0.5%/th | 25-29: 0.6%/th | 30-34: 0.8%/th | 35-39: 1.0%/th | 40-44: 1.2%/th
45-49: 1.5%/th | 50-54: 2.0%/th | 55-59: 2.5%/th | 60+: 4.5%/th
โ ๏ธ Batasan & Asumsi Model
- Conditional Independence: Model mengasumsikan independensi dalam setiap cell sukuรusia (misal: tinggi dan gaji independent given suku dan usia)
- Data Suku-Agama: Berdasarkan Sensus 2010, mungkin ada pergeseran minor
- Mixed Heritage: Keturunan campuran mungkin underrepresented dalam data suku
- Urban Height: Adjustment berdasarkan studi nutrisi general, bukan data spesifik Indonesia
- Sub-wilayah: Tidak ada granularitas (misal: Jakarta Selatan vs Jakarta Timur)
- Gaji: Definisi = take-home pay bulanan, tidak termasuk THR/bonus
- Self-selection: Data BPS menggunakan self-identification untuk suku
๐ Sumber Data & Referensi