Definisi Normalisasi Data
Konsep normalisasi pertama kali
dikemukakan oleh Dr. E.F Codd dalam sebuah papernya pada tahun 1970. Dan tahun 1972 dalam papernya ini
mendefinisikan suatu struktur data baru yang disebut dengan struktur data
hubungan (Relational Data Structure).
Secara umum normalisasi merupakan proses untuk mengorganisasikan
file untuk menghilangkan group elemen yang berulang-ulang (Normalization).
Menurut Kroenke:
Normalisasi adalah proses untuk mengubah suatu relasi yang memiliki masalah
tertentu kedalam dua buah relasi atau lebih sehingga tidak terdapat suatu
masalah. Masalah ini disebut dengan Anomali.
Database dianggap normal jika ia tidak mengulangi informasi atau tidak
menimbulkan keanehan pada proses update atau penghapusan data.
Atribut
Atribut identik dengan istilah Kolom Data tetapi dapat menunjukkan
fungsinya sebagai pembentuk karakteristik (sifat-sifat) yang melekat dalam
sebuah tabel. Pada penerapan aturan normalisasi, bisa berdampak pada penghilangan atau
penambahan kolom tertentu, atau bahkan dapat membentuk suatu tabel baru.
Jenis-Jenis Atribut;
A.
Atribut Key dan Atribut Deskriptif
B.
Simple Attribute dan Composite Attribute
C.
Single-Valued Attribute dan Multi-Valued Attribute
D.
Mandatory Attibute dan Null Value
E.
Derived Attribute
A. Atribut Key dan Atribut Deskriptif
Atribut Key
Adalah satu atau gabungan dari beberapa atribut yangdapat membedakan semua baris
data (Row/Record) dalam tabel secara unik. Dikatakan unik jika pada
atribut yang dijadikan Key tidak boleh ada baris data dengan nilai yang
sama.
Terdapat 3 macam Key;
◦ Super-key,
◦ Candidate-Key,
◦ Primary-Key,
Atribut Deskriptif
Adalah atribut-atribut yang
tidak menjadi/merupakan Primary-Key. Jadi, dalam tabel Mahasiswa, yang
menjadi Atribut Deskriptif adalah selain Nim.
Jenis Atribut Key
Super-key, merupakan satu atau lebih atribut (kumpulan atribut) yang dapat
membedakan setiap baris data dalam sebuah tabel secara
unik. Contoh Super
key pada tabel mahasiswa;
(Nim, Nama_Mhs, Alamat_Mhs, Tanggal_LHR)
(Nim, Nama_Mhs, Alamat_Mhs)
(Nim, Nama_Mhs)
(Nama_Mhs) à jika dapat dijamin tidak ada nama yang sama.
(Nim)
Candidate-Key, merupakan kumpulan atribut
minimal yang dapat membedakan setiap baris data dalam sebuah tabel secara unik,
dan tidak boleh berisi atribut atau kumpulan atribut yang telah menjadi Superkey
yang lain. Contoh Candidate-Key pada tabel mahasiswa;
(Nim)
(Nama_Mhs) à jika dapat dijamin tidak ada nama yang sama.
Jadi, sebuah atribut Candidate-Key pastilah Superkey.
Primary-Key, merupakan salah satu dari
Candidate-Key yang memiliki sifat dasar
yaitu;
Key tersebut lebih sering (lebih natural) untuk dijadikan sebagai acuan.
Key tersebut lebih ringkas
Lebih baik dapat memiliki makna tertentu (abstraksi data)
Jaminan keunikan Key tersebut lebih baik.
Jadi, berdasarkan pertimbangan sifat dasar tersebut, maka yang lebih cocok dijadikan
sebagai Primary-Key adalah atribut Nim.
B.
Simple Attribute dan Composite
Atribut sederhana (Simple Attribute)
adalah atribut atomik yang tidak dapat dipilah lagi, sedangkan atribut
Komposit (Composite Attribute) adalah atribut yang masih dapat diuraikan
lagi menjadi sub-sub atribut yang masing-masing memiliki makna.
Contoh pada tabel Mahasiswa;
◦ Atribut Sederhana à Nim, Nama_MHS
◦ Atribut Komposit à Alamat_MHS
Pada Alamat_MHS dapat
diuriakan lagi menjadi Alamat, Kota dan Kode_POS. Bisa dimungkinkan
pengelompokan data mahasiswa berdasarkan Kota asalnya.
C. Single-Valued Attribute dan Multi-Valued Attribute
Atribut bernilai tunggal (Single-Valued
attribute) ditujukan pada atribut-atribut yang memiliki paling banyak satu
nilai untuk setiap baris data.
Contoh pada tabel Mahasiswa seluruh atributnya merupakan atribut bernilai tunggal, meskipun ada
beberapa mahasiswa yang memiliki alamat rumah lebih dari satu, tetapi yang
boleh dimasukkan hanya satu alamat saja.
Atribut bernilai ganda/banyak (Multi-Valued
Attribute) ditujukan pada atribut-atribut yang memiliki lebih dari satu
nilai setiap baris data.
Contoh pada tabel kuliah yang terdiri dari Mata_kuliah, Waktu, Ruang,
Nama_Dosen. Yang merupakan atribut bernilai ganda yaitu Waktu dan Ruang, karena
waktu menampung jadual kapan seorang Dosen mengajar pada Ruang kuliah tertentu.
D. Mandatory Attibute dan Null Value
-
Persyaratan
dalam suatu tabel ada yang mengharuskan suatu atribut memiliki nilai (Mandatory
Attibute) dan ada yang tidak harus bernilai karena memang tidak memiliki
nilai atau nilainya belum siap (Null Value).
-
Contoh pada
tabel Mahasiswa, atribut Nim dan Nama_MHS merupakan mandatory attribute,
karena dalam menyimpan data setidaknya nomor induk mahasiswa dan namanya sudah
masuk, sedangkan yang lainnya jika memang belum siap dengan data yang benar
boleh dikosongi.
-
Nilai NULL
dengan spasi berbeda, berbeda pula dengan nilai Nol. Nol adalah angka, spasi
ekivalen dengan karakter ke-32 dalam daftar ASCII, sedangkan NULL ekivalen
dengan karakter ke-0 dalam karakter ASCII.
E. Derived Attribute
Atribut turunan (Derived Attribute) adalah atribut yang nilainya
diperoleh dari pengolahan atau dapat diturunkan dari atribut atau tabel lain
yang berhubungan.
Atribut turunan sebenarnya dapat ditiadakan dalam suatu tabel, karena
nilainya bergantung pada nilai pada atribut lain dalam suatu tabel.