BAB 9
PEMROSESAN FILE DAN KONSEP MANAJEMEN
DATA
Terminology-terminologi yang
digunakan tekhnologi database adalah :
FIELD, UNSUR DATA, ATRIBUT dan
ELEMEN-ELEMEN
Istilah-istilah field, unsure data,
atribut, dan elemen digunakan secara bergantian untuk menyebutkan blok data
terkecil yang disimpan dan digunakan dalam system informasi, jika hanya
beberapa bagian field yang cocok bagi pemakai, maka foeld harus dipisahkan
menjadi beberapa unsure data yang terpisah. Fielddapat terdiri atas karakter
tunggal atau nomor tunggal, atau terdiri dari beberapa karakter atau nomor.
Contoh-contoh field adalah :
- Nama pelanggan
- Nomor tunjangan sosial karyawan
Nomor pesanan pembelian
Field biasanya secara logis
berkaitan dengan field lainnya, Pengelompokkan logis atas field disebut Catatan
( Record ). Catatan merupakan kelompok unsure-unsur data yang memuat beberapa
entitas seperti ; Karyawan, Pelanggan, Pemasok, Faktur, dll
9.1. TINJAUAN SEKILAS TENTANG TEKNOLOGI
A.Field, Unsur Data, Atribut, dan Elemen- Elemen
Istilah- istilah field, unsur data, atribut, dan
elemen digunakan secara bergantian untuk menyebutkan blok data terkecil yang
disimpan dan digunakan dalam sistem informasi. Field dapat terdiri atas
karakter tunggal atau nomor tunggal, atau dapat terdiri dari beberapa karakter
atau nomor.
Contoh- contoh field adalah :
- Nama pelanggan
- Nomor tunjangan sosial karyawan
- Nomor pesanan pembelian
Field biasanya secara logis
berkaitan dengan field lainnya;
pengelompokan logis atas field disebut catatan (record).
pengelompokan logis atas field disebut catatan (record).
B. Okurensi Data
Struktur catatan memiliki okurensi (occurences), yang juga disebut instances. Okurensi catatan adalah himpunan spesifik nilai- nilai data untuk catatan.
C. Panjang Catatan- Tetap dan variabel
Catatan dalam file dapat memiliki
panjang yang tetap atau variabel. Dalam catatan dengan panjang- tetap, baik
jumlah field maupun panjang (ukuran karakter) setiap field adalah tetap.
Sebagian besar catatan yang disimpan dalam direct access storage devices
(DASDs) adalah catatan panjang- tetap. Catatan dengan panjang- variable, lebar
field dapat disesuaikan untuk setiap okurensi data.
Catatan penjejak adalah perluasan dari catatan master,Catatan penjejak terpisah dari catatan master dan hanya ditulis sesuai kebutuhan. Dengan menggunakan file piutang dagang akun terbuka, sebagai contoh, catatan master memuat informasi yang umum bagi seluruh akun dan jumlah faktur yang memadai bagi sebagian besar akun, dimana catatan penjejak memuat lebih banyak faktur. Catatan master harus memiliki jumlah yang sama dengan catatan penjejak yang berkaitan sesuai kebutuhan. Catatan penjejak harus segera dituliskan setelah catatan master yang berkaitan.
Kelompok berulang adalah kelompok field yang berhubungan yang diulang dalam catatan dengan panjang variabel. Dalam diagram pohon 11.3 PART tampak sebagai Induk dari PEMASOK dan LOKASI karena setiap kemunculan PART akan menimbulkan lebih dari satu pemasok atau lokasi. Secara umum, elemen tingkat tertinggi dalam diagram pohon adalh induk; elemen dengan tingkatan lebih rendah yang tampak pada diagram pohon yanng berkaitan dengan (atau bagian dari induk disebut anak.
Catatan penjejak adalah perluasan dari catatan master,Catatan penjejak terpisah dari catatan master dan hanya ditulis sesuai kebutuhan. Dengan menggunakan file piutang dagang akun terbuka, sebagai contoh, catatan master memuat informasi yang umum bagi seluruh akun dan jumlah faktur yang memadai bagi sebagian besar akun, dimana catatan penjejak memuat lebih banyak faktur. Catatan master harus memiliki jumlah yang sama dengan catatan penjejak yang berkaitan sesuai kebutuhan. Catatan penjejak harus segera dituliskan setelah catatan master yang berkaitan.
Kelompok berulang adalah kelompok field yang berhubungan yang diulang dalam catatan dengan panjang variabel. Dalam diagram pohon 11.3 PART tampak sebagai Induk dari PEMASOK dan LOKASI karena setiap kemunculan PART akan menimbulkan lebih dari satu pemasok atau lokasi. Secara umum, elemen tingkat tertinggi dalam diagram pohon adalh induk; elemen dengan tingkatan lebih rendah yang tampak pada diagram pohon yanng berkaitan dengan (atau bagian dari induk disebut anak.
D. Kunci catatan dan Urutan File
Kunci atau kunci catatan merupakan unsur data atau kombinasi unsusr data yang secara unik mengidentifikasi catatan tertentu dalam file. Istilah order random relatif berkaitan dengan field dimana file tidak disortir.
9.2. EVOLUSI TEKNOLOGI DATABASE
Teknologi database berkembang sejalan dengan perkembangan perangkat keras dan perangkat lunak. Pembuatan jaringan dan teknologi komunikasi mengubah skala ekonomi pembuatan database.
Periode Kejadian Teknik database yang berkaitan :
- 1960-an Lingkungan mainframe
- Sistem manajemen database
- Layanan informasi on-line Sistem file
- Manajemen database
- Manajemen teks
- 1970-an Expert systems
Pemrograman berorientasi- obyek Inferensi dan deduksi :
- Inheritensi dan abstraksi
- 1980-an Sistem hiperteks Asosiasi
- 1990-an Sistem database intelijen Kombinasi teknik- teknik
Pengembangan
dalam teknologi untuk melakukan masukan data ke komputer secara umum berperan
dalam perkembangan database secara pesat.
A. Lingkungan Mainframe
Pada mulanya, masalah utama berkaitan dengan jumlah file yang besar.
B. Sistem Manajemen Database
Lama- kelamaan, perusahaan menghadapi masalah sistem file sederhana. Kesulitan utama termasuk menemukan file yang tepat untuk informasi yang dibutuhkan, pemborosan karena duplikasi data yang sama dalam file yang berbeda, dan kurangnya standarisasi antar file.
A. Lingkungan Mainframe
Pada mulanya, masalah utama berkaitan dengan jumlah file yang besar.
B. Sistem Manajemen Database
Lama- kelamaan, perusahaan menghadapi masalah sistem file sederhana. Kesulitan utama termasuk menemukan file yang tepat untuk informasi yang dibutuhkan, pemborosan karena duplikasi data yang sama dalam file yang berbeda, dan kurangnya standarisasi antar file.
C. Layanan Informasi On-line
Salah satu layanan database tersambung (on-line) terbesar adalah Dialog, yang sekarang mencakup ratusan database dan ratusan jutaan catatan. Banyak perusahaan mengumpulkan informasi dari layanan on-line yang harus dikaitkan secara sistematis dengan sistem informasi mereka. Ini berhubungan juga dengan kebutuhan baru, manajemen teks, yang bersama- sama dengan data grafis dan suara, membutuhkan teknologi yang lebih baik dari yang disediakan sistem database yang tradisional. Sistem multimedia tersebut semakin penting saja masalah ini.
D. Expert Systems
Sistem ahli (expert systems) membantu pengambilan keputusan tingkat tinggi dan telah sukses diterapkan dalam beberapa area seperti pengesahaan pemberian pinjaman, penentuan dimana penggalian mineral dilakukan, dan diagnosa pengobatan.
E. Pemrograman Berorientasi-Objek
Pemrograman Berorientasi- Objek meliputi pendefinisian obyek- obyek dari daftar atau kumpulan informasi yang rumit.
Salah satu layanan database tersambung (on-line) terbesar adalah Dialog, yang sekarang mencakup ratusan database dan ratusan jutaan catatan. Banyak perusahaan mengumpulkan informasi dari layanan on-line yang harus dikaitkan secara sistematis dengan sistem informasi mereka. Ini berhubungan juga dengan kebutuhan baru, manajemen teks, yang bersama- sama dengan data grafis dan suara, membutuhkan teknologi yang lebih baik dari yang disediakan sistem database yang tradisional. Sistem multimedia tersebut semakin penting saja masalah ini.
D. Expert Systems
Sistem ahli (expert systems) membantu pengambilan keputusan tingkat tinggi dan telah sukses diterapkan dalam beberapa area seperti pengesahaan pemberian pinjaman, penentuan dimana penggalian mineral dilakukan, dan diagnosa pengobatan.
E. Pemrograman Berorientasi-Objek
Pemrograman Berorientasi- Objek meliputi pendefinisian obyek- obyek dari daftar atau kumpulan informasi yang rumit.
F. Sistem Hiperteks
Sistem hiperteks memungkinkan para pemakai untuk mengambil database dengan cara random melalui pemilihan kata- kata kunci. Aplikasi awal hipermedia dalam bisnis sangat berkaitan dengan materi- materi referensi seperti manual kebijakan dan pelatihan.
G. Sistem Database Intelejen
Sistem database intelejen merefleksikan kecenderungan penggabungan seluruh teknologi- teknologi terbaru, termasuk yang paling muktahir, ke dalam satu sistem database.
Sistem hiperteks memungkinkan para pemakai untuk mengambil database dengan cara random melalui pemilihan kata- kata kunci. Aplikasi awal hipermedia dalam bisnis sangat berkaitan dengan materi- materi referensi seperti manual kebijakan dan pelatihan.
G. Sistem Database Intelejen
Sistem database intelejen merefleksikan kecenderungan penggabungan seluruh teknologi- teknologi terbaru, termasuk yang paling muktahir, ke dalam satu sistem database.
9.3. SISTEM MANAJEMEN DATABASE DAN ARSITEKTURNYA
Pada tingkat konseptual, database
merupakan kumpulan beragam elemen informasi yang akan digunakan untuk tujuan-
tujuan yang telah dipilih. Catatan dan field- field dalam database
distrukturkan dan diorganisasikan dalam beberapa pola logis, sehingga membantu
pembentukan struktur data logis. Terdapat tiga jenis struktur data logis yang
dapat digunakan untuk mencapai tujuan tersebut, yaitu : hirarkis, jaringan, dan
relasional.
A. Arsitektur Konseptual
Model data hubungan entitas- entity relationship (ER) merupakan pendeketan yang populer. Model ER menggambarkan hubungan antar segmen secara sederhana. Terdapat pula metode- metode konseptual lainnya, termasuk teknik pembuatan model berorientasi-obyek-object-oriented modeling technique (OMT), yang pada dasarnya dikembangkan untuk pemrograman berorientasi- obyek dan diadaptasi untuk pembuatan model Blaha, Premerlani, dan Rumbaugh. Kelas obyek berkaitan dengan segmen, dan obyek berkaitan dengan bagian tertentu.
B. Arsitektur Database pada Tingkat Logis : Struktur Database Logis
Hubungan- hubungan yang timbul antara segmen- segmen dalam database ditentukan oleh struktur data logis, yang juga disebut skema atau model database. Tiga model utama struktur data logis yang ada dalam literatur adalah :
Hubungan- hubungan yang timbul antara segmen- segmen dalam database ditentukan oleh struktur data logis, yang juga disebut skema atau model database. Tiga model utama struktur data logis yang ada dalam literatur adalah :
- Model pohon atau hirarkis
- Model jaringan
- Model relasional
Penjelasannya :
- Model pohon atau hirarkis
Struktur pohon merupakan representasi langsung proses segmentasi yang telah di jelaskan sebelumnya.Dalam struktur pohon,setiap simpul mewakili himpunan field(misalnya,segmen),dan simpul berkaitan dengan node lain yang tingkatanya lebih tinggi dalam struktur pohon.Simpul yang lebih tinggi disebut simpul induk.Hubungan antara induk dan anak di sebut cabang. - Struktur jaringan
Struktur jaringan memungkinkan segmen anak memiliki lebih dari satu induk.struktur pohon dan jaringan keduanya diterapkan dengan penunjuk field(field pointer),dengan segmen lintas-hubung,seperti yang akan di bahas lebih jauh dalam bagian berikutnya. - Implementasi struktur-struktur pohon dan jaringan
Topik implementasi srtuktur-struktur pohon dan jaringan lebih merupakan bagian dari arsitektur fisik database di bandingkan sebagai arsitektur logis.Dalam organisasi daftar,setiap catatan memuat satu atau lebihponter(field)yang mengindikasikan alamat catatan logis berikutnya yang memiliki atribut yang sama.Catatan dapat merupakan bagian dari beberapa daftar.Daftar ini disebut organisasi multydaftar. Dua area aplikasi sistem berdasar penunjuk field yang paling berkrmbang adalah hiperteks dan jaringan data semantik. - Struktur data relasional
Model relasional memandang database sebagai kumpulan dua tabel dimensional dibandingkan sebagai struktur jenis hirarkis atau jaringan.Aturan-aturan tertentu di sebut format-format normal mengatur pembuatan tabel-tabel.
ketiga format normal adalah sebagai berikut:
-Format normal Aturan
-Format normal pertama Membagi tabel untuk mengeliminasi kelompok berulang
-Format normal kedua Membagi tabel sehingga tidak ada kunci yang memntukan nilai field non-kunci.
-Format normal ketiga Membagi tabel sehingga tidak ada field non- kunci yang menentukan nilai field non- kunci lainnya.
C. Arsitektur database pada tingkat fisik
Dalam pembahasan tingkat fisik arsitektur database,kita akan berfokus pada tiga metode akses file:Sekuensial,Terindeks,langsung.
Dalam pembahasan tingkat fisik arsitektur database,kita akan berfokus pada tiga metode akses file:Sekuensial,Terindeks,langsung.
- File
terakses secara sekuensial
Dalam file akses sekuensial,catatan-catatan hanya dapat di akses dalam sekuens yang telah di tentukan sebelumnya.organisasi file sekuensial bukan merupakan alat sortir data yang bermanfaat jika hanya terdapat sedikit saja catatan yang akan di akses dalam file yang memuat banyak catatan.file sekuensial bermanfaat dalam pemrosesan batch,secara normal mengakses seluruh catatan dalam file.kesimpulannya,organisasi file sekuensial bermanfaat jika di butuhkan pemrosesan batch. - File
terindeks
Setiap atribut dapat di ekstrak dari catatan dalam file utama dan di gunakan untuk membuat file baru yang bertujuan menyediakan indeks untuk file asli.File seperti itu di sebut file terindeks atau file terinversi.File dikatakan terinversi secara penuh jika ada indeks untuk seluruh fieldnya.File sekuensial terindeks adalah file sekuensial yang tersimpan dalam DASD dan di indeks serta di sortir secara fisik dalam field yang sama.File-file tersebut umumnya berhubungan dengan file ISAM,dimana ISAM berlaku sebagai kontraksi metode akses sekuensial terindeks.Area utama(primer)merupakan bagian dari disk dimana catatan-catatan aktual di tulis.area tambahan merupakan bagian terpisah dari disk yang di lokasikan bagi file untuk memuat tambahan yang di buat,tanpa melakukan pemrosesan ekstensif terhadap file awal. - File
terakses secara langsung
File terakses secara langsung memungkinkan catatan-catatan individual dapat di panggil secara cepat tanpa menggunakan indeks.Tranformasi random merupakan metode penyimpanan dan penempatan catatan dalam file akses langsung yang di gunakan secara luas.jadi istilah akses random sering kali di gunakan sebagai sinonim dari akses langsung.
D. Hubungan ekonomik antar teknik-teknik
organisasi file
Teknik-teknik akses file yang telah di bahas(sekuensial,terindeks,dan akses langsung) cocok untuk situasi-situasi yang berbeda.gambar 11.18 mengiktisarkan kapan masing-masing teknik organisasi file di gunakan.aspek ekonomik pemrosesan file sangat ditentukan oleh rasio aktifitas(jumlah catatan-catatan yang di akses dibagi dengan jumlah catatan dalam file),dan waktu yang dibutuhkan untuk pemrosesan dan inquiri.
Teknik-Teknik organisasi file Saat terbaik Keterbatasan
Sekuensial Rasio aktifitas tinggi,seperti dalam pemrosesan batch Tidak memungkinkan untuk mengakses catatan tunggal secara cepat Terindeks Rasio aktifitas rendah,ukuran file dari moderat sampai tinggi Pemutakhiran file membutuhkan pemutakhiran indeks-indeks
Teknik-teknik akses file yang telah di bahas(sekuensial,terindeks,dan akses langsung) cocok untuk situasi-situasi yang berbeda.gambar 11.18 mengiktisarkan kapan masing-masing teknik organisasi file di gunakan.aspek ekonomik pemrosesan file sangat ditentukan oleh rasio aktifitas(jumlah catatan-catatan yang di akses dibagi dengan jumlah catatan dalam file),dan waktu yang dibutuhkan untuk pemrosesan dan inquiri.
Teknik-Teknik organisasi file Saat terbaik Keterbatasan
Sekuensial Rasio aktifitas tinggi,seperti dalam pemrosesan batch Tidak memungkinkan untuk mengakses catatan tunggal secara cepat Terindeks Rasio aktifitas rendah,ukuran file dari moderat sampai tinggi Pemutakhiran file membutuhkan pemutakhiran indeks-indeks
Sekuensial
terindeks File harus di proses dengan pola pemrosesan batch(rasio aktifitas
tinggi) dan non batch(rasio aktifitas rendah) Sama dengan sekuensial dan
terindeks
Langsung Rasio aktifitas rendah,file berukuran rendah,struktur jaringan,dan struktur pohon Memerlukan kunci-kunci untuk menempatkan catatan-catatan
E. Arsitektur fisik,Perangkat keras,dan waktu tanggap
Langsung Rasio aktifitas rendah,file berukuran rendah,struktur jaringan,dan struktur pohon Memerlukan kunci-kunci untuk menempatkan catatan-catatan
E. Arsitektur fisik,Perangkat keras,dan waktu tanggap
Dari sisi
perangkat keras,waktu tanggap di pengaruhi oleh waktu akses fisik.ini adalah
waktu yang dibutuhkan CPU untuk melakukan pemanggilan blok tunggal data dari
disk,yang disebut waktu akses disk.faktor lain yang dapat mempengaruhi waktu
tanggap adalah bagaimana catatan data secara fisik didistribusikan dalam disk.
Dalam harddisk,data dalam trek atau silinder yang sama dapat di akses tanpa memindahkan alat baca tulis.harus di tekankan bahwa banyak sistem database yang tergantung pada kegiatan masukan atau keluaran sistem oprasinya.kebutuhan menyimpan file secara berurutanbergantung pada arsitektur fisik database dan metode akses file yang digunakannya.
Dalam harddisk,data dalam trek atau silinder yang sama dapat di akses tanpa memindahkan alat baca tulis.harus di tekankan bahwa banyak sistem database yang tergantung pada kegiatan masukan atau keluaran sistem oprasinya.kebutuhan menyimpan file secara berurutanbergantung pada arsitektur fisik database dan metode akses file yang digunakannya.