BAB 2
LANDASAN TEORI
2.1 Pengertian File Teks
File teks merupakan suatu file yang berisi informasi – informasi dalam bentuk teks.
Data yang berasal dari dokumen pengolahan kata, angka yang digunakan dalam perhitungan, nama dan alamat dalam basis data merupakan contoh yang termasuk
dalam masukan data teks yang terdiri dari karakter, angka dan tanda baca. Input
dan output data teks dipresentasikan sebagai set karakter atau sistem kode yang dikenal oleh sistem komputer. Ada tiga jenis set karakter umum yang dapat
digunakan untuk input dan output pada komputer, yaitu ASCII, EBCDIC, dan Unicode
. ASCII American Code for Information Interchange adalah suatu standar internasional dalam kode huruf dan simbol seperti Hex dan Unicode, tetapi ASCII
bersifat universal. Kode ASCII 8 bit memiliki komposisi bilangan biner yang dimulai dari 00000000 sehingga 11111111. Total kombinasi yang dihasilkan adalah 256,
dimulai dari kode 0 hingga 255 yang terdapat dalam sistem bilangan desimal. EBCDIC Extended Binary Codec Decimal Interchange Code merupakan salah satu
set karakter yang diciptakan oleh komputer merk IBM. EBCDIC terdiri dari 256 karakter yang masing – masing karakternya berukuran 8 bit. Adanya keterbatasan
pada kode ASCII dan EBCDIC, maka dibuat standar kode internasional baru yang merupakan kode 16 bit yang disebut Unicode. Unicodemerupakan suatu standar
industri yang dirancang untuk mengizinkan teks dan simbol dari semua tulisan di dunia agar dapat ditampilkan dan dimanipulasi secara konsisten oleh komputer
Sudewa, 2003.
2.1.1 Format Teks
Secara umum format data teks dibagi menjadi dua bagian, yaituSudewa, 2003:
Universitas Sumatera Utara
1. Teks sederhana plain text
Pada teks sederhana ini, jenis format yang sering digunakan adalah format data teks .txt.
2. Teks terformat formatted text
Merupakan teks terformat dan mengandung styles. Format data dokumen Microsoft Word .docx merupakan contoh format teks jenis.
Contoh format data teks diatas beserta perangkat lunak yang biasa digunakan diantaranya adalah:
1. Format data teks .txt
Format data teks adalah format teks yang dapat digunakan untuk menyimpan huruf, angka, karakter kontrol atau simbol – simbol lain.Format ini biasa
digunakan dalam tulisan seperti titik, koma, tanda petik dan sebagainya. Berbeda dengan jenis teks terformat yang satu huruf tersebut seperti font,
ukuran, tebal atau tidak dan sebagainya. Kelebihan format data teks ini adalah ukuran datanya yang kecil, yangdikarenakan tiadanya fitur untuk memformat
tampilan teks. Saat ini perangkat lunak yang paling banyak digunakan untuk memanipulasi format data ini adalah Notepad.
2. Format data dokumen .docx
Doc merupakan ekstensi arsip dokumen perangkat lunak Microsoft Word yang paling banyak digunakan dalam menulis laporan, makalah dan sebagainya.
Docx merupakan jenis teks terformat yang tidak hanya dapat mengatur tampilan teks seperti styles font, ukuran huruf dan sebagainya, namun juga
dapat menyisipkan gambar. 3.
Hyper Text Markup Language .htm atau .html Merupakan format teks standard untuk tampilan dokumen web.
4. Rich Text Format .rtf
Format teks ini dikembangkan oleh Microsoft yang dapat dibaca oleh berbagai macam platform, seperti Windows, Linux, Mac OS dan sebagainya.
2.1.2 Tipe teks
Tipe teks merupakan tipe dasar yang sudah sangat dikenal dalam kehidupan sehari – hari. Tipe teks terdiri dari tipe karakter char dan tipe string. Tipe karakter char
Universitas Sumatera Utara
terdiri atas satu huruf, angka, tanda baca, atau karakter khusus seperti “a”, “1”, “” dan sebagainya. Tipe string terdiri atas nol atau lebih karakter seperti “algoritma”,
“teks” dan sebagainya.
2.2 Kriptografi