Bahasa sebagai bagian yang penting dari kehidupan manusia, dalam bentuk tulis dapat merupakan catatan dari pengetahuan yang didapat oleh umat manusia dari satu generasi ke generasi berikutnya sedangkan dalam bentuk lisan merupakan sarana komunikasi antar individu dalam suatu masyarakat.
Bahasa dapat dibedakan
menjadi 2 yaitu bahasa alami dan bahasa buatan. Bahasa alami adalah bahasa yang
digunakan manusia untuk berkomunikasi, misalnya bahasa daerah, bahasa inggris,
jepang, dan sebagainya. Sedangkan Bahasa buatan merupakan bahasa yang sengaja
dibuat secara khusus untuk kebutuhan tertentu, seperti bahasa-bahasa
pemrograman komputer atau bahasa pemodelan.
Pengolahan Bahasa Alami
Pengolahan Bahasa Alami (PBA) atau Natural
Language Processing (NLP) merupakan cabang dari ilmu komputer dan
linguistik yang membahas tentang interaksi antara bahasa manusia (bahasa alami)
dan komputer. NLP juga sering disebut sebagai cabang dari kecerdasan buatan (Artificial
Inteligence) dan memiliki kajian yang berhubungan dengan linguistik
komputasional. Sedikit melihat sejarahnya, pengolahan bahasa alami
dimulai pada tahun 1950-an. Bapak ilmu komputer, Alan Turing, menerbitkan
sebuah artikel. Di dalam artikel terkenalnya ini Alan Turing mengusulkan sebuah
tes yang sekarang dikenal Turing Test. Sebuah tes yang akan mengukur kemampuan
mesin (program komputer) untuk menunjukan kecerdasannya. Ilustrasinya, seorang
juri (manusia) akan melakukan percakapan dengan manusia dan mesin yang
melakukan tes tersebut. Peserta akan dipisahkan satu sama lain. Mesin tersebut
akan dinyatakan lulus tes jika juri tidak bisa membedakan antara manusia dan
mesin. Tujuan dari bidang bahasa alami ini adalah untuk melakukan
proses pembuatan model komputasi dari bahasa manusia, sehingga antara manusia
dan komputer dapat melakukan interaksi dengan perantaranya bahasa alami. Sebuah
sistem bahasa alami (Natural Language System) harus memperhatikan
pengetahuan dari bahasa itu sendiri baik dari segi kata yang digunakan, apa
arti dari sebuah kata, fungsi kata dari sebuah kalimat dan bagaimana dari
kata-kata tersebut dapat membentuk sebuah kalimat. Bahasa alami
pada prinsipnya merupakan bentuk dari representasi suatu pesan yang ingin
dikomunikasikan oleh antar manusia, bisa berupa suara atau ucapan tetapi juga
bisa dalam bentuk tulisan.
Tingkatan Pengolahan Bahasa Alami
Secara singkat pengolahan bahasa alami (Natural Language
Processing) mengenal beberapa tingkat pengolahan, yaitu:
1. Fonetik dan Fonologi Berhubungan dengan suara yang menghasilkan kata
yang dapat dikenali. Bidang ini menjadi penting dalam proses aplikasi yang
memakai metode speech based system.
2. Morfologi pengetahuan tentang kata dan bentuknya
dimanfaatkan untuk membedakan satu kata dengan lainnya.
3. Sintaksis pemahaman tentang urutan kata dalam pembentukan
kalimat dan hubungan antar kata tersebut dalam proses perubahan bentuk dari
kalimat menjadi bentuk yang sistematis. Meliputi proses pengaturan tata letak
suatu kata dalam kalimat akan membentuk kalimat yang dapat dikenali. Selain itu
dapat pula dikenali bagian-bagian kalimat dalam suatu kalimat yang lebih besar.
4. Semantik pemetaan bentuk struktur sintaksis dengan memanfaatkan tiap
kata ke dalam bentuk yang lebih mendasar dan tidak tergantung struktur kalimat.
Semantik mempelajari arti suatu kata dan bagaimana dari arti kata-kata tersebut
membentuk suatu arti dari kalimat yang utuh. Dalam tingkatan ini belum tercakup
konteks dari kalimat tersebut.
5. Pragmatik Pengetahuan pada tingkatan ini berkaitan dengan
masing-masing konteks yang berbeda tergantung pada situasi dan tujuan pembuatan
sistem.
6. Discourse Knowledge Melakukan pengenalan apakah suatu kalimat
yang sudah dibaca dan dikenali sebelumnya akan mempengaruhi arti dari kalimat
selanjutnya. Informasi ini penting diketahui untuk melakukan pengolahan arti
terhadap kata ganti orang dan untuk mengartikan aspek sementara dari informasi.
7. World Knowledge Mencakup arti sebuah kata secara umum dan
apakah ada arti khusus bagi suatu kata dalam suatu percakapan dengan konteks
tertentu. Definisi ini tidaklah bersifat kaku dan untuk setiap bentuk
bahasa alami yang ada biasanya ada pendefinisian lagi yang lebih spesifik
sesuai dengan karakter bahasa tersebut. Pada beberapa masalah mungkin hanya
mengambil beberapa dari pendekatan tersebut bahkan mungkin ada yang melakukan
tambahan proses sesuai dengan karakter dari bahasa yang digunakan dan sistem
yang dibentuk. Selain yang sudah disebutkan di atas masih ada lagi satu masalah
yang cukup menantang dalam bahasa alami, yaitu ambiguitas atau makna ganda dari
suatu kata atau kalimat. Dari satu masukan yang sama dapat menjadi beberapa
arti yang berbeda dan masing-masing dapat bernilai benar tergantung pada
keperluan pemakai. Hal ini dapat terjadi pada hampir semua tingkatan pendekatan
di atas.
Komponen Utama Bahasa Alami
Pengolahan Bahasa Alami terdiri dari tiga bagian utama, yaitu:
1. Parser Suatu sistem yang mengambil kalimat input bahasa alami dan
menguraikannya ke dalam beberapa bagian gramatikal (kata benda, kata kerja,
kata sifat, dan lain-lain).
2. Sistem Representasi Pengetahuan Suatu sistem yang menganalisis output
parser untuk menentukan maknanya.
3. Output Translator Suatu terjemahan yang merepresentasikan
sistem pengetahuan dan melakukan langkah-langkah yang bisa berupa jawaban atas
bahasa alami atau output khusus yang sesuai dengan program komputer lainnya.
Kategori Aplikasi Pengolahan Bahasa Alami
Teknologi Pengolahan
Bahasa Alami atau Natural Language Processing (NLP) adalah teknologi yang
memungkinkan untuk melakukan berbagai macam pemrosesan terhadap bahasa alami
yang biasa digunakan oleh manusia. Sistem ini biasanya mempunyai masukan dan
keluaran berupa bahasa tulisan (teks). NLP mempunyai aplikasi yang sangat luas.
Beberapa diantara
berbagai kategori aplikasi NLP adalah sebagai berikut:
1. Natural Language Translator Translator dari satu bahasa alami ke
bahasa alami lainnya, misalnya translator bahasa Inggris ke bahasa Indonesia,
bahasa Indonesia ke bahasa Jepang dan sebagainya. Translator bahasa alami bukan
hanya kamus yang menerjemahkan kata per kata, tetapi harus juga mentranslasikan
sintaks dari bahasa asal ke bahasa tujuannya.
2. Translator Bahasa Alami ke Bahasa Buatan Translator yang mengubah perintah-perintah dalam
bahasa alami menjadi bahasa buatan yang dapat dieksekusi oleh mesin atau
komputer. Sebagai contoh, translator yang memungkinkan kita memberikan perintah
bahasa alami kepada komputer. Dengan sistem seperti ini, pengguna sistem dapat
memberikan perintah dengan bahasa sehari-hari, misalnya, untuk menghapus semua
file, pengguna cukup memberikan perintah “komputer, tolong hapus semua file!”
Translator akan mentranslasikan perintah bahasa alami tersebut menjadi perintah
bahasa formal yang dipahami oleh komputer, yaitu “dir *.* ”.
3. Text Summarization Suatu sistem yang dapat “membuat
ringkasan” hal-hal yang penting dari suatu wacana yang diberikanDalam dunia
kecerdasan buatan pengolahan bahasa alami merupakan aplikasi terbesar setelah
sistem pakar. Banyak para ahli Artificial Intelligence berpendapat bahwa bidang
yang penting yang dapat dipecahkan oleh Artificial Intelligence adalah
Pengolahan Bahasa Alami (Natural Language Processing).
Aplikasi Pengolahan
Bahasa Alami
Secara umum, Jenis
aplikasi yang bisa dibuat dalam bidang ilmu NLP terbagi dua, yaitu text-based
application dan dialogue-based application.
Text-based
application adalah segala macam
aplikasi yang melakukan proses terhadap teks tertulis seperti misalnya dokumen,
e-mail, buku, dan sebagainya.
Beberapa jenis aplikasi
NLP yang berbasis teks:
1. Programs for Classifying and Retrieving
Documents by Content Program yang mampu
mengklasifikasi dan mengambil isi dari suatu dokumen berdasarkan kontennya.
Seperti spam filtering (pemfilteran pesan sampah), language identification
(identifikasi bahasa), dan lain-lain.
2. Machine Translation Program yang mampu mentranslasi kalimat
baik berupa teks maupun suara dari satu bahasa alami ke bahasa lainnya. Contoh:
Google Translate.
Dialogue-based
application idealnya melibatkan bahasa lisan atau pengenalan suara, akan tetapi
bisa juga memasukan interaksi dialog dengan mengetikkan teks pertanyaan melalui
keyboard.
Beberapa jenis aplikasi
NLP yang berbasis dialog:
1. Intelligent Personal Assistant Perangkat lunak yang mampu melakukan tugas-tugas
dan jasa berdasarkan inputan dari pengguna, lokasi, dan memiliki kemampuan
untuk mengakses informasi dari berbagai sumber online (seperti cuaca, keadaan
lalu lintas, berita, saham, dll). Contohnya adalah Siri pada produk-produk
Apple dan S-Voice pada produk-produk seluler Samsung.
2. Chatbot adalah program komputer yang didesain untuk mensimulasikan
sebuah percakapan cerdas dengan satu atau lebih pengguna manusia melalui
inputan suara atau teks, utamanya digunakan untuk percakapan kecil. Contoh:
Cleverbot, SimSimi, dan Begobet.
Komentar
Posting Komentar