DOĞAL DİL İŞLEME

Doğal Dil İşleme veya orijinal ismiyle Natural Language Processing (NLP), yapay zekanın gelişimi ve dil bilimle ortaklaşa geliştirilen çalışmalar sonucunda hayatımıza girmiş bir terimdir. En geniş kapsamıyla doğal
dil işleme, Türkçe, İngilizce gibi doğal dillerdeki metinlerin, ses dalgalarının bilgisayar tarafından algılanarak yazılım programında çözümlenmesi ve bilgisayar ortamına aktarılmasıdır. Doğal Dil işleme teknolojisini benzersiz
kılan, kullanıcıların sistemlerle sınırlı ifadeler yerine, kendi doğal ifadeleriyle konuşarak etkileşime geçmelerine olanak tanıması ve insan-makine etkileşimini doğal bir diyaloğa dönüştürmesidir.

Doğal dil işleme ile doğal dillerin kurallı yapısının çözümlenmesi veya yeniden üretilmesi amaçlanmıştır. Doğal dilin yapısını çözümlediğimiz ve üretim yapmaya başladığımız zaman, insanların makinelere olan beklentisi
yükselmektedir ki keza, son yıllarda insanların makinelerle olan bağının giderek arttığına hepimiz şahit olmaktayız.

Doğal dil insanların iletişim kurması ve hayatta kalması için kullanılan en temel özelliklerden biridir. Sosyal bir insanın günlük hayatında dilden uzak kalması mümkün değildir. Konuşmanın haricinde herhangi bir yerde
rastlanabilecek metinler, işaretler, menüler, e-postalar, SMS, internet sayfaları, reklamlar ve daha nice örnekle dil karşımıza çıkmaktadır. Konuşma da yine aynı şekilde hayatımızın her alanında yer alan ve hatta yazmaktan daha kolay ifade ettiğimiz dil özelliğidir. Haliyle insanlar ses ve metin ile tüm işlerini halledebilmektedirler.

Peki doğal dil işleme için yapılan çalışmalar nelerdir?

Metin verilerini doğrudan işleyip analiz yapılırken ses verileri üzerinde doğrudan işlem yapılamıyor, öncelikle ses verileri yazılı metinlere çevriliyor ve bu yazılı metinler doğal dil işleme modüllerine uygun hale getirilip makine tarafından işleniyor ve ayrıca hedef dilde tek kelimeden başlayıp kurallı cümle ve konu bütünlüğü içeren paragraflar , ana dili hedef dil olan kişilere sesli bir şekilde okutulup dijital ortamda kayıt edilip veri tabanı oluşturuluyor. Daha sonra bu veriler karşılaştırılıyor. Ayrıca doğal dil işleme ile ilgilenirken üzerinde çalışılan dilin, dil morfolojisi seviyeleri olan kelime bilimi, sözdizimi, anlamsal ve söylevi bilmek oldukça önemlidir.

NLP kullanım alanları şöyle sıralayabiliriz.
Makine diline ceviri (machine translation) → NLP merkezine yer alan bu kullanım alanı, sözcük ve kelime dizilerinden anlam çıkarmaya çalışma işlemidir. Spam ile mücadele (fighting spam) → Mail verisinden anlamlar çıkararak filtreleme işlemi yapılması NLP kullanım alanlarından biridir.
Bilginin çıkarılması(Information Extraction) → Finans alanında yapılan algoritmik ticaret sırasında haberlerden, forumlardan, sosyal medyalardan bilgi çıkarılması diğer NLP kullanım alanıdır. Özetleme(Summarization) → Gittikçe artan veriden özet bilgiler çıkarmaya pazarlama alanında çok rastlanır. Bir markanın müşteri gözünde iyi veya kötü olarak algılanıp algılanmadığı metinlerin yorumlanması ile özetlenebilir. Soru Cevaplama (Question Answering) → Sorulan sorulardan anlamlar çıkarıp uygun cevaplar verebilmek NLP kullanım alanlarındandır. Domain isimlerlerinin kontrol edilmesinde —NLP ile son kullanıcıyı aldatmaya yönelik domain isimlerinin kontrolu yapılabilir. Açık kaynak kod güvenlik analizi— Bazı kod desenlerinin yakalanmasını için kullanılır. Oltalama ( Phishing Identification  )— Kullanıcıları yemlemek için kullanılabilecek kelimelerin bulunmasında kullanılır.

KAYNAKÇA:

Hazırlayan: Göksel Şimşek

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir