UBİ 619 - Doğal Dil İşleme

ÖĞRETİM ÜYESİ
Bahar Karaoğlan, Prof.Dr.
ASİSTANT
Can Umut İleri
DERS NOTU

DERSİN AMACI
Dersin hedefi öğrencilerin doğal dil işleme (DDİ) alanındaki temel kavramları anlamasını ve güncel araştırmalar konusunda fikir sahibi olmalarını sağlamaktır. Dersi başarıyla tamamlayan öğrencilerin dil bilgisini işleyen algoritmaları gerçekleyebilmeleri, ve dillerin hesaplama özelliklerini kullanarak yeni yöntemler geliştirebilmeleri beklenmektedir.

DETAYLAR

Dersin Adı

Doğal Dil İşleme 

 

Dersin Kodu

UBİ 619

 

Dersin Türü

Seçmeli

 

Dersin Seviyesi

Doktora

 

Dersin AKTS Kredisi

7,5

 

Haftalık Ders Saati (Kuramsal)

3

 

Haftalık Uygulama Saati

 

 

Haftalık Laboratuar Saati

 

 

Dersin Verildiği Yıl

 

 

Dersin Verildiği Yarıyıl

 

 

Dersin Öğretim Üyesi (Üyeleri)

Prof. Dr. Bahar KARAOĞLAN

 

Öğretim Sistemi

Örgün Eğitim

 

Eğitim Dili

Türkçe

 

Dersin Ön Koşulu Olan Ders(ler)

Yok

 

Ders İçin Önerilen Diğer Hususlar

İstatistiksel Yöntemleri anlama ve uygulama becerisi.

 

Staj Durumu

Yok

 

Dersin Amacı

Dersin hedefi öğrencilerin doğal dil işleme (DDİ) alanındaki temel kavramları anlamasını ve güncel araştırmalar konusunda fikir sahibi olmalarını sağlamaktır. Dersi başarıyla tamamlayan öğrencilerin dil bilgisini işleyen algoritmaları gerçekleyebilmeleri, ve dillerin hesaplama özelliklerini kullanarak  yeni yöntemler geliştirebilmeleri beklenmektedir.

 

Öğrenme Çıktıları

1.      Kural tabanlı ve istatistiksel metotlar ile DD analiz tekniklerini anlayabilme.

2.      DDİ çözümlemesinde belirsizlik probleminin anlaşılması ve giderilmesi tekniklerini kavrayabilme.

3.      Literatür taraması yaparak alanda mevcut araştırma ve uygulama yöntemlerini kavrayabilme.

4.      Söz dizimsel ve söz anlamsal DDİ yöntemlerini kavrayabilme.

5.      DDİ de derlemlerin önemini ve özelliklerini kavrayabilme.

6.      Dil modellerinin anlayabilme.

7.      Zipf kanunları ve N-gramların anlayabilme.

8.      Sözcük türü etiketleme yöntemlerini ve uygulama alanlarını kavrayabilme.

9.      Sözcük gövdeleme, kökleme yöntemlerini kavrayabilme.

10.  Söz öbeklerinin belirlenmesi yöntemlerini kavrayabilme.

11.  Makine tercümesi yöntemlerini kavrayabilme. 

 

Dersin İçeriği

Bu ders doğal dil işleme konusunun çeşitli yönlerini içerir. Gövdeleme algoritmaları; morfolojik analiz, morfolojik belirsizlik gibi dil işleme görevleri için sonlu durum yöntemlerinin uygulanması; makine çevirisi ve bilgi çıkarsama gibi konuları kapsar.

 


 

 

 

 

Haftalık Ayrıntılı

Ders İçeriği

Hafta

Kapsam

 

I

Giriş:

DDİ konusu ve problemlerine genel bakış.

 

II

Olasılık:

Olasılık teorisine giriş: modern DDİ'nın alt-yapısı, Olaylar ve sayma, birleşik ve durumsal olasılık, marjinaller, bağımsızlık, Bayes kuralı, Örnek DDI uygulamaları.

problem çözümü

III

Bilgi Teorisi:

Bilgi Nedir?, "Gürültülü kanal" (İng. Noisy channel) problemi, "Shannon oyunu"(dil eksenli), Entropi/dağınım, çapraz-entropi, enformasyon kazancı - bazı dil olgularının uygulanması.

problem çözümü 

IV

Bilgi Teorisi: (devam)

Zipf kanunları.

okuma ve tartışma

V

Dil Modellemesi ve Naive Bayes:

Olasılıksal dil modelleme ve uygulamaları, Markov modeller, N-gram'lar, Bir kelimenin olasılığını tahmin etme ve SMOOTHING, Dilin üretilen modelleri, uygulaması: dilin otomatik tespiti.

problem çözümü

VI

Bilgi Çıkarsama:

Bilgi kaynakları, Kural tabanlı yöntemler.

okuma ve tartışma

VII

İçerik Bağımsız Gramer'ler (İBG) için Söz Dizimi ve Gövdeleme:

Gövdeleme,belirsizlikler, İçerik bağımsız Gramerler, Olasılıksal IBG'ler

araştırma ve raporlama

VIII

Ara sınav

 

IX

Sözcük Türü Etiketleme ve HMM (Hidden Markov Models):

Sözcük türü etiketleme kavramı, örnekler ve kullanımı; Penn külliyatı ve Brown derlemi; Olasılıksal (ağırlıklandırlmış) sonlu durum yöntemleri; HMM tanımı ve kullanımı. 

 

X

En çok Belirsizlik Modeli:

Söz öbeklerinin belirlenmesi yöntemleri

araştırma ve raporlama

XI

Hesaplamalı Anlamlar:

Anlam gösterimi, lambda hesabı, Söz dizimsel/anlamsal arayüzler, mantıksal çıkarsamalar.

okuma ve tartışma

XII

Derlem ve Diğer kaynaklar

 

XIII

Makine Çevirisi

 

XIV

Öğrenci Proje Sunumları

 

XV

Öğrenci Proje Sunumları

 

XVI

Yıl Sonu sınavı

 

 

 


 

Ders Kitabı /Malzemesi /Önerilen Kaynaklar

Ders Kitabı: Jurafsky, D. and Martin, J. H. Speech and Language Processing. Prentice Hall: 2000. ISBN: 0130950696

 

Yardımcı Kitaplar: Manning, C. D. and H. Schütze: Foundations of Statistical Natural Language Processing. The MIT Press. 1999. ISBN 0-262-13360-1.

Allen, J. Natural Language Understanding. The Benajmins/Cummings Publishing Company Inc. 1994. ISBN 0-8053-0334-0.

 

© 2014 Uluslararası Bilgisayar Enstitüsü. TÜM HAKLARI SAKLIDIR.