Yapay Zekâ Tabanlı Doğal Dil İşleme

Dilisleme_NelerYapiyoruz_1200x1000_01

Sahada Kullanıma Girebilecek Kadar Gelişmiş Teknolojilere Sahibiz

Doğal dil işleme, akademik olarak uzun yıllardır üzerinde çalışılan bir konu olsa da gerçek hayatta kullanılabilecek kadar iyi ve hızlı çalışan çözümler, pek çok alanda halen bulunmuyor ya da çok az sayıda bulunuyor. DataBoss olarak hem geliştirdiğimiz teknolojilerle hem de bugüne kadar yaptığımız çalışmalarda elde ettiğimiz birikimle Yapay Zekâ Tabanlı Doğal Dil İşleme konusunda, kullanıma alınmış ve başarıyla görev yapan, etkin çözümler ortaya koyuyoruz. Bu alandaki teknolojimizin, birikimlerimizin ve kabiliyetlerimizin öne çıkan noktaları, şöyle sıralanıyor:

  • Alternatifler arasında en geniş etiketli ve etiketsiz Türkçe dili veri tabanı (2 milyarı aşkın tweet, blog ve gazete yazısı, 250 binin üzerinde etiketli veri)
  • Uçtan uca metin işleme sistemi (SaaS)
  • Metin özetleme, metinler arası ilişki bulma, metin temizleme ve düzeltme, metni öğelere ayırma, metinde morfoloji bulma, metinden konu çıkarma kabiliyetleri
  • Türkçe, Arapça (5 lehçe), Farsça, İngilizce, Kürtçe (2 lehçe) dil destekleri
  • Metinden 24 farklı varlık çıkarımı (Dünyada standart olarak sadece 4 sınıf için varlık çıkarımı yapılmaktadır)
  • Yeni varlık sınıflarının eklenebilmesi
  • Metinden 14 sınıf duygu çıkarımı (Dünyada standart olarak sadece 3 sınıf için duygu çıkarımı yapılmaktadır: pozitif, negatif, nötr)

Uçtan Uca Metin İşleme Sistemi (SaaS)

Doğal Dil/Metin İşleme konularında uçtan uca çözümler sunuyor ve geliştirdiğimiz çözümleri hem ürünlerimize entegre ediyoruz hem de servis olarak sağlıyoruz. Bu alanda geliştirdiğimiz çözümler:

  • Metin/Doküman Özetleme Servisi
  • Metinler Arası İlişki Bulma Servisi
  • Metin Temizleme ve Düzeltme Servisi
  • Metni Öğelere Ayırma Servisi
  • Metinden Varlık Çıkarımı (NER – Named Entity Recognitiıon)
  • Metinden Duygu Tanıma (Sentiment Analizi)
  • Metinde Morfoloji Bulma
Dilisleme_NelerYapiyoruz_1200x1000_05
Dilisleme_NelerYapiyoruz_1200x1000_02

Metinden 24 Sınıf Varlık Çıkarım Sistemi

Varlık ismi tanımlama; kişi, kurum adı, organizasyon, lokasyon vb. daha önceden tanımlanmış sınıfların, metinlerden tespit edilmesini amaçlar. Bilgi çıkarımının en önemli aşamalarından biri olan varlık ismi tanımlama, birçok alanda kullanılıyor. Çeşitli kanallardan gelen verileri bu doğrultuda analiz edip güncel Doğal Dil İşleme tekniklerini kullanarak metinde hangi içeriklerin bulunduğunu tespit edebiliyoruz.

Metinden 14 Sınıf Duygu Tanıma Sistemi

Duygu analizi bir yazının duygu içerip içermediğinin saptanması ve bu duygunun değerlendirilmesidir. Bu teknoloji ile insanların belirli bir konuya yönelik tutumları tespit edilebilir. Bu amaçla sosyal medya başta olmak üzere çeşitli kanallar üzerinden gelen verileri analiz edip güncel Doğal Dil İşleme tekniklerini kullanarak verilen metinin pozitif, negatif veya nötr duygu içerdiğini, otomatik olarak tespit edebiliyoruz.

Dilisleme_NelerYapiyoruz_1200x1000_03
Dilisleme_NelerYapiyoruz_1200x1000_04

Hash Tabanlı Ses Arama Sistemleri

Ses Kimliği Çıkarma ve Ses Arama konularında çözümler sağlıyoruz. Bu kapsamda, Fast Fourier Transform (FFT) ile zaman alanı (time domain) içindeki ses sinyallerini frekans alanına (frequency domain) aktarıyoruz ve ses spektrumu oluşturuyoruz. Aranacak ses kaydı içerisinden örnekler alınarak ses izi (hash) oluşturuyoruz. En iyilenmiş arama performansı için içlerinde arama yapılacak ses kayıtlarında optimum miktarda örnekleme yapıyoruz. Böylece, arama yapılacak olan referans veri tabanı büyüklüğünü, belli bir seviyede tutabiliyoruz. Ses arama çözümlerimiz ile;

  • Oluşturulan ses izleri veri tabanı içerisindeki kayıtlar arasında aranır.
  • En çok eşleşme olan veya belli bir eşik değeri üzerinde eşleşme bulunan kayıtlar tespit edilir.
  • Dilden bağımsız olarak arama işlemleri gerçekleştirilebilir.