Sesin Geleceği; Siri, Alexa ve Ok Google'dan sonra bizi bekleyenler?

TWEET THIS

Konuşma arabirimleri ve kişisel sanal asistanların, bir sonraki mükemmel fırtına olacağı şüphe götürmez bir gerçek. 1950'lerin başından bu yana bilim adamları, girişimciler ve tüketiciler doğal insan dilini kullanarak insan ve makine arasında boşluğu kapatmakla uğraşıyorlar. Makinelerin karmaşık hesaplama tabanlı görevlerde insandan daha iyi performans göstermesine karşın dili anlamada çok geride kalması, uzun süre hayal kırıklığı olarak kaldı.

Makinelerin bir insan seviyesi yeterliliğinde konuşulanları anlayabilmesine ilişkin gösterilen çabalar aynı hızda bir ilerleme yaratabilmiş değil. Bu alandaki ilk önemi gelişme "speech recognation" konuşma tanıma alanında gerçekleşti. Ses dalgalarının metin mesajlarına çevrilmesi teknolojisi olarak tanımladığımız bu teknolojinin ilk seviyeleri özellikle çağrı merkezlerinde kelime ve komut bazlı yönlendirme şekliyle kullanıldı. IVR "Interactive Voice Response" olarak adlandırdığımız sistemler her ne kadar birinci aşamada makinelere iş yaptırma için ilham verici bir adım olsa da makinelere konuşarak iş yaptırma hayalinden uzak durumdaydı. Önceden programlanmış komutlara yanıt üretmek için kullanılan bu tip sistemler teorik olarak bir köpeğin eğitildiği alanlardaki komutları yerine getirmesinden farksız.

Doğal dili anlamaya (NLU) yönelik yetkinliğe sahip makinelerin hayatımıza girmesiyle, sürekli öğrenen ve ilk kez duyduğu bir çok ifade ve sorguya yanıt verebilen bilgisayarlarla tanıştık. Gelişmiş dil anlama teknolojisi, daha hızlı kablosuz bağlantılar, bulut çözümlerinin yarattığı patlama ve yeni tip müşterinin "bütün hayatını mobil üzerinden yöneten, sürekli bağlı ve metin girdisi kullanarak kendisi hakkında veri üreten" sağladıkları üzerine geliştirilen birinci seviye kişisel sanal asistanlar en azından beklentilerimizi karşılama noktasında iyi bir adım sayılabilirdi. 

Bir sonraki 5 yıl başka bir mükemmel fırtınanın habercisi oldu. Arka tarafında yapay zeka ve yüksek miktar veri üzerinde koşan klavyesiz ve ekransız araçlar. Google, Amazon, Apple gibi tüm işletim sistemlerine konuşma tanıma teknolojisi eklendi. Ücretsiz olarak kullandırılan bu teknoloji yeni bir müşteri deneyimi yaratmak üzere kullanıcılara sunuldu. Doğal olarak konuşulanı anlama noktasındaki tüm hayallerimiz yavaş yavaş gerçeklenmeye başlarken hayallerimiz somut bir hal aldı. Buna rağmen müşteri komutlarının gruplanmış çeşitli cevaplara yönlendirilmesi ya da gerekli bir anahtar kelimeden yoksun cümlelerin optimum yanıtların dışında tutulması gibi sorunlar hala büyük bir bariyer. Zira insanlar arası iletişim böyle yürümüyor. Binlerce farklı kavram ve kelime, çeşitli konfigürasyonları ile geniş bir kapsamda kullanılabilir durumda iken makineler bu esnekliğe halen sahip değil ve yeni sesli asistan dalgasının önüdeki en büyük mücadele alanı bu noktada. 

Bütün bu engeller yakın bir takvimde yaşanabilecek gelişmelere ilişkin hayal gücümüzü frenlememeli. Doğal ve akıllı kullanıcı arayüzü teknolojisi günlük yaşama sorunsuz bir şekilde entegre olduğunda gelişmiş ses teknolojilerinin her yerde bulunacağına ilişkin bir şüphe yok. Sesimizi, bağlı cihazlar ve akıllı yaşam alanlarında, ışıklar, mutfak aletleri, ses ve ısıtma sistemleri ile iletişim kurmak için kullanabileceğiz. Facebook kurucusu Zuckerberg'in geliştirdiği ev içi yapay zeka asistanı Jarvis günlük hayatımızın nereye gidebileceğini göstermesi açısıdan güzel bir demo niteliğinde. 

Üstelik konu sadece evimizle ilgili değil. Piyasadaki daha fazla otomobil üreticisi, sürücülerin ve yolcuların, ellerini ve gözlerini serbest bırakarak yeni bir yolculuk deneyimi yaşayabilmesi için ses tabanlı sistemler geliştirmeye odaklanmış durumda. Mercedes'in yapay zekalı asistanı araç içi bir çok fonksiyonu sesle çalıştırabilmemize imkan tanıyor. Akıllı ev sistemlerimiz ile akıllı araçlarımızın kendi aralarında bir dil oluşturacağı ve birbirlerine iş yaptırabilecekleri makineden makineye evreni, dil anlama teknolojisinin bariylerine oranla çok daha düşük engellere sahip. 

ComScore 2020 yılında ayda 200 milyar aramanın sesle ile yapılacağını ön görüyor. Bu da toplamda 50 milyar dolarlık bir pazar fırsatına işaret ediyor. Ses talebi yoğunlaşıp çeşitleneceğinden doğal dil anlamada her zaman ön planda kalmaya devam edecek. Doğal dilin arkasındaki matematik keşfedildikçe zorlu şartlada oluşan sesleri ayırt etme ve anlamlandırma kolaylaşacak. Aksi durumda kullanıcıların, söylediklerini anlamayan makinelere güveni sürekli azalacaktır. 

Her bir ilgi alanı için uzmanlık seviyesinde anlama kabiliyeti gerekiyor üstelik. İnsanı, anlama kabiliyeti noktasında özel kılan farklı uzmanlık alanları için özelleştirilmiş terminolojiye hakim olabilmesi. Bir sanal asistandan da aynı ölçüde bir yetkinlik beklememiz bu açıdan gayet doğal bir davranış. Bir yemeğin tarifini bilmek kadar malzemeleri de tanımak önemlidir. Bu durum sesli asistanlar için de geçerli. Tarifler konusunda uzman bir sesli asistandan malzemeler konusunda da uzmanlık beklemek sıradışı bir davranış olmayacak.

Bütün bunların temelinde tabiki yapay zeka teknolojilerinde yaşanan çığır açıcı gelişmeler yatıyor. Bizi geleceği dair umutlandırıp daha fazla hayal gücüne sahip olmak için teşvik eden de bu. Donanım seviyesindeki yenilikçi yaklaşımlar, daha yetkin algoritmalar ve her geçen gün büyüyen veri, doğal dilin anlamlandırılması konusunda daha da iyi seviyeleri görmemiz için yeterli materyaller. 

Halen büyük teknoloji şirketleri için doğal dilin anlaşılması noktasında başlangıç seviyesindeyiz. Siri, Google Home ve Alexa gibi servislerin halen komut düzeyinde çalışıyor olmasının arkasında henüz yeteri kadar çeşitliğe ve derinliğe sahip olmayan ses tanıma algoritmaları var. Buna rağmen umutlu olmak için çok fazla şeye sahibiz. Şu an dünyanın çeşitli yerlerinde onlarca girişim sadece sesi daha iyi tanımak için çalışıyor ve her geçen gün yeni bir yaklaşım önümüze geliyor. Çok uzak olmayan bir vakitte günlük hayatımıza ilişkin tüm sorunları konuşabildiğimiz sanal asistanlara devredip çok daha az şeyi dert edeceğiz ve bugünlere ilişkin tahminler sadece bir bilim kurgu hayali değil. 

Bilimkurgu demişken bu yıl Oscar'da en iyi erkek oyuncu ödülünü almasına kesin gözüyle bakılan Joaquin Phonex'in bir başka sağlam filmi "Her"ü izlemenizi ve sesli asistanların geleceğine ilişkin hayalgücünüzü zorlamanızı tavsiye ederim.