Konuşmacı Tanıma Sistemlerinde Güvenliğin Ve Gürbüzlüğün Artırılmasına Yönelik Derin Öğrenme Tabanlı Yöntemlerin Geliştirilmesi

dc.contributor.authorDişken, Gökay
dc.date.accessioned2025-01-06T17:23:46Z
dc.date.available2025-01-06T17:23:46Z
dc.date.issued2023
dc.departmentAdana Alparslan Türkeş Bilim ve Teknoloji Üniversitesi
dc.description01.08.2023
dc.description.abstractBu proje, gelişen teknolojiler nedeniyle konuşmacı tanıma sistemleri için güvenlik açığı oluşturan sentezlenmiş konuşmaların ve tekrar-çal saldırılarının tespit edilmesine odaklanmıştır. ASVspoof organizasyonuna ait 2015 ? 2021 yılları arasında sunulan dört veri tabanı kullanılmıştır. Bu veri tabanları çeşitli sayıda konuşma sentezleme, konuşma çevirme, tekrar-çal (kaydedilen sesi oynatma) saldırıları içermektedir. Ayrıca literatüre uygun olarak NOISEX-92 ve QUT-NOISE veri setlerinden eklenebilir gürültü örnekleri kullanılmıştır. Böylece gürültü altında da sahte konuşma tespiti yapabilen gürbüz sistemlerin geliştirilmesi amaçlanmıştır. Kullanılan yöntemlerden biri, konuşmacı tanıma sistemlerinde de yüksek performans gösteren i-vector yöntemidir. Bu vektörler, farklı uzunluktaki konuşma verilerinin düşük boyutlu ve sabit uzunluklu temsilleridir. Gürbüz i-vectorler elde etmek amacıyla denoising autoencoder adı verilen derin öğrenme modeli kullanılarak gürültülü vektörlerin temiz vektörlere benzetimi sağlanmıştır. Farklı bir yöntem olarak, gürültü maskesi uygulanarak i-vectorlerin çıkarımı aşamasında gürbüzlük elde edilmiştir. Derin öğrenme modellerinin konuşmacı tanıma ve sahte konuşma tespiti çalışmalarındaki başarılı sonuçlar göz önüne alınarak evrişimsel (konvolüsyonel) sinir ağları (CNN) içerikli karmaşık mimariler de kullanılmıştır. Diferansiyel CNN kullanarak gürültü maskesi elde edilmiş ve bu alandaki en iyi çalışmalarla kıyaslanabilecek düzeyde başarı yakalanmıştır. Delta konvolüsyonu algoritması ve buna uygun filtreler geliştirilmiştir. Bu yeni yaklaşımın geleneksel kepstral özniteliklerle de ham ses verisi ile de çalışabildiği gösterilmiştir. Benzer modellerin öğrenebilen parametre sayısını büyük oranda azaltırken performansta kazanç sağlanabildiği gösterilmiştir. Çapraz veri testlerinde literatürdeki en iyi sonuçlardan birine ulaşılmıştır.
dc.identifier.endpage58
dc.identifier.startpage0
dc.identifier.trdizinid1222578
dc.identifier.urihttps://search.trdizin.gov.tr/tr/yayin/detay/1222578
dc.identifier.urihttps://hdl.handle.net/20.500.14669/912
dc.indekslendigikaynakTR-Dizin
dc.language.isotr
dc.relation.publicationcategoryProje
dc.relation.tubitakinfo:eu-repo/grantAgreement/TUBITAK/EEEAG/121E057
dc.rightsinfo:eu-repo/semantics/openAccess
dc.snmzKA_20241211
dc.subjectDerin öğrenme
dc.subjectEvrişimsel sinir ağları
dc.subjectSahte konuşma tanıma
dc.titleKonuşmacı Tanıma Sistemlerinde Güvenliğin Ve Gürbüzlüğün Artırılmasına Yönelik Derin Öğrenme Tabanlı Yöntemlerin Geliştirilmesi
dc.typeProject

Dosyalar