18 / 05 / 2024

Aman dikkat 3 saniye yetiyor! İyiye mi kullanılır kötüye mi bilinmez ama ses klonlayan yapay zeka geliştirildi

Aman dikkat 3 saniye yetiyor! İyiye mi kullanılır kötüye mi bilinmez ama ses klonlayan yapay zeka geliştirildi

Microsoft, VALL-E isimli metinden konuşmaya yapay zeka modelini ilan etti. Yapay zeka, 3 saniyede sesinizi klonlayabilecek.



Microsoft Vall-E yapay zeka nedir?

Microsoft, yalnızca üç saniyelik bir ses örneğiyle kişinin ses dalgalarını taklit yoluyla yapay zeka tabanlı modelini ilan etti. Dalga biçimlerini farklılaştırarak konuşmayı sentezleyen öteki stillerin aksine, VALL-E bir kişinin çıkardığı sesi analiz yeteneği var. Bu bilgiyi bileşenlere bölen model, eğitim bilgilerini kullanarak o sesin  “codec” bilgilerini oluşturabiliyor. Microsoft, VALL-E’nin konuşma sentezleme özelliğini, Meta aracılığı ile oluşturulan halka açık sesli kitaplar ile geliştirdiğini söyledi. 7000’den,  fazla konuşmacıdan 60 bin saatlik İngilizce konuşmayı içeren LibriLight isimli bir ses kitaplığını kullandı. VALL-E, önceden dizayn edilmiş hazır sesler olmadan çalışabilir ve analiz ederek öğrenme yeteneğine sahip. Yani daha önce hiç işitmediği sözleri bile öğrenerek çıkartabilir. 
Microsoft’un yapay zeka modeli, şu alamada halka açık olarak arz edilmedi.

Aman dikkat 3 saniye yetiyor! İyiye mi kullanılır kötüye mi bilinmez ama ses klonlayan yapay zeka geliştirildi

Şirket başta emniyet olmak üzere türlü konularda önlem almayı göz ardı etmedi. Birinin sesini taklit etme veya belirli bir konuşmacının kimliğine  bürünme gibi olaylar için algılama modeli üzerinde çalıştığını ifade etti.

Apple ise daha evvel kitapları sesli hale getiren yapay zeka modelini ilan etmişti. Apple Books, yapay zeka ile ses sentezleme modelini kullanarak birçok kitabı sesli hale getirmeyi amaçlıyor.


Geri Dön