Google Cloud Text-to-Speech; Artık 187 Ses ve 95 Wave Net sesine Sahip

Google Cloud Text-to-Speech 187 Ses ve 95 Wave Net’le %70 Daha Net.

Şubat ayında Google, çok kanallı tanıma, cihaz profilleri ve yapay zeka sistemi tarafından oluşturulan ek dilleri tanıtan Google Cloud Platform (GCP) AI metin-konuşma ve konuşma-metin hizmetleriyle ilgili bir dizi güncelleme yaptığını açıkladı.


WaveNet – Google ana şirketi Alphabet’s Deep Mind’in öncülüğünü yaptı.


Bu geliştirmelerden yola çıkarak Mountain View şirketi, bugün Google Cloud Text-to-Speech’teki yeni değişkenlerin ve seslerin sayısını yaklaşık% 70 oranında genişleterek toplamda 33’e kadar olan toplam dil ve değişken sayısını artırdı.


Şimdi, 76 yeni ses ve 38 yeni WaveNet destekli sesin eklenmesiyle Google Cloud Text-to-Speech, 187 toplam ses (bu yılın başında 106’dan) ve 95 toplam WaveNet sesine (Şubat ayında 57’den 57’ye kadar) sahip ve bir buçuk yıl önce; 6 Yeni dille desteklenen diller ve dil çeşitleri arasında;

Google Cloud Text-to-Speech
Google Cloud Text-to-Speech

Çekçe, İngilizce (Hindistan), Filipinli, Fince, Yunanca, Hintçe, Macarca, Endonezyaca, Mandarin Çincesi (Çin), Modern Standart Arapça, Norveççe (Nynorsk) ve Vietnamca.


Başlatılmamış olanlara göre, WaveNet, konuşmadaki tonal kalıpları tanımlayarak, dilbilimde atasözü olarak adlandırılan vurgu ve tonlama gibi şeyleri taklit ediyor.


Önceki konuşma; nesil modellerinden çok; daha ikna edici ses snippet’leri üretiyor.


Google Cloud Text-to-Speech, ortalama konuşma puanına dayalı olarak; insan konuşmasıyla yapay zeka konuşma kalitesi kıyaslandığında; doğal konuşma açığını% 70 kapattığını ve bu güncellemeninde daha verimli olduğunu söylüyor.


Google’ın tensör işleme ünitelerinde (TPU’larda), yapay zeka model eğitimi için optimize edilmiş devrelerle donatılmış; özel yongalarda çalışan bir saniyelik bir ses örneğinin oluşturulması yalnızca 50 milisaniyede sürüyor.


Aharon, Cloud Metinden Konuşmaya sunulan yapay zeka seslerinin sayısına göre Microsoft’un Azure Speech Services ve Amazon Poly gibi rakipleri bir adım attığını belirtti.
Polly’nin 58 sesinden 11’i ,bir yapay zeka modeli tarafından üretilirken, Azure Speech Services’in yalnızca 5 sesi yapay zeka tarafından üretildi.
Dahası, Polly ve Azure Speech Services’leri, yapay zeka destekli seslere sahip, yalnızca 2 veya 4 toplam dil ve sürüm seçeneği sunmaktalar.
Soru Sorun: Medya Fatih Sitemize Trafik Konusu İle Soru Sorabilirsiniz ve Maksimum 24 saat İçerisinde Cevap Verilir.Sitemize Soracak Olduğunuz Soruları: Medyafatih@hotmail.com adresine gönderiniz veya yazının altında bulunan yorum bırak bölümünden soru sorabilirsiniz.Google Cloud Text-to-Speech, API tarafından işlenen; 1 milyon karaktere kadar kelime kullanmaktadır. İlginizi Çekebilir:TL Kaç Afgani Eder

Bir cevap yazın