OpenAI, 15 saniyelik kayıttan ses klonlayabilen yeni teknolojisini tanıttı
OpenAI, 15 saniyelik kayıttan ses klonlayabilen yeni teknolojisini tanıttı
Yapay zeka sohbet robotu ChatGPT’nin geliÅŸtiricisi OpenAI, “Voice Engine” adını verdiÄŸi yeni teknolojisinin yalnızca yazılı metin ve 15 saniyelik tek ses örneÄŸi kullanarak orijinal konuÅŸmacıya çok benzeyen doÄŸal bir konuÅŸma üretebildiÄŸini duyurdu.
OpenAI tarafından, şirketin ses klonlayabilen yeni teknolojisine ilişkin açıklama yapıldı.
Açıklamada, “Voice Engine”in yalnızca yazılı metin ve 15 saniyelik tek bir ses örneÄŸi kullanarak konuÅŸmacının sesine çok benzeyen bir konuÅŸma üretebildiÄŸi bilgisi paylaşıldı.
Söz konusu teknolojinin 2022’de geliÅŸtirildiÄŸi belirtilen açıklamada, “kötüye kullanım potansiyeli” nedeniyle daha geniÅŸ bir sürüm için temkinli ve bilinçli yaklaşım benimsendiÄŸi ifade edildi.
“İnsanların seslerine benzeyen konuÅŸmalar üretmenin özellikle de seçim yılında ciddi riskler taşıdığının farkındayız.” denilen açıklamada, bu kapsamda ABD’nin de dahil olduÄŸu çok sayıda uluslararası ortakla birlikte çalışılarak geri bildirim toplandığı belirtildi.
Güvenlik endiÅŸelerine iliÅŸkin, Voice Engine’in test aÅŸamasındaki kullanıcı partnerlerine, kiÅŸi veya kuruluÅŸların kimliÄŸini kullanmanın yasaklandığı, orijinal konuÅŸmacının rızasının gerektiÄŸi ve seslerin yapay zeka tarafından üretildiÄŸinin izleyicilere açıkça bildirilmesinin zorunlu kılındığı açıklandı.
Çeviri de yapabilecek
Açıklamada ayrıca, Voice Engine’in orijinal konuÅŸmacının sesini koruyarak çeviri yapabileceÄŸi de kaydedildi.
Video ve podcast gibi içerik üreticilerinin bu özellikten faydalanarak “kendi sesleriyle” dünyaya ulaÅŸabileceÄŸi, çevrilen seste orijinal konuÅŸmacının “aksanını” da koruyabileceÄŸi bilgisi paylaşıldı.
Kaynak: AA