Baidu İnsan Sesini Birebir Kopyalayabilen Teknoloji Geliştirdi

Baidu ses klonlama

Çin’in arama motoru devi Baidu, yakın zaman önce insan seslerine odaklanan yeni bir yapay zeka geliştirdiğini duyurmuştu. Bugün bir başka açıklama yapan şirket, insan sesini sadece birkaç saniye dinleyerek birebir kopyalayabilen bir teknoloji geliştirdiklerini söyledi.

Baidu Deep Voice olarak adlandırılan yapay zeka teknolojisiyle birlikte sesler üzerine çalışmalar yapmaya devam eden arama motoru devi, yaklaşık bir yıl önce yine insan sesini taklit etmeyi denediği örnekler yayınlamıştı. İlk örneklerin ardından çalışmalarını sürdüren şirket, bugün daha ürkütücü yeni ses kayıtlarını merak edenlerle paylaştı.

Yapılan yeni çalışmalara kadar insan sesini taklit etmeye çalışan diğer yapay zeka örnekleri, vurgulara ve duraklamalara dikkat etmeden cümleleri okuyorlardı. Bu sebeple ortaya çıkan klon sesler robotik bir hal alıyor, anlaşılsa dahi gerçekçi durmuyordu. Özellikle gerçekçi ses taklitleri konusunda kendisini geliştirmeye çalışan Baidu, Deep Voice 2 ile birlikte istediği amaca biraz daha yaklaştı.

Ses taklit etme hızını geliştiren ve işlemin normalden neredeyse iki daha hızlı gerçekleşmesini sağlayan arama motoru devi, yaptığı geliştirmeler sonucunda ortaya çıkan sesleri GitHub hesabı üzerinden paylaşmaktan da geri kalmadı.

YORUMLAR