Sóylewdi tanıw hám sintezlew
Speech Recognition & Synthesis (burın Speech Services dep atalǵan)[1] — Google tárepinen Android operaciyalıq sisteması ushın islep shıǵılǵan ekrandı oqıwǵa arnalǵan qosımsha. Ol kóp tillerdi qollap-quwatlaw menen ekrandaǵı tekstti dawıslap oqıw (sóylew) ushın qosımshalarǵa múmkinshilik beredi. Tekstti sóylewge aylandırıw Google Play Books tárepinen kitaplardı dawıslap oqıw ushın, Google Translate tárepinen sózlerdiń aytılıwın kórsetiw ushın awdarmalardı dawıslap oqıw ushın, Google TalkBack hám basqa da dawıslı keri baylanısqa tiykarlanǵan qoljetimlilik qosımshaları, sonday-aq úshinshi tárep qosımshaları tárepinen paydalana aladı. Paydalanıwshılar hárbir til ushın dawıs maǵlıwmatların ornatıwı kerek.
Tariyxı
Ayırım qosımsha baǵdarlamashıları, mısalı Hyundai 2015-jılı, ózleriniń Android Auto qosımshaların Tekstti dawısqa aylandırıw xızmetin kirgiziw ushın beyimlestirip hám ózgertip basladı[2]. textPlus hám WhatsApp sıyaqlı qosımshalar xabarlandırıwlardı dawıs penen oqıw hám dawıs penen juwap beriw funkcionallıǵın usınıw ushın Tekstti dawısqa aylandırıw xızmetin paydalanadı.
Google Cloud Text-to-Speech xızmeti 2014-jılı Google tárepinen satıp alınǵan[3], Googledıń Ullı Britaniyadaǵı jasalma intellekt sıńar kompaniyası DeepMind tárepinen jaratılǵan WaveNet programmalıq támiynatı menen isleydi[4]. Ol óziniń básekilesleri Amazon hám Microsofttan ózgesheleniwge háreket etedi[5].
Kópshilik dawıs sintezatorları (sonıń ishinde Appledıń Siri-i) konkatenativlik sintezdi paydalanadı, onda baǵdarlama jeke fonemalardı saqlaydı, sońınan olardı sózler hám gápler dúziw ushın birlestiredi. WaveNet sóylewdi adamǵa uqsas pát hám buwınlarǵa, fonemalarǵa hám sózlerge intonaciya menen sintezleydi. Basqa kópshilik tekstti dawısqa aylandırıw sistemalarınan ayırmashılıǵı, WaveNet modeli qayta islenbegen audio tolqın formaların basınan baslap jaratadı. Model úlken kólemdegi sóylew úlgileri arqalı oqıtılǵan neyron tarmaǵın paydalanadı. Oqıtıw processinde tarmaq sóylewdiń tiykarǵı strukturasın, mısalı, qaysı tonlar bir-biriniń izinen keletuǵının hám realistlik sóylew tolqın formasınıń qanday kóriniste bolatuǵının shıǵarıp aladı. Tekst kirgizilgende, oqıtılǵan WaveNet modeli tiyisli sóylew tolqın formaların basınan baslap, hárbir úlgini bir-birlep, sekundına 24 000 úlgige shekem hám jeke dawıslar arasında tegis ótiwler menen jarata aladı.
Xızmet 2023-jılı Speech Recognition & Synthesis dep qayta ataldı.
Derekler
- ↑ Wang. «You'll never guess the latest Google app to cross 10 billion installs (seriously)». Android Police (8-noyabr 2021-jıl). 8-noyabr 2021-jılda túp nusqadan arxivlendi. Qaraldı: 18-noyabr 2021-jıl.
- ↑ «Google, Hyundai show off new third-party Android Auto apps». CNET. CBS Interactive. Qaraldı: 17-yanvar 2015-jıl.
- ↑ «WaveNet» (en). www.deepmind.com. Qaraldı: 22-iyun 2023-jıl.
- ↑ Gibbs, Samuel (2014-01-27). "Google buys UK artificial intelligence startup Deepmind for £400m". https://www.theguardian.com/technology/2014/jan/27/google-acquires-uk-artificial-intelligence-startup-deepmind.
- ↑ «Text-to-Speech AI: Lifelike Speech Synthesis» (en). Google Cloud. Qaraldı: 22-iyun 2023-jıl.