Ruski jezik za pico tts. Pregled sintetizatora govora za Android. Googleova sinteza govora

13.11.2019 Zanimljiv

Bok svima. U današnjoj epizodi govorit ćemo o Pico TTS programu koji se nalazi na Android uređaju. Dakle, što je ovaj program? Što ona radi, čemu služi? Sva ta pitanja danas ću razmotriti, nema sumnje. Pokušat ću sve napisati jednostavnim ljudskim jezikom =)

Dakle, evo prvih podataka. Pico TTS je aplikacija tipa sintetizatora govora, s ovom aplikacijom možete govoriti tekst. Međutim, postoji jedan veliki problem: Pico TTS nema ruski jezik. Usput, alternativni Googleov sintetizator teksta u govor ima ruski!

Usput, TTS je kratica za Text To Speech, što se pak prevodi kao Text To Speech =)

Ali zašto vam uopće treba sintetizator govora? Omogućuje vam izgovor teksta u aplikacijama. Na primjer, Googleov sintetizator teksta u govor može čitati tekst u Google prevoditelju, TalkBacku ili u nekim aplikacijama koje koriste sintezu govora. Hmm, sinteza govora? I zvuči moćno!

U principu, aplikaciju Pico TTS možete izbrisati takvu kakva jeste, ali je bolje da je zamrznete. Zatim, ako ste uvjereni da vam apsolutno ne treba i da vam neće trebati u budućnosti, možete ga kasnije izbrisati. Za zamrzavanje i brisanje preporučam aplikaciju Titanium Backup(imajte na umu da su za to potrebna root prava).

Također sam pročitao da kvaliteta Pico TTS-a nije baš dobra, te da se aplikacija ne razvija i da je prisutna na Androidu samo za pokazivanje.. =(

Ako zapravo trebate onemogućiti pretvaranje teksta u govor, tada trebate otići na Postavke > glasovni unos i izlaz > tekst u govor > poništite sve kućice tamo =)

Ne znam je li to istina ili ne, ali jedna osoba je napisala poruku da on osobno nije obrisao Pico TTS. Kaže da je na jednom telefonu obrisao Pico TTS nakon čega, koji god sintesajzer govora instalirao, ništa nije radilo. Je li ovo istina ili besmislica? ne znam Ali pronašao sam ovu poruku na Android forumu i zaključio da je vrijedno proslijediti vam ovu informaciju.

Ovdje sam našao sliku, ovo je postavka gdje možete odabrati TTS:

Kao što vidite, postoji čak i Samsung TTS =) Usput, ovdje je skoro ista slika, ali ovdje je SVOX Classic TTS:

Odnosno, mogu postojati različiti sintisajzeri, ali Pico TTS dolazi kao ugrađeni, dok se drugi mogu instalirati samostalno.

I ovdje je ova slika, to su također postavke, ali naizgled već na tabletu, a ovdje je sve gotovo isto:

TTS je odabran u odjeljku Jezik i unos =)

Pa, to je sve ljudi, mislim da sam rekao sve, što je Pico TTS sada znate, zar ne? To znači da je moj zadatak uspješno obavljen. Na kraju, rekla bih da se čuvate i sretno!

Jezični motori i sintesajzeri ( TTS pretvaranje teksta u govor) nikada nisu bili nešto savršeno za ruski jezik. Za razliku od engleskih, čiji je razvoj bio konstantan i stalan, najbolji predstavnik domaćih sintisajzera više od deset godina bio je muški glas. Nikolaj od Acapela. Posljednjih godina natječe se s dvije sasvim pristojne ženske opcije - Alena (Acapela) i Katerina, kasnije - Katerina II (ScanSoft RealSpeak).

Za svakodnevnu upotrebu bilo je potrebno malo truda, a za mobilne platforme, prvenstveno Android, bile su prikladne samo u kombinaciji s osobno računalo, prisiljavajući tekst da se pretvori u zvuk kako bi se kasnije mogao reproducirati sa standardnim Mp3 playerom na krajnjem uređaju.

Neku nadu za napredak, kao što se često događa, dala je dobra korporacija Google, pogledajte naš materijal:
. Sve do nedavno, maksimalne mogućnosti koje je pružao pretraživački div bile su ograničene na online rad s njihovim sintesajzerom. Rezultat, iskreno govoreći, nije bio nešto revolucionarno. S primjerom Google rad Možete se upoznati s TTS API-jem na opće informacije o Klubu.

Bilo je nekoliko drugih rješenja posebno prilagođenih za korištenje s pametnim telefonima:

  • Pico TTS isporučuje se prema zadanim postavkama - bez ruskog jezika
  • IVONA Text-to-Speech - nažalost, podrška za ruski još nije implementirana, iako je službeni glas Tatyane predstavljen na web stranici programera
  • SVOX klasični pretvarač teksta u govor- jedini radni model. Instalacija softvera je besplatna, probno razdoblje za procjenu. Konačna cijena ~ 3 USD
Kao što vidite, samo rješenje stvarno djeluje SVOX. Unatoč svoj “realnosti”, sustav radi izuzetno loše. Odnosno, njegova glavna svrha je čitanje na ruskom, formalno to ispunjava, ali slabo čita.

I tako, krajem svibnja 2014. Google Play pojavljuje se njihov novi potpuno besplatni Google Speech Synthesizer. Ovaj proizvod lako nadmašuje dosadašnja rješenja koja koriste ruske TTS sustave, štoviše, po mom skromnom mišljenju, ovaj ženski glas bolji je od dostupnih rješenja za osobna računala.

Ispod je mali demo fragment primljen sa pametnog telefona s instaliranim Googleovim sintetizatorom govora - ruski ženski glas (za sada jedini dostupan)

Unos primljen putem standardni program za fb2 FBReader s povezanim modulom čitača Čak i ako računalni govor ne percipirate u kontekstu bodovanja knjige, ovo će vam rješenje omogućiti da nadogradite svoj mobilni prijatelj. Google navigacija će umjesto vas početi čitati imena ulica, posebne aplikacije moći će čitati SMS tekst i brojeve tijekom dolaznih poziva.

Osim toga, što je vrlo korisno za slabovidne ili slijepe korisnike, sada možete u potpunosti koristiti TalkBack - analogni čitač zaslona Jaws koji je mnogima poznat iz rada na osobnim računalima. Ovaj sustav ostvaruje potencijal Androida za glasovno obavještavanje o svim događajima na telefonu, omogućujući vam da njime upravljate bez gledanja ekrana.

    Nedostaci rada sa sintisajzerom
  • Značajan nedostatak za ljubitelje audio knjiga je povećana potrošnja energije, za nekoliko sati presnimavanja izgubit ćete do pola napunjene baterije
  • Smetnja snimljena samo pri reprodukciji preko zvučnika telefona: lagano prigušivanje - slabljenje razine zvuka na početku rečenice. Kroz žičane slušalice, vanjski uređaj i bluetooth ovaj efekt nedostaje
  • Nema podrške za prilagođene naglaske i rječnike

Ne možete očekivati ​​posebna čuda - to je samo računalo, međutim, neka hladnoća tijekom čitanja može se nekome učiniti ugodnim predahom od viška teatralnosti u radu pojedinih izvođača.

Instalacija sintisajzera je izuzetno jednostavna.
Idite na stranicu proizvoda u trgovini. Google Play će vas kao i obično obavijestiti o kompatibilnosti s vašim uređajem - potreban je Android 4.0.3 i više, tada će doći do preuzimanja i instalacije. Zatim morate preuzeti "glas":
Postavke -> Posebne mogućnosti-> Ispis funkcije pretvaranja teksta u govor -> Google sintetizator govora (neka vas ne uzbuni prijeteće upozorenje, proizvođač neće saznati ništa novo o vama kroz ovaj program, on već sve sigurno zna) -> preuzimanje. I za mir, ponovno pokrenite.

    UPD: listopad 2016
Za Android 4.2 (bolje 4.4) i više, osnovnom ženskom glasu dodano je 6 novih - tri muška i tri ženska:

Ako vam engleski nije materinji jezik i ne pišete aplikacije samo za iPhone, tada ćete imati prilično poteškoća ako želite pronaći odgovarajući alat za razvoj tzv. mobilne "glasovne" aplikacije.

Ova recenzija daje klasifikaciju i opisuje najvrjednije mobilne TTS motore.

Bavim se istraživanjem u području dizajna sučelja Mobilni uredaji za osobe s oštećenjem vida. Za provedbu jednog od svojih projekata trebao mi je mehanizam za generiranje glasa s višejezičnom podrškom (barem dva jezika - engleski i ruski). To je bio razlog za potragu za sintetizatorom govora.

Radi praktičnosti, TTS motore dijelimo u tri klase:

  • komercijalni;
  • besplatni (rješenja licencirana pod GPL, LGPL i mekšim licencama kao što su BSD licenca ili wxWindows licenca, koje omogućuju komercijalni razvoj proizvoda);
  • ugrađeni (alati koje pruža sam operativni sustav).

Komercijalni motori

SVOX mobilni TTS

Cijena: n/a
Jezici: 26, uključujući ruski
visoka
Mobilni OS: Android, Symbian, Windows CE/ Windows Mobile SKUHATI

Tvrtka SVOX ima najukusnije tehnička točka prikaz proizvoda - SVOX Mobile TTS. Međutim, budući da tvrtka posluje uglavnom u B2B segmentu, nikada nisu odgovorili na moja dva e-maila s upitom o cijeni.

Cijena navedena u zaglavlju odnosi se na operativne sustave kao što su Windows Mobile i Symbian, ali Acapelin poslovni model varira ovisno o odabranom OS-u. Primjerice, najjače promoviraju iOS smjer, za što je napravljena zasebna web stranica. Tamo se možete registrirati i besplatno dobiti probnu verziju njihovog motora. Gola SDK cijena za bivši iPhone OS je 250€. Također iz svakog artikla koji prodajete u aplikaciji Pohranite aplikacije Zaračunavaju se znatne kamate.

Napominjem da Acapela pruža sintezu govora u "oblaku", kao i prijenos SDK-a na bilo koju platformu.

Besplatni motori

Flite
Cijena: br
Jezici: engleski plus mogućnost kompajliranja FestVox jezika
Subjektivna ocjena kvalitete zvuka: niska
Mobilni OS: Android, Windows CE/Windows Mobile, iOS, PalmOS
Mogućnost razvoja komercijalnih proizvoda: da (CMU licenca)

U desktop svijetu, festivalski sintetizator govora je dobro poznat. Ima priključak pod nazivom Flite za mobilne uređaje i ugrađene sustave, koji se distribuira pod vlastitom licencom nalik na X11, što omogućuje besplatnu distribuciju softvera svima, kao i izradu komercijalnih i besplatnih aplikacija temeljenih na njemu. Postoje priključci za Windows CE/Windows Mobile, PalmOS, Android i .

Upute za sastavljanje motora za WM uključene su u distribuciju, međutim, na ovoj platformi eSpeak ima jedno značajno ograničenje - generiranje glasa moguće je samo u WAV datoteka. Može se nabaviti sklopljeni TTS motor za Windows Mobile.

ESpeak je prenesen na Android. Najlakši način da isprobate je instalirati aplikaciju TTS Service Extended s Android Marketa, koja vam omogućuje prebacivanje između ugrađenog motora i eSpeaka. Ovaj TTS mehanizam se distribuira pod uvjetima GNU GPL.

Ugrađena rješenja

Ugrađena rješenja prisutna su samo u Symbianu i Androidu. Iz nepoznatog razloga, Microsoft je svoj mobilni OS lišio odgovarajućeg softverskog sučelja (MS SAPI).
Symbian

Cijena: br
Jezici: engleski
Subjektivna ocjena kvalitete zvuka: izuzetno niska
Mogućnost razvoja komercijalnih proizvoda: da

Ugrađeni TTS Symbian Foundationa skriven je u klasi CMdaAudioPlayerUtility. Iako ne govori ništa o tome, dopušta sintezu govora. Nažalost, ruski jezik nije podržan. Kvaliteta generiranja engleskog govora je vrlo niska. Bez pripreme prilično je teško razumjeti što je točno rekao.

Dodatni jezični paketi mogu se preuzeti, ali je popis podržanih telefona vrlo ograničen. Instaliranje paketa za ruski jezik na uređaju sa Symbain OS S60 5. nije dalo očekivane rezultate; ugrađeni TTS nije govorio ruski.

Napominjem da postoji prilično zgodno API proširenje pod nazivom NSS TTS Utility API, čiji opis možete pronaći

Čitač zaslona za Android ili pametni telefon za slabovidne ili slijepe osobe

Suvremeni svijet neprestano napreduje. Divno diplomirao softver— zaslonski najavljivač, zahvaljujući kojem osoba lišena vida može uroniti u svijet visoka tehnologija. Već smo pisali ranije, ali u ovoj recenziji ćemo se osvrnuti na aplikacije za pametne telefone.

Softver za sintetiziranje govora izgleda kao aplikacija koja omogućuje prijevod tekstualne informacije na govornu poštu.

Širok izbor ovih proizvoda ne prestaje zadivljivati ​​korisnike, stoga predlažem da pobliže pogledate one najpopularnije.

Klasifikacija primjene

Već je razvijen i pušten velik broj sintetizatora govora, uz njihovu pomoć užitak je ne samo vizualno percipirati korisna informacija, ali i čuti.

Ovi programi su podijeljeni u dvije vrste: plaćeni i besplatni.

Oni programi koji su “bazirani na lopti” imaju oskudniji arsenal mogućnosti, ali se također mogu koristiti, s plaćenim verzijama stvari su zabavnije, njihova golemost ne poznaje granice.

Sintetizatori govora na ruskom jeziku

Za operativne sustave kao što je Android postoji mnogo opcija za sintetizatore govora, ali većina njih nema verzije na ruskom jeziku.

Pogledajmo nekoliko najpopularnijih čitača zaslona:

Ovaj program je razvijen za Android. Ima visoke stope sinteze govora, višejezičan, ima 25 različiti jezici, uključujući Russified.

Programeri su Acapela Group S.A. približan trošak je 4 eura.

Višejezični sintetizator govora koji nije komercijalan. Obrada informacija na 37 jezika, glasovna gluma je dobra, postoji mnogo glasovnih opcija.

Radi na nekoliko operativni sustavi Linux, Mac OS, Microsoft Windows i RISC OS. Za ispravnu reprodukciju glasa razvijen je prošireni rječnik.

Zbog neprofitnih aktivnosti, program radi nešto lošije od plaćene aplikacije, ali programeri imaju planove za poboljšanje performansi.

Postavljanje TTS-a

U početku morate odlučiti koji je sintetizator govora najprikladniji. Preuzmite i instalirajte aplikaciju, zatim idite na TTS postavke. Pogledajmo upute korak po korak:

  1. Morate početi s lansiranjem;
  2. Zatim morate ići na postavke aplikacije;
  3. Odaberite i instalirajte željeni jezik;
  4. Odlučite se za sintezu govora;
  5. Trebali biste odabrati motor, najčešće "automatski";
  6. Postavite brzinu govora koja vam odgovara;
  7. Prilagodite prema vlastitom nahođenju Dodatne mogućnosti, potrebno za rad.

Kada su svi parametri postavljeni, ako je potrebno, možete započeti s radom.

TalkBack je standardni uslužni program, koji je obično ugrađen u Android OS. Ova funkcija je razvijen za osobe s problemima vida, slabovidne osobe, zahvaljujući TalkBacku, mogu bez problema koristiti gadgete.

Kada prvi put pokrećete program, možete koristiti upute. Pripovjedač ima vrlo opsežne postavke. Na svim uređajima, uključeno različiti tipovi firmware, postoje male razlike u postavkama usluge.

Glavne značajke TalkBacka su:

  • Promjenjiva razina glasnoće reprodukcije;
  • Mogućnost promjene tona glasa;
  • Glasovni zapis svakog pritiska tipke;
  • Postoji senzor udaljenosti, zahvaljujući kojem se podešava razina zvuka;
  • Uređaj javlja informacije o dolaznim pozivima i SMS-ovima, Caller ID princip;
  • Pretvorite govor u tekst i obrnuto;
  • Kontrola gestama.

Ovo su glavne značajke, ali postoji i veliki izbor sekundarnih.

TalkBack je nezamjenjiva aplikacija za osobe koje su izgubile sposobnost gledanja i korištenja istih uređaja kao osobe koje vide

Za osobe oštećena vida ovo je pravo otkriće. Osobama s punim vidom ova aplikacija neće biti zgodna, može smetati i usporiti proces rada na uređaju.

Osobi koja ne vidi ništa bit će dosta teško sama postaviti program, pa je najbolje potražiti pomoć ljudi oko sebe.

Za gadgete koji rade na Androidu, to je moguće glasovna pomoć u upravljanju. TalkBack izgovara sve ikone na koje možete kliknuti prstom ili jednostavno dok se krećete po zaslonu.

U tome pomaže značajka Istraži dodirom. Jesti detaljne upute, kako točno koristiti ovu funkciju.

Nakon čitanja uputa, korisnici nemaju problema s radom uređaja.

Kako biste odabrali željenu ikonu i aktivirali element, samo kliknite prstom na ikonu i pokrenut će se reprodukcija glasovna uputa. Pomicanje, popraćeno različitim tonovima, također dodaje praktičnost.

Video: Acapela Tts glasovi za Android

Zaključak

Nakon što smo razumjeli rad i funkcionalnost čitača zaslona, ​​možemo izvući sljedeće zaključke:

  1. Spikeri su neizostavan program za osobe s problemima vida i sljepoćom;
  2. Koristeći takve programe, možete izgovoriti bilo koje testne informacije;
  3. Informacije proizvedene glasom mogu se lako pretvoriti u pisani tekst;
  4. Cijena glasovnih zvučnika je niska, postoje čak i besplatni.

Nuance VocalizerEx TTS Milena Rus- ovo je sustav pretvaranja teksta u glas koji možete besplatno preuzeti; to je potpuni sintetizator govora za Android.

Vaš SMS, tekstualne datoteke, knjige i imena pretplatnika koji vas zovu, koristeći ovu aplikaciju Za Android izglasat će lijep i ispravan ženski glas Milene. Aplikacija za vokalizaciju Radi ne samo s telefonima i tabletima koji podržavaju TTS tehnologiju, već i s aplikacijama kao što su:

Kako instalirati sintetizator govora za Android – Nuance VocalizerEx TTS Milena Rus?

  1. Trebali biste premjestiti mapu VocalizerEX u sdcard/ (sdcard0/) u korijen memorijske kartice ili učiniti ovo: cdcard\VocalizerEx , mnt\extSdCard\VocalizerEx (uređaji s interna kartica memorije u vokalizeru, možete ručno odrediti stazu gdje se nalazi mapa VocalizerEx u TTS postavkama). Root za Android nije potreban.
  2. Instalirajte APK - vocalizer_e.tts_1.0.2.3j.apk
  3. Idemo na Postavke na uređaju - Jezik i unos - Sinteza govora (ili slično).
  4. Odaberite VocalizerEx TTS. Nakon aktivacije možete poslušati primjer izgovora (neke telefone ili tablete možda ćete morati ponovno pokrenuti). U postavkama možete promijeniti brzinu govora itd., put do imenika.
  5. Koristimo ga u programima.

Pažnja! Datoteka koju ćete preuzeti je samoraspakirajuća arhiva s nastavkom [*.exe]. Sve što trebate učiniti je odabrati na računalu pod Windows put, gdje želite izdvojiti sadržaj. Ova funkcija značajno štedi prostor na našem poslužitelju i vaš/naš promet. Izvorna veličina: 767 MB (uštedite 107 MB).