Limba rusă pentru pico tts. Revizuirea sintetizatoarelor de vorbire pentru Android. Sinteza vorbirii Google

13.11.2019 Interesant

Salutare tuturor. În episodul de astăzi vom vorbi despre programul Pico TTS, care poate fi găsit pe un dispozitiv Android. Deci, ce este acest program? Ce face ea, pentru ce este? Toate aceste probleme vor fi luate în considerare astăzi de mine, nu mă îndoiesc. Voi încerca să scriu totul într-un limbaj uman simplu =)

Deci iată primele date. Pico TTS este o aplicație de tip sintetizator de vorbire, cu această aplicație puteți rosti text. Cu toate acestea, există o problemă puternică: Pico TTS nu are limba rusă. Apropo, sintetizatorul alternativ Google Text-to-Speech are limba rusă!

Apropo, TTS înseamnă Text To Speech, care la rândul său se traduce prin Text To Speech =)

Dar de ce ai nevoie oricum de un sintetizator de vorbire? Vă permite să vorbiți text în aplicații. De exemplu, sintetizatorul Google Text-to-Speech poate citi text în Google Translator, TalkBack sau în unele aplicații care folosesc sinteza vorbirii. Hmm, sinteza vorbirii? Și sună puternic!

În principiu, puteți șterge aplicația Pico TTS așa cum este, dar este mai bine să o înghețați. Apoi, dacă sunteți convins că nu aveți absolut nevoie de el și că nu veți avea nevoie de el în viitor, atunci îl puteți șterge mai târziu. Pentru înghețare și ștergere recomand aplicația Backup din titan(rețineți că acest lucru necesită drepturi root).

Am mai citit ca calitatea Pico TTS nu este foarte buna, si ca aplicatia nu este dezvoltata si este prezenta pe Android doar pentru show.. =(

Dacă practic trebuie să dezactivați textul în vorbire, atunci trebuie să mergeți la Setări > intrare vocalăși scoateți > text în vorbire > debifați toate casetele de acolo =)

Nu știu dacă acest lucru este adevărat sau nu, dar o persoană a scris un mesaj că nu a șters personal Pico TTS. Spune că a șters Pico TTS de pe un telefon, după care, indiferent ce sintetizator de vorbire a instalat, nimic nu a funcționat. Este adevărat sau aiurea? Nu stiu. Dar am găsit acest mesaj pe forumul Android și am decis că merită să vă transmit aceste informații.

Aici am găsit o poză, aceasta este setarea în care poți selecta TTS:

După cum puteți vedea, există chiar și un Samsung TTS =) Apropo, aici este aproape aceeași imagine, dar aici există un SVOX Classic TTS:

Adică, pot exista diferite sintetizatoare, dar Pico TTS vine ca unul încorporat, în timp ce altele pot fi instalate independent.

Și iată această imagine, acestea sunt și setări, dar se pare că deja pe tabletă, și aici totul este aproape la fel:

TTS este selectat în secțiunea Limbă și introducere =)

Ei bine, asta-i tot băieți, cred că am spus totul, ce este Pico TTS acum știi, nu? Aceasta înseamnă că sarcina mea a fost finalizată cu succes. În fine, aș zice să ai grijă de tine și mult succes!

Motoare de limbaj și sintetizatoare ( TTS text-to-speech) nu au fost niciodată ceva perfect pentru limba rusă. Spre deosebire de cele engleze, a căror dezvoltare a fost constantă și constantă, cel mai bun reprezentant al sintetizatoarelor domestice de mai bine de zece ani a fost vocea masculină. Nikolay din Acapela. În ultimii ani, a concurat cu două opțiuni feminine destul de decente - Alena (Acapela) și Katerina, mai târziu - Katerina II (ScanSoft RealSpeak).

Pentru utilizarea de zi cu zi, a fost necesar un efort, iar pentru platformele mobile, în principal Android, acestea erau potrivite numai împreună cu calculator personal, forțând ca textul să fie convertit în sunet, astfel încât să poată fi redat ulterior cu un player Mp3 standard pe dispozitivul final.

Câteva speranțe de progres, așa cum se întâmplă adesea, au fost date de buna corporație Google, vezi materialul nostru:
. Până de curând, capacitățile maxime oferite de gigantul căutării erau limitate la lucrul online cu sintetizatorul lor. Rezultatul, sincer vorbind, nu a fost ceva revoluționar. Cu exemplu Lucru pe Google Vă puteți familiariza cu API-ul TTS la Informații generale despre Club.

Au existat câteva alte soluții adaptate special pentru utilizarea cu smartphone-uri:

  • Pico TTS furnizat implicit - fără limba rusă
  • IVONA Text-to-Speech - din păcate, suportul pentru limba rusă nu a fost încă implementat, deși vocea oficială a lui Tatyana este prezentată pe site-ul dezvoltatorului
  • SVOX Classic Text to Speech Engine- singurul model de lucru. Instalarea software-ului este gratuită, perioadă de probă pentru evaluare. Prețul final ~ 3USD
După cum puteți vedea, doar soluția funcționează cu adevărat SVOX. În ciuda tuturor „realității”, sistemul funcționează extrem de prost. Adică, scopul său principal este să citească în rusă, formal îl îndeplinește, dar citește prost.

Și așa, la sfârșitul lunii mai 2014, Google Play Apare noul lor Google Speech Synthesizer complet gratuit. Acest produs eclipsează cu ușurință soluțiile anterioare folosind sistemele rusești TTS, în plus, în opinia mea umilă, această voce feminină este mai bună decât soluțiile disponibile pentru computerele personale.

Mai jos este un mic fragment demo primit de la un smartphone cu sintetizatorul de vorbire Google instalat - o voce feminină rusă (deocamdată singura disponibilă)

Intrare primită prin program standard pentru fb2 FBReader cu modul cititor conectat Chiar dacă nu percepeți vorbirea computerului în contextul notării cărților, această soluție vă va permite să vă actualizați prieten mobil. Navigarea Google va începe să citească numele străzilor pentru dvs., aplicatii speciale va putea citi textul SMS și numerele în timpul apelurilor primite.

În plus, și acest lucru este foarte util pentru utilizatorii cu deficiențe de vedere sau nevăzători, acum puteți utiliza pe deplin TalkBack - un analog al cititorului de ecran Jaws, familiar pentru mulți de la lucrul la computerele personale. Acest sistem realizează potențialul Android pentru notificarea vocală a tuturor evenimentelor de pe telefon, permițându-vă să îl controlați fără a vedea ecranul.

    Dezavantajele lucrului cu un sintetizator
  • Un dezavantaj semnificativ pentru un iubitor de cărți audio este consumul de energie crescut; în câteva ore de dublare, veți pierde până la jumătate din încărcarea bateriei.
  • O supărare înregistrată doar la redarea prin difuzorul telefonului: ușoară fade in - atenuare a nivelului sunetului la începutul unei propoziții. Prin căști cu fir, dispozitiv externși bluetooth acest efect lipsește
  • Nu există suport pentru accente personalizate și dicționare

Nu vă puteți aștepta la miracole deosebite - este doar un computer, totuși, o oarecare răceală în timpul lecturii poate părea unora un răgaz plăcut din excesul de teatralitate în munca interpreților individuali.

Instalarea sintetizatorului este extrem de simplă.
Accesați pagina produsului din magazin. Google Play vă va anunța ca de obicei despre compatibilitatea cu dispozitivul dvs. - este necesar Android 4.0.3 și mai mare, apoi va avea loc descărcarea și instalarea. Apoi trebuie să descărcați „vocea”:
Setări -> Abilitati speciale-> Ieșirea funcției text-to-speech -> Sintetizator de vorbire Google (nu vă alarmați de avertismentul amenințător, producătorul nu va afla nimic nou despre dvs. prin acest program, știe deja totul cu siguranță) -> descărcați. Și pentru liniște sufletească, reporniți.

    UPD: octombrie 2016
Pentru Android 4.2 (mai bine 4.4) și o versiune ulterioară, 6 noi au fost adăugate la vocea feminină de bază - trei bărbați și trei femei:

Dacă limba ta maternă nu este engleza și nu scrii aplicații doar pentru iPhone, atunci vei avea o perioadă destul de dificilă dacă vrei să găsești instrumente potrivite pentru dezvoltarea așa-zisului. aplicații mobile „activate pentru voce”.

Această recenzie oferă o clasificare și descrie cele mai demne dintre motoarele mobile TTS.

Fac cercetări în domeniul designului de interfețe dispozitive mobile pentru persoanele cu deficiențe de vedere. Pentru a implementa unul dintre proiectele mele, aveam nevoie de un motor de generare a vocii cu suport în mai multe limbi (cel puțin două limbi - engleză și rusă). Acesta a fost motivul căutării unui sintetizator de vorbire.

Pentru comoditate, împărțim motoarele TTS în trei clase:

  • comercial;
  • gratuit (soluții licențiate sub GPL, LGPL și licențe mai soft, cum ar fi Licența BSD sau Licența wxWindows, care permit dezvoltarea comercială a produselor);
  • încorporat (instrumente furnizate de sistemul de operare însuși).

Motoare comerciale

SVOX Mobile TTS

Preț: n/a
Limbi: 26, inclusiv rusă
înalt
Sistem de operare mobil: Android, Symbian, Windows CE/ Windows Mobile BREW

Compania SVOX are cele mai „delicioase” punct tehnic vizualizare produs - SVOX Mobile TTS. Cu toate acestea, deoarece compania operează în principal pe segmentul B2B, nu mi-au răspuns niciodată la cele două e-mail-uri ale mele prin care mi-au cerut un preț.

Prețul afișat în antet se aplică sistemelor de operare precum Windows Mobile și Symbian, dar modelul de afaceri Acapela variază în funcție de sistemul de operare ales. De exemplu, ei promovează cel mai puternic direcția iOS, pentru care a fost creat un site web separat. Acolo vă puteți înregistra și obține gratuit o versiune de evaluare a motorului lor. Preț SDK pentru fostul iPhone OS este 250€. De asemenea, din fiecare articol pe care îl vindeți în aplicație Stocați aplicațiile Se percepe dobândă considerabilă.

Remarc că Acapela oferă sinteză de vorbire „în nor”, ​​precum și portarea SDK-ului pe orice platformă.

Motoare gratuite

Flite
Pret: nu
Limbi: engleză plus capacitatea de a compila limbi FestVox
Evaluarea subiectivă a calității sunetului: scăzută
Sistem de operare mobil: Android, Windows CE/Windows Mobile, iOS, PalmOS
Posibilitatea dezvoltarii produselor comerciale: da (licenta CMU)

În lumea desktop-ului, sintetizatorul de vorbire Festival este bine cunoscut. Are un port numit Flite pentru dispozitive mobile și sisteme încorporate, care este distribuit sub propria licență asemănătoare X11, care permite ca software-ul să fie distribuit în mod liber oricui, precum și să construiască atât aplicații comerciale, cât și gratuite pe baza acestuia. Există porturi pentru Windows CE/Windows Mobile, PalmOS, Android și .

Instrucțiunile pentru compilarea motorului pentru WM sunt incluse în distribuție, cu toate acestea, pe această platformă eSpeak are o limitare semnificativă - generarea vocii este posibilă numai în Fișier WAV. Motorul TTS asamblat pentru Windows Mobile poate fi obținut.

ESpeak a fost portat pe Android. Cel mai simplu mod de a o încerca este să instalați aplicația TTS Service Extended de pe Android Market, care vă permite să comutați între motorul încorporat și eSpeak. Acest motor TTS este distribuit în conformitate cu termenii GNU GPL.

Soluții încorporate

Soluțiile încorporate sunt prezente numai în Symbian și Android. Dintr-un motiv necunoscut, Microsoft și-a privat sistemul de operare mobil de interfața software corespunzătoare (MS SAPI).
Symbian

Pret: nu
Limbi: engleza
Evaluarea subiectivă a calității sunetului: extrem de scăzută
Posibilitate de dezvoltare a produselor comerciale: da

TTS-ul încorporat al Fundației Symbian este ascuns în clasa CMdaAudioPlayerUtility. Deși nu spune nimic despre asta, permite sinteza vorbirii. Din păcate, limba rusă nu este acceptată. Calitatea generării vorbirii în limba engleză este foarte scăzută. Fără pregătire este destul de greu de înțeles ce a spus exact.

Pachete de limbi suplimentare pot fi descărcate, dar lista de telefoane acceptate este foarte limitată. Instalarea pachetelor pentru limba rusă pe un dispozitiv care rulează Symbain OS S60 5th nu a dat rezultatele așteptate; TTS-ul încorporat nu vorbea rusă.

Observ că există o extensie API destul de convenabilă numită NSS TTS Utility API, a cărei descriere poate fi găsită

Cititor de ecran pentru Android sau smartphone pentru o persoană cu deficiențe de vedere sau nevăzătoare

Lumea modernă este în continuă progres. Absolvent minunat software— un crainic pe ecran, datorită căruia o persoană lipsită de vedere poate plonja în lume tehnologie avansata. Am scris mai devreme, dar în această recenzie ne vom uita la aplicațiile pentru smartphone.

Software-ul sintetizator de vorbire arată ca o aplicație care oferă traducere informații text la mesageria vocală.

Varietatea largă a acestor produse nu încetează să uimească utilizatorii, așa că vă sugerez să aruncați o privire mai atentă la cele mai populare.

Clasificarea aplicațiilor

Un număr mare de sintetizatoare de vorbire au fost deja dezvoltate și lansate, cu ajutorul lor este o plăcere nu numai să percepi vizual Informatii utile, dar și să audă.

Aceste programe sunt împărțite în două tipuri: plătite și gratuite.

Acele programe care sunt „bazate pe minge” au un arsenal mai mic de capabilități, dar pot fi și folosite; cu versiunile plătite, lucrurile sunt mai distractive, vastitatea lor nu cunoaște limite.

Sintetizatoare de vorbire în limba rusă

Pentru sistemele de operare precum Android, există multe opțiuni pentru sintetizatoarele de vorbire, dar cele mai multe dintre ele nu au versiuni în limba rusă.

Să ne uităm la câteva dintre cele mai populare cititoare de ecran:

Acest program este dezvoltat pentru Android. Are rate mari de sinteză a vorbirii, multilingv, are 25 limbi diferite, inclusiv rusificat.

Dezvoltatorii sunt Acapela Group S.A.. costul aproximativ este de 4 euro.

Un sintetizator de vorbire multilingv care nu este comercial. Procesarea informațiilor în 37 de limbi, interpretarea vocală este bună, există multe opțiuni de voce.

Funcționează la mai multe sisteme de operare Linux, Mac OS, Microsoft Windowsși RISC OS. Pentru reproducerea corectă a vocii, a fost dezvoltat un dicționar extins.

Datorită activităților non-profit, programul are rezultate puțin mai slabe decât aplicatii platite, dar dezvoltatorii au planuri de îmbunătățire a performanței.

Configurarea TTS

Inițial, trebuie să decideți care sintetizator de vorbire este cel mai potrivit. Descărcați și instalați aplicația, apoi accesați setările TTS. Să ne uităm la instrucțiunile pas cu pas:

  1. Trebuie să începeți cu lansarea;
  2. Apoi trebuie să mergeți la setările aplicației;
  3. Selectați și instalați limba necesară;
  4. Decideți asupra sintezei vorbirii;
  5. Ar trebui să selectați un motor, cel mai adesea „automat”;
  6. Setați viteza de vorbire care vi se potrivește;
  7. Personalizați la discreția dvs Opțiuni suplimentare, necesar pentru muncă.

Când toți parametrii sunt setați, dacă este necesar, puteți începe operarea.

TalkBack este utilitate standard, care este de obicei integrat în sistemul de operare Android. Această funcție a fost dezvoltat pentru persoanele cu probleme de vedere, persoanele cu deficiențe de vedere, datorită TalkBack, pot folosi gadget-uri fără probleme.

Când porniți programul pentru prima dată, puteți utiliza instrucțiunile. Naratorul are setări foarte extinse. Pe toate dispozitivele, pornit tipuri diferite firmware, există mici diferențe în setările serviciului.

Principalele caracteristici ale TalkBack sunt:

  • Nivel variabil al volumului de redare;
  • Abilitatea de a schimba tonul vocii;
  • Voce off pentru fiecare apăsare a tastei;
  • Există un senzor de distanță, datorită căruia este reglat nivelul sunetului;
  • Dispozitivul raportează informații despre apelurile și SMS-urile primite, principiul Caller ID;
  • Convertiți vorbirea în text și invers;
  • Controlul gesturilor.

Acestea sunt caracteristicile principale, dar există și o mare varietate de caracteristici secundare.

TalkBack este o aplicație indispensabilă pentru persoanele care și-au pierdut capacitatea de a vedea și de a folosi aceleași dispozitive ca și persoanele văzătoare

Pentru cei cu deficiențe de vedere, aceasta este o adevărată descoperire. Pentru persoanele cu vedere completă, această aplicație nu va fi convenabilă; poate fi enervantă și poate încetini procesul de lucru pe dispozitiv.

Va fi destul de dificil pentru o persoană care nu poate vedea nimic să configureze singur programul, așa că cel mai bine este să ceri ajutor de la oamenii din jurul tău.

Pentru gadgeturile care rulează pe Android, este posibil asistenta vocalaîn management. TalkBack rostește toate pictogramele pe care puteți face clic cu degetul sau pur și simplu în timp ce vă deplasați pe ecran.

Funcția Explorare prin atingere vă ajută în acest sens. Mânca instrucțiuni detaliate, cum să utilizați exact această funcție.

După citirea instrucțiunilor, utilizatorii nu au probleme la operarea dispozitivului.

Pentru a selecta pictograma dorită și a activa elementul, trebuie doar să faceți clic pe pictogramă cu degetul și va avea loc redarea prompt vocal. Derularea, însoțită de diferite tonuri, adaugă, de asemenea, confort.

Video: Acapela Tts Voices pentru Android

Concluzie

După ce am înțeles activitatea și funcționalitatea cititoarelor de ecran, putem trage următoarele concluzii:

  1. Cranicii sunt program indispensabil pentru persoanele cu probleme de vedere și orbire;
  2. Folosind astfel de programe, puteți exprima orice informație de testare;
  3. Informațiile produse prin voce pot fi ușor convertite în text scris;
  4. Costul difuzoarelor de voce este mic, există chiar și gratuit.

Nuance VocalizerEx TTS Milena Rus- acesta este un sistem text-voice pe care îl puteți descărca gratuit; este un sintetizator de vorbire cu drepturi depline pentru Android.

SMS-ul dvs., fișiere text, cărți și numele abonaților care vă sună, folosind aceasta aplicație Pentru Android va fi exprimată de frumoasa și corectă voce feminină a Milenei. Aplicația Vocalizer Funcționează nu numai cu telefoane și tablete care acceptă tehnologia TTS, ci și cu aplicații precum:

Cum se instalează un sintetizator de vorbire pentru Android – Nuance VocalizerEx TTS Milena Rus?

  1. Ar trebui să mutați folderul VocalizerEX în sdcard/ (sdcard0/) la rădăcina cardului de memorie sau să faceți acest lucru: cdcard\VocalizerEx , mnt\extSdCard\VocalizerEx (dispozitive cu card intern memorie în vocalizer, puteți specifica manual calea în care se află folderul VocalizerEx în setările TTS). Root pentru Android nu este necesar.
  2. Instalați APK - vocalizer_e.tts_1.0.2.3j.apk
  3. Să mergem la Setări pe dispozitiv - Limbă și introducere - Sinteză vorbire (sau similar).
  4. Selectați VocalizerEx TTS. După activare, puteți asculta un exemplu de pronunție (este posibil să fie nevoie ca unele telefoane sau tablete să fie repornite). În setări puteți modifica viteza de vorbire etc., calea către director.
  5. Îl folosim în programe.

Atenţie! Fișierul pe care îl veți descărca este o arhivă autoextractabilă cu extensia [*.exe]. Tot ce trebuie să faceți este să selectați pe computerul dvs. de sub Calea Windows, de unde doriți să extrageți conținutul. Această funcție economisește în mod semnificativ spațiu pe serverul nostru și traficul dvs./nostru. Dimensiunea originală: 767 MB (economisiți 107 MB).