Orosz nyelv a pico tts számára. Az Android beszédszintetizátorainak áttekintése. Google Speech Synthesis

13.11.2019 Érdekes

Sziasztok. A mai epizódban a Pico TTS programról lesz szó, amely Android készüléken is megtalálható. Szóval mi ez a program? Mit csinál, mire való? Mindezekkel a kérdésekkel foglalkozni fogok ma, semmi kétség. Megpróbálok mindent egyszerű emberi nyelven leírni =)

Tehát itt vannak az első adatok. A Pico TTS egy beszédszintetizátor típusú alkalmazás, ezzel az alkalmazással szöveget beszélhet. Van azonban egy komoly probléma: a Pico TTS-nek nincs orosz nyelve. Egyébként az alternatív Google Text-to-Speech szintetizátornak orosz van!

Egyébként a TTS a Text To Speech rövidítése, ami viszont úgy fordítható, hogy Text To Speech =)

De miért van szükség beszédszintetizátorra? Lehetővé teszi szövegek felmondását az alkalmazásokban. Például a Google Text-to-Speech szintetizátor képes szöveget olvasni a Google Fordítóban, a TalkBackben vagy egyes beszédszintézist használó alkalmazásokban. Hmm, beszédszintézis? És erősen hangzik!

Elvileg törölheti a Pico TTS alkalmazást úgy, ahogy van, de jobb, ha lefagyasztja. Ezután, ha meg van győződve arról, hogy egyáltalán nincs rá szüksége, és a jövőben sem lesz szüksége rá, akkor később törölheti. Lefagyasztáshoz, törléshez ajánlom az alkalmazást Titanium Backup(vegye figyelembe, hogy ehhez root jogok szükségesek).

Azt is olvastam, hogy a Pico TTS minősége nem túl jó, és az alkalmazást nem fejlesztik, és csak bemutatásra van jelen Androidon.. =(

Ha alapvetően le kell tiltania a szöveget beszédre, akkor menjen a Beállítások > elemre hangbemenetés kimenet > szöveg beszédre > törölje az összes jelölőnégyzet bejelölését =)

Nem tudom, hogy ez igaz-e vagy sem, de egy ember írt egy üzenetet, hogy személyesen nem törölte a Pico TTS-t. Azt mondja, hogy egy telefonról törölte a Pico TTS-t, ami után akármilyen beszédszintetizátort is telepített, egyik sem működött. Ez igaz vagy hülyeség? Nem tudom. De az Android fórumon találtam ezt az üzenetet, és úgy döntöttem, hogy érdemes továbbadni ezt az információt.

Itt találtam egy képet, ez az a beállítás, ahol kiválaszthatod a TTS-t:

Amint látod, van még Samsung TTS is =) Egyébként itt majdnem ugyanaz a kép, de itt van egy SVOX Classic TTS:

Vagyis lehetnek különböző szintetizátorok, de a Pico TTS beépített, míg mások önállóan telepíthetők.

És itt van ez a kép, ezek is beállítások, de láthatóan már a táblagépen, és itt minden majdnem ugyanaz:

A TTS a Nyelv és bevitel részben van kiválasztva =)

Nos, ennyi, srácok, azt hiszem, mindent elmondtam, mi az a Pico TTS, most tudod, nem? Ez azt jelenti, hogy a feladatomat sikeresen teljesítettem. Végül azt szeretném mondani, hogy vigyázzatok magatokra és sok sikert!

Nyelvi motorok és szintetizátorok ( TTS szövegfelolvasó) soha nem volt valami tökéletes az orosz nyelv számára. Az angolokkal ellentétben, amelyek fejlődése állandó és egyenletes volt, a hazai szintetizátorok legjobb képviselője több mint tíz éve a férfi hang volt. Nikolai Acapelából. Az elmúlt években két egészen tisztességes női lehetőséggel versenyzett - Alena (Acapela) és Katerina, később - Katerina II (ScanSoft RealSpeak).

A mindennapi használathoz némi erőfeszítésre volt szükség, és mobil platformokra, elsősorban Androidra, csak a személyi számítógép, ami arra kényszeríti a szöveget, hogy hanggá alakítsa, hogy később lejátszhassa a végeszközön lévő szabványos Mp3-lejátszóval.

Némi reményt a haladásra, ahogy ez gyakran megesik, a jó vállalat, a Google adott, lásd anyagunkat:
. Egészen a közelmúltig a keresőóriás által biztosított maximális képességek a szintetizátorral való online munkára korlátozódtak. Az eredmény, őszintén szólva, nem volt valami forradalmi. Példával Google munka A TTS API-val a következő címen ismerkedhet meg Általános információ a Klubról.

Számos más, kifejezetten okostelefonokhoz szabott megoldás is volt:

  • Pico TTS alapértelmezés szerint - orosz nyelv nélkül
  • IVONA Text-to-Speech - sajnos az orosz támogatást még nem hajtották végre, bár Tatyana hivatalos hangja megjelenik a fejlesztő webhelyén
  • SVOX Classic Text To Speech Engine- az egyetlen működő modell. A szoftver telepítése ingyenes, próbaidőszak az értékeléshez. Végső ár ~ 3 USD
Mint látható, csak a megoldás működik igazán SVOX. A „valóság” ellenére a rendszer rendkívül rosszul működik. Vagyis fő célja az orosz nyelvű olvasás, formailag teljesíti, de rosszul olvas.

Így 2014 május végén A Google Play megjelenik az új, teljesen ingyenes Google Speech Synthesizerjük. Ez a termék könnyen felülmúlja az orosz TTS rendszereket használó korábbi megoldásokat, ráadásul szerény véleményem szerint ez a női hang jobb, mint a személyi számítógépekhez elérhető megoldások.

Az alábbiakban látható egy kis demórészlet, amelyet egy olyan okostelefonról kaptunk, amelyre a Google beszédszintetizátora van telepítve – egy orosz női hang (egyelőre az egyetlen elérhető)

A nevezés a következőn keresztül érkezett szabványos program fb2 FBReaderhez csatlakoztatott olvasó modullal Még ha nem is érzékeli a számítógépes beszédet a könyvek pontozása során, ez a megoldás lehetővé teszi a mobil barát. A Google navigáció elkezdi olvasni az utcaneveket, speciális alkalmazások képes lesz olvasni az SMS-eket és a számokat bejövő hívások közben.

Ezen túlmenően, és ez nagyon hasznos a gyengénlátó vagy vak felhasználók számára, most már teljes mértékben használhatja a TalkBack-et – a Jaws képernyőolvasó analógját, amelyet sokan ismernek a személyi számítógépeken való munka során. Ez a rendszer felismeri az Androidban rejlő lehetőségeket a telefonon zajló összes esemény hangos értesítésére, lehetővé téve az irányítást anélkül, hogy látná a képernyőt.

    A szintetizátorral végzett munka hátrányai
  • A hangoskönyvek szerelmeseinek jelentős hátránya a megnövekedett energiafogyasztás, pár órás szinkronizálás alatt akár a felét is elveszíti az akkumulátor töltöttsége
  • Bosszúság, amelyet csak a telefon hangszóróján keresztül rögzítettek: enyhe elhalványulás - a hangszint csillapítása a mondat elején. Keresztül vezetékes fejhallgató, külső eszközés Bluetooth ez a hatás hiányzik
  • Az egyéni ékezetek és szótárak nem támogatottak

Különös csodákra nem lehet számítani – ez csak egy számítógép, azonban az olvasás közbeni elhidegülés egyesek számára kellemes felüdülésnek tűnhet az egyes előadók munkájában fellépő teátrális túlzottságtól.

A szintetizátor telepítése rendkívül egyszerű.
Menjen a termékoldalra az üzletben. A Google Play a szokásos módon értesíti Önt az eszközével való kompatibilitásról – Android szükséges 4.0.3 és magasabb, akkor megtörténik a letöltés és a telepítés. Ezután le kell töltenie a „hangot”:
Beállítások -> Különleges képességek-> Szövegfelolvasó funkció kimenete -> Google beszédszintetizátor (ne ijedj meg a fenyegető figyelmeztetéstől, a gyártó ezen a programon keresztül nem fog megtudni rólad semmi újat, már mindent biztosan tud) -> letöltés. És a nyugalom érdekében indítsa újra.

    UPD: 2016. október
Android 4.2 (jobb 4.4) és újabb verziók esetén 6 új hangot adtunk az alap női hanghoz – három férfi és három női:

Ha nem az angol az anyanyelve, és nem csak iPhone-ra ír alkalmazásokat, akkor elég nehéz dolga lesz, ha megfelelő eszközöket szeretne találni az ún. mobil „hangalapú” alkalmazások.

Ez az áttekintés besorolást ad, és leírja a mobil TTS motorok közül a legmegfelelőbbet.

Kutatást végzek az interfész tervezés területén mobil eszközök látássérült emberek számára. Az egyik projektem megvalósításához hanggeneráló motorra volt szükségem többnyelvű támogatással (legalább két nyelv - angol és orosz). Ez volt az oka a beszédszintetizátor keresésének.

A kényelem kedvéért a TTS motorokat három osztályba osztjuk:

  • kereskedelmi;
  • ingyenes (a GPL, LGPL és a lágyabb licencek, például a BSD License vagy a wxWindows License alapján licencelt megoldások, amelyek lehetővé teszik a termékek kereskedelmi fejlesztését);
  • beépített (maga az operációs rendszer által biztosított eszközök).

Kereskedelmi motorok

SVOX Mobile TTS

Ár: n/a
Nyelvek: 26, beleértve az oroszt
magas
Mobil operációs rendszer: Android, Symbian, Windows CE/ Windows Mobile SÖRFŐZÉS

Az SVOX cégnek van a legfinomabb műszaki pont terméknézet - SVOX Mobile TTS. Mivel azonban a cég főként a B2B szegmensben működik, a két árat kérő emailemre soha nem válaszoltak.

A fejlécben feltüntetett ár olyan operációs rendszerekre vonatkozik, mint a Windows Mobile és a Symbian, de az Acapela üzleti modellje a választott operációs rendszertől függően változik. Leghatározottabban például az iOS-irányt hirdetik, amelyhez külön weboldalt készítettek. Itt regisztrálhat, és ingyenesen megkaphatja a motorjuk kiértékelő verzióját. Csupasz SDK ár egykori iPhone Az operációs rendszer ára 250 €. Valamint az alkalmazásban eladott minden termékből Alkalmazások tárolása Jelentős kamatot számítanak fel.

Megjegyzem, hogy az Acapela „felhős” beszédszintézist biztosít, valamint az SDK-t bármilyen platformra portolja.

Ingyenes motorok

Flite
Ár: nem
Nyelvek: angol, valamint FestVox nyelvek fordításának lehetősége
Szubjektív hangminőség-értékelés: alacsony
Mobil operációs rendszer: Android, Windows CE/Windows Mobile, iOS, PalmOS
Kereskedelmi termékek fejlesztésének lehetősége: igen (CMU licenc)

Az asztali világban a Festival beszédszintetizátor jól ismert. Flite nevű portja van mobileszközökre és beágyazott rendszerekre, amelyet saját X11-szerű licencük alatt terjesztenek, ami lehetővé teszi a szoftverek szabadon terjesztését bárki számára, valamint az arra épülő kereskedelmi és ingyenes alkalmazások építését is. Vannak portok Windows CE/Windows Mobile, PalmOS, Android és .

A WM motor összeállítására vonatkozó utasításokat a disztribúció tartalmazza, azonban ezen a platformon az eSpeak-nek van egy jelentős korlátja - hanggenerálás csak WAV fájl. A Windows Mobile-hoz összeállított TTS motor beszerezhető.

Az ESpeak portolták Androidra. Úgy próbálhatja ki a legegyszerűbben, ha telepíti az Android Marketről a TTS Service Extended alkalmazást, amellyel válthat a beépített motor és az eSpeak között. Ezt a TTS-motort a GNU GPL feltételei szerint terjesztik.

Beágyazott megoldások

A beépített megoldások csak Symbianban és Androidban vannak. A Microsoft ismeretlen okból megfosztotta mobil operációs rendszerét a megfelelő szoftveres felülettől (MS SAPI).
Symbian

Ár: nem
Nyelvek: angol
A hangminőség szubjektív értékelése: rendkívül alacsony
Kereskedelmi termékek fejlesztésének lehetősége: igen

A Symbian Foundation beépített TTS-je a CMdaAudioPlayerUtility osztályban van elrejtve. Bár nem mond róla semmit, de lehetővé teszi a beszédszintézist. Sajnos az orosz nyelv nem támogatott. Az angol beszédgenerálás minősége nagyon alacsony. Felkészülés nélkül elég nehéz megérteni, mit is mondott pontosan.

További nyelvi csomagok is letölthetők, de a támogatott telefonok listája nagyon korlátozott. Az orosz nyelvű csomagok telepítése egy Symbain OS S60 5th rendszert futtató eszközre nem hozta meg a várt eredményt, a beépített TTS nem beszélt oroszul.

Megjegyzem, van egy meglehetősen kényelmes API-bővítmény, az NSS TTS Utility API, amelynek leírása megtalálható

Képernyőolvasó Androidra vagy okostelefonra látássérült vagy vakok számára

A modern világ folyamatosan fejlődik. Csodálatos diplomás szoftver— képernyőbemondó, aminek köszönhetően a látástól megfosztott ember belecsöppenhet a világba magas technológia. Korábban írtunk, de ebben az áttekintésben az okostelefonos alkalmazásokat fogjuk megvizsgálni.

A beszédszintetizátor szoftver úgy néz ki, mint egy fordítást biztosító alkalmazás szöveges információk hangpostára.

Ezeknek a termékeknek a széles választéka mindig lenyűgözi a felhasználókat, ezért azt javaslom, hogy nézze meg közelebbről a legnépszerűbbeket.

Alkalmazások besorolása

Nagyszámú beszédszintetizátort fejlesztettek már ki és adtak ki, segítségükkel nemcsak vizuálisan érzékelhető. hasznos információ, hanem hallani is.

Ezek a programok két típusra oszthatók: fizetős és ingyenes.

Azok a programok, amelyek „labdaalapúak”, szűkebb képességarzenállal rendelkeznek, de használhatók is, a fizetős verziókkal szórakoztatóbb a dolog, hatalmasságuk nem ismer határokat.

Orosz nyelvű beszédszintetizátorok

Az olyan operációs rendszerek esetében, mint az Android, számos lehetőség kínálkozik a beszédszintetizátorokhoz, de a legtöbbnek nincs orosz nyelvű verziója.

Nézzünk meg néhányat a legnépszerűbb képernyőolvasók közül:

Ez a program Androidra lett kifejlesztve. Magas a beszédszintézis aránya, többnyelvű, 25 különböző nyelvek, köztük oroszosított.

A fejlesztők az Acapela Group S.A.. hozzávetőleges költség 4 euró.

Többnyelvű beszédszintetizátor, amely nem kereskedelmi. Információfeldolgozás 37 nyelven, a hangszínészkedés jó, sok a hangbeállítás.

Többen működik operációs rendszer Linux, Mac OS, Microsoft Windowsés RISC OS. A helyes hangvisszaadás érdekében egy bővített szótárt fejlesztettek ki.

A program a nonprofit tevékenységek miatt valamivel rosszabbul teljesít, mint fizetett pályázatok, de a fejlesztők a teljesítmény javítását tervezik.

A TTS beállítása

Kezdetben el kell döntenie, hogy melyik beszédszintetizátor a legalkalmasabb. Töltse le és telepítse az alkalmazást, majd lépjen a TTS-beállításokhoz. Nézzük meg a lépésről lépésre szóló utasításokat:

  1. Az indítással kell kezdenie;
  2. Ezután el kell lépnie az alkalmazás beállításaihoz;
  3. Válassza ki és telepítse a kívánt nyelvet;
  4. Döntse el a beszédszintézist;
  5. Ki kell választania egy motort, leggyakrabban „automatikusan”;
  6. Állítsa be az Önnek megfelelő beszédsebességet;
  7. Testreszabása saját belátása szerint Extra lehetőségek, munkához szükséges.

Ha minden paraméter be van állítva, szükség esetén megkezdheti a működést.

A TalkBack az szabványos segédprogram, amely általában az Android operációs rendszerbe van beépítve. Ez a funkció látásproblémákkal küzdők számára lett kifejlesztve, a látássérültek a TalkBacknek köszönhetően probléma nélkül használhatják a kütyüket.

A program első indításakor használhatja az utasításokat. A Narrátor nagyon kiterjedt beállításokkal rendelkezik. Minden eszközön bekapcsolva különböző típusok firmware, kis eltérések vannak a szolgáltatás beállításaiban.

A TalkBack főbb funkciói a következők:

  • Változtatható lejátszási hangerőszint;
  • A hangszín megváltoztatásának képessége;
  • Hangfelvétel minden billentyűleütésről;
  • Van egy távolságérzékelő, amelynek köszönhetően a hangszint beállítható;
  • A készülék információkat közöl a bejövő hívásokról és SMS-ekről, hívóazonosító elve;
  • A beszédet szöveggé alakíthatja és fordítva;
  • Gesztusvezérlés.

Ezek a fő jellemzők, de sokféle másodlagos is létezik.

A TalkBack egy nélkülözhetetlen alkalmazás azok számára, akik elveszítették a képességüket, hogy ugyanazokat az eszközöket lássák és használják, mint a látó emberek.

A látássérültek számára ez egy igazi lelet. A teljes látású emberek számára ez az alkalmazás nem lesz kényelmes, bosszantó lehet, és lelassíthatja az eszközön végzett munkát.

Annak, aki semmit nem lát, meglehetősen nehéz lesz önállóan beállítani a programot, ezért a legjobb, ha segítséget kér a körülötte lévő emberektől.

Az Androidon futó kütyük esetében ez lehetséges hangos segítségnyújtás a menedzsmentben. A TalkBack kimondja az összes ikont, amelyre rákattinthat az ujjával, vagy egyszerűen a képernyőn való mozgás közben.

Az Explore by Touch funkció ebben segít. Eszik részletes utasításokat, hogyan kell pontosan használni ezt a funkciót.

Az utasítások elolvasása után a felhasználóknak nincs problémája az eszköz működtetésével.

A kívánt ikon kiválasztásához és az elem aktiválásához csak kattintson az ikonra az ujjával, és megtörténik a lejátszás hangutasítás. A különböző hangszínekkel kísért görgetés szintén növeli a kényelmet.

Videó: Acapela Tts Voices Androidra

Következtetés

A képernyőolvasók működésének és funkcióinak megértése után a következő következtetéseket vonhatjuk le:

  1. A bemondók azok nélkülözhetetlen program látásproblémákkal és vaksággal küzdők számára;
  2. Az ilyen programok használatával bármilyen tesztinformációt hangozhat;
  3. A hang által előállított információ könnyen írott szöveggé alakítható;
  4. A hangszórók ára alacsony, még ingyenesek is vannak.

Nuance VocalizerEx TTS Milena Rus- ez egy ingyenesen letölthető szöveg-hangrendszer; ez egy teljes értékű beszédszintetizátor Androidra.

Az SMS-ed, szöveges fájlok, könyvek és az Önt hívó előfizetők nevei, segítségével ez az alkalmazás Mert Android Milena gyönyörű és korrekt női hangja fogja megszólaltatni. Vocalizer alkalmazás Nem csak a TTS technológiát támogató telefonokkal és táblagépekkel működik, hanem olyan alkalmazásokkal is, mint például:

Hogyan telepítsünk beszédszintetizátort Androidra – Nuance VocalizerEx TTS Milena Rus?

  1. Helyezze át a VocalizerEX mappát az sdcard/ (sdcard0/) mappába a memóriakártya gyökerébe, vagy tegye ezt: cdcard\VocalizerEx , mnt\extSdCard\VocalizerEx (eszközök belső kártya memória a vocalizerben, manuálisan megadhatja a VocalizerEx mappa elérési útját a TTS beállításaiban). Root for Android nem szükséges.
  2. Az APK telepítése – vocalizer_e.tts_1.0.2.3j.apk
  3. Menjünk a Beállítások - Nyelv és bevitel - Beszédszintézis (vagy hasonló) menüpontra.
  4. Válassza a VocalizerEx TTS lehetőséget. Az aktiválás után meghallgathat egy kiejtési példát (egyes telefonokat vagy táblagépeket újra kell indítani). A beállításokban módosíthatja a beszéd sebességét stb., a könyvtár elérési útját.
  5. Programokban használjuk.

Figyelem! A letöltendő fájl egy önkicsomagoló archívum [*.exe] kiterjesztéssel. Mindössze annyit kell tennie, hogy kiválasztja a PC-n az alatt Windows elérési út, ahol ki szeretné bontani a tartalmat. Ez a funkció jelentősen megtakarít helyet a szerverünkön és az Ön forgalmán. Eredeti méret: 767 MB (107 MB megtakarítás).