Paul scrie:Sorin scrie:Ogg, nu ca poate unii oameni folosesc inca Winamp 3, dar mp3 da.
Si ca sa raspund la prima intrebare, criteriile mele pentru clasarea TTS-urile sunt: cursivitatea, claritatea, expresivitatea(respectarea ¡CORECTA! a semnelor de punctuatie), apoi strict legat de limba intervin pronuntarea corecta a cifrelor si diacriticele. Si, crede-ma, ca per total, Carmen o depaseste pe Ancutza. Nu ca as avea ceva cu voi. Doamne fereste. E pur si simplu o constatare 100% obiectiva.
Ai uitat unul dintre cele mai importante criterii: comprehensibilitatea, inclusiv la viteze mari. Aceasta inseamna ca TTS-ul trebuie sa ramana usor de inteles, inclusiv la viteze mari. La acest capitol Ancutza este cel mai bine cotata.
Un alt criteriu important este ergonomia. Atunci cand ai mult de citit, vocea utilizata nu trebuie sa fie obositare. O voce este obositoare daca are prea multe inflexiuni, daca este afectata. O voce utilizata de catre nevazatori trebuie sa fie impersonala, pentru ca in spatele ei se afla autorul care a scris romanul sau e-mailul. Nu intotdeauna o voce feminina afectata este potrivita; de fapt chiar foarte rar.
Vorbesti despre pronuntarea corecta a cifrelor. Incearca propozitia "am 3-4 ani" cu Ancutza si cu Carmen. Incearca "12.3"; Carmen nu numai ca isi permite sa citeasca virgula in loc de punct, dar nici nu pronunta corect cuvantul virgula. Oricum un TTS trebuie sa citeasca ce scrie, nu ce se presupune ca ar trebui scris.
Ai mentionat pronuntarea diacriticelor. Carmen are probleme serioase, pe cand Ancutza pronunta corect.
Interpretarea corecta a semnelor de punctuatie ? in limba romana, la virgula cititorul ridica tonul. Carmen ridica tonul numai la anumite silabe.
Desigur, Carmen este un TTS dezvoltat in Polonia, de catre polonezi, asa ca nu are cum sa accentueze corect cuvintele din limba romana. Asculta cu Carmen cuvantul "culoare" si apoi cu Ancutza. In timp ce Carmen accentueaza in mod gresit prima vocala, Ancutza pune accentul corect, ca si in limba romana. Exista sute de reguli de accentuare in limba romana, care toate trebuie respectate.
Un alt criteriu esential pentru orice TTS in limba romana este respectarea foneticii limbii romane. Doua vocale alaturate se pot citi ca si diftong sau ca si hiat. Te rog asculta cu Carmen cuvantul "macaroanele". Ridicol, nu-i asa ?
Apoi, un TTS trebuie sa cunoasca abrevierile curente in limba pentru care a fost conceput. Te rog asculta cu Carmen cuvantele CFR, sau PCR, sau UDMR, sau html.
Un TTS trebuie sa recunoasca datele calendaristice; citeste cu Carmen 23.08.44 si razi!
Un TTS trebuie sa recunoasca ora; citeste cu Carmen 12:03:15
Asadar, sa reluam criteriile pe care le-ai enumerat:
- cursivitate: ambele voci sunt cursive, nici una nu vorbeste cu hopuri, desi Carmen se poticneste la anumite combinatii de vocale sau abrevieri.
- claritate: claritatea reprezinta pronuntarea limpede a sunetelor; din acest punct de vedere Carmen este ceva mai buna decat Ancutza, dar din pacate accentuarea gresita si pronuntarea incorecta a vocalelor diminueaza claritatea.
- expresivitatea: Carmen a fost optimizata sa fie expresiva. Acest lucru poate insa sa devina obositor la citirea textelor lungi. Ancutza a fost optimizata sa fie comprehensibila la viteze de redare mari; din acest motiv este mai putin expresiva.
- pronuntarea corecta a cifrelor: nesatisfacator pentru Carmen. Nu citeste corect zecimalele, nu citeste corect datele calendaristice, nu citeste corect orele, nu citeste corect intervalele numerice. Ancutza citeste corect toate numerele, datele, orele, expresii matematice.
- diacriticele: Carmen citeste incorect diacriticele in majoritatea situatiilor. Ancutza citeste corect toate diacriticele.
- comprehensibilitate (claritate) la viteza ridicata: Carmen este foarte greu de inteles la viteze ridicate. Ancutza a fost optimizata pentru citirea cu viteza ridicata, specifica lecturilor si navigarii pe internet.
- accentul corect in limba romana: Carmen accentueaza aleator. Ancutza respecta regulile de accentuare in limba romana.
- citirea corecta a diftongilor si triftongilor: Carmen nu cunoaste regulile de citire ale acestora (de altfel cei de la IVO ne-au cautat si ne-au rugat sa le vindem aceste reguli, pentru ca in limba romana nu au de unde sa le obtina). Ancutza respecta cele cateva sute de reguli de citire (de exemplu litera x se pronunta uneori c si s alteori g si s).
- un TTS scris pentru o anumita limba trebuie sa cunoasca un minim de cuvinte care se citesc in mod diferit: abrevieri, cuvinte din engleza etc. (cititi cuvantul windows sau chiar etc cu Carmen)
Apoi ar mai fi un criteriu. Cunosti cu siguranta WinTalker. Este o voce romaneasca realizata in Cehia, care a ramas in acelasi stadiu ca si cel in care a fost realizata. Spre deosebire, Ancutza este realizata de catre romani pentru romani; aceasta voce se dezvolta continuu si noi corectem rapid toate erorile pe care le aflam de la testerii nostrii. Noi urmeaza sa adaugam continuu noi facilitati, cum ar fi recunoastrea automata a diacriticelor atunci cand acestea lipsesc, recunoastrea cifrelor romane, recunoastrea de noi cuvinte care nu respecta regulile de citire in limba romana si multe altele. Ma indoiesc ca cei de la IVO scot in fiecare luna cate o noua versiune; noi asa facem.
Asadar, draga Sorin, ti-am demonstrat cu multe exemple ca in afara unei voci clare (atunci cand citeste cuvinte simple) Carmen nu are nici un avantaj asupra vocii Ancutza, dimpotriva esueaza lamentabil atat in situatii simple, cat si in situatii unde numai un roman cunoaste pronuntia corecta. In concluzie si obiectiv, Ancutza este mult mai buna.