Citanje clanaka

classic Classic list List threaded Threaded
14 messages Options
Reply | Threaded
Open this post in threaded view
|

Citanje clanaka

Драган Сатарић
Ako se neko seća ja sam pomenuo profesora Vladu Delića i njegov program za sintezu govora.
Obećao mi je da će sintetizovati govor za neki od tekstova samo ako mu dostavim neki tekst.
Obzirom da je tekst neophodno pročistiti od viki tagova, pregledati interpunkciju, prepisati brojeve itd to je oduzimalo suviše vremena.
U svakom slučaju ko se ne seća ranijeg primera neka pogleda članak Almogaveri.

Dakle, uglavnom se mom nedostatku vremena može zahvaliti što nemamo još neke članke pročitane na srpskom jeziku.
U svakom slučaju, profesor nije bio lenj pa mi je poslao neke linkove za testove koje su oni interno pravili u firmi.
http://alfanum.ftn.uns.ac.rs/demo/mp3/

Ja sam proverio, i video da je deo teksta uzet iz našeg članka.
Ovo samo znači da ćemo uskoro imati neki duži članak iščitan.
Moram priznati da je ovaj glas mnogo manje monotom od onoga u Almogaverima.
Ipak je prošlo 3 godine a oni su značajno napredovali.

Ukoliko nekog zanima, može da predloži koji članak da ide na mašinsko čitanje.

d

_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Sasa Stefanovic
E pa ovo je odlično. Skoro da se ne primeti da je mašinski rađeno. Mislim, naspram http://translate.google.com/ i njihovog izgovora ... ovo je za medalju.


2010/7/22 Драган Сатарић <[hidden email]>
Ako se neko seća ja sam pomenuo profesora Vladu Delića i njegov program za sintezu govora.
Obećao mi je da će sintetizovati govor za neki od tekstova samo ako mu dostavim neki tekst.
Obzirom da je tekst neophodno pročistiti od viki tagova, pregledati interpunkciju, prepisati brojeve itd to je oduzimalo suviše vremena.
U svakom slučaju ko se ne seća ranijeg primera neka pogleda članak Almogaveri.

Dakle, uglavnom se mom nedostatku vremena može zahvaliti što nemamo još neke članke pročitane na srpskom jeziku.
U svakom slučaju, profesor nije bio lenj pa mi je poslao neke linkove za testove koje su oni interno pravili u firmi.
http://alfanum.ftn.uns.ac.rs/demo/mp3/

Ja sam proverio, i video da je deo teksta uzet iz našeg članka.
Ovo samo znači da ćemo uskoro imati neki duži članak iščitan.
Moram priznati da je ovaj glas mnogo manje monotom od onoga u Almogaverima.
Ipak je prošlo 3 godine a oni su značajno napredovali.

Ukoliko nekog zanima, može da predloži koji članak da ide na mašinsko čitanje.

d

_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l



_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Bojan Kalkan
Саша Стефановић wrote:

> E pa ovo je odlično. Skoro da se ne primeti da je mašinski rađeno.
> Mislim, naspram http://translate.google.com/ 
> <http://translate.google.com/#> i njihovog izgovora ... ovo je za
> medalju.
>
>
> 2010/7/22 Драган Сатарић <[hidden email]
> <mailto:[hidden email]>>
>
>     Ako se neko seća ja sam pomenuo profesora Vladu Delića i njegov
>     program za sintezu govora.
>     Obećao mi je da će sintetizovati govor za neki od tekstova samo
>     ako mu dostavim neki tekst.
>     Obzirom da je tekst neophodno pročistiti od viki tagova,
>     pregledati interpunkciju, prepisati brojeve itd to je oduzimalo
>     suviše vremena.
>     U svakom slučaju ko se ne seća ranijeg primera neka pogleda članak
>     Almogaveri.
>
>     Dakle, uglavnom se mom nedostatku vremena može zahvaliti što
>     nemamo još neke članke pročitane na srpskom jeziku.
>     U svakom slučaju, profesor nije bio lenj pa mi je poslao neke
>     linkove za testove koje su oni interno pravili u firmi.
>     http://alfanum.ftn.uns.ac.rs/demo/mp3/
>
>     Ja sam proverio, i video da je deo teksta uzet iz našeg članka.
>     Ovo samo znači da ćemo uskoro imati neki duži članak iščitan.
>     Moram priznati da je ovaj glas mnogo manje monotom od onoga u
>     Almogaverima.
>     Ipak je prošlo 3 godine a oni su značajno napredovali.
>
>     Ukoliko nekog zanima, može da predloži koji članak da ide na
>     mašinsko čitanje.
>
>     d
>
>     _______________________________________________
>     Wikimediasr-l mailing list
>     [hidden email]
>     <mailto:[hidden email]>
>     https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
>
>
> ------------------------------------------------------------------------
>
> _______________________________________________
> Wikimediasr-l mailing list
> [hidden email]
> https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
>  
Kao spikerka sa dnevnika

_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Драган Сатарић
Mogao bi neki od LikILink članaka ?

d



_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Mihajlo Andjelkovic
Ок, мени као музичком уху сметају понеки спојеви, али стварно су
резултати задовољавајући за објављивање.

М
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Драган Сатарић
Čovek traži komentare. Slobodno ih dajte.

Ja sam prokomentarisao da su rezultati značajno bolji nego kod Almogavera.
Dinamika oko kraja rečenice je mnogo prirodnija.
Nema cimanja onako grubog i nije toliko zamorno.
Savladane su brojke, čak i zapete pa i tačke unutar velikog broja.

Ja sam predložio da razmotri posebnu dinamiku za početak i kraj većih celina kao što su pasusi.

Sem ovoga sam primetio još oko nekih interpunkcija prostor za poboljšanje.
Inače, primetio sam neprirodan izgovor za "snneg" itd.

Šta ste vi primetili?

d


_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Filip Maljković
In reply to this post by Драган Сатарић
On 07/22/2010 10:06 AM, Драган Сатарић wrote:

> Ako se neko seća ja sam pomenuo profesora Vladu Delića i njegov
> program za sintezu govora.
> Obećao mi je da će sintetizovati govor za neki od tekstova samo ako mu
> dostavim neki tekst.
> Obzirom da je tekst neophodno pročistiti od viki tagova, pregledati
> interpunkciju, prepisati brojeve itd to je oduzimalo suviše vremena.
> U svakom slučaju ko se ne seća ranijeg primera neka pogleda članak
> Almogaveri.
>
> Dakle, uglavnom se mom nedostatku vremena može zahvaliti što nemamo
> još neke članke pročitane na srpskom jeziku.
> U svakom slučaju, profesor nije bio lenj pa mi je poslao neke linkove
> za testove koje su oni interno pravili u firmi.
> http://alfanum.ftn.uns.ac.rs/demo/mp3/
>
> Ja sam proverio, i video da je deo teksta uzet iz našeg članka.
> Ovo samo znači da ćemo uskoro imati neki duži članak iščitan.
> Moram priznati da je ovaj glas mnogo manje monotom od onoga u
> Almogaverima.
> Ipak je prošlo 3 godine a oni su značajno napredovali.
>
> Ukoliko nekog zanima, može da predloži koji članak da ide na mašinsko
> čitanje.
Nije lose. Samo, primecujem da se odredjeni glasovi (a mozda i celi
slogovi) previse zbrzaju ponekad. Izgovor stranih imena bi trebalo da
bude malo sporiji, ali pitanje je koliko je jednostavno implementirati
to (tj. trebalo bi da softver analizira tekst, sto, pretpostavljam, vec
radi, a onda da nepoznate reci koje pocinju velikim slovima nesto
sporije iscita). Takodje sam primetio iritantan efekat u odredjenim
delovima, koji mi dosta lici na flanging (v. clanak na enwiki), a u
sustini je podrhtavanje glasa. Ne znam zbog cega se to javlja.

poz,
Filip

_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Milos Rancic-2
In reply to this post by Драган Сатарић
2010/7/22 Драган Сатарић <[hidden email]>:

> Čovek traži komentare. Slobodno ih dajte.
>
> Ja sam prokomentarisao da su rezultati značajno bolji nego kod Almogavera.
> Dinamika oko kraja rečenice je mnogo prirodnija.
> Nema cimanja onako grubog i nije toliko zamorno.
> Savladane su brojke, čak i zapete pa i tačke unutar velikog broja.
>
> Ja sam predložio da razmotri posebnu dinamiku za početak i kraj većih celina
> kao što su pasusi.
>
> Sem ovoga sam primetio još oko nekih interpunkcija prostor za poboljšanje.
> Inače, primetio sam neprirodan izgovor za "snneg" itd.
>
> Šta ste vi primetili?

Њихову презентацију сам гледао, тј. слушао пре неколико година у
Лабораторији за експерименталну психологију, код садашњег декана
Филозофског факултета, Александра Костића. И тада је њихов
синтетизатор био импресиван (ово кажем из лингвистичке перспективе,
пошто су покупили све акценте како ваља и пошто знам како им изгледа
алгоритам).

Сумњам да су од тада напредовали, пошто су стигли до тачке кад су
рекли да им је неопходна помоћ лингвиста, а лингвиста који се тиме
баве нема. У питању је решавање акцената помоћу синтаксе.  Мислим,
постоји доста обимна литература на ту тему, али је литература
дескриптивна, а њима треба стохастичка и/или формална. И то
подразумева организовани рад на статистичком и формалном истраживању
српког језика, нпр. да се да неком докторанту да се тиме позабави, а у
овом тренутку се докторанти који се занимају за целу област могу
избројати на прсте једне руке. Хоћу рећи, њихов проблем не спада у
категорију ноу-хауа који се да препричати, па имплементирати мање или
више срећно, већ у категорију проблема који захтевају квалитетно
истраживање које би трајало годину-две дана.

Узевши у обзир то, синтетизатор је врхунски и тешко је да ће се у
наредних десетак година поправити.

Е, сад. Требало би направити пројекат којим бисмо претворили сав
материјал са Википедије у говорни материјал. Мислим да се то да
организовати. У сваком случају, требало би да се видимо с њима и да
попричамо о томе како да пројекат изведемо и сл.
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Драган Сатарић
Pošto ima interesovanja o ovom poduhvatu evo malo informacija.
U prilogu je njihov poster kojim su Ministarstvu predstavili rezultate svog rada.

Iz spiska istraživača se vidi da među istraživačima ima ljudi iz bivšeg Instituta za eksperimentalnu fonetiku i patologiju govora.

Za sledeću godinu su prijavili da će istraživačku ekipu proširiti istraživačima iz Filozofskog fakulteta. E sad, koliko su oni reprezentativni, to ne znam.

Sve u svemu, napreduju. Rezultati su dobri. Imam kod sebe i spisak predviđenih rezultata i aktivnosti. Smatraju da su dobro savladali čitanje. Sada doteruju hrvatski, makedonski itd.  Sledeći veliki korak im je prepoznavanje govora i emocija.

U svakom slučaju bićemo i dalje u kontaktu. On je svojevremeno pitao možemo li nekakav zajednički projekat pokrenuti. Tu se postavilo pitanje slabovidećih, slepih, gluvih i nagluvih osoba sa pratećim aplikacijama tekst-govor i govor-tekst. Oni ovo prijavljuju nekima za finansiranje, kao što je Ministarstvu za socijalni rad itd kao humanitarni projekat.

Što se nas tiče, možda možemo mi nešto predložiti. Ne znam može li se predložiti sledeća primena:
1. neko zada govorni upit / izgovori kao da kuca nešto u polje Search
2. Vikipedija prepozna reči i ponudi mu rezultat pretrage i ponudi opcije za izbor
3. osoba odabere željeni članak, izgovori, Vikipedija prepozna izbor
4. program pročita članak na Vikipediji

Teško da će ovo moći da se ugradi u MediaWiki sw ali zvuči zanimljivo, zar ne?

d




_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l

Poster 11001.pdf (565K) Download Attachment
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Mihajlo Andjelkovic
In reply to this post by Milos Rancic-2
Примедбе које смо изнели ја и Филип се нису тицале самог избора
акцената, већ повезивања делова у целину (колико се сећам употребио
сам реч 'спојеви'). То је толико уочљиво (тј. чак глас уме да звучи
нељудски) да мене и мрзи да указујем на тачна места где до тога
долази. Верујем да су тога и сами аутори синтетизатора свесни.

М
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Mihajlo Andjelkovic
In reply to this post by Драган Сатарић
Можда и може да се угради као екстензија, ако има начина да се синтеза
обавља ван сервера ВМ. Значи, вероватно причамо о имплементацији у
Јави. :)

Такође постоји варијанта да се направи посебан сајт, који користи
податке са Википедије, тј. чита и прослеђује, а успут пружа овај
сервис. На њему би се све могло реализовати.

М
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Драган Сатарић
Teoretski, mi bi to mogli da postavimo na neki naš URL.
Recimo, www.vikipedija.rs (a ne samo www.wikipedia.rs)  :)

S tim što je po meni problematičniji deo prepoznavanje govora nego čitanje.

Ne znam da li bi kod njih mogli probuditi interesovanje za takvu vrstu eksperimenta.

d

22. јул 2010. 14.01, Михајло Анђелковић <[hidden email]> је написао/ла:
Можда и може да се угради као екстензија, ако има начина да се синтеза
обавља ван сервера ВМ. Значи, вероватно причамо о имплементацији у
Јави. :)

Такође постоји варијанта да се направи посебан сајт, који користи
податке са Википедије, тј. чита и прослеђује, а успут пружа овај
сервис. На њему би се све могло реализовати.

М
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l


_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Драган Сатарић
Čudno da niko nije reagovao na www.vikipedija.rs
Da li to znači da za ovo znamo duže vreme?

Koliko vidim neko je iz Češke ovo zakupio. (mada u Nišu)
Pogledajte datume!
Tip je juče zakupio na još godinu dana.

Da li smo mogli da reagujemo kod Loopia da ne dozvole produženje zakupa?

d

_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Citanje clanaka

Nikola Smolenski-2
On 08/03/2010 11:08 AM, Драган Сатарић wrote:
> Čudno da niko nije reagovao na www.vikipedija.rs <http://www.vikipedija.rs/>
> Da li to znači da za ovo znamo duže vreme?

Знамо. Постоји писмо којим сам добио wikipedia.rs, ако хоћеш можеш да га
прилагодиш и пошаљеш њему. Ако до тога дође, код РНИДС-а сам
издејствовао попуст за арбитражу, тако да би нас дошло само око 700 евра.

> Da li smo mogli da reagujemo kod Loopia da ne dozvole produženje zakupa?

Не.
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
https://lists.wikimedia.org/mailman/listinfo/wikimediasr-l