Linkovi ka viseznacnim

classic Classic list List threaded Threaded
40 messages Options
12
Reply | Threaded
Open this post in threaded view
|

Linkovi ka viseznacnim

Јован Вуковић
Ocigledno je da imamo problem sa linkovanjem na viseznacne odrednice. Trenutno imamo preko 5.000 clanaka koji u sebi sadrze linkove ka viseznacnim odrednicama (softver prikazuje samo 5.000, a verovatno ima dosta vise). Trebalo bi nekako da resavamo ovo. Na poljskoj mejling listi se trenutno diskutuje o ovome i javio se predlog da se uvede neka ekstenzija koja ce se aktivirati kada korisnik pokusa da snimi stranicu koja u sebi sadrzi link ka viseznacnoj. Ona bi trebala da ga opomene da se u clanku nalazi link ka viseznacnoj i da ga pita da li je siguran da tako zeli da ga linkuje. To bi se pojavljivalo kad god neki link vodi ka stranici koja ima savlon ((viseznacna odrednica)). Samo da napomenem da poljaci imaju nesto tako i ako se ne stavi opis izmene (aktivira se polje za opis izmene i kaze da nije naveden opis, po meni je to glupo, ali moze se i o tome diskutovati). E sad sta ostali misle o ovim linkovima ka viseznacnim odrednicama?

_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Kašterović Slobodan
Мислим да се оба проблема (постојећи и будући линкова на вишезначне)
могу ријешити ботовима и да није потребно проширење софтвера у ту сврху,
које би осим тога било веома "неперформантно".


Каштер



Јован Вуковић schrieb:

> Ocigledno je da imamo problem sa linkovanjem na viseznacne odrednice.
> Trenutno imamo preko 5.000 clanaka koji u sebi sadrze linkove ka
> viseznacnim odrednicama (softver prikazuje samo 5.000, a verovatno ima
> dosta vise). Trebalo bi nekako da resavamo ovo. Na poljskoj mejling
> listi se trenutno diskutuje o ovome i javio se predlog da se uvede
> neka ekstenzija koja ce se aktivirati kada korisnik pokusa da snimi
> stranicu koja u sebi sadrzi link ka viseznacnoj. Ona bi trebala da ga
> opomene da se u clanku nalazi link ka viseznacnoj i da ga pita da li
> je siguran da tako zeli da ga linkuje. To bi se pojavljivalo kad god
> neki link vodi ka stranici koja ima savlon ((viseznacna odrednica)).
> Samo da napomenem da poljaci imaju nesto tako i ako se ne stavi opis
> izmene (aktivira se polje za opis izmene i kaze da nije naveden opis,
> po meni je to glupo, ali moze se i o tome diskutovati). E sad sta
> ostali misle o ovim linkovima ka viseznacnim odrednicama?
> ------------------------------------------------------------------------
>
> _______________________________________________
> Wikimediasr-l mailing list
> [hidden email]
> http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
>  


_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Јован Вуковић
A kako to botovima. Kako bi bot znao o cemu se radi. Npr. clanak vodi na Makedonija i bot treba da odluci da li je to Republika Makedonija ili Makedonija (pokrajina). Postoje botovi koji to rade, ali za botom mora da sedi neko ko bi rucno rekao sta bot treba da stavlja

_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Mihajlo Andjelkovic
Хехе, па CppBot може да зна све. :-) А како му је тренутно једини
проблем да се улогује, лако може да генерише листе послова по шаблону

1. у том и том чланку
2. ту и ту повезницу заменити том и том

што онда може да изведе било који бот, или група ботова.

М
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Срђан Весић
Ako sam ja dobro shvatio, problem je Word sense disambiguation (ne znam kako se ovo tacno kaze na srpskom). To je ozbiljan problem, savrsen algoritam jos uvek ne postoji a dobro resenje moze pravo u neki naucni casopis iz racunarske lingvistike  :P

poz,
Srdjan


2007/11/6, Mihajlo Andjelkovic <[hidden email]>:
Хехе, па CppBot може да зна све. :-) А како му је тренутно једини
проблем да се улогује, лако може да генерише листе послова по шаблону

1. у том и том чланку
2. ту и ту повезницу заменити том и том

што онда може да изведе било који бот, или група ботова.

М
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l


_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Kašterović Slobodan
In reply to this post by Јован Вуковић
Бот не би одлучивао шта је исправно. :) Ту се слажем са Срђаном :)

- Рјешење за будуће линкове: Бот би упозоравао (порука на разговор
корисника) да снимљени текст садржи везу ка вишезначној одредници.

- Рјешење за постојеће линкове: Бот би написао поруку на страни за
разговор чланка да у њему постоји линк ка вишезначној одредници.


Каштер


Јован Вуковић schrieb:

> A kako to botovima. Kako bi bot znao o cemu se radi. Npr. clanak vodi
> na Makedonija i bot treba da odluci da li je to Republika Makedonija
> ili Makedonija (pokrajina). Postoje botovi koji to rade, ali za botom
> mora da sedi neko ko bi rucno rekao sta bot treba da stavlja
> ------------------------------------------------------------------------
>
> _______________________________________________
> Wikimediasr-l mailing list
> [hidden email]
> http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
>  


_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Mihajlo Andjelkovic
Auh sad videh o čemu se radi. Radim više poslova istovremeno pa se pogubih.

Tu se slažem da bot pod milim bogom NE MOŽE da zna čime da zameni
višeznačnu odrednicu.

Ali šta može: može da prikupi informacije o svim postojećim i
predstavi ih u željenom formatu.

M
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Mihajlo Andjelkovic
I kako to obično biva, da se opet pojasnim:

> Ali šta može: može da prikupi informacije o svim postojećim i
> predstavi ih u željenom formatu.

Znači bot može da prikupi informacije o poveznicama ka višeznačnim
odrednicama koje se nalaze u člancima (a ne trebaju). Nego recite vi
meni šta sa njima kad se prikupe? 'Oćemo neku radnu akciju pa svako po
100 članaka dnevno ili kako? (da se pripreme spomenice :P)

M
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Јован Вуковић
Pa to i jeste problem. Bot bas i ne pomaze mnogo ako generise spisak. mislim i to moze da koristi, ali ne mnogo. Ako postavi 5000+ poruka na stranama za razgovor i nije mnogo uradio, jer ne resavamo time. Ostavljanje poruke na str. za razgovor moze da koristi, a i treba to da radi, ali zar nije bolje da mu kad klikne na sacuvaj straicu izbaci jednom upozorenje da pokusava da snimi stranicu sa vezom ka viseznacnoj i da ga pita da li zeli da izmeni. Ako ne zeli klikne opet na sacuvaj i sve je uredu. Ako je nemoguce da se izvede onda ok, saljemo poruke.

 A sto se tice akcije mozemo to da odradimo. Mada meni je sasa rekao da postoji bot za tako nesto, ali njime mora da upravlja covek. Bilo bi dobro da se i on javi i da kaze. Mislim da je pre pomocu toga sredjivao neke planete ili tako nesto.

_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Mihajlo Andjelkovic
Ијој Јоване, немој само странице за разговор да пунимо порукама
(мислим, непотребна бирократија). А што се корисности листе свега тиче
па мислим да је корисна:

(1) Макар да знамо са коликим се проблемом носимо
(2) Неко може да уд'ри па да чисти по реду. Зашто тражити од стране до
стране где је шта погрешно повезано (као што би то био случај са
порукама на странама за разговор, сем у случају додатне категоризације
(ајој мајко...)) кад може све на једном месту?

Ал' добро то са ботом би (у случају јузер-френдли интерфејса) било
оптимално решење. Поготово ако га покреће више људи истовремено, за
различите опсеге чланака.

М
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Mihajlo Andjelkovic
А што се додатка софтверу тиче, ту сам благо против, макар док не
видимо колико проблем узима маха. На шта мислим:

(1) колико таквих линкова има, порука ће бити приказивана и
корисницима који нису такве повезнице додали, већ само неку малу
измену - иритирајуће
(2) када једном очистимо све овакве повезнице, њихов број ће бити лако
регулисати на месечном нивоу...
(3) ако се пак (2) покаже нетачним, увек можемо додати ту екстензију

М
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Sasa Stefanovic
In reply to this post by Mihajlo Andjelkovic
Да ли сте знали, недеља 45, дан 3
Постоји већ бот који решава вишезначне одреднице у питон Википедија боту. Дакле, он проналази чланке који садрже овакве везе ка вишезначним одредницама, "чита" ту вишезначну одредницу и тражи везе, и онда нуди кориснику који је покренуо бота да изабере један број који представља везу ка чланку у тој вишезначној одредници. Код тог бота се може погледати овде а може га покретати сваки корисник који има бота на ср: вики. Наравно, бот је само полуаутоматски и НЕ МОЖЕ да зна на шта треба да линкује, он само понуди решење а корисник треба да одабере везу. Дакле, ко има времена и воље може са овим да ради.


On 11/6/07, Mihajlo Andjelkovic <[hidden email]> wrote:
I kako to obično biva, da se opet pojasnim:

> Ali šta može: može da prikupi informacije o svim postojećim i
> predstavi ih u željenom formatu.

Znači bot može da prikupi informacije o poveznicama ka višeznačnim
odrednicama koje se nalaze u člancima (a ne trebaju). Nego recite vi
meni šta sa njima kad se prikupe? 'Oćemo neku radnu akciju pa svako po
100 članaka dnevno ili kako? (da se pripreme spomenice :P)

M
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l



--
Саша Стефановић
site: http://www.djevrek.info
mail: [hidden email]
icq: 137936207
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Sasa Stefanovic
Ukratko o botu ima i na Meti na http://meta.wikimedia.org/wiki/Solve_disambiguation.py

On 11/7/07, Sasa Stefanovic <[hidden email]> wrote:
Да ли сте знали, недеља 45, дан 3
Постоји већ бот који решава вишезначне одреднице у <a href="http://sourceforge.net/projects/pywikipediabot/" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">питон Википедија боту . Дакле, он проналази чланке који садрже овакве везе ка вишезначним одредницама, "чита" ту вишезначну одредницу и тражи везе, и онда нуди кориснику који је покренуо бота да изабере један број који представља везу ка чланку у тој вишезначној одредници. Код тог бота се може погледати <a href="http://svn.wikimedia.org/viewvc/pywikipedia/trunk/pywikipedia/solve_disambiguation.py?view=markup" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">овде а може га покретати сваки корисник који има бота на ср: вики. Наравно, бот је само полуаутоматски и НЕ МОЖЕ да зна на шта треба да линкује, он само понуди решење а корисник треба да одабере везу. Дакле, ко има времена и воље може са овим да ради.


On 11/6/07, Mihajlo Andjelkovic <[hidden email]> wrote:
I kako to obično biva, da se opet pojasnim:

> Ali šta može: može da prikupi informacije o svim postojećim i
> predstavi ih u željenom formatu.

Znači bot može da prikupi informacije o poveznicama ka višeznačnim
odrednicama koje se nalaze u člancima (a ne trebaju). Nego recite vi
meni šta sa njima kad se prikupe? 'Oćemo neku radnu akciju pa svako po
100 članaka dnevno ili kako? (da se pripreme spomenice :P)

M
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
<a href="http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)"> http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l



--
Саша Стефановић
site: <a href="http://www.djevrek.info" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)"> http://www.djevrek.info
mail: [hidden email]
icq: 137936207



--
Саша Стефановић
site: http://www.djevrek.info
mail: [hidden email]
icq: 137936207
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Filip Maljković
In reply to this post by Mihajlo Andjelkovic
Mihajlo Andjelkovic wrote:

> Ијој Јоване, немој само странице за разговор да пунимо порукама
> (мислим, непотребна бирократија). А што се корисности листе свега тиче
> па мислим да је корисна:
>
> (1) Макар да знамо са коликим се проблемом носимо
> (2) Неко може да уд'ри па да чисти по реду. Зашто тражити од стране до
> стране где је шта погрешно повезано (као што би то био случај са
> порукама на странама за разговор, сем у случају додатне категоризације
> (ајој мајко...)) кад може све на једном месту?
>
> Ал' добро то са ботом би (у случају јузер-френдли интерфејса) било
> оптимално решење. Поготово ако га покреће више људи истовремено, за
> различите опсеге чланака.
>
> М
Pored onog sto je Sasa naveo, jedan newsflash: spisak postoji odavno i
nalazi se ovde:
http://sr.wikipedia.org/wiki/%D0%9F%D0%BE%D1%81%D0%B5%D0%B1%D0%BD%D0%BE:Disambiguations
Tako da nema potrebe generisati ga.

Ja sam misljenja da je poluautomatski bot za sada najbolje resenje.
Ostavljanje poruka na stranama za razgovor je redundantno, a neka
ugradjivanja u softver su malo verovatna.

Filip




_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Djordje Stakic
U nekim situacijama upravo i treba da stoji
link do viseznacne odrednice - npr. ukoliko zelite
da vidite ostala znacenja... pa je nezgodno da
uvek upozorava prilikom snimanja te strane.

_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Јован Вуковић
In reply to this post by Filip Maljković
O tom sasinom botu sam i pricao. Sto se tice spiska, naveo sam ga, ali izgleda da nije potpun, tj da obuhvata samo 5000 strana. E sad da li je lako regulisati na mesecnom nivou nisam siguran.Ljudima je mnogo lakse da stave Makedonija nego Republika Makedonija i sl. Poljaci kazu da je borba sa vetrenjacama. Sto se tice slanja poruka, trebalo bi da se uvede tek kada se veci deo pocisti. U svakom slucaju bot bi mogao da generise negde spisak da znamo barem koliko tih clanaka ima.

Током 7.11.07., Filip Maljkovic <[hidden email]> је написао:
Mihajlo Andjelkovic wrote:
> Ијој Јоване, немој само странице за разговор да пунимо порукама
> (мислим, непотребна бирократија). А што се корисности листе свега тиче
> па мислим да је корисна:
>
> (1) Макар да знамо са коликим се проблемом носимо
> (2) Неко може да уд'ри па да чисти по реду. Зашто тражити од стране до
> стране где је шта погрешно повезано (као што би то био случај са
> порукама на странама за разговор, сем у случају додатне категоризације
> (ајој мајко...)) кад може све на једном месту?
>
> Ал' добро то са ботом би (у случају јузер-френдли интерфејса) било
> оптимално решење. Поготово ако га покреће више људи истовремено, за
> различите опсеге чланака.
>
> М
Pored onog sto je Sasa naveo, jedan newsflash: spisak postoji odavno i
nalazi se ovde:
<a href="http://sr.wikipedia.org/wiki/%D0%9F%D0%BE%D1%81%D0%B5%D0%B1%D0%BD%D0%BE:Disambiguations" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)"> http://sr.wikipedia.org/wiki/%D0%9F%D0%BE%D1%81%D0%B5%D0%B1%D0%BD%D0%BE:Disambiguations
Tako da nema potrebe generisati ga.

Ja sam misljenja da je poluautomatski bot za sada najbolje resenje.
Ostavljanje poruka na stranama za razgovor je redundantno, a neka
ugradjivanja u softver su malo verovatna.

Filip




_______________________________________________
Wikimediasr-l mailing list
[hidden email]
<a href="http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l


_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Mihajlo Andjelkovic
> veci deo pocisti. U svakom slucaju bot bi mogao da generise negde spisak da
> znamo barem koliko tih clanaka ima.

Ја ту бројку могу лако да извадим по следећем дампу. Што се тачног
нагомилавања овог посла на месечном нивоу тиче, живи били па видели.
Пошто неки већ покрећу овог бота, који је, како сам разумео, веома
удобан, не видим разлога да се ова методологија у одсуству боље мења.

Поздрав
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Јован Вуковић
A moze li neko ko nema tog bota da pomogne. Tj da se napravi neki program, pa da se menja sa bot zastavicom, isto rucno. Od pokretanja tog bota je slaba vajda, jer svakog mrzi to da radi.

2007/11/9, Mihajlo Andjelkovic <[hidden email]>:
> veci deo pocisti. U svakom slucaju bot bi mogao da generise negde spisak da
> znamo barem koliko tih clanaka ima.

Ја ту бројку могу лако да извадим по следећем дампу. Што се тачног
нагомилавања овог посла на месечном нивоу тиче, живи били па видели.
Пошто неки већ покрећу овог бота, који је, како сам разумео, веома
удобан, не видим разлога да се ова методологија у одсуству боље мења.

Поздрав
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l


_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Mihajlo Andjelkovic
Мислиш, људе би мрзело да покрећу бота а не и да мењају повезнице
ручно? Хм... Ја мислим да је са ботом заиста fairly easy у поређењу са
било чиме а не би требало ни бити тако компликовано инсталирати га.
Нпр. Саша би могао овако групно да нам објасни како шта да се подеси
па да сви занитересовани навале на посао.
_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
Reply | Threaded
Open this post in threaded view
|

Re: Linkovi ka viseznacnim

Kašterović Slobodan
Ако има довољно заинтересованих може се направити веб апликација која би
нудила исте одлуке у бровзеру. Наравно са логином и осталим чачкалицама.


Каштер


_______________________________________________
Wikimediasr-l mailing list
[hidden email]
http://lists.wikimedia.org/mailman/listinfo/wikimediasr-l
12