Ladislao Published on December 9, 2008
by Ladislao

Ladislao's blog

Browse posts
Kalkuli la manipulmontran ciferon de iu artikolo/teksto
12 comments (latest 8 months ago)
La Manipulanto - forumo kontraŭ la manipulado de publika E-opinio
Posted on December 8, 2008
4 comments (latest 9 months ago)
La redaktoro de Libera Folio ploras verdajn larmojn
Posted on December 4, 2008
4 comments (latest 11 months ago)
Reago de HEA al la artikolo aperinta en Libera Folio
Posted on December 3rd, 2008
8 comments (latest 11 months ago)
Kiel organizi pli bone Universalajn Kongresojn?
Posted on August 14, 2008
7 comments (latest 14 months ago)
ESENCOJ: La prezidanto de UEA akceptas kritikon pri UK 2008
Posted on August 11, 2008
3 comments (latest 14 months ago)
Ekster la klubo, aŭ kial mi ne iĝos kongresemulo
Posted on August 3rd, 2008
24 comments (latest 14 months ago)
Diversnivela komunikado kun nacilingvaj (amas)komunikiloj pri Esperanto
Posted on April 21, 2008
8 comments (latest 15 months ago)
Nova aplikaĵo por videokonferencoj
Posted on April 7, 2008
9 comments (latest 19 months ago)

Keyword tags

HEA
Hungario
La Manipulanto
manipulmontra cifero
metodologio

Member tags

Ladislao

More information

This post is public
Attribution + no Derivs
  1. Read 947 times

Kalkuli la manipulmontran ciferon de iu artikolo/teksto

Tuesday December 9, 2008 at 11:23AM

La plej grava karaketerizo de tiu ĉi mezura metodo estas la leĝo de multnombreco, do kelkaj eraroj ne influas esence la finajn montro-ciferojn.

La t.n. manipulmontra cifero ricevas formon kaj laŭ subjektiva, kaj laŭ objektiva analizo de la tekstoj. Unue La Manipulanto priserĉas tiujn kvalifikajn vortojn, esprimojn, asertojn el la artikolo, kiuj restas sen pruvoj, pravigoj aŭ justigoj. Tiuj vortoj estas ruĝigitaj kaj kiam oni movas ilian muskursoron sur tiuj vortoj, vidiĝos pliaj detaloj pri la kialoj de ilia selekto.

Analizo de vortoj-esprimoj

Tiuj detaloj aŭ notoj enhavas ankaŭ subjektivajn aludojn, kiujn eblas komenti, sed laŭ nia intenco, nur tiam ruĝiĝas iu vorto, esprimo, se ĝi havas “problemon”. Por prikalkuli la manipulmontran ciferon ni prinombras la ruĝajn vortojn - tiu cifero helpos kalkuli la finan manipul-ciferon (2a formulo) - kaj signas ĝin per la litero K (kvalifikaĵoj) en la suba formulo.

Objektivaj statistiko kaj montro-ciferoj

Laŭ empiriaj rimedoj La Manipulanto konkludis, ke la plej neŭtr(al)aj vortoj nekvalifikaj en Esperanto estas la prepozicioj (ne ĉiuj!) plus kelkaj vortoj senkategoriaj (vidu sube!).

Prepozicioj: al, antaŭ, apud, cis, ĉe, ĉirkaŭ, da, de, depost, disde, dum, ekde, ekster, el, ĝis, inter, je, krom, kun, laŭ, malantaŭ, per, po, por, post, preter, pri, pro, sen, sub, super, sur, tra, trans

Plus kelkaj vortoj senkategoriaj: ajn, aŭ, baldaŭ, ĉar, ĉi, ĉu, des, do, eĉ, ja, jen, ju, ĵus, kaj, ke, la, mem, ol, plej, pli, plu, plus, se, sed, tre, tro, tuj

Tiujn suprajn erojn de teksto ni nomas neŭtr(al)aj vortoj, kaj ilia ripetiĝado montras ion ankaŭ pri la lingvorego de la verkanto, do ilia meznombro de ripetado enhavas ankaŭ subjektivan, individuan karakterizon sendependan de la analizanto. Sed ni vidu konkretan ekzemplon:

Helpe de iu interreta tekstoanalizilo en kelkaj sekundoj oni povas prikalkuli la necesajn statistikajn ciferojn. Sube mi listigas la datenojn ricevitajn en la kazo de la analizata provartikolo.

Nombro de la karakteroj (sen spacoj): 4720
Nombro de la frazoj: 46

Nombro de la vortoj (N - en la 1a formulo): 933
Sumo de la neŭtr(al)aj vortoj en la teksto - (n1+n2+…+n25 - en la 1a formulo): 292
Nombro de la neŭtr(al)aj vortoj sen ripetoj (i - en la 1a formulo): 25

Seninformaj kvalifikaĵoj, ne neŭtr(al)aj eroj de la teksto (
K - 2a formulo): 26

Prikalkulo de la ideala ripetado de neŭtr(al)aj vortoj ĉe iu artikolo:

B - La meznombro de vorto-ripetado
N - Nombro de ĉiuj vortoj de la teksto
n - Analizitaj neŭtr(al)aj vortoj
i - Nombro de la neŭtr(al)aj vortoj en la teksto sen ripetoj

En nia analizata provartikolo la meznombro de la ideala vorto-ripetado (de neŭtralaj teksteroj) estas 79,88 –> 80. Do, en la artikolo havante 933 vortojn ĉiu 80a statistike estas tute neŭtrala.

Manipulmontra cifero:


M - Manipulmontra cifero
K - Seninformaj kvalifikaĵoj, ne neŭtr(al)aj eroj de la teksto

La demando estas, kiel rilatas la nombro de manipulantaj teksteroj al tiu de la statistike tute neŭtralaj vortoj? La absoluta manipulmontra cifero de nia analizata artikolo estas (26 x 100/80=) 32,5 procentoj. Sed en ĉiutagoj, se iu artikolo enhavas pli ol 50-procente misinformojn, tiu ne indas eĉ je la tralego; La Manipulanto tial konsideras ke ĉiu publikigita artikolo devas havi verajn, ĝustajn informojn almenaŭ duone, tial la absolutan manipulmontran ciferon endas duobligi, do la manipulanta cifero de la provartikolo iĝas 65 procentoj.

La Manipulanto
baldaŭ interrete

Notoj:
- Tiun ĉi metodon de analizo oni prefere uzu en la kazo de artikoloj/tekstoj, kiuj havas minimume 800-1000 karakterojn.
- La metodo estis testita ankaŭ en la franca kaj rumana lingvoj (kiuj lingvoj same havas prepoziciojn).
- Kiam mi uzas la esprimon ‘informo’, fakte mi parolas pri t.n. presinformo (laŭ la ‘5W+1′-regulo: kun kiu, kie, kiam, kio kaj kiel + kial okazis) .
- Ĉi-tiu metodo estas plie empiria, ol scienca.
- Mi ankaŭ kontraŭprovis la metodon: la formuloj funkcias kaj se ĉiu vorto estas iu neŭtr(al)a prepozicio (ekzemple ‘pri’), kaj se ĉiu vorto estas kvalifikaĵo (ekzemple ’stulta’).

12 Comments / add your comment?

Ladislao says:
Ŝajne havas neniu komenton. Ĉu tiom bonas mia "manipulanta" afiŝo? He-he...
Posted 10 months ago. ( permalink )
Erzsébet Tuboly says:
Ne senesperiĝu Ladislao! Semajnofine certe pluraj IP-anoj legos vian iniciaton. Leginte la instigan artikol(aĉ)on en LF mi taksas ĝin bona ideo.
Krome mi juras, ke mi estas ne nur "surpapera" persono. :-))
Posted 10 months ago. ( permalink )
Onagrino (Dominique)--- (*)pro says:
Mi ĵus eklegis vian artikolon, sed tre malfacile komprenas ĝin. Eble ĉar mi estas nekompetenta pri matematiko?

Nu, eble mi revenos legi poste.
Posted 10 months ago. ( permalink / translate )
Blazio VAHA (n.s. WACHA, Balázs) says:
Pri ia (eble iom simila) enhav-analizo okupiĝis iam Sándor Révész (ŝa:ndor re:ve:s), esperantisto, soicologo, ĵurnalisto (reĝim-sanĝo-priskribanto). Eble tie pli gravis
specifaj ŝlosilvortoj, sed mi ne scias.

La temo estas interesa, kaj mi fidas je ia eblo tiel karakterizi verkojn, artikolojn,
sed mi ne estas kompetenta pri kontrolo de la matematika parto.


Pli facila kaj interesa estas la lingva parto, ekz. listo de la vortoj malpli ŝancaj influi la esencan enhavon.Oni relegu fragmenton:

"Plus kelkaj vortoj senkategoriaj: ajn, aŭ, baldaŭ, ĉar, ĉi, ĉu, des, do, eĉ, ja, jen, ju, ĵus, kaj, ke, la, mem, nur, ol, plej, pli, plu, plus, se, sed, tre, tro, tuj"

Estas certe malfacile scii certe, kio kiom influas. Mi havas dubon pri *nur*, kiu ofte inkluzivas
ne surfacan neadon, do povas (laŭ mi) tre forte influi la mesaĝon. (En la grupo estas saĝa
nur Evinjo - ĉiu alia do estas malsaĝa).

Do mi (eĉ se ne sufiĉe kompetenta) trovas la artikolon interesa kaj laŭdinda. Certe kun konsidero de (supozebla) fakliteraturo evoluigebla.
Posted 10 months ago. ( permalink )
Blazio VAHA (n.s. WACHA, Balázs) edited this comment 10 months ago.
Ladislao replies:
Ŝajne vi pravas pri la vorto "nur", pli bonas se oni preterlasas ĝin kiel ne nepre neŭtrala vorto...
Posted 10 months ago. ( permalink )
Maria says:
Ladislao, se homoj ne tuj ekkomentis tiun-ĉi afiŝon, la kialo verŝajne estis ke oni ne certas ĉu estas ŝerco aŭ ne. Ĉar mi nun komprenis ke ne temas pri ŝerco, sed io sange serioza :-) mi kaptas la okazon atentigi pri kelkaj tekstinterpretaj elementaĵoj:

Vorton ne eblas pritrakti izolite. En teksto estas rilato inter vortoj, inter frazoj kaj inter partoj de la teksto. Krome teksto povas esti verkita sur diversaj niveloj, ekz ironia, kaj vortoj povas havi aliajn signifojn ol la bazan, ekz poezian. Krome teksto ĉiam ekzistas (ankaŭ) en eksterteksta kunteksto, do en rilato kun la ekstera mondo (kelkfoje ankaŭ kun aliaj tekstoj). Konklude: por pli profunde kompreni tekston ne sufiĉas statistiko kaj matematiko. Sufiĉe memkompreneble, laŭ mi.
Posted 10 months ago. ( permalink )
Ladislao replies:
Jes, vi pravas - se ni ĝenerale parolas pri tekstoj. Tamen, laŭ mi la t.n. presinformo (laŭ ‘5W+1′-regulo: kun kiu, kie, kiam, kio kaj kiel + kial okazis) estas difinita ĵurnalisma inform-ĝenro (pri opini-ĝenroj nun mi ne parolas). Do, kiam ni legas/aŭdas/vidas/analizas artikolon-tekston skribite laŭ la reguloj de (pri)informa ĝenro, tie estas bonvena neniu "kunteksto eksterteksta", eĉ! Eblas skribi poemon pri bankokolapso, sed certe ne pro tiu versaĵo mi decidos, ĉu mi fidas plu tiun bankon aŭ male.

Subjektivan analizon en nia kazo oni ne povas preterlasi, sed - laŭ la leĝo de multnombreco - havas gravan rolon ankaŭ la matematika-statistika reguleco de vortoj, esprimoj en iu teksto. Eĉ pli, se tiuj ciferoj ne koncernas la analizanton mem, do ili estas pli 'objektivaj' ol la nura analizo subjektiva.

Rilate la sangan seriozecon: mi nek tiam saltos en Danubon, se miaj formuloj pri manipulmontraj ciferoj fiaskos. Des pli, ke mi povas naĝi :-)...
Posted 10 months ago. ( permalink )
Blazio VAHA (n.s. WACHA, Balázs) replies:
Interesus min la opinioj de Ladislao, Maria kaj eble aliaj, pri la demando, ĉu eblas en
la kadroj de la esperantista socio specialiĝi. Tra mia vivo mi aŭdadis senĉes urĝajn
alvokojn, ke oni nepre faru tuj jen tion (ekz. ĉiu esperantisto okupiĝu pri turismo tra unu jaro)
jen pri tio (ekz. csiu esperantisto specialiĝu pri komputado aŭ ĉiu esperantisto lernu plurajn lingvojn, ĉiu esperantisto lerni administradon de firmao ktp. - Kompreneblem i iom ŝercas.

Samtempe verŝajne oni povas nur revi, ke iam oni anoncos konkurson pri pagataj postenoj
je tiu aŭ alia strikta fako. Sed mi ne volas envolvi tiun organizan-laborsferan flankon, nur
la pli ĝeneralan demandon, kiom esperantistoj mem toleras/favoras specialiĝon de aliaj esperantistoj.
Posted 10 months ago. ( permalink )
Boris Arrate says:
Saluton, Ladislao. Pri Matematiko i ne scias multon sed al mi estas stranga tio k. mi ne komprenas ciferon k. kalkulon.
Posted 10 months ago. ( permalink )
Cindy Mckeepro says:
La deziro por pli alta nivelo de profesieco inter Esperantaj ĵurnalistoj estas laŭdinda!
Semantika analizo de teksto eble ne helpus; la alvoko al aliaj ĵurnalistoj sendube helpos. Kaj ankaŭ al la legantaro. Aparte al la legantaro! Nur kiam la legantoj postulas novaĵojn kiuj estas raportitaj neŭtrale, objektive kaj profesie, tion ili ricevos.
Posted 10 months ago. ( permalink )
Vladimír Türk*pro says:
Ladislao, komente vi skribas: Jes, vi pravas - se ni ĝenerale parolas pri tekstoj. Ĉu tiuj ĵurnalistaj tekstoj ne estas ĝenerale tekstoj? Mi pensas, ke ĉiam gravas la enhavo, ne la formo, do ne gravas kalkuli vortojn, sed pripensi la enhavon.
Posted 9 months ago. ( permalink )
Ladislao replies:
Ne, kiel mi skribis, temas pri ĵurnalisme taksitaj informoj, artikoloj, kiuj ĝenerale - aŭ per kiuj - oni volas informi legantaron pri io. Plue, intertempe mi akiris kelkajn celprogramojn por ekzameni tekstojn ne nur vortnombre, sed ankaŭ semantike... Kvankam ankoraŭ ne ekzistas e-vortaroj uzeblaj de tiuj programoj. Mi laboras ankoraŭ la iniciaton... Ne maltrankviliĝu ;)
Posted 8 months ago. ( permalink )

Add your comment

Reply to this comment

Edit your comment

Please sign in to post a comment Sign in now?


rss Latest comments – Subscribe to the feed of comments related to this post.

 

Català | Čeština nové | 中文 | Deutsch | English | Español | Esperanto | Ελληνικά | Français | Galego | Italiano | Nederlands | Português | More...