Post by JarosÅaw SokoÅowskiMożna metodę udoskonalić, choćby dodając analizę X-Newsreader, ale wiele
się od tego w wynikach nie zmieni.
Dodałem, tu już nie ucinałem po pierwszym slashu, bo rozbieżność w
X-Newsreaderach jest mniejsza (do tego ignoruję User-Agent, gdy istnieje
X-Newsreader).
#v+
55.2% 5571 Mozilla
18.7% 1892 G2
8.1% 819 Microsoft Windows Live Mail 16.4.3528.331
4.1% 414 40tude_Dialog
2.9% 292 slrn
2.4% 242 Xnews
1.2% 122 Opera
0.9% 91 Groundhog
0.7% 68 Microsoft Outlook Express 6.00.2900.5931
0.6% 62 Microsoft Windows Live Mail 15.4.3555.308
0.6% 57 tin
0.5% 49 Microsoft Windows Mail 6.0.6002.18197
0.5% 47 Microsoft Outlook Express 6.00.3790.4657
0.4% 44 OE PowerTool 4.5.4
0.4% 43 NewsTap
0.3% 35 MyGate/2.6.0.171 (http://barin.com.ua/soft/mygate/)
0.3% 32 Forte Agent 1.93/32.576 English (American)
0.3% 30 HotdogEd
0.3% 28 PiaoHong.Usenet.Client.VIP:2.02
0.3% 28 Gnus
0.3% 26 Pan
0.2% 24 Claws Mail 3.17.8 (GTK+ 2.24.32; x86_64-suse-linux-gnu)
0.2% 19 Tosenevrati v4.05
0.1% 13 MesNews/1.08.06.00-gb
0.1% 11 Thunderbird
0.1% 9 PiaoHong.Usenet.Client.Free:2.02
0.1% 8 Microsoft Windows Mail 6.0.6001.18000
0.1% 7 Microsoft Outlook Express 6.00.2900.5512
0.1% 7 Forte Agent 4.2/32.1118
0.0% 3 Hamster
0.0% 2 Forte Agent 4.0/32.1071
0.0% 2 KNode
0.0% 1 Experimental
0.0% 1 Claws Mail 3.16.0 (GTK+ 2.24.32; x86_64-pc-linux-gnu)
0.0% 1 n4mail
0.0% 1 MicroPlanet-Gravity
#v-
Post by JarosÅaw SokoÅowskiDrugi ważny wniosek jest taki, że bramka Google jest problemem dokuczliwym,
ale wcale nie aż tak powszechnym. Tu (to będzie moja "uwaga do Adama")
warto się przyjrzeć jak rozkłada się na grupy uzyskany wynik około 20%.
Ciekawy test, tylko ciężko sprawdzić, bo są grupy, na których jest tak
mały ruch, że fałszują wynik (np. w ostatnich 20 tysiącach postów na
pl.misc.samochody.garbusy 100% postów było z G2... czyli dwie sztuki).
Tzn. wynik jest technicznie poprawny, ale raczej nie o to nam chodzi.
Zrobiłem test dla ostatnich 50 tysięcy postów (od końca grudnia 2020)
i wyciąłem grupy, które przez ten czas zgromadziły poniżej 50 postów.
Kolejne pola oznaczają:
- procentowy udział postów z G2
- liczbę postów z G2
- całkowitą liczbę postów (w tym z G2)
- grupę
#v+
96.8% 60 62 pl.hum.poezja
89.0% 525 590 pl.rec.paralotnie
67.9% 850 1251 pl.sci.fizyka
56.1% 105 187 pl.sci.matematyka
39.6% 1856 4683 pl.pregierz
38.9% 42 108 pl.misc.kolej
38.8% 52 134 pl.comp.programming
30.4% 31 102 pl.rec.kuchnia
28.5% 79 277 pl.sci.inzynieria
27.5% 50 182 pl.sci.kosmos
20.8% 11 53 pl.rec.foto.cyfrowa
20.4% 32 157 pl.rec.rowery
19.3% 34 176 pl.soc.prawo.podatki
17.7% 83 470 pl.misc.militaria
15.1% 226 1500 pl.soc.polityka
14.6% 269 1847 pl.misc.budowanie
13.1% 33 252 pl.sci.psychologia
12.0% 9 75 pl.rec.foto
10.0% 21 211 pl.soc.religia
9.0% 180 1997 pl.misc.elektronika
8.5% 8 94 pl.rec.lotnictwo
7.9% 71 903 pl.biznes.banki
6.3% 4 63 pl.rec.gory
5.2% 22 420 pl.rec.fantastyka.sf-f
4.7% 8 171 pl.internet.mordplik
2.4% 55 2322 pl.soc.prawo
1.9% 10 523 pl.comp.os.ms-windows.winnt
1.3% 1 79 alt.pl.test
1.2% 7 600 pl.comp.os.linux
0.7% 4 535 pl.misc.telefonia.gsm
0.5% 4 747 pl.comp.pecet
#v-
Post by JarosÅaw SokoÅowskiGdy ja kiedyś robiłem podobne pomiary, wyszło, że kilka mocno aktywnych
grup przekształciło się w fora webowe -- w zasadzie wszyscy siekają tam
z gugla. W przypadku pozostałych jest to zjawisko marginalne, raczej
malejące, niż nasilające się.
Na to wygląda.