"Marek, puść w internet"
Uwaga, puszczam:
2006-12-30 00:53:00 | linkuj
Prezentowane statystyki powstały na podstawie adresów email podawanych przy rejestracji na stronie Kurnik.pl. Naturalnie, nie można ich traktować jako reprezentatywnych dla całej populacji polskich internautów, ale nie powinny być też zbyt rozbieżne ze stanem rzeczywistym, bowiem wielkość próbki była dosyć duża (2,8 mln. wszystkich adresów; 691 tys. z rejestracji w ostatnich 3. miesiącach).
Wcześniej podobne statystyki nie były publikowane, bo nie jest łatwo to zbadać, a liczby kont podawane przez różnych dostawców ciężko zweryfikować. Publikowano jedynie statystyki stron dostępu do poczty, nie uwzględniając korzystających z programów pocztowych.
| dostawca | udział, wszystkie |
udział, ost. 3 miesiące |
|---|---|---|
| Onet | 24,2% | 23,4% |
| WP | 24,2% | 24,3% |
| o2 | 20,5% | 19,2% |
| Interia | 12,0% | 11,1% |
| Neostrada | 1,5% | 1,5% |
| 1,4% | 1,7% | |
| Gazeta | 0,8% | 0,7% |
(min. 10 tys.)
| domena (dostawca) | liczba |
|---|---|
| @wp.pl (WP) | 678.765 |
| @o2.pl (o2) | 432.591 |
| @interia.pl (Interia) | 265.007 |
| @op.pl (Onet) | 249.139 |
| @vp.pl (Onet) | 134.935 |
| @tlen.pl (o2) | 130.194 |
| @poczta.onet.pl (Onet) | 113.508 |
| @buziaczek.pl (Onet) | 106.058 |
| @poczta.fm (Interia) | 72.177 |
| @hotmail.com | 64.738 |
| @neostrada.pl (Neostrada) | 44.809 |
| @gmail.com (Google) | 40.965 |
| @onet.eu (Onet) | 40.277 |
| @yahoo.com | 32.158 |
| @autograf.pl (Onet) | 25.437 |
| @gazeta.pl (Gazeta) | 24.195 |
| @go2.pl (o2) | 14.157 |
| @onet.pl (Onet) | 10.120 |
| razem powyższe | 2.479.230 |
| wszystkie | 2.815.500 |
Mylić się jest rzeczą ludzką (wprowadzający adresy onet.eu, wp.eu itp. zdają się o tym chyba nie pamiętać).
| błąd | liczba adresów |
|---|---|
| adres poprzedzony "www." (zawiera też "@") | 34,7 tys. |
| @02.pl (zero dwa) | 5,9 tys. |
| kropka przed "@" | 4,7 tys. |
| .pl. | 3,1 tys. |
| @onet.poczta.pl | 1,2 tys. |
| .p | 1,0 tys. |
| @gmail.pl | 0,5 tys. |
| końcówka pl ale nie .pl | 0,3 tys. |
| .pl/ | 0,3 tys. |
| .l | 0,3 tys. |
| @2o.pl | 0,1 tys. |
Inne, mniej popularne: onetpoczta.pl, poczta.onet (bez .pl), pocztafm.pl, poczta.fm.pl.
(nie każdy z adresów o powyższych cechach musi być oczywiście błędny; np. @2o.pl czy @gmail.pl mogłyby być prawidłowe, ale na 99,9% nie są)
| znak | liczba adresów |
|---|---|
| cyfra | 1370 tys. (48,7%) |
| podkreślenie | 360 tys. (12,8%) |
| kropka | 250 tys. (08,8%) |
| myślnik | 100 tys. (03,5%) |
(dopuszczają powyższych znaków jest różna u różnych dostawców)
Zobacz też:
2006-12-28 15:51:00 | linkuj
Ciebie również. Nas wszystkich!
Bomba!

2006-12-17 21:56:00 | linkuj
Jeśli ktoś szuka pomysłu na ciekawy prezent dla dziecka, polecam magnetyczne klocki geometryczne GEOMAG. Niezłe cuda można z nich konstruować.
Naturalnie, to zabawka dla dzieci ;)
Na forum Geomag jeszcze więcej konstrukcji.
2006-12-06 03:53:00 | linkuj
Któraś z kolei osoba poleciła mi nagranie wykładu Luisa von Ahna na temat Human Computation.
Dzięki wszystkim. Temat jest niewątpliwie ciekawy. Sam zapewne będę z tym eksperymentował za jakiś czasu przy okazji nowego projektu, który gotuję.
2006-12-06 03:38:00 | linkuj
Na stronach www.alexa.com można od dość dawna znaleźć darmowe statystyki witryn internetowych z całego świata. Statystyki są zbierane za pomocą ogólnodostępnego Alexa Toolbar -- rozszerzenia do przeglądarki, które pokazuje różne informacje o odwiedzanych witrynach, blokuje popupy, chroni przed phishingiem itp.
Wobec statystyk Alexa krąży wiele nieprzychylnych opinii, zwykle wynikających z ich niezrozumienia, ale jednocześnie zagraniczne publikacje internetowe często się na nie powołują. Poniżej kilka moich obserwacji i ciekawostek:
Na początek najbardziej niezwykła rzecz: toolbar Aleksy używa naprawdę sporo polskich internautów, coś około 1% (100-150 tys. osób). Rzecz niezwykła, bo według obiegowych opinii korzystają z niego przeważnie webmasterzy, a do tego toolbar nie jest dostępny w polskiej wersji.
Szacunek 1% pochodzi z pobieżnej analizy logów witryny Kurnik.pl (informacje o tym, czy ktoś używa tego toolbara, można znaleźć w zmiannej User-Agent). Kurnik ma dziennie około 200 tys. unikalnych użytkowników (cookies), którzy łączą się z jakichś 110 tys. różnych adresów IP. Wśród nich łączący się z około 1 tys. różnych adresów IP (0,9%) posiadają Alexa Toolbar. W tygodniu różnych IP rejestrowanych jest około 530 tys., a z toolbarem jest 7,5 tys. różnych (1,4%). Oczywiście na podstawie popularności Alexa Toolbar wśród kurnikowców nie można dokładnie oszacować jego popularności wśród wszystkich polskich internautów, ale błąd tego szacunku nie powinien przekraczać 10% (mniej więcej w takim stopniu statystyki przeglądarek/systemów/rozdzielczości/itp. z Kurnika pokrywają się z tymi z ranking.pl, które powstają z 14 mln. cookies tygodniowo).
O tym, że 1% populacji to duża liczba użytkowników niech świadczy fakt, że panel badania Megapanel PBI/Gemius składa się z 15-20 tys. osób (blisko dziesięc razy mniej).
Popularność Toolbara wśród polskich internautów dopiero w ostatnim czasie jakoś magicznie wzrosła (od razu mówię, że nie mam z tym nic wspólnego). Widać to po niezwykłych wzrostach udziałów liczby odsłon (patrz niżej) dla większości polskich witryn w statystykach Aleksy, chociaż nie było jakichś gigantycznych wzrostów patrząc na ich bezwzględne wartości.
Wzrost udziału odsłon Onet.pl według Aleksy wyglądał tak:

A faktycznie (na podstawie statystyk typu site-centric, czyli dużo dokładniejszych) wyglądało to tak:

Kluczem dla poprawnego rozumienia statystyk Aleksy są dwie rzeczy:
Statystyki zasięgu i liczby odsłon nie mówią o bezwględnych wartościach, ale o udziałach.
"Daily reach per million" (zasięg) mówi, ile osób na milion odwiedziło witrynę, a "Daily pageviews per million", ile (średnio) odsłon na milion na wszystkich witrynach było na danej witrynie. Gdyby zamiast na milion podawano na 100, to byłyby to procentowe udziały. Jako że udziały dotyczą całego internetu (całej populacji internautów, przynajmniej teoretycznie), większość witryn miałaby wyjątkowo małe wartości udziału (dużo zer po przecinku), gdyby podawać je procentowo, stąd dla wygody podawane są na milion.
Suche wartości udziału zasięgu i odsłon per million niewiele mówią, ale świetnie nadają do porównywania witryn między sobą. Jeśli dodatkowo znamy bezwzględne wartości zasięgu i liczby odsłon jednej z porównywanych witryn, to w prosty sposób możemy je oszacować dla pozostałych witryn.
Przykład: dla kurnik.pl w ostatnim czasie dzienny zasięg to 200 tys. unikalnych użytkowników, a dzienna liczba odsłon to około 4,2-4,5 mln. Niedawno Vagla pisał o stronie PKW, która "stopniała" pod wpływem dużego zainteresowania w dwóch dniach po wyborach. Porównując statystyki Kurnik.pl i pkw.gov.pl, widać, że zainteresowanie nie było jakieś astronomiczne (250 tys. osób), chociaż względnie wzrost na PKW może się wydawać spory:
Zasięg:

Odsłony:

Statystyki zasięgu dotyczą dziennego udziału w liczbie odwiedzających.
Co z tego wynika? Najlepiej obrazuje to klasyczny przykład grono/idg/gery:

Na powyższym wykresie grono.net ma 2-3 razy większy zasięg niż IDG i gery.pl, chociaż według badań Gemiusa IDG i gery.pl mają 2-3 krotnie większy zasięg niż grono.net. Nie ma tutaj jednak żadnej sprzeczności, bowiem w przypadku Aleksy chodzi o dzienny zasięg, a w badaniach Gemiusa -- miesięczny.
Przykład: witryna, którą regularnie dzień w dzień odwiedzałoby te same 100 tys. osób miałaby miesięczny zasięg 100 tys. osób. Z kolei witryna, którą odwiedzałoby po 10 tys. codziennie innych osób, miałaby miesięczny zasięg 30 x 10 tys. = 300 tys. Pierwsza ma dzienny zasięg 10 razy większy niż druga, chociaż miesięcznie druga ma 3 razy większy zasięg niż pierwsza.
W przypadku odsłon powyższe różnice okresów, dla których podawane są statystki, nie mają znaczenia, bowiem dzienne udziały odsłon są wprost proporcjonalne do miesięcznych.
Fantastyczną rzeczą w statystykach Aleksy jest to, że są podawane z opóźnieniem zaledwie 2-3 dni! Widać na nich np. jak strona kononowicz.pl w tydzien czasu zdobyła około 100 tys. dzienny zasięg startując od zera.
Porównując statystyki z Aleksy z tymi z badania Megapanel należy pamiętać, że dla dużych portali mogą występować spore rozbieżności wynikające z tego, że w Megapanelu następuje łączenie statystyk dla witryn portali występujących w innych domenach niż portalowa (np. na poczet o2.pl w badaniu Megapanel liczą się także statystyki kafeteria.pl, tlen.pl, pudelek.pl i dziesiątce innych).
Na Aleksie takiego łączenia nie ma, stąd np. o2.pl ma tam dużo mniej odsłon niż gazeta.pl.

Alexa nie pokazuje statystyk dla "podserwisów" (sport.onet.pl, blog.onet.pl itp.), a jedynie dla całej domeny (*.onet.pl). Są jednak podawane jakieś procentowe statystyki popularaności dla poddomen. Np. dla Onet.pl wygląda to tak:

Pomiar liczby odsłon może być obarczony dużym błędem w zależności od technologii, w jakiej wykonana jest witryna (ajax/nieajax, z ramkami/bez ramek).
AKTUALIZACJA:
BartekB napisał:
Wzrost instalacji toolbaru Alexy (faktyczny bądź tylko wynikający ze zmiany nagłówka User-Agent) wynika z tego, że serwis megaupload.com nie narzuca ograniczeń maks. ilości ściągających użytkowników na kraj, jeśli wykryje ten nagłówek. Zob. np. (na szybko znalezione): http://www.punkrock.yoyo.pl/forum/index.php?topic=749.msg5875 (osobiście też sprawdzałem -- działa, wystarczy zmienić User-Agent).
2006-11-17 03:39:00 | linkuj
W logach serwera widzę, że wiele osób regularnie dzień w dzień wchodzi na stronę www.futrega.org/stek/, by sprawdzić, czy jest coś nowego na Steku. Niektórzy robią to nawet kilka razy dziennie (najwięcej wejść notuję z adresu 85.232.225.130 -- zgadnijcie czyjego).
Dla tych wszystkich osób, które tak odwiedzają tego bloga przez WWW, chciałbym polecić wypróbowanie czegoś, co się zwie czytnikiem RSS-ów, na przykład nowego Google Readera. Dzięki takiemu wynalazkowi nie trzeba żmudnie chodzić po stronach, które się czytuje, by sprawdzić, czy i co jest nowego -- czytnik robi to za nas. Wcześniej trzeba tylko pododawać w nim linki do plików RSS-ów udostępnianych przez większość serwisów newsowych i blogi, które chce się śledzić. Później wchodzi się do czytnika i od razu na jednej stronie ma się podane na tacy wszystko, co nowego się w nich pojawiło.
Polecam akurat nowego Google Readera, bo w odróżnieniu od poprzedniej wersji i innych czytników, jakie próbowałem, jest wyjątkowo przyjemny i prosty w użyciu (poprzednia wersja była jakimś nieporozumieniem, zabawką z efektami wizualnymi).
Online'owy czytnik RSS-ów, jakim jest GR, ma też te dwie miłe cechy: a) jest dostępny z dowolnego komputera (jak webmail); b) po otwarciu nie trzeba czekać, aż pościągają się RSS-y, które śledzimy. Są od razu sprawdzone i gotowe do konsumpcji.
Niedawno w wywiadzie z prezesem Interii (już byłym), można było przeczytać, że on RSS-y raczej nie bardzo, bo co z tego, że coś mu tam wyskakuje, jak on pracuje (powiadomienia o publikacji nowych tekstów). Używanie RSS-ów w taki sposób (że coś tam wyskakuje) nie jest dobrym pomysłem, delikatnie mówiąc. Tym wszystkim, co dotychczas tak rozumieli istotę RSS-ów, też polecam Google Readera. (I dzięki Bogu, że gazeta.pl zaprzestała wydawania własnego czytnika -- Wiadomka -- który taką istotę RSS-ów popularyzował).
Jeśli ktoś paranoicznie podchodzi do spraw prywatności i nie ma ochoty dzielić się z Google jeszcze większą ilością informacji o sobie, to można spróbować Bloglines, które są dosyć podobne.
I jeszcze jedno odnośnie zgłaszania "czegoś fajnego" na Steka. Strona do zgłaszania przez długi czas nie działała poprawnie i wszystkie zgłoszenia ginęły. Jak ktoś podsyłał jakieś donosy na firmę na G., to jeszcze raz proszę.
2006-10-27 01:02:00 | linkuj
Może kogoś zainteresuje? Fragment ze strony warsztatu:
Cel: Wspólne przeczytanie i omówienie kanonu tekstów dotyczących cyberkultury. Celem jest przy tym nie tylko zapoznanie się z podstawowymi lekturami, ale przede wszystkim ustalenie co do owego kanonu należałoby zaliczyć. Każde soptkanie owocuje wspólnym (wiki) stworzeniem krótkiego pisemnego omówienia. Zbiór opisanych w ten sposób tekstów może być w przyszłości podstawą do wydania zbioru tekstów źródłowych dotyczących stycznych technologii i myśli społecznej: sposobów w jakie rozwój technik komputerowych zmienia świat kultury, rzeczywistość socjoekonomiczną, wpływa na refleksję polityczną.
Cykl: tygodniowy, w każdy poniedziałek o godz. 17.00, począwszy od 30 października, wstęp wolny
Miejsce: REDakcja Krytyki Politycznej, ul. Chmielna 26 m. 19, domofon 319, drugie piętro. Na miejscu darmowy hotspot wifi (korzystanie z laptopów w trakcie zajęć mile widziane), kawa, herbata.
Jak tak dalej pójdzie, zmienię profil na tablicę ogłoszeń o imprezach dla geeków. A jeśli już przy imprezach jesteśmy, to z przyjemnością zobaczyłbym u nas coś jak BarCamp.
2006-10-27 00:16:00 | linkuj
W najbliższy piątek planowane jest małe Firefox Party w Warszawie z okazji ukazania się Firefoksa 2. Podobne imprezy planowane są też w najbliższy weekend na całym świecie.
Jeśli ktoś ze znajomych (lub "prawie-znajomych") się wybiera, dajcie znać.
2006-10-25 00:59:00 | linkuj
Dwa szybkie linki:
2006-10-11 00:41:00 | linkuj
Gemius szuka prawnika, który chciałby się podjąć "próby rozstrzygnięcia", czy niedawne pobranie przeze mnie pewnych danych ze stron audyt.gemius.pl było "zachowaniem naruszającym obowiązujące w Polsce normy prawa karnego lub cywilnego, czy też było działaniem legalnym". Internet Standard w sensacyjnym artykule obwieścił, że to może oznaczać tylko jedno: będzie wojna!
W tekście na blogu Gemiusa jest mowa m.in. o "włamaniach na serwery z wykorzystaniem luk i błędów programistów". W prywatnej korespondencji ze mną pobranie danych jest wprost nazywane kradzieżą i porównywane do pozbawienia kogoś materialnej rzeczy pod jego nieuwagę (równie niedorzeczne, co częste porównywanie skopiowania mp3 do wyniesienie ze sklepu płyty CD). Jest też mowa o wejściu w posiadanie danych z audyt.gemius.pl bez wiedzy i zgody firmy.
Jeśli w tym tekście na blogu nie ma niedokładności i chodzi tylko o to, czy samo pobranie danych było w porządku, to chciałbym tutaj przedstawić kilka aspektów tego, co miało miejsce (chociaż niektórzy wydali już na mnie skazujące wyroki).
Pobranie danych ze stron audyt.gemius.pl nie wymagało żadnego włamywania się na serwery ani nic z tych złych rzeczy. Statystyki witryn były tam otwarcie dostępne.
Na przykład, dla Wikipedii statystyki można było zobaczyć pod poniższym adresem:
http://audyt.gemius.pl/popup_wykres.php?per=30&ids=65928
...a dla YouTube pod tym:
http://audyt.gemius.pl/popup_wykres.php?per=30&ids=70615
Oba powyższe adresy można było otworzyć klikając "legalnie" myszką po stronach audyt.gemius.pl.
Pewnego razu, kierując się ciekawością, wpisałem do przeglądarki adres, który różnił się od adresu ze statystykami Wikipedii tylko jedną cyfrą:
http://audyt.gemius.pl/popup_wykres.php?per=30&ids=65927
Moim oczom ukazały się wtedy statystyki witryny lasik.pl. Zmieniając dalej tą jedną liczbę w adresie, mogłem oglądać statystyki innych witryn. Wykorzystując wrodzony spryt, zautomatyzowałem ten proces, pisząc prosty skrypt, który pobrał strony ze statystykami dla wszystkich witryn.
Teraz, jeśli powyższe było kradzieżą (przypominam, że chodzi o samo pobranie danych; późniejsza publikacja fragmentu to zupełnie inna kwestia), to mam następującą serię pytań retorycznych:
Czy otwarcie stron na serwerze przez wpisanie ich adresu do przeglądarki (zamiast z kliknięcia myszką w link) jest już włamaniem na serwer?
Czy kradzieżą było otwarcie już jednej strony ze statystykami przez wpisanie jej adresu? Jeśli nie, czy otwarcie 3 nią było? A 13? 300? 3,3 tys.?
Czy przed pobraniem danych powinienem był starannie "obklikać" całą witrynę audyt.gemius.pl, by upewnić się (w 100%), że strony, które chcę otworzyć lub pobrać skryptem, są osiągalne z klikania myszką?
A gdybym na serwerze otwierał strony (lub pobierał dane) nieosiągalne bezpośrednio z innych stron tego serwera, ale podlinkowane na zewnętrznych witrynach (np. jak ten plik) to też byłaby to kradzież?
Czy przed pobraniem danych powinienem był się zatrzymać i głęboko zastanowić, czy może nie są one tam dostępne w wyniku błędu, awarii, niedopatrzenia lub nielegalnego umieszczenia na serwerze?
Gemius pisze, że dane zostały pobrane bez wiedzy i zgody firmy. Czy przed otwarciem jakiegoś adresu na serwerze (np. audyt.gemius.pl/scisle/tajne/) przez wpisanie go do przeglądarki powinienem zwracać się z prośbą o zgodę, bo w ten sposób mogę wejść w posiadanie jakichś danych, których nie powinienem widzieć?
???
Jeszcze jedna rzecz.
Była kiedyś bardzo podobna sytuacja, kiedy jakiś dziennikarz pobrał z serwera WWW jakiejś firmy raport finansowy przed jego publikacją, wpisując w przeglądarce zmodyfikowany adres jakiegoś starego raportu. Przed oficjalną publikacją raportu napisał na jego podstawie jakiś artykuł lub wiadomość, która źle wpłynęła na notowania firmy. Podobnie jak teraz Gemius, tamta firma też nazywała to włamaniem na serwer i kradzieżą i wytoczyła dziennikarzowi lub gazecie, dla której pracował, proces sądowy.
Czy ktoś pamięta dokładnie, co to była za sprawa i jak się skończyła?
AKTUALIZACJA:
Vagla zamieścił swój komentarz w temacie.
Wiadomo dzięki niemu, że sprawa, o którą pytałem, dotyczyła Reutersa i firmy Intentia International. Tylko jak ona się zakończyła?
2006-10-11 00:04:00 | linkuj
Statystyki rozdzielczości ekranów używanych przez internautów są są mniej więcej znane, ale jak się do nich mają faktyczne rozmiary okna przeglądarki, w której przeglądane są strony? Czy internauci z ekranami 1280x1024 i większymi przeglądają strony w oknach otwartych na cały ekran, czy może zbliżonych szerokością do 1024, pod którą optymalizuje się najczęściej układ stron?
Poniżej wyniki małego badania, jakie ostatnio przeprowadziłem w tym temacie.
Rozdzielczość ekranu o szerokości >1000 miało 85,8% badanych.
Okno przeglądarki o szerokości >1000 - 61,8% (!), a >900 - 75,4%Rozdzielczość ekranu o wysokości >700 - 85,8%
Okno przeglądarki o wysokości >600 - 38,5%, >550 - 76,9%, >500 - 83,4%Wśród osób z rozdzielczością 1024x...
okno o szerokości >1000 miało 66,4% badanych, a >900 - 85,1%Wśród osób z rozdzielczością 1280x...
okno o szerokości >1200 miało 75,1% badanych, a >1000 - 92,7%Wśród osób z rozdzielczością 1440x...
okno o szerokości >1400 miało 65,9% badanych, a >1300 - 70,0%
Wnioski? Jeden jest bezdyskusyjny: płynny układ (dostosowujący się do szerokości okna) dla stron zawierających tekst do czytania nie ma racji bytu, bo bardzo długie linie w wysokich rozdzielczościach, w których okna przeglądarek otwierane są przeważnie na całą szerokość ekranu, będą poważnie utrudniały przechodzenie wzrokiem z końca jednej linii do początku następnej. Niby oczywista sprawa, ale sam Jakob Nielsen ("usability guru") do niedawna używał takiego układu na swoich stronach.
Przy okazji tego małego badania wyszło też, że na ranking.pl musi mieć miejsce łączenie rozdzielczości w grupy (może dobrym pomysłem byłoby zaznaczenie tam tego?).
Aktualne statystyki wyglądają tam następująco:
1024x768 - 69.8%
1280x1024 - 16.4%
800x600 - 13.0%
1600x1200 - 0.6%
640x480 - 0.2%
...podczas gdy u mnie zróżnicowanie według samych tylko szerokości wyszło takie:
1024x - 64,9%
1280x - 14,4%
800x - 13,8%
1152x - 5,7%
1440x - 0,3%
960x - 0,17%
1600x - 0,12%
1400x - 0,12%
640x - 0,2%
Badanie było przeprowadzone na stronie głównej Kurnika w dniach 3-9 października 2006 na około 550 tys. unikalnych cookies z 420 tys. różnych adresów IP.
AKTUALIZACJA:
Wysokość i szerokość okna przeglądarki dotyczą tylko tego obszaru, w którym pokazywana jest zawartość przeglądanych stron.
2006-10-10 02:16:00 | linkuj
W poprzdnich odcinkach:
W dokumencie opisującym algorytm "real users" Gemius wprowadza zmianę, pisząc, że nowe założenie zostało zweryfikowane i jest OK (musi być) — tak jakby to było ogólnie prawdziwe, a nie zależało ściśle od warunków, w jakich się prowadzi badanie.
Na stronie Metodologia na audyt.gemius.pl zostaje dodana krótka informacja o przeprowadzonej analizie. Mowa w niej jednak o innym założeniu, niż wprowadzono. Gdyby nie pewne zależności, o których nie wspomniano, analiza byłaby bezużyteczna (tak tylko ta informacja jest myląca).
Szczegółowych wyników analizy - brak. Powód: dlaczego mamy ułatwiać pracę konkurencji?
Czy takie podejście do sprawy uwiarygadnia badanie i Gemiusa?
2006-09-19 13:35:00 | linkuj
Ogłoszenie z grupy dyskusyjnej CC Polska.
W dniu 23 września o godzinie 17:00 w auli VII w gmachu głównym Szkoły Głównej Handlowej (SGH) przy al. Niepodległości 162 w Warszawie odbędą się obchody piątej rocznicy powstania polskiej edycji Wikipedii.
Z tej okazji w Polsce gościć będzie założyciel światowej Wikipedii i prezes Fundacji Wikimedia, Jimmy Wales. W maju 2006 roku magazyn Time umieścił Walesa na liście myślicieli i naukowców, którzy zaliczają się do 100 najważniejszych osób kształtujących dzisiejszy świat.
Obchody rozpocznie spotkanie z Jimmym Walesem, będące drugą odsłoną cyklu "Salon Creative Commons Polska". W trakcie spotkania Jimmy Wales wygłosi wykład na temat Wikipedii i odpowie na pytania uczestników. Salony Creative Commons Polska są organizowane we współpracy z Państwowym Wydawnictwem Audiowizualnym w ramach projektu "Kultura 2.0", którego najważniejszą częścią będzie odbywająca się w dniach 6-7 grudnia 2006 roku w Pałacu Kultury i Nauki w Warszawie konferencja "Kultura 2.0. Media - sztuka - dziedzictwo. Cyfrowy wymiar przyszłości".
Głównym sponsorem imprezy jest Wikia Polska, nowopowstały oddział Wikia, firmy pozwalającej swoim użytkownikom na założenie darmowej wiki (systemu publikowania treści w internecie, na którym oparta jest Wikipedia). Jimmy Wales jest prezesem Wikia oraz nadzoruje powstanie polskiego oddziału tej firmy.
Spotkanie sponsoruje także Janmedia, agencja interaktywna działająca na rynku amerykańskim i europejskim.
2006-09-15 12:48:00 | linkuj
www.futrega.org/etc/internet_statystyki_trendy.html
Na stronie o powyższym adresie można znaleźć informacje o 100 pierwszych witrynach pod względem udziału czasu, liczby odsłon i zasięgu w czerwcu 2006, a także, co ciekawsze, 6. i 12. miesięczne trendy (kto najwięcej stracił, kto zyskał). Statystyki i trendy są na podstawie wyników badania Megapanel PBI/Gemius z czerwca 2005, grudnia 2005 i czerwca 2006. Z tego ostatniego miesiąca są nawet prawie pełne wyniki dla 4,5+ tys. witryn (z informacjami o udziale czasu, odsłonach i zasięgu witryn, bez statystyk demograficznych). Jest też krótki komentarz na temat badań.
Wcześniej tak obszerne statystyki nie były nigdzie publikowane, chociażby dlatego, że nie pozwalają na to warunki, na jakich kupuje się wyniki badania. Jakim cudem je publikuję? Otóż możne ja w całości pobrać ze strony audyt.gemius.pl, która normalnie pokazuje wyniki tylko dla 10-20 pierwszych witryn, ale jak się "dobrze poklika", tzn. zmieni jeden z parametrów do strony pokazującej wyniki, to można oglądać je także dla innych witryn (np. pod tym linkiem można znaleźć wyniki dla gogle.pl [nie google.pl], a zmieniając w adresie numer 65742 na inny, można zobaczyć dla innych).
Prawdopodobnie jest to zaniedbanie ze strony Gemiusa, że te dane są tam tak otwarcie dostępne. Zwykle zauważając coś takiego, wypada powiadomić od razu operatora witryny, a nie trąbić publicznie, i pewnie sam bym tak zrobił, gdyby nie to, że podobne sytuacje miały już miejsce nie raz. Gdybym po raz kolejny tak po prostu zwrócił uwagę na lukę, czułbym się jak darmowy kontroler jakości i antykompromitacji Gemiusa. Wcześniej zwracałem uwagi na błędy i luki, nie pisząc nawet o nich tutaj. Tym razem Gemius musi zapłacić za niedbalstwo. Publikacja częściowych wyników badania z jednego miesiąca nie jest chyba jednak wysoką ceną, bo spora ich częśc (nawet z informacjami o demografii) jest dostępna na stronach sieci reklamowych, do których należą witryny.
Z ciekawszych tendencji, jakie można zauważyć po krótkiej analizie wyników, jest spadek udziałów największych witryn -- zarówno w czasie spędzanym łącznie na witrynach, jak i udział w odsłonach (podkreślam, że chodzi o udziały, nie wartości bezwzględne -- te rosną, ale dużo wolniej niż całość).
Czołówka listy witryn o największych spadkach udziału czasu pomiędzy czerwcem 2005 a czerwcem 2006 wygląda tak:
nazwa/adres spadek spadek
udziału względnie
Onet.pl -6,45% -28,6%
Wirtualna Polska -3,75% -27,5%
INTERIA.PL -1,74% -23,0%
Idea -1,71% -98,8% (przeniesiona/orange)
Gazeta.pl -0,51% -22,1%
Allegro.pl -0,49% -7,5%
A bardziej ogólnie:
łączny udział czasu 10. pierwszych witryn (pierwszych pod względem czasu) na przestrzeni ostatniego roku wyglądał tak:
czerwiec 2005: 70.21% grudzień 2005: 69.83% czerwiec 2006: 64.87%
...a w przypadku odsłon, udział 10. pierwszych witryn był taki:
czerwiec 2005: 61.1% grudzien 2005: 59.8% czerwiec 2006: 54.2%
Mówiąc krótko, następuje rozproszenie ruchu w Sieci, a ujmując to obrazowo, tzw. długi ogon podnosi się i/lub wydłuża (pręży?). Mam nawet teorię, jakie są przyczyny tego wzrostu ruchu na mniejszych witrynach. Nie jest to niestety innowacja małych, ale coś bardziej narodowego -- cwaniackie pozycjonowanie.
Kiedyś zapytania dla popularnych haseł, które generują coraz więcej wizyt na stronach, zwracały na pierwszych pozycjach duże, znane witryny, bardzo często witryny portali. Obecnie różnej maści "spryciarze" doprowadzili do takiej sytuacji, że w Google pierwszym wynikiem nawet dla takich prostych zapytań jak "kazaa" czy "skype" nie są już strony producentów tych programów, czego można by oczekiwać, ale jakaś amatorska "stronka", z której można pobrać ww. programy. Wpisując "gry" (prawdopodobnie najczęściej wpisywane hasło z Polski) 90% witryn na pierwszych trzech stronach wyników to niepodpisane "stronki", biorące udział w programach wymiany linków, a nie, jak przed rokiem, witryny o grach portali. Malutkie witryny wymieniające się linkami dominują nawet pierwsze pozycje "komercyjnych" zapytań typu "meble", "karty kredytowe", "mieszkania", "apteka internetowa" i wielu innych.
Sytuacja prawdopodobnie szybko się nie zmieni i dalej będziemy mogli obserwować podbój cyberprzestrzeni przez małych. Na zakończenie fragment jednego komentarza z gorącej dyskusji na temat pozycjonowania z IS:
Nie rozumiem tego i co z tego, że kiwają googla, czy to jakiś grzech, skoro się da?
AKTUALIZACJA:
Przeglądanie wykresów witryn spoza pierwszej 20 zostało już zablokowane.
Jedna z osób zauważyła, że to nie jest pierwszy raz, kiedy statystyki tak dużej liczby witryn są publicznie dostępne, bo pierwsze wyniki Megapanelu w 2004 też były tak dostępne.
Niektóre osoby mają poważne problemy z odróżnieniem "cwaniackiego pozycjonowania" od "pozycjonowania". W pozycjonowaniu nie ma nic złego. W cwaniackim pozycjonowaniu, do którego można zaliczyć programy automatycznej wymiany linków czy ukryte treści na stronach -- jest.
Na audyt.gemius.pl liczbowe identyfikatory witryn zostały zamienione na coś, co wygląda na sumy md5. Istnieje pewne prawdopodobieństwo, że nie są one losowe, ale związane z dawnymi identyfikatorami. Onet.pl, który miał identyfikator liczbowy 202, jest teraz identyfikowany przez ciąg 719361217294f9bc825302b89aba5c20. Konkurs! Dla osoby, która znajdzie zależność, według jakiej powstają te sumy md5, stawiam wiadro czekolady (pracownicy Gemiusa nie mogą brać udziału w tym konkursie).
AKTUALIZACJA:
Gemius szuka prawnika, będzie wojna
2006-09-06 22:23:00 | linkuj
Kilka dni temu przestała istnieć strona gogle.pl (jedno "o"). A była to niezwykła strona, bo jedyne co robiła, to przekierowywała zapytania zbłakanych internautów do wyszukiwarki Google. I nie byłoby w tym nawet nic nadzwyczajnego, gdyby nie statystyki, jakie notowała: od co najmniej dwóch lat co miesiąc miała około 1 mln. odwiedzających i kilkanaście milionów odsłon, a w styczniu tego roku nawet 30 mln. odsłon (według badania Megapanel PBI/Gemius).
Obecnie wejście gogle.pl od razu przekierowuje do strony www.google.pl
Poniżej na pamiątkę zrzut ekranu gogle.pl, jaki udało mi się wygrzebać z archive.org.
2006-09-03 16:21:00 | linkuj
Dwa miesiące temu pisałem o znalezieniu błędu w założeniach do teorii badania Megapanel PBI/Gemius. Gemius zmienił w tamtym czasie te założenia, dopisując m.in. jedno niezbędne, co do którego jednak niewiele wiadomo. Założenie zostało dopisane z adnotacją, że stanowi przedmiot badań.
Marcin Pery z Gemiusa przesłał mi wczoraj informację, że po dwóch miesiącach nie wiadomo nic nowego i nie widać prostego sposobu, w jaki można byłoby cokolwiek powiedzieć o spełnialności tego nowego założenia.
To miłe, że zostałem poinformowany, ale hej, panowie, czy w tej sprawie chodzi tylko o to, żebym się odczepił i Gemius mógł dalej kręcić biznes as usual? Wydaje mi się, że wyjaśnienie i informowanie o sprawie należy się nie tylko mi.
Po przeprowadzonych przez nas analizach i usilnych probach znalezienia roznych metod zweryfikowania ponizszej hipotezy zostala nam jedynie nastepujaca mozliwosc: proba weryfikacji niniejszej hipotezy przy wykorzystaniu danych panelowych.
Nie znalezlismy innej metody, ktora umozliwialaby powiedzenie czegokolwiek sensownego o niemonitorowanych przez nas witrynach. Oczywiscie pamietam jakie masz zdanie na temat wiarygodnosci danych pochodzacych z panelu, jednakze naprawde nie widzimy innych rozsadnych mozliwosci. Dlatego rozpoczelismy jakis czas temu analize danych panelowych i jak tylko beda dostepne wyniki analiz, udostepnimy je.
Mała uwaga: stawianie problemu w ten sposób, jakby chodziło o dowiedzenie się "czegoś sensownego o niemonitorowanych witrynach" jest odwracaniem kota ogonem.
AKTUALIZACJA:
Zobacz: Gemius story, odcinek 327 - "Analiza"
2006-09-01 16:26:00 | linkuj
Jakie tytuły noszą artykuły na temat ostatniego badania Gemiusa o reklamie w internecie (w którym 69% internautów uznało, że jest irytująca, a 53,8% że nudna)?
Internet Standard: 34% internautów w Polsce uznaje reklamę internetową za skuteczną
Gemius: Reklama w internecie – irytująca i skuteczna.
Poniżej przykład, że reklama w internecie wcale nie musi być nudna:
(zrzut ekranu autentyczny; billboard u góry reklamuje to samo, co 5 innych form na stronie -- znajdź wszystkie)
Zobacz też: Czy reklamy przeszkadzają odbiorcom?
AKTUALIZACJA:
Tytuły w innych miejscach:
Onet.pl (za PAP): Gemius: Reklama w Internecie jest skuteczna
Bankier.pl: Reklama w internecie – irytująca i skuteczna
2006-08-23 20:24:00 | linkuj
Muszę się dowiedzieć, co takiego jest w tym Allegro, że jest częściej poszukiwane niż "sex" na Google (Alek zastanawia się, dlaczego "sex" a nie "seks"? Dobre pytanie!).
Mój "pierwszy raz" na Allegro miał już co prawda miejsce (dwa miesiące tematu), ale jakoś nie doznałem wtedy jakichś ekscytacji. Może coś źle robiłem? Nie wiem. Próbuję zatem jeszcze raz.
Do pozbycia się mam trzy książki, które mogą zainteresować czytelników Steka. Prawdopodobnie zainteresowanie będzie tak małe, że będzie można je wziąć okazyjnie za parę złotych (normalnie kosztują po $10-20). Zapraszam!
The Search: How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture, John Battelle
Dosyć nowa książka Johna Battelle o rynku wyszukiwarek, głównie o Google, zjawiskach związanych z wyszukiwarkami itp.
Informacje o książce na Amazon.com
Strona aukcji
The Age of Spiritual Machines, Ray Kurzweil
Fantazje Kurzweila na temat sztucznej inteligencji i ogólnie przyszłości.
Informacje o książce na Amazon.com
Strona aukcji
The Humane Interface: New Directions for Designing Interactive Systems, Jef Raskin
Klasyka użyteczności.
Informacje o książce na Amazon.com
Strona aukcji
(Dwie pierwsze książki są w twardej okładce, jeśli to ma znaczenie).
I jeszcze jedno ogłoszenie: tamten mały eksperyment z przekazywaniem książek o tematyce rozwoju osobistego ustał w miejscu, bo nie ma chętnych na książkę od osoby, która otrzymała The Magic of Thinking Big (założyła bloga dopiero po otrzymaniu książki, więc raczej nie ma jeszcze zbyt wielu czytelników, żeby było jakieś zainteresowanie). Do wzięcia jest Super Brain Power: 6 Keys to Unlocking Your Hidden Genius. Może ktoś się skusi?
2006-08-22 22:43:00 | linkuj
Dawno nie widziałem tak dobrego pomysłu. Napiprojekt to prosty program do ściągania napisów do filmów. Wskazujesz plik na dysku, klikasz znajdź i dopasuj napisy i odpowiedni plik z napisami po chwili pojawia się w katalogu z filmem. Bomba!

(znalezione przez wykop.pl)
2006-08-21 23:35:00 | linkuj
Może nie lepsze, a częściej poszukiwane na Google. I może nie już, a lada dzień
(według Google Trends).
Ciekawe, że liczba zapytań o "sex" w Google z czasem praktycznie nie rośnie, chociaż wydawałoby się, że jeśli przybywa internautów, to powinna też rosnąć liczba zapytań o to.
2006-08-21 23:08:00 | linkuj
Popracować nad angielskim. Serio.
Próba zawojowania na międzynarodowym rynku z notkami prasowymi pisanymi łamanym angielskim raczej się nie uda. Zwłaszcza teraz, kiedy konkurencyjne statystyki Google Analytics są już dostępne bez zaproszeń, bez ograniczeń na liczbę odsłon, w pełni za darmo, w wielu językach itd.
Fragment ostatniej notki prasowej z Gemius.com:
Place of connection influence on the watched websites
Have you ever thought how the Internet users spend their time in the Internet. Which sites they visit most often according to the place of connection to the Internet? The results are really interesting.
[...]
In May analysis of the ranking shows that the highest participation of the Internet users who use the Internet at work is on the sites dedicated to biggest portals and news, like delfi.lt, omni.lt or lrytas.lt. So as we can see employees are not wasting their time in the Internet but read news to be updated. At homes Internet users are relaxing and mostly visit chats, games and blogs sites. On first place according to Audience composition was point.lt followed by blogas.lt and games.lt.
2006-08-20 19:26:00 | linkuj
Uzupełniając Słownik alternatywny o braki wśród polskich nazwisk, poszukiwałem jakiejś obszerniejszej listy najpopularniejszych nazwisk w Polsce, ale z trudem udawało mi się znaleźć coś większego niż TOP 50-100 (szukając w Sieci).
Znalazłem jednak stronę Serwisu heraldycznego ODWP, która pokazuje liczbę osób o podanym nazwisku, jakie żyły na początku lat 90. w Polsce (według bazy PESEL, z której pochodzą dane). Na stronie można nawet zobaczyć, w jakich województwach, ilu z nich mieszkało.
Nie było tam jednak listy nazwisk według popularności, ale mogłem ją wygenerować przy pomocy prostego skryptu. Gdyby ktoś kiedyś potrzebował takiej listy, to udostępniam do pobrania:
Najpopularniejsze nazwiska w Polsce, 20 tys. pozycji (250KB)
TOP 20 wygląda następująco:
220217 Nowak 131940 Kowalski 104418 Wiśniewski 92945 Dąbrowski 89366 Lewandowski 88932 Wójcik 87935 Kamiński 87690 Kowalczyk 85988 Zieliński 84527 Szymański 81390 Woźniak 72368 Kozłowski 65942 Jankowski 63519 Wojciechowski 62629 Kwiatkowski 59403 Kaczmarek 59069 Mazur 58246 Krawczyk 57934 Piotrowski 54652 Grabowski
2006-08-19 16:50:00 | linkuj
Badanie na temat tego, gdzie najbardziej przeszkadzają ludziom reklamy. Na pierwszym miejscu zdecydowanie telewizja, na drugim internet.
(zdjęcie z tygodnika Wprost)
2006-08-17 15:44:00 | linkuj
Google Labs, Adobe Labs, Digg Labs, Mozilla Labs ...
???ComArch otworzył centrum badawczo-rozwojowe w Warszawie
Google uruchomi w Polsce centrum badawcze
Onet otwiera centrum badawczo-rozwojowe
Grupa Prokomu powoła do życia Centrum Badawczo-Rozwojowe (CBR)
Swistak Lab (beta) - kierunek Web 2.0!
Kurnik.pl planuje Eko-Lab Badawczo-Rozwojowy w Koziej Wólce
PS. Też a propos unijnych funduszy - Wojciech Cellary w Gaziecie:
Wojciech Cellary: Do informatyzowania kraju można mieć dwa podejścia. Pierwsze jest takie: mamy, powiedzmy, miliard euro i możemy za to zafundować sobie systemy informatyczne w paru ministerstwach. Drugie mówi: rozbijmy tę pulę na 100 tys. małych projektów i spróbujmy za te pieniądze zrobić coś na skalę ogólnopolską, by społeczeństwo stało się aktywniejsze i lepiej pojęło, o co chodzi w informatyzacji i elektronicznej gospodarce.
Za tym pierwszym podejściem stoi m.in. lobbing wielkiego przemysłu informatycznego, który dzięki temu może liczyć na wielkie kontrakty. Dlatego ilekroć ktoś z decydentów mówi o informatyzacji, ma na myśli właśnie ten model. Za drugą strategią, która leży przede wszystkim w interesie dobrze wykształconej, przedsiębiorczej młodzieży, nikt nie lobbuje, dlatego takie idee nie przebijają się do rządzących. A przecież informatyzacja państwa to przede wszystkim informatyzacja społeczeństwa.
2006-08-14 21:57:00 | linkuj
50 najczęściej wpisywanych adresów do wyszukiwarki na Onecie:
(lista powstała z kombinacji najczęściej wpisywanych zwrotów zawierających www lub .pl)
www.google.pl 1123 wp.pl 824 www.wp.pl 812 www.interia.pl 769 www.gry.pl 740 www.pkobp.pl 688 interia.pl 637 www.orange.pl 484 www.era.pl 471 google.pl 458 o2.pl 432 www.gogle.pl 402 www.o2.pl 397 www.allegro.pl 387 www.gratka.pl 362 gazeta.pl 314 www.kurnik.pl 303 serwisy onet.pl 300 (!?) www.sexplaneta.pl 290 gry.pl 279 www.gazeta.pl 253 www.jetix.pl 250 www.bph.pl 248 www.ilove.pl 238 www.alegro.pl 215 www.cartoonnetwork.pl 215 www.google 215 (!) drzwi antywlamaniowe domar-gerda.waw.pl 212 (reklama?) www.mobile.de 195 gratka.pl 191 www.maxior.pl 184 tlen.p 184 (!?) ilove.pl 176 www.ing.pl 175 www.tp.pl 173 allegro.pl 172 www.lotto.pl 165 orange.pl 157 fotka.pl 153 pkobp.pl 148 www.fotka.pl 146 www.bzwbk.pl 142 www.ikea.pl 137 www.plusgsm.pl 133 www.tlen.pl 131 www.smog.pl 127 www interia pl 120 www.itvp.pl 120 http://www.interia.pl 116 (!) www.tvp.pl/tg 114
A poniżej 10 najczęściej wpisywanych do Google spośród powyższych 50
(wykresy z Google Trends):


Wpisywanie adresów do wyszukiwarek (zamiast do paska adresu przeglądarki) to jedno ze zjawisk, budzących zdziwienie u osob, które wiedzą, jaka jest różnica między polem wyszukiwarki a polem adresu.
Inne ciekawe zjawiska tego typu, o których wiem:
2006-08-09 23:58:00 | linkuj
Na stronach serwisu aukcje.org można znaleźć wywiad z Rafałem Agnieszczakiem -- czarodziejem od fotka.pl, Swistaka, Finansowo.pl i kilku pomniejszych serwisów (fotka.pl to hit ostatnich czasów pod względem popularności mierzonej liczbą odsłon -- ma ich więcej niż np. cała gazeta.pl).
Wywiad zaczyna się kiepsko, ale później jest ciekawiej.
J.S.: Twoje zdanie o serwisach web2.0?
R.A.: Dużo szumu, dużo zapału, mało dobrych pomysłów i małe szanse na sukces. To tak w skrócie. Większość to bezmyślne kalki zachodnich projektów skierowane do wąskiego grona osób. Jestem w stanie pogrążyć konkretną argumentacją każdy tego typu pomysł powstały w ostatnim półroczu. Mój ulubiony przykład to Wykop.pl, projekt porażający inwencją począwszy od nazwy (swobodne tłumaczenie słowa „digg"). W 6 miesięcy zarejestrował niewiele ponad 2000 użytkowników, a każdy opublikowany tam wpis generuje maksymalnie kilkaset odwiedzin na „wykopanej” stronie. Aby ten projekt można było uznać za sukces. brakuje mu co najmniej dwóch zer w prezentowanych liczbach. To jest jak najbardziej osiągalne. Dla porównania: Fotka.pl taką liczbę użytkowników rejestruje w kilka godzin, a atrakcyjnie podany link na stronie głównej potrafi wygenerować ok. 50-60tys. odwiedzin w ciągu doby.
Drugi przykład to Olo.pl. Chłopaki poczytali trochę zachodnich blogów, nauczyli się paru modnych słów i szumnie obwieścili światu, że oto nadchodzi rewolucja. Na tym się niestety skończyło. Żenujący przykład na to, jak niewiele trzeba, aby zainteresować „branżę” pomysłem oraz jak wiele trzeba, aby na czczych marzeniach się nie skończyło.
W chwili obecnej wszystkie serwisy łeb-dwa-zero to dla mnie po prostu zabawka dla autorów i ich kolegów. Ot, tyle.
Na koniec pozytywny przykład, żeby nie było iż potrafię tylko krytykować: Idziemy.net. Pomysł skopiowany z Zachodu, popularność mizerna, ale przynajmniej wykonanie nie kłuje w oczy. Zabrakło społeczności wokół serwisu, bez tego żadna koncepcja 2.0 nie ma szans na powodzenie. Wierzę jednak, że przy odpowiednio dużym wsparciu promocyjnym serwis odżyje - w tego typu projektach widzę duży potencjał (dokładniej w styku „reala” i „wirtuala").
AKTUALIZACJA:
Rafał Agnieszczak: dżery.pl bedzie sie procesowal za wywiad na aukcje.org - zabawa przednia sie zapowiada.
2006-08-06 23:48:00 | linkuj
Ile czasu może zajmować polskim portalom reakcja na zgłoszenie luki w systemie pocztowym -- luki typu XSS, która może być wykorzystywana do wykradania kont użytkowników, czytania ich poczty itp., jeśli tylko otwarzą odpowiednio spreparowany list (nie załącznik)?
Okazuje się, że pół roku to zdecydowanie za mało. Dziury, o których wspominałem ponad pół roku temu, nadal występują w dwóch polskich portalach (obydwa potwierdziły przyjęcie zgłoszenia o luce).
2006-07-28 15:17:00 | linkuj
Tworca django (framework do pythona) w wystąpieniu w siedzibie Google wspomina o polskim grono.net, jako jednym z serwisów używających django, po czym na sali rozlega się śmiech.
Dlaczego? Zobacz.
(powyższy link wykorzystuje nową możliwość linkowana do określonego miejsca w nagraniu video; żeby nagranie rozpoczynało się od np. 10 minuty, 15 sekundy, do adresu nagrania trzeba dokleić coś takiego: #10m15s)
2006-07-20 14:09:00 | linkuj
Kilka mądrych rzeczy do zapamiętania z książki Dawida Schwartza The Magic of Thinking Big (mogą być niezrozumiałe dla osób, które nie czytały książki, ale może trochę się przydadzą?).
Wierzyć, że się uda i będzie dobrze
Uważać na wymówkarstwo (excusitis)
Pracować nad pewnością siebie i śmiałością, walczyć ze strachem
Myśleć perspektywicznie, w sposób wartościowy
Myśleć i marzyć tworczo
Tworzyć sobie otoczenie pierwszej klasy
Dbać o postawę, nastawienie
Dbać o podejście do ludzi
Działać!
Określać cele, by iść na przód
Linki na temat:
A teraz mały eksperyment blogowo-książkowo-wirusowy.
The Magic of Thinking Big, David Schwartz
Oddam tę książkę w prezencie (z darmową wysyłką) pierwszej osobie, która się do mnie zgłosi i obieca, że w takim sam sposób odda komuś jakąś własną książkę poruszającą tematykę rozwoju osobistego, produktywności, zarządzania czasem lub motywacji. W taki sam sposób znaczy przez ogłoszenie na swoim blogu o dokładnie takiej treści, jak ta, którą się teraz czyta, zaczynającą się od słów "Oddam tę książkę...", poprzedzoną tytułem książki i jej autorem.
(już nieaktualne)
Ogłoszenie aktualne, dopóki nie pojawi się tutaj informacja, że nieaktualne.
Zgłoszenia mailem.
Linki na temat:
AKTUALIZACJA:
Osoba, która otrzymała książkę, ma chyba problem ze znalezieniem chętnego na swoją (dopiero co założyła bloga, więc nie ma co się dziwić). Zamieszczam link do niej, żeby pobudzić krążenie.
2006-07-18 22:01:00 | linkuj
Uwaga, na wstępie bardzo ważne ogłoszenie:
Nie zależy mi już na kompromitacji Gemiusa ani PBI.
Gemius wycofał się niedawno z publikowania bezużytecznego rankingu zasięgów wyszukiwarek, w którym jego klienci wypadali dużo lepiej niż w tym, który był uprzednio głównym na ranking.pl. Nieśmiało przyznano też, że sposób, w jaki był on wprowadzony, pozostawiał wiele do życzenia, chociaż początkowo twierdzono inaczej.
Gemiusa traktuję teraz jako jedną z wielu "typowych firm". Zacząłem z nimi nawet znowu rozmawiać (naprawdę), ale nie oznacza to jednak, że nie mam już zastrzeżeń co do ich działalności -- nadal aktualne pozostają niektóre z uwag, jakie kierowałem odnośnie prowadzonych badań, w tym także niepublikowane.
Do rzeczy.
Zupełnie przypadkiem (słowo honoru) znalazłem błąd w algorytmie, który stanowi podstawę metodologii badania Megapanel PBI/Gemius. Konkretnie chodzi o założenia do algorytmu, według którego obliczane są względne zasięgi witryn, które później używa się do wyznaczania liczby tzw. "real users" (osób) odwiedzających poszczególne witryny.
Okazuje się, że wyznaczana tym algorytmem szacunkowa liczba cookies, jaka by występowała wśród wszystkich użytkowników w polskim internecie, gdyby nie występowało kasowanie cookies (ta liczba jest właśnie używana do wyznaczania względnych zasięgów), może być zawyżona lub, co bardziej prawdopodobne, zaniżona przy pełnym spełnianiu obecnych założeń. Jeśli będzie zaniżona, to oczywiście względne zasięgi poszczególnych witryn będą odpowiednio większe i tym samym większe będą szacunkowe liczby osób je odwiedzających.
Opis algorytmu i jego założenia można od niedawna (pół roku?) znaleźć w dokumencie Metoda estymacji rzeczywistej liczby użytkowników (real users) witryn internetowych, dostępnym ze strony ogólnego opisu metodologii badania Megapanel PBI/Gemius (aktualna wersja pliku datowana na 2 lutego 2006).
Od razu mówię, że nie jest tak, że to tylko opis tam przedstawiony jest błędny, ani tak, że tylko mi się tak wydaje, że coś jest źle. Na spotkaniu z szefami Gemiusa potwierdzono, że opis jest prawidłowy, zarówno w dokumencie, jak i moim jego rozumieniu, a po przedstawieniu "odkrycia" przyznano, że obecne założenia są faktycznie błędne i zostaną zmienione (może dobrym pomysłem byłby publiczny komentarz w tej sprawie?).
Nie będę tutaj jednak opisywał szczegółów, na czym polega błędność tych założeń, bo podobno mało kto rozumie działanie tego algorytmu. Przedstawię tylko kilka obserwacji związanych ze znalezieniem błędu i co z tego wynika.
Na wstępie dobra wiadomość (na uspokojenie): mimo błędnych założeń algorytm wyznaczania liczby "real users" może dawać "poprawne" wyniki, jeśli prawidłowe założenie, które jest potrzebne dla poprawności algorytmu, będzie prawdziwe.
Założenie, którego brakuje, brzmi mniej więcej tak: stosunek liczby odsłon wykonywanych łącznie przez osoby, które nie skasowały cookie w badanym miesiącu, na monitorowanych witrynach do liczby wszystkich odsłon wszystkich użytkowników na monitorowanych witrynach jest taki sam, jak stosunek liczby odsłon wykonywanych przez te osoby na wszystkich witrynach (monitorowanych i niemonitorowanych) do liczby wszystkich odsłon w polskim internecie.
Czy takie założenie jest prawdziwe przy monitorowaniu tylu odsłon, ile monitoruje Gemius (kiedyś było to podobno 50% wszystkich odsłon w polskim internecie)? Trudno powiedzieć. Tym bardziej, że Gemius nie ma danych o odsłonach wykonywanych na niemonitorowanych witrynach poza tymi skrzywionymi, wykonywanymi przez grupkę osób biorącą udział w badaniu panelowym.
Gdyby okazało się, że twarde dane (?) nie potwierdzają sensowności potrzebnego założenia, to mielibyśmy najprostsze wyjaśnienie, skąd bierze się unikalność metodologii badania Megapanel na skalę światową, jak dumnie jest to często podkreślane. Trzeba tutaj przyznać, że nie można tego wykluczać, bo założenie jest w zasadzie dobrane "pod algorytm" (musi być takie założenie, żeby algorytm miał sens), a nie na odwrót -- robimy na wstępie pewne założenia wynikające z obserwacji, badań itp., a dopiero z nimi konstruujemy algorytm.
Interesujące jest to, że Gemius od razu na spotkaniu, na którym zapoznał się po raz pierwszy z problemem, zapowiedział dopisanie prawidłowego założenia jeszcze na początku tego tygodnia (faktycznie potrzebne jest zastąpienie jednego założenia z obecnych, tego mówiącego o monitorowaniu 99.9% użytkowników, a nie dopisanie nowego), chociaż to nie jest wcale takie oczywiste, czy to nowe założenie jest spełniane -- na pewno jest jednak konieczne, żeby algorytm i cała metodologia miały sens.
Na pytanie, dlaczego panowie z Gemiusa sądzą, że to założenie miałoby być prawdziwe, padła, autentycznie, odpowiedź: "bo nie ma powodów, by sądzić, że nie jest prawdziwe". Stosując tego typu rozumowanie, można powiedzieć, że Gemius daje łapówki, i to sporo, bo nie ma powodów, by sądzić, że tak nie jest.
(Marcin: musisz bardziej uważać na to, co przy mnie mówisz).
Zdumiewające jest to, że błędne założenia do algorytmu nie zostały zauważone przez kilka lat od uruchomienia badania Megapanel PBI/Gemius, nawet mimo tego, że metodologia z algorytmem były wcześniej prezentowane na różnych międzynarodowych konferencjach branżowych, zaakceptowane przez radę badania PBI, jak i zagraniczne stowarzyszenia.
Gdyby opis algorytmu nie pojawił się kilka miesięcy temu na stronach Gemiusa (po usilnych prośbach), błąd pozostawałby zapewne dalej niezauważony.
Gemius mimo wszystko pozostaje dalej niechętny publikowaniu szczegółów stosowanej metodologii pod pretekstem, podając jako powód chęć zachowania przewagi konkurencyjnej nad innymi firmami badawczymi. Z tego powodu nie można już m.in. znaleźć opisu nawet tego ww. algorytmu na angielskich stronach Gemiusa, chociaż kiedyś był tam dostępny.
AKTUALIZACJA:
Zgodnie z zapowiedziami założenia do algorytmu zostały zmienione (z adnotacją, że są obecnie przedmiotem badań).
AKTUALIZACJA:
Po dwóch miesiącach analiz nie wiadomo nic nowego w tej sprawie.
2006-06-27 11:51:00 | linkuj
Panie Marku, czemu u Pana nie ma możliwości dawania komentarzy? Proponowałbym Panu Wordpressa, wygląd to kwestia szablonu (może miec Pan nawet taki sam jak teraz), a miałby Pan dodatkowe funkcjonalności, takie jak komentarze, czy statystyki(osobiście polecam SlimStats).
Rafał
Powody są bardzo proste: z komentarzami wiążą się różne drobne problemy, a ja nie lubię problemów. Mam ich już zbyt wiele, żeby niepotrzebnie ryzykować kolejnych.
Chodzi m.in. o takie sprawy, jak:
Ten ostatni przypadek miał jakiś czas temu miejsce w komentarzach słownika alternatywnego, kiedy pewnych dwóch gości znalazło sobie nowy cel w życiu -- wysyłanie w kółko komentarzy składających się z dwóch brzydkich słów powtórzonych po 100+ razy. Po skasowaniu takich komentarzy lub zepchnięciu na dalsze pozycje przez komentarze innych użytkowników, dodawali je na nowo. I tak bez przerwy przez kilka dni.
Rozwiązanie problemu wymagało chytrej modyfikacji w systemie komentarzy, specjalnie pod tych złośliwców. Nadawane były im stałe cookie i wszystkie komentarze wysyłane z tymi cookie były automatycznie ukrywane dla wszystkich użytkowników poza tymi naznaczonymi. Odnosili wtedy wrażenie, że ich komentarze są cały czas normalnie widoczne, a faktycznie były od razu kasowane.
Ale!
Jeśli ktoś ma coś mądrego do dodania do treści publikowanych na Steku, to zawsze można to przesłać do mnie mailem albo korzystając z odpowiedniego formularza. Jeśli coś jest godne publikacji (w mojej subiektywnej ocenie), to zostanie dodane do treści. Jeśli komuś taki filtr się nie podoba, to -- jeszcze lepiej -- można opublikować uwagi na własnym blogu. Każdy ma głos!
AKTUALIZACJA:
Bellois pyta, służąc jednocześnie przykładem do powyższego:
Witam. Rozumiem niechęć do komentarzy, choć sam je bardzo lubię :) Mam jednak inną propozycję - może warto dodać tylko możliwość wysyłania trackbacków? To ułatwiłoby ewentualną polemikę, a zarazem nie rodziłoby problemów. Pozdrawiam.
Z "trackbackami" wiążą się niestety te same problemy, co z komentarzami.
Poza tym Trackback is dead.
AKTUALIZACJA:
Ja myślę, że po prostu boisz się krytyki. Psychologia ;) Bo trzeba nieustannie moderować, sprawdzać, czuwać. Nie trzeba. Wystarczy uświadomić sobie, że im więcej krytyki, tym jest się fajniejszym ;) A poważnie mówiąc uznać krytykę za coś oczywistego, co przecież w realu też ma miejsce. I nie bać się bronić swojego zdania. Co do spamu to zawsze można wprowadzić moderowanie każdego komentarza - to też jakieś wyjście. Rozumiem, że każdy jest szefem na swoim blogu, sama chętnie korzystam z tego hasła u siebie, ale wolę, żeby komentowali. Chociaż... przyznam, że jak wyjadę na wakacje to usunę formularz do komentowania :)
A! Nie zgadzam się na publikację w/w treści na Twoim blogu :)
No dobra, boję się krytyki, niech będzie.
I mała uwaga odnośnie zakazu publikowania w/w treści: nie można niczego zakazywać/narzucać/itp. po fakcie. Ja mam zasadę, że nie życzę sobie otrzymywać informacji, których nie mógłbym przekazywać dalej (np. publikując na blogu), jeśli uważam to za stosowane. Jeśli komuś się taka zasada nie podoba, to albo nie powinien pisać wcale, albo powinien zapytać wcześniej, czy zgadzam się na otrzymanie czegoś, co miałbym dalej nie przekazywać.
2006-06-25 00:02:00 | linkuj
Kurnikowi stuknęło dzisiaj 5 lat! Z tej okazji została przygotowana specjalna strona urodzinowa, przedstawiająca pokrótce historię serwisu (geek-o-blogerów może na niej zainteresować zwłaszcza historia zmian strony głównej), i 1005 urodzinowych koszulek.
Marzę sobie, że uda się je opchnąć w jeden dzień (sprzedaż zaczyna się w poniedziałek). Trzymajcie kciuki.
AKTUALIZACJA:
Prawie się udało. Tysiąc sztuk poszło w nieco ponad dobę, a później przez dwa dni jeszcze dodatkowo 600, które będzie "doprodukowane".
Poniżej jedna z fotek z galerii koszulkowo-urodzinowej.

2006-06-15 23:36:00 | linkuj
Kilka słów uzupełnienia do ostatnich publikacji o chamsko-cwaniackich metodach pozycjonowania witryny nokaut.pl:
W tekście o ukrytych linkach i farmach padały nazwy firm i witryn, których powiązania między sobą mogły nie być dla wszystkich oczywiste:
Bankier, Travelplanet i Nokaut są ze sobą powiązane kapitałowo dwoma funduszami venture capital -- polskim MCI i niemieckim bmp AG; aero.pl i hotele24 to witryny związane z Travelplanet; pozycjonowaniem Bankiera i Travelplanet zajmowały się osoby z nokaut.pl, świadcząc te usługi pod marką One Vision, o czym swego czasu informowały na blogu nokaut.pl:
Nokaut to nie tylko porównywarka cen nokaut.pl, to także usługi konsultingowe, które mają na celu zwiększenie sprzedaży online. Świadczymy je pod marką One Vision.
Przez ostatni rok, jeszcze zanim powstała spółka Nokaut, kilka osób z naszego obecnego zespołu z sukcesem pomagało m.in serwisom takim jak Travelplanet.pl czy Bankier.pl
Bankier.pl wyrzucił Nokaut z listy swoich partnerów, a na powiązanej z Bankierem witrynie twoja-firma.pl wyrzucono zakamuflowany link do nokaut.pl
Śmieciowe strony (filmy-divx.pl, tanie-linie-kolejowe.pl) i farmy linków (szukane.pl, linie-lotnicze.com), o których była mowa w poprzednich publikacjach, są wszystkie hostowane na tym samym wirtualnym serwerze, co nokaut.pl, o adresie 62.129.231.241 (www.nokaut.pl jest na serwerze obok, z końcówką .240.234); domyślną stroną dla tego serwera (po wpisaniu w przeglądarce adresu 62.129.231.241) jest strona firmy One Vision.
Uzupełnienie: ktoś z czytelników dodaje, że "każdy serwer wirtualny w home.pl dostaje _WŁASNY_ adres IP. Wobec czego kupujemy konto, a wszystkie nasze serwisy stoją na jednym IP, które zostało nam przydzielone. Żadna obca strona nie może znaleźć się na tym IP."
Cała witryna firmy One Vision, z której usług korzystają (korzystały?) giełdowe (!) spółki Bankier i Travelplanet, wygląda następująco:

(brak podstawowych informacji o siedzibie firmy, telefonach itp.)
W tym samym archiwum można zobaczyć, że linie-lotnicze.com były do marca 2005 sygnowane przez firmę One Vision

-
Na blogu nokaut.pl, w odpowiedzi (ciągle zmieniającej swoją treść) na zarzuty, nokaut.pl dalej infantylnie tłumaczy się, że nie stosuje żadnych złych metod pozycjonowania.
Michał Jaskólski, członek zarządu Nokaut.pl, przesłał mi też w czwartek list, w którym grozi sądem, jeśli w ciągu 24 godzin od jego otrzymania nie usunę z bloga "nieprawdziwych informacji" i nie opublikuję obraźliwego dla inteligencji "sprostowania". Treść listu:
Witam,
w związku z umieszczeniem w blogu http://www.futrega.org/stek/ niezgodnych z prawdą informacji dotyczących Nokaut Sp. z o.o., które godzą w jej dobre imię, działając na podstawie art. 24 kodeksu cywilnego żądam natychmiastowego usunięcia niezgodnych z prawdą informacji z artykułów na stronach: http://www.futrega.org/stek/2006/06/05/nokaut_nokaut_pl_porownywarka_cen.html i http://www.futrega.org/stek/2006/06/07/nokaut_pl_seo.html i zamieszczenia sprostowania o treści wskazanej poniżej na głównej stronie http://www.futrega.org/stek/ i stronach: http://www.futrega.org/stek/2006/06/05/nokaut_nokaut_pl_porownywarka_cen.html i http://www.futrega.org/stek/2006/06/07/nokaut_pl_seo.html.
W przypadku nie zastosowania się do powyższego żądania w ciągu 24 godzin od chwili otrzymania niniejszej wiadomości, będziemy zmuszeni przekazać sprawę naszym prawnikom i skierować ją na drogę sądową.
Z poważaniem,
Michał Jaskólski
Członek zarządu Nokaut Sp. z o.o.Treść sprostowania:
W blogu dostępnym pod adresem http://www.futrega.org/stek/ zostały opublikowane nieprawdziwe informacje dotyczące działalności Nokaut Sp. z o.o.
Działania prowadzone przez Nokaut Sp. z o.o. do pozycjonowania serwisu nokaut.pl oraz serwisów naszych partnerów są zgodne z rekomendacjami twórców wyszukiwarek internetowych.
W szczególności nie używamy, ani nie rekomendujemy używania ukrytych linków oraz słów kluczowych nie mających związku z zawartością strony.
Spółka Nokaut ani nikt z jej zespołu nie był zaangażowany w tworzenie tzw. doorway pages w serwisie Bankier.pl o którym mowa na stronie http://www.futrega.org/stek/2006/06/05/nokaut_nokaut_pl_porownywarka_cen.html.
Nie zajmowaliśmy się też pozycjonowaniem serwisów internetowych funduszów bmp AG czy MCI.
Zakres współpracy spółki Nokaut z Travelplanet.pl SA jest objęty klauzulą poufności. Rekomendowane przez nas działania optymalizacyjne w serwisach Travelplanet.pl SA są zgodne z zasadami określonymi przez twórców wyszukiwarek internetowych.
Nokaut Sp. z o.o. nie ponosi odpowiedzialności ani za formę ani za treść stron internetowych, których nie jest właścicielem (np. szukane.pl, linie-lotnicze.com czy inne serwisy wymienione w dniu 7 czerwca 2006 roku pod adresem http://www.futrega.org/stek/2006/06/07/nokaut_pl_seo.html).
Krótki komentarz do jednego fragmentu:
W szczególności nie używamy, ani nie rekomendujemy używania ukrytych linków oraz słów kluczowych nie mających związku z zawartością strony.
Ukryte linki do nokaut.pl dalej znajdują się na witrynach travelplanet.pl i aero.pl, obu pozycjonowanych przez osoby z nokaut.pl (pod marką One Vision).
"Nie używamy słów kluczowych nie mających związku z zawartością strony" to typowa, PR-owa metoda pisania nie na temat. Według Wikipedii, "keyword stuffing", którego dotyczył pierwszy zarzut pod adresem nokautu, jest uważany za nieetyczną metodę optymalizacji stron, występującą wtedy, gdy strona jest obłożona słowami kluczowymi w sekcji meta lub w swojej treści. Na nokautowej stronie "odkurzacze" słowo "odkurzacz" (z odmianami) występowało 85 razy na samej tylko bezużytecznej liście słów kluczowych.
O blokowaniu komentarzy na nokautowym blogu (w wątku kończącym się słowami Co sądzisz o całej sprawie? Zapraszamy do dyskusji - w naszym blogu można dodawać komentarze) i przeciwnych głosach na wykopie ze świeżo zarejestrowanych kont na link do ostatniej publikacji szkoda pisać...
AKTUALIZACJA:
Ci goście z Nokauta są nieziemscy. Na blogu, w wątku, w który pokrętnie wszystko tłumaczą i kasują komentarze, napisali, że usunąłem sporą część "nieprawdziwych" informacji (nic nie usuwałem) i zamieściłem sprostowanie, więc sprawę można uznać za zamkniętą.
AKTUALIZACJA:
W tej całej sprawie nie ma się z czego śmiać!
2006-06-09 11:33:00 | linkuj
Wczorajsze doniesienie o tym, że nokaut.pl stosuje do pozycjonowania stron metodę "keyword stuffing" spotkało się z ich szybką reakcją, ale, niestety, nie była nią skrucha.
W ramach ratowania wizerunku bezużyteczna, długa lista słów kluczowych we wszystkich możliwych kombinacjach została zamieniona w bezużyteczną, długą listę słów kluczowych z linkami do własnej wyszukiwarki. 80% wyników wyszukiwania dla kilkudziesięciu słów, które sprawdziłem, zawierała ten sam, jednoelementowy wynik -- nazwę kategorii, w której występowały dane słowa kluczowe. Np. klikając w "odkurzacz download" (autentyczne), wynikami wyszukiwania było "kategoria: odkurzacze". Cholernie użyteczne!
Na blogu z kolei można było znaleźć infantylne tłumaczenie się, że amazon.com czy technorati.com też przecież pokazują listy słów kluczowych. Szkoda tylko, że tam są to tagi nadane wcześniej określonym elementom (produktom, blogom itp.), a nie bezużyteczne listy słów kluczowych we wszystkich kombinacjach do ściągania ruchu z wyszukiwarek.
Prowadzony przeze mnie słownik alternatywny też został przywołany w ramach tego infantylnego tłumaczenia się, ale nie potrafię zrozumieć, co miałoby być zdrożnego w tym, żeby indeksowały go wyszukiwarki (poza hasłami zawiera odmiany, znaczenia i często liczne komentarze użytkowników; internetowe wersje słowników poważnych wydawnictw są pod niektórymi względami dużo uboższe).
Ale uprawianie tzw. "keyword stuffingu" to pestka w porównaniu z innymi metodami stosowanymi do pozycjonowania nokaut.pl, które dzisiaj zauważyłem, gdy sprawdziłem, na jakich stronach znajdują się linki do nokaut.pl.
Otóż, można je znaleźć na śmieciowych, prawie pustych stronach w stylu filmy-divx pl, tanie-linie-kolejowe pl (ten sam adres IP, co nokaut.pl) itp., gdzie ni z gruszki, ni z pietruszki pojawiają się na dole tych stron ze starannie dobranymi słowami kluczowymi (sklepy internetowe, zakupy itp.).
Na witrynach należących witrynach firm należących do funduszów MCI i bmp, których pozycjonowaniem, jako firma OneVision, jak sami przyznawali na blogu, również zajmują się panowie z nokautu (sam nokaut należy do funduszu bmp), linki do swojej webdwazerowej witryny, jak w mordę strzelił, umieszczają:
jawnie widoczne, jak na bankier.pl, jako jeden z partnerów (niby nic)

Niewidoczne linki to jednak nie koniec. Panowie z nokautu, nie raz podkreślający etyczność stosowanych metod, wesoło używają sobie nawet farm linków!
Dwa pierwsze przykłady z brzegu: szukane.pl, wykorzystująca fragmenty wiadomości z bankiera, i podręcznikowy przykład farmy: linie-lotnicze com (obie też z tym samym IP, co nokaut.pl), używana przede wszystkim do pozycjonowania aero.pl, ale także nokautu, zawiera stertę podlinkowanych między sobą, prawie identycznych stron z krótką, powtarzającą się treścią; po wyłączeniu styli strony wyglądają, jak na ilustracji poniżej (ostatni link w gąszczu, zakupy internetowe, do nokaut.pl, następny, linie lotnicze, do aero.pl):

-
Chamsko-cwaniackie praktyki (bo inaczej nie można ich nazwać) stosowane do pozycjonowania nokaut.pl, bankiera, travelplanet i innych witryn oraz hipokryzja osób, które je uprawiają, zasługują jednoznacznie na potępienie. Są szkodliwe zarówno dla użytkowników wyszukiwarek, jak i dla konkurencyjnych witryn, które nie odwołują się do takich nieuczciwych praktyk.
Partnerom oraz potencjalnym partnerom nokaut.pl i usług pozycjonowania oferowanych przez firmę OneVision stanowczo odradzałbym z nimi jakąkolwiek współpracę.
Blogerów, wydawców serwisów z wiadomościami itp., jeśli w ogóle będą jeszcze publikować cokolwiek na temat niepoważnego nokaut.pl, prosiłbym o zwracanie uwagi, by nie linkować do ich witryny.
Nieetyczne pozycjonowanie to plaga.
Zobacz też:
AKTUALIZACJA:
Nokaut "prostuje", grozi sądem, obraża inteligencję
2006-06-07 02:06:00 | linkuj
Zrozum, podpisz, przekaż innym -- póki nie jest za późno.
2006-06-05 21:07:00 | linkuj
Jak wielkie znaczenie dla pozycji w wynikach wyszukiwania ma znajdowanie się na stronach odpowiednich słów kluczowych, jakie internauci wpisują w wyszukiwarki, nie trzeba chyba nikomu uświadamiać. Każdy nie raz pewnie trafił z wyszukiwarki na spam-stronę, na której znajdowała się tylko lista popularnych haseł zwykle z dodatkiem reklam AdSense.
Panowie od porównywarki cen Nokaut.pl, którzy jako pierwsi w Polsce zaczęli używać hasła "Web 2.0" w papkach marketingowych, wpadli właśnie na nowy pomysł, jak można "legalnie" przenieść takie spamerskie listy słów kluczowych na swoje strony. Robi się to tak. Najpierw piszemy, "Aby dotrzeć na tą stronę (sic), internauci wpisywali w wyszukiwarkach takie oto hasła:", po czym zamieszczamy odpowiednie słowa kluczowe, może być małą, szarą czcionką, bo i tak nikt nie będzie tego czytał poza robotami wyszukiwarek.
Czy ktoś ma wątpliwości, że taka lista jest bezużyteczna dla użytkowników?
Panowie od Nokaut.pl nigdy nie kryli zresztą swoich korzeni związanych z tzw. pozycjonowaniem i optymalizacją stron (SEO), a na ich blogu jest to często poruszany temat. Wcześniej, jak sami przyznają, zajmowali się pozycjonowaniem bankier.pl i tam też, trzeba przyznać, wykazywano się nieprzeciętną pomysłowością.
Na www.archive.org możemy znaleźć ślady stosowania na Bankierze tzw. doorway pages, tj. takich stron, które zawierają masę linków z odpowiednimi słowami kluczowymi widocznymi tylko dla robotów wyszukiwarek -- wejście na nie przeglądarką powoduje natomiast przekierowanie do normalnej wersji strony. Na każdej z takich stron umieszczonych w odpowiednich poddomenach bankier.pl (kredyty.bankier.pl, konta.bankier.pl itp.) znajdował się taki sam zestaw linków z odpowiednimi słowami kluczowymi, zero właściwej treści i taki oto pomysłowy tekst:
Uwaga! Ta strona przeznaczona jest dla urządzeń przenośnych i przeglądarek tekstowych (Lynx, Links itp.). Jeśli używasz przeglądarki graficznej, zostaniesz przekierowany na odpowiednią stronę WWW.
Nokaut. Nokaut. Nokaut.
AKTUALIZACJA: Aby dotrzeć na tę stronę, internauci wpisywali w wyszukiwarkach takie oto hasła: nokaut, nokaut pl, nokaut.pl, porównywarka cen, nokat, seo, black-hat seo, optymalizacja, nokaut, pozycjonowanie, spam, doorway pages, web 2.0, nokaut, papki, bankier i inne pierdoły.
AKTUALIZACJA:
Fragment ze wskazówek dla webmasterów od Google dla tych, którzy mają problemy z oceną opisanego przypadku:
Unikaj sztuczek mających na celu poprawienie rankingu w wyszukiwarkach. Zastosuj praktyczną zasadę: zastanów się, czy możesz bez oporów opisać swoje postępowanie wydawcom witryny konkurencyjnej. Inny przydatny test — zadaj sobie pytanie: „Czy to pomoże użytkownikom? Czy warto byłoby to robić, gdyby nie istniały wyszukiwarki?”.
AKTUALIZACJA:
Keyword stuffing to nie wszystko.
Nokaut.pl wykorzystuje do pozycjonowania niewidoczne linki i farmy linków
AKTUALIZACJA:
Nokaut "prostuje", grozi sądem, obraża inteligencję
2006-06-05 20:20:00 | linkuj
Jarosław Lipszyc w Gazecie Wyborczej o planowanej nowelizacji prawa autorskiego (http://serwisy.gazeta.pl/wyborcza/1,34474,3388712.html).
Zdumiewające jest, że propozycja nowelizacji wyszła z rządu, który swoją politykę opiera na ideach solidaryzmu społecznego i ochrony polskiej kultury. W tej legislacji bardzo łatwo bowiem wskazać jej beneficjentów. Nie będą nimi ani polskie firmy, ani polscy twórcy. Na wprowadzeniu DRM skorzystają międzynarodowe koncerny dostarczające tę technologię oraz operujące gigantycznymi pakietami praw do dóbr kultury. Restrykcyjne prawo umożliwi im zawłaszczenie polskiego dziedzictwa narodowego poprzez zmonopolizowanie kanałów dostępu do dóbr kultury.
Nie wynika to ze złej woli rządu. Procesy grodzenia kultury są złożone i słabo rozumiane. Hasła własności intelektualnej i zagrażającego jej piractwa są nośne i usprawiedliwiają nawet najbardziej drakońskie rozwiązania legislacyjne.
Zobacz też: Kryminał za obchodzenie zabezpieczeń
2006-06-04 20:27:00 | linkuj
Ogłoszenie:
Organizacja Creative Commons Polska (http://creativecommons.pl) zaprasza na pierwsze spotkanie z cyklu Salon Creative Commons, pod tytulem "Godzilla czy Przeminelo z wiatrem? Internet a kino" Bedziemy rozmawiac o wplywie internetu na kinematografie, innowacyjnych sposobach dystrybucji filmow, zaletach i wadach otwartych modeli dystrybucji filmow.
W czasie spotkania przedstawimy nie pokazywana dotychczas w Polsce animacje 3D Elephant's Dream, bedaca przykladem produkcji i dystrybucji filmu na otwartych zasadach. Pokazemy rowniez polskie filmy amatorskie z kolekcji projektu "Entuzjasci", ktorych archiwum zostanie niedlugo udostepnione online przez Centrum Sztuki Wspolczesnej.
W dyskusji na temat tworzenia i dystrybucji filmow w epoce internetu wezma udzial Leszek Bogdanowicz - szef projektu telewizji interaktywnej TVP, Lukasz Ronduda - kurator CSW i wspoltworca archiwum "Entuzjasci", Jaroslaw Jaworski - filmowiec niezalezny i wspolorganizator festiwalu filmu niezaleznego TOFFI w Toruniu. Spotkanie poprowadzi Alek Tarkowski, koordynator Creative Commons Polska.
Miejsce spotkania: Klubokawiarnia Chlodna 25.
Data: 13 czerwca 2006, godz. 18.00
Adres: Ul. Zelazna 75a (rog Chlodnej)
Wstep wolny
Wiecej informacji na stronie creativecommons.pl/salon
Adres creativecommons.pl/salon jakoś jeszcze nie działa już działa.
AKTUALIZACJA:
2006-06-01 15:32:00 | linkuj
Gazeta Prawna, 24 maja 2006:
Na zmiany portal wyda w tym roku 6-7 mln zł. Serwisy Interii wzbogacone będą o nowe narzędzia, które zwiększą jej interaktywność. Pierwszym, które przejdzie zmiany, będzie serwis wspólnotowy Znajomi.pl. W odświeżonej wersji ma zadebiutować w czerwcu. Dzięki takim zmianom serwisy Interii ostatecznie przekształcą go całkowicie w portal w stylu Web 2.0. To najnowszy trend w rozwoju internetu w kierunku medium coraz bardziej interaktywnego, współtworzonego przez samych użytkowników sieci. W takim kierunku zmieniają się najwięksi światowi giganci. Ostatnio swoją nową stronę w stylu Web 2.0 zaprezentował Yahoo!
– To jedyny kierunek, w którym mogą i powinny iść portale w Polsce, aby nadążać za zmianami na rynku – mówi Gwidon Humeniuk, dyrektor departamentu internetu CR Media Consulting.
Według niego, Interia jest portalem, który charakteryzuje się bardzo dużym tempem rozwoju, podążając za dwoma światowymi trendami. Jednym z nich jest rozwój zawartości multimedialnej, zapoczątkowany udostępnianiem wiadomości w wersji wideo, a potem stworzeniem działu z teledyskami. Drugi to właśnie rozwój w kierunku Web 2.0.
– Interia czerpie ze sprawdzonych rozwiązań światowych. Powstają takie serwis jak Znajomi, Nowe Randki, Blogi czy Zdjęcia, które są na wysokim poziomie. Myślę, że możemy spodziewać się coraz więcej tego typu projektów w tym portalu – dodaje Gwidon Humeniuk.
2006-05-24 20:55:00 | linkuj
Szykują nam się właśnie zmiany prawa autorskiego o szkodliwości porównywalnej do patentów na oprogramowanie, jeśli nie większej, i podobnie jak z patentami dyktowane konicznością dostosowania naszego prawa do unijnych dyrektyw.
Proponowane zmiany wprowadzą karalność posiadania lub wykorzystywania urządzeń i oprogramowania, które może być stosowane do obchodzenia zabezpieczeń przed odtwarzaniem lub kopiowaniem utworów (muzyki, filmów, książek w postacie elektronicznej itp.).
Kto wytwarza urządzenia, ich komponenty lub programy komputerowe przeznaczone do niedozwolonego usuwania lub obchodzenia skutecznych technicznych zabezpieczeń przed odtwarzaniem lub zwielokrotnianiem utworów lub przedmiotów praw pokrewnych albo dokonuje obrotu takimi urządzeniami, ich komponentami lub programami komputerowymi albo reklamuje je w celu sprzedaży lub najmu, podlega grzywnie, karze ograniczenia wolności albo pozbawienia wolności do lat 3.
Kto posiada, przechowuje lub wykorzystuje urządzenia, ich komponenty lub programy komputerowe, o których mowa w ust. 1, podlega grzywnie, karze ograniczenia wolności albo pozbawienia wolności do roku.
Według proponowanych zmian karalne będzie np.
Mało tego. Proponowane zmiany uderzą mocno w dozwolony użytek osobisty, dzięki któremu obecnie możemy np. zupełnie legalnie kopiować utwory chronione prawem autorskim dla rodziny czy znajomych z pracy, nagrywać je z radia czy telewizji itp. Wprowadzenie karalności obchodzenia zabezpieczeń pozbawi nas tych praw.
Dobrym tekstem o szkodliwości DRM-ów dla społeczeństwa, biznesu i samych artystów są notatki z przemówienia Cory'ego Doctorowa dla Microsoftu (tekst przetłumaczony na wiele języków -- może ktoś miałby chęć przełożyć na polski?).
Zobacz też:
Ostatni link jest do wiadomości na gazeta.pl, która wreszcie otworzyła swoje archiwa i artykuły nie będą już po trzech miesiącach znikać (nie mylić archiwum gazeta.pl z archiwum Gazety Wyborczej, które jest obszerniejsze i nadal płatne). Przydałoby się jeszcze, żeby na gazeta.pl nie trzeba było walczyć z prawie chamskimi reklamami zakrywającymi treści stron.
2006-05-17 16:11:00 | linkuj
Zagadka:
Jak to możliwe, że w rankingu wyszukiwarek na ranking.pl sama wyszukiwarka Google miesiąc w miesiąc ma dokładnie taki sam zasięg jak Google jako całość w wynikach badania Megapanel PBI/Gemius -- jako całość tzn. z uwzględnieniem innych serwisów Google, takich jak gmail, blogi, video, grupy dyskusyjne itp. (w badaniu Megapanel PBI/Gemius łączy się oglądalność wszystkich serwisów portali, o ile portale figurują jako właściciele domen, pod którymi funkcjonują te serwisy; np. do statystyk o2.pl zaliczają się także statystyki witryn tlen.pl, kafeteria.pl, pudelek.pl itp.) ???
Rozwiązanie:
W badaniu Megapanel Google nie jest uznawane za portal, a łączenie oglądalności serwisów ma miejsce tylko dla portali. O tym, czy coś jest portalem, decyduje rada badania, w której skład wchodzą osoby z portali Onet, WP, Interia, Gazeta, serwisu Rzeczpospolitej i z Gemiusa.
Ale!
Nie jest jednak tak źle, bowiem do oglądalności wyszukiwarki Google zaliczane jest wszystko, co występuje w domenie *.google.com (plus google.pl i kilku innych lokalnych), czyli poza wyszukiwarką także... poczta, video, grupy dyskusyjne, mapy itd. Z większych rzeczy Google nie ma uwzględnianych chyba tylko blogów (z domeny blogspot.com).
Krótko mówiąc:
Powyższe informacje o niedorzecznym uwzględnianiu serwisów niewyszukiwawczych do wyszukiwarki pochodzą bezpośrednio od Gemiusa, ale w wynikach na audyt.gemius.pl też można zobaczyć, że coś dziwnego dzieje się ostatnio ze statystykami Google, a konkretniej średnim czasem na użytkownika spędzanym na witrynie w miesiącu. Intuicja podpowiada, że powinien kształtować się cały czas mniej więcej na tym samym poziomie.
W ostatnich dwóch miesiącach nastąpił jednak duży wzrost (z 2g46m do 3g51m), tak jakby zmieniła się charakterystyka korzystania z Google, a prawdopodobnie wpływ na to miała rosnąca popularność Gmaila i Google Video -- obu wliczanych właśnie na poczet wyszukiwarki.
Niedawno opublikowane informacje o liczbie zapytań do Google w USA (w wysokości 2,9 mld w marcu 2006) wzbudziła też ostatnio pewne podejrzenia wobec 1,4 mld odsłon na wyszukiwarce Google z Polski (według badania Megapanel PBI/Gemius).
Liczba internautów w USA to około 200 mln, a Google ma tam około 40-50% rynku. W Polsce internautów jest jakieś 11,4 mln, a zasięg Google to ponoć 80%, czyli około 9 mln osób. 2,9 mld zapytań generowanych przez około 80-100 mln internautów w USA wobec 1,4 mld odsłon generowanych na wyszukiwarce przez 9 mln internautów w Polsce wygląda bez wątpienia podejrzanie.
Ten fenomen można prawdopodobnie wytłumaczyć tym, że:
2006-05-06 11:06:00 | linkuj
Na wykop.pl od kilku godzin wisi sobie informacja o tym, że na stronach Ministerstwa Transportu i Budownictwa można przeglądać dane kilku tysięcy subskrybentów biuletynu informacyjnego tegoż ministerstwa. Poza adresami email, dane zawierają także imiona i nazwiska subskrybentów (!). Można wśród nich znaleźć adresy pracowników innych ministerstw, policji, dużych firm czy dziennikarzy.
Żeby było śmieszniej, do zadań jednego z departamentów tego Ministerstwa, Departamentu Telekomunikacji, należy koordynowaniem działań w zakresie zwalczania spam" (sic). Z tego ministerstwa pochodzi też wiecznie żywy pomysł, żeby zdelegalizować pop-upy i wprowadzić surowsze kary jako sposób na walkę ze spamem (wygląda bardziej na walkę z bezrobociem, bo spam można efektywnie zwalczać technicznymi środkami).
Brak słów.
Zobacz też: 50,000 adresów konkursowiczów Żywca
2006-05-02 23:14:00 | linkuj
Alek Tarkowski w Gazecie o tzw. "piractwie" (http://serwisy.gazeta.pl/wyborcza/1,34591,3314742.html).
Internet może stanowić groźną konkurencję dla dotychczasowych metod dystrybucji kultury, ale równie dobrze może być potężnym narzędziem w rękach twórców i dystrybutorów. Ważny głos do tej dyskusji - dotychczas nieobecny - mogłaby wnieść awangarda twórców eksperymentujących z dystrybucją internetową. Nawet jeśli zalewa nas potężna fala zmian związanych z nowymi technologiami, nie warto stać na brzegu i narzekać, że woda jest zimna, skoro na jej czubku można surfować. Nowe idzie, nie ma się czego bać.
2006-05-01 11:49:00 | linkuj
Na Google maps pojawiły się właśnie dokładne mapy wielu krajów europejskich, w tym Polski.
Nie działa dla nich jeszcze, co prawda, wyszukiwanie po nazwach ulic czy miejscowości (chociaż Warszawę znajduje) i brakuje dokładnych map satelitarnych, ale i tak już są niezłe. Wyszukiwanie po nazwach ulic itp. można znaleźć na mapach szukacza (mapa.szukacz.pl).


2006-04-25 14:16:00 | linkuj
Odpowiedź wydawnictwa PWN w związku z publikacją Grafika z sieci bez pozwolenia na okładce PWN-u:
Wydawnictwo Naukowe PWN dziękuje za zainteresowanie, jak również przyczynienie się do odkrycia naszego niedopatrzenia, a dzięki temu uregulowania spraw związanych z naszą publikacją. Zdarzenie to stanowi przypadek wyjątkowy, zupełnie nie przystający do polityki naszej firmy pieczołowicie respektującej wszelkie prawa autorskie. Zasmuca nas cień jaki położył się na naszej reputacji, jednak dokładamy wszelkich starań, by incydent zakończył się szybko i dla obu stron satysfakcjonująco. Wystosowaliśmy już pismo z prośbą o wykupienie praw do publikacji grafiki.
Anna Gogolewska
Kierownik Działu Graficznego PWN
2006-04-19 19:13:00 | linkuj
Podpisuję się pod tekstem Krzysztofa Urbanowicza Agresywne reklamy utrudniają lekturę „Gazety Wyborczej" on-line:
Jestem wiernym czytelnikiem wielu tytułów, w tym „Gazety Wyborczej". Od pewnego czasu nie sposób czytać ją w wersji on-line ze względu na agresywne reklamy, które zasłaniają nie część, ale prawie cały monitor na niektórych stronach.
Spryciarze tak zaplanowali okienka reklamowe, że:
- nie można ich zlikwidować, bo nie mają guziczka z krzyżykiem, który symbolizuje zamknięcie,
- mają nieregularne, rozmyte kształty maskujące guzik z krzyżykiem.
- przemieszczają się po ekranie z taką szybkością, że nie można w nie trafić etc.
Uważam, że tak agresywna, prawie chamska reklama wywołuje efekt odwrotny od zamierzonego, przynajmniej u mnie. Z pewnością nie skorzystam z żadnej z marek, które próbują zmusić mnie w tak brutalny sposób do czytania swoich sloganów.
Problem "prawie chamskich" form reklamy rodem z serwisów porno nie dotyczy tylko gazeta.pl, ale w przypadku tego portalu ich stosowanie jest wyjątkowo głupie.
2006-04-18 16:33:00 | linkuj
Na grupie dyskusyjnej pl.rec.gry.scrabble pewna osoba zauważyła, że okładka jednej z nowości wydawnictwa PWN pt. "Słownik scrabblisty" zawiera fragment pewnej ilustracji z sieci -- darmowej tapety, którą można pobrać ze strony scratchadelic.com.
Ilustracja wygląda tak: