Zanimalo me koliki je procenat najpopularnijih domaćih sajtova koji zapravo koriste domaći hosting i/ili domene. Da bih to saznao, odlučio sam da kreiram Python skriptu koja će pogledati listu najpopularnijih sajtova na našim prostorima (tako što će scrape-ovati Alexa.com), pogledati IP iza svake domene sa tog spiska, i onda pogledati u kojoj je državi taj server. U ovom članku je kratko objašnjenje skripte i rezultati za 500 najpopularnijih sajtova u državama bivše Jugoslavije.

Za potrebu ove skripte, pored osnovnih Python biblioteka, koristio sam još i requests, BeautifulSoup i python-geoip.

Objašnjenje i poneki problemi sa kojim sam se susreo

  • Pošto sam veliki fan open source-a, uštedio sam sebi jedno pola sata posla scrape-ujući Alexa.com tako što sam iskoristio već postojeću alexa-topsites skriptu (iako je zadnja promjena u ovoj skripti stara tri godine, samo je promjena jedne linije koda bila potrebna da skripta funkcioniše savršeno i dan danas).
  • Dok sam ručno prolazio kroz nekoliko domena, primjetio sam da je CloudFlare dosta popularan na našim prostorima. Nažalost, zbog načina na koji CloudFlare funkcioniše, nisam u mogućnosti da dođem do fizičke lokacije servera sakrivenih iza CloudFlare-a, tako da su oni automatski otpali iz liste sajtova koji koriste domaći hosting.
  • Pošto je naša regija relativno mala, dosta je slučajeva u kojoj je jedna domena (tipa .rs) vrlo popularna u drugoj državi (tipa Bosni i Hercegovini). Iako bi se ovo moglo smatrati domaćim hostingom, odlučio sam da pod domaćim hostingom smatram isključivo one koji su hostovani unutar države u kojoj su popularni.
  • Pošto Alexa daje pun kurac rezultata, odlučio sam da se fokusiram na najpopularnijih 500 sajtova po državi.
  • U rezultatima, iz logičnih razloga, nisu prikazani sajtovi koji nisu dostupni online u trenutku kada je skripta radila.
  • Ukoliko želite da ponovite ovaj test, da ga odradite za neku drugu državu ili da povećate broj analiziranih sajtova, preuzmite Python skriptu odavdje i pokrenite je sa python naziv_skripte.py XX NN, gdje je XX domena države, a NN broj najpopularnijih sajtova u toj državi koji želite da analizirate.

Rezultati

Ukoliko želite da pređete direktno na rezultate neke države, to možete uraditi klikom na sljedeće linkove (po abecednom redu): Bosna i Hercegovina, Crna Gora, Hrvatska, Makedonija, Slovenija, Srbija.

NAPOMENA: Broj ispred sajta predstavlja rangiranje sajta po popularnosti u državi.

Bosna i Hercegovina

  • Broj sajtova sa serverom unutar Bosne i Hercegovine: 22/500
  • Broj sajtova koji koriste .ba domenu: 76/500

Lista popularnih sajtova sa serverima unutar Bosne i Hercegovine:

Crna Gora

  • Broj sajtova sa serverima unutar Crne Gore: 14/500 (~3%)
  • Broj sajtova koji koriste .me domenu: 56/500

Lista popularnih sajtova sa serverima unutar Crne Gore:

Hrvatska

  • Broj sajtova sa serverima unutar Hrvatske: 112/500
  • Broj sajtova koji koriste .hr domenu: 156/500

Lista popularnih sajtova sa serverima unutar Hrvatske:

Makedonija

  • Broj sajtova sa serverima unutar Makedonije: 70/500
  • Broj sajtova koji koriste .mk domenu: 151/500

Lista popularnih sajtova sa serverima unutar Makedonije:

Slovenija

  • Broj sajtova sa serverima unutar Slovenije: 144/500
  • Broj sajtova koji koriste .si domenu: 144/500

Lista popularnih sajtova sa serverima unutar Slovenije:

Srbija

  • Broj sajtova sa serverima unutar Srbije: 87/500
  • Broj sajtova koji koriste .rs domenu: 112/500

Lista popularnih sajtova sa serverima unutar Srbije:

Skripta

Koji je ovo đavo?

Chrome is basically crippling Chromium's features

TIL that installing Chrome on Ubuntu effectively messes up some Chromium features that worked just fine previously. Here's what happened....… Continue reading

My Top 16 Songs of 2016

Published on December 17, 2016