Konsepton sivusto: Analytiikka ja hakukoneoptimointi

Mikko Paltamaa 15. maaliskuuta 2010, 14:54 6 kommenttia

Sivuston sijoitus Googlen hakutuloksissa riippuu sivujen PageRank-arvosta. PageRank on Googlen hakukoneen kaikille sivuille laskema, sivun “tärkeyttä” kuvaava arvo.

Yksinkertaistettuna PageRank-algoritmi toimii seuraavasti:

Sivun tärkeys arvioidaan sivulle osoittavien linkkien perusteella. Kukin linkittävä sivu äänestää sivuja, joihin linkittää. Kyse ei ole pelkästään äänten määrään liittyvästä laskennasta, vaan jokaisen äänen painoarvon määrittää linkittävän sivun oma PageRank-arvo.

Esimerkiksi linkki Iltalehden etusivulta kasvattaa PageRank-arvoa huomattavasti enemmän kuin linkki satunnaisesta keskustelupalstan viestistä.

Sivustolle muilta sivustoilta johtavat linkit ovat siis erittäin tärkeä tekijä hakukonenäkyvyyden kannalta. Linkkien hankkimiseen on monia eri keinoja. Keinot riippuvat pitkälti siitä, minkälainen sivusto on kyseessä.

Yrityksen kotisivuille voi hankkia näkyvyyttä esimerkiksi erilaisista hakemistoista. Hakemistoja löytyy erilaisten yhdistysten, kuten Suomen Yrittäjien ja toimialakohtaisten yhdistysten sivustoilla. Mainostamista, bannerivaihtoa, ristiinlinkitystä ja muuta vastaavaa voi myös harkita, mutta sopimuksen todellinen arvo kannattaa aina arvioida tapauskohtaisesti.

Googlen yrityspalvelukeskuksen kautta voi lisätä oman yrityksen tiedot Google Mapsiin. Erilaisia yritysrekistereitä on vaikka kuinka paljon, mutta suurin osa on ainakin osittain huijausta, eikä niiden hinta yleensä vastaa hyötyä.

Saapuvien linkkien lisäksi sivujen sijoituksiin hakutuloksissa vaikuttaa sivujen laatutekijät. Esimerkkejä laatutekijöistä ovat hakusanojen esiintymistiheys, hakusanojen löytyminen sivun osoitteesta, sivun otsikoista ja muista tärkeistä HTML-elementeistä sekä palvelimen vastausajat. Eri laatutekijöistä ja niiden merkityksestä ei ole tarkkaa tietoa, mutta sitäkin enemmän teorioita.

Hakukoneoptimoinnin hyviin puoliin kuuluu se, että useimmat hakukoneoptimointiin liittyvät parannukset parantavat samalla sivuston käytettävyyttä.

Hakukoneoptimointi Konsepton sivustolla

Konsepton sivustolle ei vielä ole juurikaan linkkejä ulkopuolelta. Niiden määrän kasvattaminen onkin seuraava tärkeä tavoite.

Sivuston HTML-koodi, sivujen osoitteet ja muut vastaavat asiat on muotoiltu siten, että hakukoneet ymmärtävät sivuston optimaalisella tavalla. Kotisivujen perussisältö on myös suunniteltu siten, että sivuilla olisi paljon hakusanoja, joihin hakukoneet voivat tarttua. Tämä työ on vielä suurelta osin kesken. Tulevaisuudessa perussivujen määrää on tarkoitus kasvattaa ja sisältöä kehittää hakukoneoptimoinnin kannalta.

Eräs syy tämän blogin olemassaololle on sivuston kävijämäärän kasvattaminen. Mitä enemmän sivustolla on merkityksellistä sisältöä, sitä paremmin sivusto näkyy hakukoneissa eri hakusanoilla. Lisäksi blogikirjoituksiin saatetaan linkittää muualta, jolloin kirjoitusten hakukonesijoitus paranee ja sivustolle voi tulla vierailijoita linkkien kautta.

Suurestakaan kävijävirrasta ei ole hyötyä, mikäli se ei edusta sivuston kohderyhmää. Näkyminen ammattiaiheisilla sivustoilla (esimerkiksi ArcticStartup ja Vierityspalkki) on Konsepton kohdalla erittäin tärkeää ja kuuluu jatkuviin kehityskohteisiin.

Analytiikkatyökalut

Tulosten mittaaminen on oleellinen osa kaikkea kehitystyötä, myös sivustojen optimointia. Esimerkiksi Google tarjoaa useita ilmaisia sivustojen analytiikkaan ja hakukoneoptimointiin liittyviä työkaluja.

Konsepton sivustolla on käytössä seuraavat työkalut:

Google Analytics

Google Analyticsin avulla saadaan selville esimerkiksi sivuston päivittäiset kävijämäärät ja sivunlataukset, sekä sivusto-, osio- ja sivukohtaisesti. Sivustojen optimoinnissa auttavat mm. tiedot sivustolla vietetystä ajasta, keskimääräisistä sivunäytöistä vierailua kohden sekä välittömästä poistumisprosentista. Lisäksi nähdään mistä lähteistä sivustolle saavutaan, millä hakusanoilla sivustolle päädytään, miten mahdolliset AdWords-kampanjat toimivat sekä erilaisia tilastoja kävijöiden laitteistosta ja ohjelmista.

Käytännössä kaikille sivustoille kannattaa ottaa käyttöön Google Analytics. Palvelun käyttöönottamiseksi riittää kirjautuminen palveluun, muutaman asetuksen määrittäminen sekä pienen koodinpätkän lisääminen kaikille sivuille, joita halutaan mitata.

Konsepton sivuston kävijämäärien kehittymistä on helppo seurata Google Analyticsin avulla. Analytics ei kuitenkaan ole ainoa vaihtoehto. Tarkoituksenani on kokeilla lähiaikoina palvelua nimeltä Clicky.

Clickyn pitäisi näyttää Googlen palveluun verrattuna selvästi tarkempaa ja reaaliaikaisempaa dataa. Lisäksi sen käyttöliittymän pitäisi olla parempi. Kävijämääriltään pienillä sivustoilla palvelu on ilmainen, mutta suurempien kohdalla palvelu toimii kuukausimaksulla.

Google Verkkovastaavan työkalut

Google Verkkovastaavan työkalut (tai Webmaster Tools) näyttää tietoja siitä, kuinka sivustosi näkyy Googlen hakurobotille. Palvelusta näet esimerkiksi millä hakusanoilla sivustosi on näkynyt hakutuloksissa, mitä avainsanoja sivustoltasi on löytynyt, milloin sivusto on viimeksi indeksoitu, kuinka suuri osa sivuston sivuista on indeksoitu ja mitä virheitä indeksoinnissa mahdollisesti tapahtui.

Lisäksi voit käyttää palvelua XML-muotoisten sivukarttojen osoitteen ilmoittamiseen sekä toivotun domain-nimen (www vai ei) määrittämiseen.

Edellä mainittujen lisäksi isäksi Googlelta löytyy monia muita hyödyllisiä työkaluja esimerkiksi hakusanojen valitsemista ja analysointia varten.

Esimerkiksi Google Verkkosivuston optimoija (Website Optimizer) kuulostaa kiinnostavalta. Sen avulla voi testata useita eri versioita sisällöstä ja selvittää mikä vaihtoehto toimii parhaiten. En ole kuitenkaan vielä työskennellyt projektissa, jossa eri versioiden kokeiluun olisi riittänyt resursseja.

Muita työkaluja

Googlen palvelut antavat tietoa lähinnä tuloksista, mutta eivät niinkään tulosten syistä. Sivujen optimoinnin kannalta on erittäin tärkeää saada tietoa myös vierailijoiden käyttäytymisestä sivustolla.

Vierailijoiden käyttäytymisestä ja ajatuksista saadaan tietoa esimerkiksi käytettävyystestien avulla, mutta tällöin ongelmina ovat otannan pienuus ja testauksen kustannukset.

Ongelman ratkaisemiseksi on kuitenkin kehitetty työkaluja, jotka tallentavat vierailijoiden klikkaukset sivustolla. Tallennetut klikkaukset voidaan myöhemmin näyttää esimerkiksi lämpökarttana sivun päällä, tai seurata mitä polkuja yksittäiset käyttäjät ovat edenneet.

Näiden tietojen pohjalta voidaan helposti nähdä mitkä sivun osat keräävät eniten klikkauksia. Osassa on myös mahdollisuus vertailla useampaa eri vaihtoehtoa (A/B testing).

Tällaisia työkaluja ovat muun muassa:

Tällä hetkellä Konsepton sivustolla ei ole käytössä mitään klikkauksia nauhoittavaa työkalua, mutta sellainen on tarkoitus lisätä piakkoin. Ensin täytyy kuitenkin selvittää, mikä työkalu sopisi tarkoitukseen parhaiten.

Aiemmin olen käyttänyt Clickdensityä. Palvelun tarjoama data on ollut erittäin hyödyllistä ja toimivaa, mutta ikävä kyllä monet muut ongelmat ovat haitanneet palvelun käyttöä.

Palvelussa ilmeni käyttäjätileihin ja käyttäjien oikeuksiin liittyviä bugeja, jotka ovat pahimmillaan estäneet sovelluksen käytön. Palautteeseen lähettämisen jälkeen ongelmien korjaamista on joutunut pahimmillaan odottamaan viikkoja. Lisäksi Clickdensityn palvelimet ovat välillä nurin, jolloin vierailijoiden selaimet jäävät odottamaan vastausta palvelimilta ja sivusto voi vaikuttaa hitaalta.

Näihin ongelmiin nähden palvelu on melko kallis. Kuvaavasti palvelu on myös kirjoitushetkellä nurin, joten en voi käydä tarkistamassa hintoja sivustolta.

Tämä kirjoitus kuuluu sarjaan Konsepton sivustoa käsitteleviä kirjoituksia. Kirjoitukset ovat:

Kommentit

  1. Itseasiassa “Pagerankilla” ei ole mitään tekemistä sivuston hakukonenäkyvyyden kanssa vaan Trustrankilla.

  2. Kiitos kommentista, Juha. Koska olet hakukoneoptimoinnin ammattilainen, niin minun parasta perehtyä asiaan tarkemmin ennen kuin ryhdyn väittelemään. :-)

    Google kertoo omilla sivuillaan seuraavaa:

    Kun käyttäjä kirjoittaa haun, koneemme hakevat hakemistosta hakua vastaavat sivut ja palauttavat tulokset, jotka mielestämme ovat kaikkein osuvimpia. Osuvuus määritetään yli 200 tekijän avulla, joista yksi on sivun PageRank-arvo. PageRank on sivun merkityksen mittari ja se muodostetaan muilta sivuilta tulevien linkkien perusteella. Yksinkertaistettuna jokainen linkki sivuston sivulle toisesta sivustosta kasvattaa sivuston PageRank-arvoa. Kaikki linkit eivät ole samanarvoisia: Google työskentelee kovasti käyttäjäkokemuksen parantamiseksi tunnistaakseen roskapostilinkit ja muut tavat, jotka vaikuttavat kielteisesti hakutuloksiin. Parhaita linkkityyppejä ovat sisällön laadun perusteella annetut linkit.

    (Lähde)

    The software behind our search technology conducts a series of simultaneous calculations requiring only a fraction of a second. Traditional search engines rely heavily on how often a word appears on a web page. We use more than 200 signals, including our patented PageRank™ algorithm, to examine the entire link structure of the web and determine which pages are most important. We then conduct hypertext-matching analysis to determine which pages are relevant to the specific search being conducted. By combining overall importance and query-specific relevance, we’re able to put the most relevant and reliable results first.

    (Lähde)

    Eli näiden tietojen mukaan PageRank on edelleen yhtenä tekijänä mukana hakutulosten järjestämisessä.

    Sen sijaan TrustRank on monimutkaisempi asia. Ilmeisesti TrustRank voi tarkoittaa ainakin kolmea asiaa:

    1. Tieteellinen artikkeli Combating Web Spam with TrustRank vuodelta 2004, jolla ei ole mitään tekemistä Googlen kanssa (vaan Yahoon)
    2. Tuotemerkki “TrustRank”, jonka Google rekisteröi vuonna 2005 ja josta luopui vuonna 2008
    3. Googlen patentti Search result ranking based on trust, joka on haettu 2006 ja myönnetty 2009

    (Lähde)

    Kohdassa yksi mainitun tieteellisen artikkelin mukaan TrustRankin ideana on vähentää spämmäämisen vaikutusta antamalla sivustoille niiden “hyväntahtoisuutta” kuvaava arvo. TrustRankia voidaan käyttää joko hakutulosten järjestämiseen PageRank-arvojen ohella, tai spämmisivustojen havaitsemiseen ja karsimiseen pois indeksistä.

    Kiinnostavaa sinänsä, mutta ilmeisesti tällä ei ole mitään tekemistä Googlen kanssa. Sen sijaan Googlen hakutulosten järjestämiseen liittyy kolmas kohta, eli patenttihakemus.

    En ole lukenut patenttihakemusta, mutta sitä käsittelevässä artikkelissa sanotaan seuraavaa:

    The patent itself goes into some detail on how information from annotations and labels from experts might be used by the search engine to re-order the rankings of search results in response to queries.

    [...]

    It’s possible that Google may be learning about the trustworthiness of sites and people who annotate and label pages from a number of sources, and that what they learn about those pages may be used in a trust rank that can influence how pages may be ranked at the search engine.

    This “Trust Rank” is very different from the TrustRank developed by the writers of the Stanford/Yahoo paper.

    Eli ilmeisesti Googlen käyttämästä luottamuksen arvionnista ei ole olemassa kovin tarkkoja tietoja. Joka tapauksessa se on eri asia kuin mihin artikkelissa viitataan.

    Luullakseni voidaakseni turvallisesti olettaa, että Google tekee edelleen kuten yläpuolella väittää, eli käyttää PageRankia sekä mainittuja yli 200 muuta tekijää yhdessä määrittämään sivujen sijoituksen hakutuloksissa. Patenttihakemuksen kohteena oleva luottamusarviointi on todennäköisesti yksi niistä.

    Eli näiden tietojen pohjalta uskoisin, että PageRank-algoritmilla on edelleen merkitystä Googlen hakutulosten järjestämisessä. Mutta en ole perehtynyt asiaan tämän syvällisemmin, joten ottaisin mielelläni tarkentavia kommentteja vastaan.

  3. PageRank on pähkinäkuoresssa matemaattinen arvo linkkien määrälle. Linkit vaikuttavat hakukonenäkyvyyteen, mutta laatu korvaa märän eli PageRank arvo ei ole yhtä tärkeä kun ns TrustRank.

    Jos PageRank arvo perustuu siihen kuinka moni sivu linkittää sivuillesi niin TrustRank perustuu enemmän siihen kuinka moni arvovaltainen ja “laadukas” sivu on linkittänyt sivuillesi. Linkeissä laatu on kaiken A ja O.

    Siinä mielessä Juha on oikeassa, että selaimessa esitettävä PageRank ei vaikuta hakukonenäkyvyyteen. Se on lähinnä viihteellinen lisäelementti selaimessa.

  4. Selaimessa esitettävää Pagerankkia Google on todennut vaihtelevansa “huvikseenkin”. Sen päätehtävä on harhauttaa hakukoneoptimointia tekeviä.

    Pääasiassa trust rank muodostuu seuraavista:

    1) Ulkopuolisten linkkilähteiden laadun mukaan
    2) Ulkopuolisten linkkilähteiden teeman mukaan
    3) Ulkopuolisen linkkien luonnollisuuden mukaan

  5. Näin kaneettina että Googlen kertomuksiin hakukoneoptimointiin ja siihen vaikuttavista seikoista kannattaa suhtautua aika kriittisesti. Googlen intresseissä ei ole kertoa miten hakukoneoptimointia Googleen tehdään.

  6. Nicolaksen kommentti pitää todennäköisesti paikkansa. Eli “laadukkaiden” sivustojen merkityksen korostaminen laskennassa kuuluu todennäköisesti Googlen keinoihin spämmääjien torjumiseksi.

    Epäselväksi jää kuitenkin se, miten Googlen luottamukseen perustuvat algoritmit oikeasti toimivat. Samoin kuin se, miten ja millä perusteella Google valitsee arvovaltaiset sivustot. Todennäköisesti eri tavalla kuin mitä edellä linkittämässäni, TrustRank-algoritmia käsittelevässä artikkelissa kerrotaan.

    On vähän harhaanjohtavaa kutsua Googlen nykyistä algoritmia trust rankiksi tai TrustRankiksi. Googlella on ilmeisesti käytössään useita eri algoritmeja ja niihin vaikuttavia, käytännön tulosten pohjalta säädettäviä parametrejä. Mitään niistä ei ainakaan virallisesti kutsuta tuolla nimellä.

    En usko, että Google valehtelee algoritmien määrästä:

    The most famous part of our ranking algorithm is PageRank, an algorithm developed by Larry Page and Sergey Brin, who founded Google. PageRank is still in use today, but it is now a part of a much larger system. Other parts include language models (the ability to handle phrases, synonyms, diacritics, spelling mistakes, and so on), query models (it’s not just the language, it’s how people use it today), time models (some queries are best answered with a 30-minutes old page, and some are better answered with a page that stood the test of time), and personalized models (not all people want the same thing).

    (Lähde)

    Ehkä pitäisi ajatella, että trust rank on hakukoneoptimoijien käyttämä nimitys Googlen nykyisestä kokoelmasta eri algoritmeja, jotka käytännössä suosivat laadukkaiksi tiedettyjä linkkilähteitä. Eli “niin sanottu trust rank”, kuten Nicolas kirjoitti.

Kommentoi kirjoitusta

Voit käyttää seuraavia html-tageja:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre lang="" line="" escaped="">