Yritystietojen automatisoitu varmentaminen - Oskari Järvelin

Olen viimeaikoina työskennellyt rakentaessa palvelua, jossa hinta perustuu asiakasyrityksen henkilöstömäärään. Pienen palvelun vähäisten työntekijäresurssien säästämiseksi piti asiakasyritysten henkilöstöjen koot pystyä varmentamaan pitkälle automatisoidusti.

Lähdin etsimään netistä palveluja, joista löytyisi suomen yritysten tietoja mukaanlukien henkilöstön koko. Heti ensimmäisenä löytyi kultakaivos: Suomen Asiakastieto Oy:n ilmainen sivusto, josta löytyy suoraan kaikki tärkeimmät yrityksen tiedot mukaanlukien nimi, käynti- ja postiosoitteet, y-tunnus, liikevaihto ja henkilöstön koko.

Ja jos asiat voisivat mennä yhtään helpommaksi, yrityksen tietoja pystyy hakemaan palvelusta suoraan Y-tunnuksen perusteella.

PHP-skreippaus

PHP:ssä on erittäin kätevä valmis funtio file_get_contents() -joka hakee annetun sivuston kaiken sisällön. Lopuksi tarvitsee vain osata löytää sisällöstä oikeat tiedot.

Halutun tekstin sijainnin sivustosta löytää kätevästi strpos() -funtiolla. Loput on pelkkää leikkelyä, uudelleenformatisointia ja lopulliseen muotoon muuttamista.

Alta löydät valmiin funtioni, joka palauttaa arrayna kaikki Asiakastieto-verkkopalvelusta löytyvät yrityksen tiedot.

Palautuva data

Funktio palauttaa arrayn, jonka avaimet (keys) on listattu alle tummalla. Avaimen perässä on selkokielinen selitys arvon (value) sisällöstä.

  • businessId: Y-tunnus
  • numericalBusinessId: Y-tunnus ilman viivaa
  • name: Yrityksen nimi
  • streetAddress: Yrityksen vierailuosoite
  • postalCode: Yrityksen vierailuosoitteen postinumero
  • city: Yrityksen vierailuosoitteen postitoimipaikka
  • municipality: Yrityksen vierailuosoitteen kunta
  • county: Yrityksen lääni
  • mailingAddress: Yrityksen postiosoite
  • mailingPostalCode: Yrityksen postinumero
  • mailingCity: Yrityksen postitoimipaikka
  • turnover: Yrityksen liikevaihto
  • formattedTurnover: Yrityksen liikevaihto, 1k€
  • personnel: Henkilöstö
  • formattedPersonnel: Henkilöstön määrä muotoiltuna
  • primaryBusinessAreaCode: Toimialakoodi
  • country: Maakoodi
  • normalizedName: Yrityksen URL-ystävällinen nimi
  • overviewUri: Linkki yrityksen tietoihin Asiakastieto Oy:n sivustolla. HUOM! Linkin alkuosa https://www.asiakastieto.fi puuttuu!
  • formattedStreetAddress: Ei tiedossa, palauttaa yleensä ”{}”
  • nameType: Ei tiedossa, palauttaa yleensä ”{}”
  • situation: Ei tiedossa, palauttaa yleensä ”{}”
  • formattedAdditionalInformation: Ei tiedossa, palauttaa yleensä ”{}”
Kategoriat: GistKooditWordPress