Foto návod: OpenRefine hostovaný u Google zdarma

Rád využívám všechny různé technologie co se dostanou po ruky a ještě raději je kombinuji :) .  Proto když jsem viděl, že Google nabízí služby Google Cloud Shell do konce roku 2016 zdarma, tak jsem věděl, že na tom půjde postavit něco užitečného. Jelikož jsem chtěl tahat data z různých API  a řešil jsem problém s počtem strojů a konektivitou do internetu, tak mě napadlo, že bych to mohl zkombinovat. Výsledek je návod vytvořit OpenRefine hostovaný u Google.

K čemu může sloužit OpenRefine hostovaný  u Google?

  • Jednoduchá instance OpenRefine pro pomalejší notebook/počítač.
  • Ano máte to v Cloudu, takže to spustíte i na tabletu, či mobilu :).
  • Ano je to v cloudu, takže kliknete a nabídka vám vyskočí o 300 ms pozdějí… ale stejně rychle vyskočí i filtr, co by vám trvalo načíst 10sec.
  • Je tam omezení ramky na 500Mb, což je málo, ale i tak to stačí pro 95% uživatelů OpenRefine.
  • Pro profi uživatele  OpenRefine to může sloužit jako stahovač dat třeba z API, pěkné rychle a nemusíte mít doma zapnutý stroj. Příklad je ráno, potřebujete dotáhnou data, zapnete, pracujete, jdete na schůzku, oběd, pracujete, večer vyzvednete data.
  • Místo na projekty 5Gb (Jeden projekt  má většinou tak 30-100Mb)
  • Místo OpenRefine si tam můžete postavit třeba crawler, co má řádkový přístup nebo to mít prostě jako další místo na hraní.

Kdo nemá si založí v Google Developer console projekt…

Aby šlo využít Google Cloud Shell je nutné mít v Google Developer console
Proto kdo nemá tak založí, kdo má tento krok přeskočí.

Zajděte na https://console.developers.google.com/project a prostě vytvořte projekt.
Console developer google

Aktivace Google Cloud Shell

Otevřete si https://console.developers.google.com/project

1. Kliknout na ikonku v pravém horním rohu

OpenRefine-hosted-by-Google-for-free1

2. Potvrdit

OpenRefine-hosted-by-Google-for-free3

3. Počkat na aktivaci a start nové virtual machine, cca 10-30sec

OpenRefine-hosted-by-Google-for-free4

Instalace OpenRefine na Google Cloud Shell

4. Stáhnout OpenRefine zadáním příkazu do terminálu

OpenRefine-hosted-by-Google-for-free5

5. Rozbalit OpenRefine pomocí terminálu

OpenRefine-hosted-by-Google-for-free6

OpenRefine-hosted-by-Google-for-free7

6. Otevřít složku Spustit textový editor nano a editovat refine.ini

Otevření složky:

Spuštění editoru:

OpenRefine-hosted-by-Google-for-free8

7. Úprava nastavení OpenRefine

7.1 Editace

Pohybuje se šipkami,

Je nutné odkomentovat (smazat#) řádky REFINE_PORT a REFINE_HOST .

Dále je nutné nastavit:

REFINE_PORT nastavit na 8082

REFINE_HOST nastavit na 0.0.0.0

OpenRefine-hosted-by-Google-for-free9

7.2 Uložení

Klávesová zkratka Ctrl + X spustí nabídku exit

Zmáčknete Y (Chci uložit)

Zmáčknete Enter (Ano Chci)

OpenRefine-hosted-by-Google-for-free10

OpenRefine-hosted-by-Google-for-free11

 

8. Spuštění OpenRefine na Google Cloud Shell

OpenRefine-hosted-by-Google-for-free12

9. Spuštění okna s OpenRefine

Kliknou vlevo nahoře v terminálu ikonku.

Vybrat „Change port“ > „Port 8082“> klik

A je hotovo…

OpenRefine-hosted-by-Google-for-free13

Výsledek:

OpenRefine hostovaný na Google.
OpenRefine-hosted-by-Google-for-free14

Zkratky pro terminál (linux Debian):

  • Pokud chce zavřít program tak CTRL+C jej zabijete (Omluvte linux, ale je drsný a nemilosrdný)
  • Pokud ho chcete dát na pozadí CTRL+Z
  • Obnova programu co by dán na pozadí „fg %1“
  • Kontrola co vám všechno běží „ps“