Við undirbúning reikningsins þarf að vinna eftirfarandi verkþætti
Úrvinnslukerfið er byggt til þess að safna lykil gögnum sem nýtast við að fylla inn í PEFA-Builder vinnubókina. PEFA-Builder kerfið er þróað af Eurostat til þess að aðstoða við útfyllingu á PEFA Questionnaire eyðublaði.
Sum vinnslan í kerfinu er þung og því frekar hægvirk. Til þess að flýta fyrir endurtekinni vinnslu eru gögn tímabundið vistuð í _GognUt möppunni. Ef keyra á vinnsluna upp á nýtt þarf að fjarlægja þessi millibils skjöl, sem enda öll á .dput endingunni. _GognUt mappan inniheldur þar að auki ýmis skjöl sem úrvinnslukerfið býr til
Til þess að geta keyrt úrvinnslukerfið þarf viðkomandi að hafa les- og skrif- rétt inn á UmhverfisTolfraedi gagnagrunninn. Í sumum tilfellum þarf að setja inn notendanafnið í skriftuna, en þessu verður breytt í seinni uppfærslum
Gagnaflæði: Grunn hugmynd
Til þess að keyra úrvinnslukerfið þarf að sækja kóðann á gitlab með því að fara á https://code.hagstofa.local/ThorsteinnA/pefa_urvinnsla. Þennan kóða er hægt að sækja með því að hlaða honum niður, eða “klóna” með git. GitLab svæðið er líka með “development branch” línu þar sem nýjustu breytingar og hannanir eru settar inn.
Til viðbótar þarf að bæta við nokkrum möppum inn
Lykil upplýsingar fyrir reikninginn koma frá Orkustofnun í formi IEA reikninga sem þeir skila inn. Til viðbótar eru notuð gagnasett um dreifingu eldsneytis, fjölda ökutækja, kortaveltu og önnur gögn sem eru til innan Hagstofunnar.
Þessi skjöl eru sótt af vef Eurostat, eða fengin með fyrirspurn frá þeim. Mikilvægt er að skoða vandlega ef eihverjar breytingar eru skráðar í hverju á að skila. Einnig er mikilvægt að sækja nýjustu útgáfu af PEFA-Builder, þar sem eldri útgáfur geta ekki unnið upp úr nýrri IEA gögnum
Orkustofnun skilar þremur til fjórum gagnasettum til IEA, sem síðan eru áframsend til Euorstat.
Gagnasettin eru:
Skjölin ættu að vera send af Orkustofnun til okkar þegar búið er að skila þeim, en það er allur gangur á því. Ég hef þurft að senda beiðni til Jóns Ásgeirs Haukdal Þorvaldssonar undanfarin ár.
Gögnin eru oft með villum og mistökum í sér, sérstaklega þegar kemur að kolabókhaldinu, en einnig kemur fyrir að aðrar villur koma inn. Villurnar eru t.d.
Það getur því orðið nokkur vinna að leiðrétta tölur, en þetta þarf að gera ef PEFA-builder kerfið á að ná að klára vinnsluna
Þessar upplýsingar koma frá Orkustofnun. Tengiliður til 2021 var Jón Ásgeir Haukdal (jon.asgeir.haukdal@os.is). Þar á bæ er þetta þekkt sem “Notkunarskrá sem er send til Umhverfisstofnunar”. Excel skjalið er sem sent er frá Orkustofnun (t.d. Notkunarskrá send UST 240522.xlsx). Gögn úr skjalinu eru sett inn á gagnagrunninn í AEA vinnsluferlinu.
Þessar upplýsingar koma frá Samgöngustofu. Söfnun og uppvinnslu er lýst í verkefnislýsingunni fyrir “Samgöngustofa_ökutæki” verkefninu. Þetta verkefni ætti að klára í AEA vinnslunni
Þessar tölur eru sóttar af innri gagnagrunninum (zeus). Þar sem verslunargrunnurinn er með töflu fyrir hvert ár (og breytilegar upplýsingar um tollanúmer) var búin til söfnunartafla fyrir upplýsingar á því formi sem gagnast best í umhverfistölfræðinni. Lykil taflan er á Umhverfistolfraedi.vrsl.gogn_verslun. Til þess að uppfæra hana þarf að flytja línur úr viewinu: UmhverfisTolfraedi.vrsl.v_gogn_verslun_nyjast inn í töfluna (t.d.):
insert into Umhverfistolfraedi.vrsl.gogn_verslun
select * from UmhverfisTolfraedi.vrsl.v_gogn_verslun_nyjast
Þegar nýtt ár kemur inn í verslunargrunninn þarf að biðja um aðgang að þessari töflu og uppfæra lýsinguna á UmhverfisTolfraedi.vrsl.v_gogn_verslun_nyjast viewinu (ætti að vera nokkuð augljóst)
Líklegast þarf ekki að uppfæra vrsl.gogn_verslun töfluna í þessari framkvæmd, þar sem þessi aðgerð ætti að vera nokkuð reglulega framkvæmd í öðrum verkefnum.
Úrvinnslukerfið er allt í R-markdown skjölum. Hvert skjal í kerfinu vinnur eitt stórk verkefni, eða hluta af verkefnunum. Ef RMD skjölunum er raðað í stafrófsröð er keyrsluröðin rétt:
Skjölin eru:
Þessi vinnsla býr til “greiður” sem lýsa hvernig mismunandi liðir í IEA skjölunum eiga að dreifast niður á atvinnugreinar. Vinnslan er enn í þróun, en hér er notast við margskonar gagnalindir (rekstrar upplýsingar o.þ.h.) til þess að útbúa greiðuna. Það er gagnlegt að rýna kóðann af og til, en vinnslan ætti ekki að þurfa að breytast að ráði nema að við fáum nýjar upplýsingar í hús.
Vinnslan skilar excel skjali með fjölmörgum flipum. Skjalið er síðan notað af PEFA builder kerfinu
Þessi vinnsla býr til greiðu um hvernig eldsneyti sem skráð er í vegasamgöngur er notað eftir atvinnugreinum. Þetta er nákvæmlega sama vinnsla og er notuð í AEA úrvinnslunni og því er mikilvægt að hafa í huga samhæfingu á þessum tveimur niðurstöðum.
Vinnslan skilar excel skjali. Skjalið er síðan notað af PEFA builder kerfinu
Þessi vinnsla safnar upplýsingum um eldsneyti sem útlendingar kaupa hérlendis og eldsneyti sem Íslendingar kaupa erlendis. Því miður eru upplýsingarnar sem sóttar eru ekki nákvæmlega með sama niðurbroti og er kallað eftir í PEFA-builder kerfinu, en hér er hægt að skoða tímaraðir hvaða upplýsingar voru settar inn
Vinnslan skilar excel skjali með upplýsingum sem síðar eru afritaðar í vinnsluskrefi í PEFA-builder kerfinu
Eftir keyrsluna á R-pakkanum hef ég fært alla úrvinnslu yfir á V:/Fyrirtækjasvið/Fyrirtækjatölfræði/Umhverfisteymi/PEFA/ svæðið. Þar hef ég haldið utan um úrvinnsluna hvert ár. PEFA úrvinnslan (builderinn) býr til eitt skjal fyrir hvert skilaár. Ég hef keyrt eldri ár aftur (og skilað) ef ég hef fundið áberandi villu í gögnunum, eða viljað keyra gögn lengra aftur í tímann
Í möppunni Vinnsla 2021 (v5.6 - 2021) (og önnur ár) eru t.d. athugasemdir um leiðréttingar sem ég gerði við skilaskjölin (sem er ekki auðvelt að gera) og athugasemdir.
Eurostat er árlega með námskeið í hvernig á að nota PEFA builder kerfið. Að auki eru til vinnulýsingar og myndbönd sem hægt er að sækja af vefsíðu Eurostat. Mín reynsla er að þrátt fyrir allar þessar leiðbeiningar er PEFA-builder kerfið flókið, illskiljanlegt og villugjarnt. Lykillinn að því að fá þetta til þess að takast er:
Hönnun á PEFA-builder
Helstu villur sem ég hef lent í eru:
Ef PEFA-builderinn nær að klára er búið til eitt questionnaire skjal fyrir árið sem er unnið upp. Þetta skjal er með ógrynni af cross-check hlutum (supply/use) sem gerir nærri því ómögulegt að leiðrétta einstaka liði í skjalinu sjálfu. Ég hef samt
Skilað á gagnagáttinni þeirra. Hér þarf viðkomandi að vera samþykktur skilaaðili á gögnunum. Einnig er mikilvægt að líta yfir metadatað og halda utan um ef einhverjar breytingar hafi orðið á uppvinnslunni.
Skilaskjalið, eða skilaskjalið þegar það kemur aftur frá Eurostat með beiðni um breytingar og athugasemdir eru settar aftur inn á gagnagrunninn sem niðurstöður.
Þetta er gert í verkefninu “EUROSTAT_skilaskjol_aftur_inn”, sem er hægt að sækja á Gitlab á https://code.hagstofa.local/fyrirtaeki/umhverfistolfraedi/eurostat_skilaskjol_aftur_inn . Lýsing á þessu verkefni er annars staðar.
Byrting frétta byrjar á framleiðslu á px töflum. Þessi framleiðsla er í “px-smiðir” verkefninu sem hægt er að sækja á Gitlab á https://code.hagstofa.local/fyrirtaeki/umhverfistolfraedi/px-smidir . Lýsing á þessu verkefni er annars staðar.
Gagnasettin sem eru framleidd í þessu eru tengd keyrsluskjölunum.