Mašininis mokymasis I: reikalavimai

Prieš du mėnesius buvo rašyta apie Mapbox sukurtą atvirą ortofotografijų atpažinimo programinę įrangą „Robosat“.

Robosat

Tai mašininio mokymosi, gilaus mokymosi (angl. deep learning) priemonė, skirta spręsti nuotraukų segmentavimo (angl. image segmentation) uždavinį. Čia patikslinsiu, kad nuotraukų analizę (angl. computer vision) grubiai galima būtų skirstyti į du tipus:

  • objektų aptikimas – galimybė nurodyti, kad „štai šiame nuotraukos stačiakampyje yra objektas X“,
  • segmentavimas – tai irgi objektų aptikimas, bet nuotraukos taško lygmenyje, t.y. nurodymas, kad „štai šitame pateiktos nuotraukos taške yra objektas X“ (paprastai aptiktas X objektas identifikuojamas daugiau nei viename nuotraukos taške, rezultato pavyzdį matote aukščiau pateiktoje iliustracijoje, kur identifikuojami pastatai, keliai ir medžiai).

Toks ortofotografijų segmentavimas leidžia spręsti tokius uždavinius:

  1. identifikuoti, kad kažkuriame Lietuvos segmente (ortofotografijos kvadratėlyje) yra ar nėra kažkokių objektų, tarkime pastatų,
  2. identifikuoti objektų geometrijas (formas).

Kaip tai pagerintų Lietuvos žymėjimo situaciją, lyginant su dabartine?

Pirmas punktas (objektų aptikimas) leidžia robotui duoti patikrinti atnaujintas ortofotografijos kaladėles (pvz. trečdalį Lietuvos) ir tada žmogų nukreipti tik į tas vietas, kur aptikti nepažymėti objektai (arba kur objektas pažymėtas, bet ortofotografijoje jo nebesimato). Taigi žmogus vis tiek turi atlikti žymėjimo darbą, bet jam nebereikia „ieškoti“ objektų žymėjimui. Pavyzdžiui rasti pastatus dideliuose retai gyvenamuose plotuose yra ne tokia jau ir paprasta užduotis – reikia peržiūrėti labai didelį plotą, o kai analizuojamame regione norimų objektų jau yra nemažai pažymėta, žmogaus dėmesys atbunka ir daroma nemažai klaidų (praleidžiami skirtumai tarp ortofotografijų ir sužymėtų objektų). Taipogi, kai objektus aptinka robotas, tai galima tikėtis tolygaus (pilno) objekto sužymėjimo visame apdorotame regione (pvz. Lietuvoje), t.y. galima tikėtis, kad bus sužymėti beveik visi objektai, o ne taip, kaip yra dabar – sužymėti tik tie plotai, kurie kažkam kažkodėl pasirodė įdomūs.

Antras punktas (objektų geometrijos identifikavimas) leistų dar daugiau – robotas galėtų (galbūt su žmogaus patvirtinimu) pats sužymėti (ar ištrinti) objektus.

Kas įmanoma, kas neįmanoma, kokios realios galimybės ir problemos, negalima atsakyti nepadarius bandymo su Lietuvoje naudojamomis Nacionalinės Žemės Tarnybos ortofotografijomis (ORT10LT). Atsakyti negalima, nes rezultatai labai priklauso nuo konkretaus ortofotografinio žemėlapio savybių: spalvų, rezoliucijos, analizuojamo objekto savybių (skirtingose šalyse skirtingi pastatai) ir pan. T.y. negalima tiesiog remtis užsienio rezultatais.

Kad tai būtų išsiaiškinta, jau beveik du mėnesius vykdomas bandomasis robosat naudojimas aplink Labanorą. Apie rezultatus parašysiu kitame įraše.

Share

Pastatai 2018

Kiek pastatų turime suvedę į atvirąjį žemėlapį? Palyginkime su GDR10LT.
Jei GDR’e yra 1,8 milijono pastatų, tai OpenStreetMap jų kol kas yra tik 0,8 milijono.
O čia galite pažiūrėti, kaip pastatų braižymas pasiskirstęs geografiškai:

Pastatų skaičiaus palyginimas su GDR

Kaip matome, pastatų dar labai daug trūksta. Labiausiai trūksta rečiau apgyvendintose vietovėse, soduose. Tikriausiai todėl, kad pastatai ten labai monotoniški – greitai pabosta braižyti. Taigi jei kada rasite laisvas kelias minutes – pridėkite naujų namukų – juos braižyti galima minutę, galima pusvalandį – kaip jau jums patinka. Ir žemėlapius pastatai tikrai labai praturtina, ir adresus suvesti žmonėms paprasčiau, ir įvairias lankytinas vietas žymėti aiškiau.

Share

Vilnius 2007-2018

Vilniaus atvirasis žemėlapis ne visada buvo toks detalus, koks yra šiandien. Jį pildome jau daugiau nei 10 metų. Automatinis importas buvo darytas tik su adresų informacija, taigi visi keliai, pastatai, lankytinos vietos yra suvestos, patikrintos ir pataisytos rankomis.
Šiame video galima pamatyti, kaip Vilniaus kelių duomenys pildėsi nuo 2007 iki 2018 metų.

Jei norite patys susikurti istorinį video savo miestui, instrukciją ir reikiamą skriptą rasite straipsnyje apie istorijos video kūrimą. Jums reikės kantrybės importuojant duomenis, o video kūrimas QGIS’u jau tik vaikų žaidimas.

Share

Kartografijos problemos ir jų sprendimai

Pagrindiniu vadinamas OpenStreetMap žemėlapis (tas, kurį matome www.openstreetmap.org) dažnai sulaukia neigiamų nuomonių, nes yra perkrautas, jame rodoma (ar bandoma rodyti) galybė įvairiausios informacijos, neaiškus žemėlapio tikslas ir žinutė, kurią jis bando perduoti. Bet geriau pasidomėjus paaiškėja, didžioji dalis tokios kritikos nėra pelnyta, šio žemėlapio kartografai sprendžia labai netrivialias problemas. „Pagrindinis“ žemėlapis visų pirma yra skirtas žymėtojams, kad jie matytų tai, ką sužymėjo. Tai reiškia, kad jis skirtas labiau žemėlapiais besidominčiais žmonėmis nei eilinis žmogus, todėl persotinimas yra leistinas. Taip pat reikia suprasti, kad šis stilius yra skirtas rodyti viso pasaulio duomenis, o tai reiškia, kad kartografai turi išspręsti galybę įvairiausių uždavinių, kaip maksimaliai aiškiai pavaizduoti norimą informaciją, kai jos variacijų gali būti labai labai daug. Jei kažkokia simbolizavimo priemonė (spalva, šablonas, simboliai) panaudoti vienoje vietoje vaizduoti elementui ar savybei X, kitame pasaulio gale elementui Y jau reikia ieškoti kitokių sprendimų. O juk sprendimas kiek įmanoma turi būti intuityvus.

Imagico

Tinklaraštyje blog.imagico.de galima šiek tiek paskaityti pasakojimų, kokios pasitaiko problemos ir kokie kartografiniai jų sprendimai svarstomi ar pritaikomi OpenStreetMap žemėlapyje.

  • Paišyti linijas yra paprasčiausia dalis. Ar tikrai? Ką daryti, kai daug neištisinių (punktyrinių) linijų reikia pavaizduoti šalia, jei jos nėra tiesios? Kaip turint ribotą spalvų kiekį pavaizduoti svarbias kelio savybes: klasifikaciją, dangą, paskirtį? Ar esate pastebėję „pašvaistę“ aplink žemėlapyje rodomą tekstą? O pašvaistę aplink kelius?
  • Vandens įraše aprašomas vandens objektų vaizdavimas. Dažniausiai visas vanduo būna vienos spalvos, bet gal nebūtinai? Gal galima skirtingomis spalvomis pavaizduoti skirtingas vandens savybes, ir tai padaryti taip, kad žemėlapio naudotojui vaizdavimo skirtumai būtų kiek galima intuityvesni? O kaip vaizduoti brastas, kad jos neuždengtų savęs?
  • Miškų vaidavimo įraše rasite informacijos apie tai, kokie gali būti miškai, iš karto pasakysiu, kad tai ne tik: lapuočiai, spygliuočiai ir mišrūs. Kaip skirtingi miškai buvo vaizduojami skirtingais istoriniais periodais. Kokie miškų žymėjimai yra svarbūs? Koks gaunasi galutinis miškų vaizdas?

Taip, didžioji dalis šios informacijos yra gan specifinė ir techninė, bet tai turėtų būti geras pavyzdys, ką gi daro „tie kartografai“. Pagaliau kiekvienam žemėlapių mylėtojui šie įmagico.de įrašai turėtų būti malonūs skaityti, nes yra daug iliustracijų 🙂

Share

Pasivaikščiojimo informacija OsmAnd

Pasivaikščiojus po įdomesnio landšafto vietas, tarkim po „Karoliniškių kraštovaizdžio draustinį“:

Karoliniškių kraštovaizdžio draustinis

labai vaizdžiai informaciją apie greičio ir aukščio pasikeitimus rodo OsmAnd:

OsmAnd pėdsako informacija

Matome ne tik įprastą informaciją: kelią žemėlapyje, nueitą atstumą ir trukmę, bet ir greičio bei aukščio kitimus kelionės metu. Ypatingai pedantiškiems ar asmeninės informacijos saugotojams OsmAnd leidžia netgi redaguoti savo pėdsakus (ištrinti, pakeisti, pridėti taškus).

Kad veiktų šitas gėris, reikia įgalinti įskiepį „Įrašyti savo keliones“. Tada pagrindiniame žemėlapio ekrane atsiras mygtukas, leidžiantis pradėti, baigti pėdsakų įrašymą. Vėliau, duomenų skydelio maršrutų skiltyje parinkę kurį nors įrašytą pėdsaką, matysite aukščiau pateiktą vaizdelį.

Jei įgalinsite įskiepį „OSM redagavimas“, tai prie maršrutų veiksmų atsiras parinktis „Eksportuoti“, kuri jūsų pėdsaką įkels į OpenStreetMap pėdsakų bazę, todėl vėliau šį pėdsaką galės naudoti visi žemėlapio redaguotojai, braižydami naujus ar tikslindami esamus takus. Lietuvoje dar yra pažintinių takų, kurie pažymėti tik kaip taškai, t.y. kurių keliai nežinomi 😉

Share