Sterke bachelor-oppgaver i KartAi-prosjektet

Det har vært hele fire bachelorprosjekter og et masterprosjekt direkte tilknyttet KartAi-prosjektet i vår. De har levert sterke resultater på flere ulike områder. Flere har fått toppkarakter: A 🥳

CADAiD – AI-validering av byggetegninger

Link til oppgaven: Rapporter og resultater

Ingeborg Brommeland Austeid
Julia Jørstad
Charlotte Celine Thorjussen


Obtaining a building permit can be a challenging and time-consuming process. When filling out a digital building application, applicants are required to submit various architectural drawings documenting the changes they want to make. However, architectural drawings have been reported as one of the main reasons behind incomplete building applications and application deficiencies. CADAid is developed to explore how machine learning can contribute in addressing these challenges. By developing a web application applying machine learning models, we can evaluate if drawings include the required drawing types, scale and cardinal direction, and room types. To achieve this, a phased, iterative development approach is employed for system development and machine learning integration. To conclude, machine learning can efficiently contribute to evaluation of architectural drawings within digital building applications, aiding verification of necessary requirements and reducing deficiencies.

ArkivGPT

Link til oppgaven: Rapporter og resultater

Markus Hwan Tørå Hagli
Nikolai Eidsheim
Sondre Horpestad

Architecture is critical in software development, particularly when translating stakeholder requirements into a functional system. This thesis introduces ArkivGPT, a building case summary generation system designed for caseworkers handling building permits. Based on microservice architecture, ArkivGPT connects to municipal archives to retrieve documents, utilizes a language model to generate summaries, and delivers these summaries to caseworkers. ArkivGPT is currently a minimum viable product (MVP) designed to be a proof of concept. To ensure that the system architecture aligns with the quality attributes specified by stakeholders — reliability, modifiability, scalability, and integratability — this study utilizes the Architectural Tradeoff Analysis Method (ATAM) to perform an analysis of the system. This method comprehensively examines the architecture through a structured process of nine steps across three phases, identifying whether the system meets the elicited quality attributes. Following the ATAM methodology, this analysis investigates ArkivGPT’s alignment with the identified quality attributes, revealing that while the architecture supports most scenarios, it encounters challenges in scalability and reliability. Specifically, the system’s integrity could be severely compromised due to issues originating from inadequate mapping within the archive. The analysis also reveals that there is a significant risk related to the internal communication pattern in the system because it may result in high resource usage when processing a high number of requests simultaneously. This study highlights the necessity of prioritizing modifications to the system architecture before its production release. However, the tradeoff between addressing every issue has to be evaluated due to its high complexity and potential cost implications. The improvements will ensure ArkivGPT meets its current stakeholder requirements and is robust enough to adapt to future demands.

GeoGPT – Søk i geografiske data med språkmodeller

Link til oppgaven: https://kompetansetorget.uia.no/fullfoerte-oppgaver/geogpt-soek-i-geografiske-data-med-spraakmodeller

Aleksander Grimstad Mo
Carsten Østergaard
Lars Gunnar Stokke
Theodor Litlere
William Peter Johansson Åredal

Prosjektsammendrag
Dette prosjektet har laget en «proof of concept» ved å benytte språkmodeller og vektordatabase til gjenfinning av geografisk data, for å forbedre søkefunksjonen på Kartverkets portal Geonorge.no.
Som prosjektmetodikk har gruppen hovedsakelig benyttet Scrum med Jira som styringsverktøy.

Teknologi

Den tekniske løsningen baserer seg på bruk av vektordatabasesøk med språkmodell embeddings og Retrieval Augmented Generation (RAG) for instruks av språkmodell til å besvare spørsmål med relevant kontekst hentet fra Vektor DB. I utviklingen er det brukt Javascript med HTML og CSS. For vektordatabasesøk er det benyttet PostgreSQL med Pgvector. Python, Pandas og Regex er benyttet blant annet for å rense metadata for DOK datasettene fra Geonorge. Docker, shell scripts og batch script er brukt for oppsett og kjøring av Vektor DB.

GeoGPT: An LLM-Based Geographic Information System

Link til oppgaven: Rapporter og resultater

Karl Oskar Magnus Holm
Master of Science in Engineering and ICT, June 2024
Supervisor: Hongchao Fan, NTNU
Co-supervisors: Alexander Salveson Nossum and Arild Nomeland, Norkart AS

Sammendrag
Nyvinninger innenfor språkprosessering har ført til fremveksten av store og kraftige språkmodeller, for eksempel modellene som ligger bak ChatGPT — en språkmodellbasert chat-applikasjon utviklet av OpenAI. Slike generative språkmodeller har vist seg å være allsidige, og denne masteroppgaven vil utnytte språkmodellenes evner til
logisk resonnering og kodegenerering til å utvikle en GIS-applikasjon som kan løse GIS-oppgaver basert kun på problemformuleringer fra brukeren i naturlig språk. Den foreslåtte løsningen, en applikasjonen ved navn GeoGPT, tilbyr tre forskjellige agenttyper som gjennom eksperimenter har vist at de kan utføre en rekke ulike GIS-analyser på OpenStreetMap (OSM)-data uten nevneverdig hjelp fra brukeren. GeoGPT utnytter function calling, som i prinsippet gir agentene muligheten til å ta i bruk eksterne verktøy. Agentene har blitt tildelt forskjellige verktøy og har også forskjellige måter å aksessere OSM-dataene på. Den ene agenten bruker en PostGIS-database, en annen bruker en OGC API Features-server for å laste ned GeoJSON over HTTP, og den tredje har direkte tilgang til shapefiler lagret lokalt i miljøet som GeoGPT kjører i. Eksperimentelle resultater, basert på en ny GIS-benchmark, viser at SQL/PostGIS-agenten gir korrekt
svar på flest oppgaver, i tillegg til å være raskest og billigst. Resultater fra et eksperiment utført for å evaluere betydningen av kvaliteten på problemformuleringen til brukeren, viser at det å gi GeoGPT sekvensielle trinn for å løse problemet forbedrer sjansen betraktelig for at den produserer riktig svar. Samlet sett viser arbeidet i denne masteroppgaven at et språkmodellbasert GIS, slik som GeoGPT, kan løse mange vanlige GIS-oppgaver basert kun på spørringer formulert ved naturlig språk, men også at GIS-ekspertise blir viktigere og viktigere etter hvert som oppgavene blir mer utfordrende.

Tilgjengeliggjøring av nasjonale kartdata til bruk i AI-algoritmer

Link til oppgaven: https://kompetansetorget.uia.no/fullfoerte-oppgaver/tilgjengeliggjoering-av-nasjonale-kartdata-til-bruk-i-ai-algoritmer

Gustav Svartsund
Victor Bakken
Cassandra Hartvedt Vårdal
Tørres Andreas Båshus
Larisa Saitova

Denne rapporten beskriver utviklingsprosessen for en applikasjon for generering av treningsdata til bruk for maskinlæringalgoritmer, og er en fortsettelse på et tidligere bachelorprosjekt fra våren 2023 med tittelen “Automatisering av dataflyt fra nasjonale kartbaser mot AI-algoritmer”. Prosjektet ble gjennomført i samarbeid med Tietoevry og Kartverket og går inn under et større forskningsprosjekt med navn KartAI. Målet med prosjektet er å tilgjengeliggjøre genereringen av kartdata som videre kan brukes til å trene maskinlæringsmodeller. Rapporten dekker hva som ble gjort under prosjektperioden som gikk fra januar 2024 til mai 2024.