Projektsteckbrief BData4AF
Kurzbeschreibung des Projektes BigData for ArtIFARM
Kategorie
FuE-Projekt
Partner
4
Budget
≈ 353 Tsd. €
Laufzeit
Nov. 2022 – April 2024
Das Team
Markscheider Prof. Dr.-Ing. Tobias Hillmann
Hochschule Neubrandenburg
Lehrstuhl für praktische Geodäsie, Kartographie und Datenverarbeitung
Prof. Dr.-Ing. Mark Vehse
Hochschule Stralsund
Lehrgebiet Konstruktion und digitale Produktentwicklung
Martin Schult M.Sc.
Boreus GmbH
Solution Architect
Heiner Clausohm
Clausohm-Software GmbH
…
Norman Rauthe M.Sc.
Hochschule Neubrandenburg
wissenschaftlicher Projektmitarbeiter
Maik Focke B.Sc
Hochschule Stralsund
wissenschaftlicher Projektmitarbeiter
Das ArtIFARM-Bündnis fokussiert als kurzfristiges Ziel als einer der ersten Schritte die Entwicklung einer technologischen Grundlage einer regionalen Big Data Infrastruktur und als mittelfristiges Ziel den Aufbau einer Big Data-Datenstruktur nach Bedarfsanalyse aller Bündnispartner sowie die Entwicklung von Algorithmen zur künstlichen Intelligenz im Anwendungsrahmen.
Das Ziel des Projektes „Big Data System für landwirtschaftliche Anwendungen“ ist die Erhebung, Sammlung, Verarbeitung und Speicherung von unstrukturierten und strukturierten Daten in einem Data Lake und deren Auswertung durch Data Science für alle Partner im ArtIFARM-Bündnis. Das Big Data System ist als Startervorhaben im ArtIFARM-Bündnis Grundlage und Basis für darauf aufsetzende KI-FuE-Vorhaben und soll durch diese darauf teilweise aufsetzenden Vorhaben mit zusätzlichen neuen Daten weiterwachsen und für andere Use Cases durch diese Vorhaben weiterentwickelt werden. Das Big Data System bildet die Grundlage aller weiteren IT-Anwendungen im landwirtschaftlichen Bereich, bei denen raum-zeitliche Datenstrukturen die Basis für weitere Anwendungen und Lösungen bilden. Die in dem Big Data System zu sammelnden Daten stehen teilweise als Open Data (als OGC Webservices oder zum Direktdownload) zur Verfügung. Die georeferenzierten offenen Daten aus dem Bundesland Mecklenburg-Vorpommern oder aus Fernerkundungsprogrammen weisen allerdings für viele landwirtschaftliche Anwendungen eine zu unzureichende räumliche und spektrale Auflösung auf. Daher sollen auch Schnittstellen für weitere Daten, die von unterschiedlichen Sensoren (aus Bodenmechanik, Geophysik und Physik, Chemie, Bildverarbeitung etc.) und von unterschiedlichen Plattformen (Fahrzeug, Luftfahrzeug, Drohne) generiert werden, geschaffen werden. Dabei müssen die Daten hinsichtlich ihrer Datenintegrität analysiert, bewertet und ggf. korrigiert werden. Mit den unterschiedlichen Techniken und Analysemethoden der Künstlichen Intelligenz werden verschiedene Vorhersage- und Analyseschichten zum Big Data System hinzugefügt. Das Analyse-KI-System soll für unterschiedliche Aufgaben angelernt und trainiert werden, damit es für universelle landwirtschaftliche Aufgaben einsetzbar ist.
Das Big Data System ist die Datengrundlage für das WIR!-ArtIFARM-Bündnis.
Das Big Data System soll als Demonstrator allen ArtIFARM-Bündnispartnern für eigene Untersuchungen, Projekte und KI-Anwendungen zur Verfügung gestellt werden. Dabei versteht sich das Big Data System als offenes modulares System, bei dem auch zukünftige nicht erfasste Daten/Datentypen gespeichert und berücksichtigt werden können.
Vorbereitende Maßnahmen zur Datensammlung und Datenstrukturierung wie die Abfrage und Erfassung aller möglicher Datenquellen für landwirtschaftliche Anwendungen. Die zu sammelnden Daten aus zugänglichen Quellen, aus Quellen von Bündnispartnern und in Echtzeit erfasste Daten müssen für das Big Data System strukturiert werden. In der Datenbank soll der Raumbezug auf ETRS89/UTM erfolgen, daher ist bei allen raumbezogenen Daten die Georeferenzierung und Atmosphärenkorrektur-Korrektur abzugleichen und vorzunehmen. Je nach Big Data System müssen die Im- und Export-Datenformatschnittstellen festgelegt werden, hier ist auch festzulegen, ob Originaldaten (Data Lake) oder strukturierte Daten (Data Warehouse) verarbeitet und gespeichert werden. Beim Aspekt der Datenintegrität werden Maßnahmen zum Schutz gegen interne und externe Verstöße erarbeitet und die Einhaltung der gesetzlichen Vorschriften nach den Parametern des ALCOA-Prinzips etabliert.
Realisierung der Datenbankstruktur, Datenbank, Datenbankabfragen und der Kommunikation mit der Datenbank.
Entwicklung von exemplarischen Lösungen und Datenanalysen durch Machine Learning- und Deep Learning-Algorithmen mit bekannten und unbekannten Klassifizierungen. Zur Verarbeitung von heterogenen und unscharfen Daten sollen Bayes’sche Netze eingebunden werden. Prozesse zum Deuten, Interpretieren und Verstehen der Ergebnisse beinhalten auch das Ermitteln von Alternativlösungen aufgrund unscharfer Daten oder von Faktoren unbekannter Gewichtung. Zur bestmöglichen Nutzung muss die Usability für unterschiedliche Anwendergruppen untersucht und das System angepasst werden.
Ferner werden die Aspekte der Datensicherheit, Datenverfügbarkeit und des Datenschutzes bearbeitet. Die thematischen Schwerpunkte sind hier die Transparenz von prozessierten und veredelten Daten, die Nachweisführung und Kontrolle über die zur Verfügung gestellten Daten, das Nutzen von Daten für unterschiedliche Anwendungen, Aktivitäten und eventueller Austausch mit anderen Systemen oder Lösungen.