BigData

Artificial Intelligence in Farming

Projektsteckbrief BData4AF

Kurzbeschreibung des Projektes BigData for ArtIFARM

FuE-Projekt

KATEGORIE

4

PARTNER

≈ 353 Tsd. €

BUDGET

Nov. 2022 – Sep. 2024

LAUFZEIT

Das Team

Markscheider Prof. Dr.-Ing. Tobias Hillmann

Hochschule Neubrandenburg

Lehrstuhl für praktische Geodäsie, Kartographie und Datenverarbeitung

Prof. Dr.-Ing. Mark Vehse

Hochschule Stralsund

Lehrgebiet Konstruktion und digitale Produktentwicklung

Martin Schult M.Sc.

Wiit AG

Solution Architect

Heiner Clausohm

Clausohm-Software GmbH

Norman Rauthe M.Sc.

Hochschule Neubrandenburg

wissenschaftlicher Projektmitarbeiter

Maik Focke B.Sc

Hochschule Stralsund

wissenschaftlicher Projektmitarbeiter

Ziel des Vorhabens

Das Ziel des Projektes „Big Data System für landwirtschaftliche Anwendungen“ ist die Erhebung, Sammlung, Verarbeitung und Speicherung von unstrukturierten und
strukturierten Daten in einem Data Lake und deren Auswertung durch Data Science für alle Partner im ArtIFARM-Bündnis. Das Big Data System im ArtIFARM-Bündnis bildet eine technologische Grundlage für darauf aufsetzende FuE-Vorhaben. Es wächst durch diese darauf teilweise aufsetzenden Vorhaben mit zusätzlichen neuen Daten und wird für andere Use Cases durch diese Vorhaben weiter entwickelt.

Der BData4AF Data Lake bietet eine Grundlage für raum-zeitliche Datenstrukturen. Die Daten können über vielfältige standardisierte Schnittstellen in den Data Lake eingespeist und wiederum zur Verfügung gestellt werden. So lassen sich Daten zu Maschinen und Feldern direkt über die Hersteller-APIs beziehen. Ältere dateibasierte Archive, die bei den Landwirten gespeichert sind, können über die NextCloud-WebDAV-Schnittstelle einfach in den Data Lake übertragen werden. Eine vollautomatsche Bildverarbeitung von Drohnenaufnahmen ist ebenso möglich. Die Grundlage für weitere Schnittstellen sind gelegt, womit zeitnah weitere Landmaschinen-Hersteller oder auch Agrarmanagement Systeme
angebunden werden können.

Ergebnisse

Zu den wichtigsten Ergebnissen zählen die Konzipierung und der Aufbau des
Data Lakes. Dieser setzt sich aus den Teilsystemen Datenimport, Prozessierung,
Transformation, Speicherung, Bereitstellung, Recherche, Data Science, Identität und Zugangsmanagement zusammen.

Aktuell werden folgende Eingangsschnittstellen für den Import von Daten genutzt: das WebDAV Protokoll, zum Import von Daten aus zum Beispiel freigegebenen Ordnern der ArtIFARM OwnCloud, die Maschinendaten der Herstellers John Deere werden über dessen RestFul API abfragt und die Luftbilder des Drohnenherstellers DJI können direkt über die BData4AF DJI-Cloud oder direkt per Python Skript und SSH Protokoll in den Data Lake übertragen werden.

Die Prozessierung der Daten sowie das Management und Monitoring der Datapipelines wird durch das Open Source Framework Apache Airflow ermöglicht. Eine Oberfläche ermöglicht ein einfaches und übersichtliches Monitoring sowie eine Steuerung der bestehenden Pipelines. Mit dem dazugehörigen Python-Framework können durch Wissenschaftler weitere Worflows definiert und angepasst werden (siehe Beispiel im Bild).

Importierte Rohdaten werden in einem separaten Layer in einem Minio S3 Object Store in ihrem ursprünglichen Format und Umfang gespeichert. Im Folgenden werden die Daten hinsichtlich ihrer Datenintegrität analysiert harmonisiert und transformiert. Die harmonisierten Datensätze bilden dann die Grundlage für die Erstellung von Trainingsdatensätzen für KI-Modelle. Für Trainingsdatensätze sowie harmonisierte Rohdaten ist im Object Store ein weiterer Layer definiert und je Forschungsprojekt organisiert.

Anwendung

Als Beispielanwendung wurde ein Use Case zur Feldsteindetektion auf Luftbildern mittels eines KI-Modells umgesetzt. Dazu wurden Sensordaten durch
Drohnenbefliegungen als Grundlage für Trainings- und Testdaten erhoben und durch die Methode cGAN pix2pix synthetische Bilddaten generiert.

Es wurde gezeigt, dass auf Grundlage von echten und synthetischen Daten das KI-DETR-Modell 94,8 % der Feldsteine auf den Luftbildern erkennt (siehe Bild, rot umrandet die als Steine erkannten Objekte).

Das entwickelte KI-Modell steht inklusive den Trainingsdatensätzen und Datentransformationsprozessen zur Weiterentwicklung in anderen
Forschungsprojekten bzw. zur Verwendung in Demonstratoren zur Verfügung.

Nutzen für die Region

Der entwickelte Data Lake kann nun durch weitere Anwender*innen und für weitere Use Cases verwendet werden. Dabei wird dieses Werkzeug um so mächtiger, je mehr Datenquellen angebunden werden.

Auf Basis des ArtIFARM Data Lakes können nun in weiteren Projekten digitale Anwendungen entwickelt werden, die Landwirt*innen anhand der gesammelten Daten bei der Entscheidungsfindung unterstützen.

Ein weiteres Ziel ist, die Daten zu nutzen, um den bürokratischen Aufwand in der Landwirtschaft zu reduzieren, indem, wo ausreichend Daten schon vorhanden sind, Berichtspflichten weitestmöglich automatisiert werden.

Mehr erfahren?

Sie interessieren sich für den ArtIFARM Data Lake? Sie möchten mit dem Projektteam oder dem ArtIFARM-Bündnis direkt in Kontakt treten? Dann nutzen Sie gerne die Kontaktmöglichkeiten des Projektteams (oben) oder unser Kontaktformular.

Jetzt Kontakt aufnehmen