Anwendung von Q&A-Modellen zur Extraktion von Unternehmensinformationen: Konzeption, Umsetzung und Benchmarking

Art

Masterarbeit

Track

Prototype,Main,Industry

Anwendung von Q&A-Modellen zur Extraktion von Unternehmensinformationen: Konzeption, Umsetzung und Benchmarking LSWI

Ziel

Ziel dieser Arbeit ist die Untersuchung, Weiterentwicklung und Anwendung von Q&A-Modellen zur Extraktion von Unternehmensinformationen. Es sollen bestehende LLM-Modelle evaluiert und im Rahmen des Design Science Research Methodology (DSRM) Ansatzes weiterentwickelt werden.

Hintergrund

Informationen über Unternehmen sind die Grundlage, um fundierte Entscheidungen über die Zusammenarbeit treffen zu können. Unternehmen teilen viele Informationen auf ihren Homepages, jedoch in unstrukturierter Form, die eine gezielte Verarbeitung und Analyse erfordert. Diese Daten, wenn richtig extrahiert und interpretiert, dienen als solide Grundlage für die Evaluierung potenzieller Geschäftspartner, wodurch Risiken minimiert und Chancen für erfolgreiche Zusammenarbeiten erkannt werden können. In einer schnelllebigen Geschäftswelt ist der Zugang zu präzisen und strukturierten Unternehmensinformationen, insbesondere aus primären Quellen wie Homepages, entscheidend, ein potenzieller Wettbewerbsvorteil.

Die Extraktion von spezifischen Informationen aus umfangreichen Texten ist ein wesentlicher Aspekt im Bereich der Datenanalyse. Hierbei können Q&A-Modelle, die auf Large Language Models (LLM) basieren, eine geeigneten Ansatz darstellen. Diese Modelle ermöglichen es, gezielte Fragen zu einem Text zu beantworten und dadurch relevante Informationen zu extrahieren.

Anforderungen

Methode / Vorgehen:

  1. Vergleich & Benchmarking: Untersuchung und Vergleich der Leistungsfähigkeit existierender Q&A-Modelle, als Ausgangspunkt für die Arbeit.
    1. Benchmarking: Vergleich der ausgewählten Modelle hinsichtlich ihrer Leistungsfähigkeit.
    2. Modellauswahl: Identifizierung und Auswahl geeigneter Q&A-Modelle als Basis.
  2. Fein-Tuning & Anpassung: Anwendung des DSRM Ansatzes zur Modellanpassung und -verbesserung.
    Fein-Tuning & Entwicklung: Ausgehend vom ausgewählten Modell soll dieses für den spezifischen Anwendungszweck feintrainiert und weiterentwickelt werden, wobei der DSRM Ansatz als methodischer Leitfaden dient.
  3. Validierung: Überprüfung des entwickelten Modells anhand realer Testfälle und Unternehmensinformationen.
    Das optimierte Modell soll anhand geeigneter Testfälle validiert werden. Hierbei sollen Informationen von einzelnen Unternehmen und einem Cluster von beispielsweise 100 Unternehmen extrahiert und analysiert werden.


Ergebnis: 
Am Ende der Arbeit steht ein Q&A-Modell, welches zielführend Unternehmensinformationen extrahiert. Die Ergebnisse sollen Aufschluss über die Stärken, Schwächen und Potenziale des Modells im Vergleich zu bestehenden Lösungen geben.

Studiengang

Interessierte Kandidaten mit Kenntnissen im Bereich Large Language Models, Datenverarbeitung und Machine Learning sind willkommen

Bewerbung

Um Ihnen eine optimale Betreuung bieten zu können, möchten wir Sie bitten, sich im Vorfeld intensiv mit dem Thema auseinanderzusetzen und erste Recherchen durchzuführen.

Alle relevanten Informationen zum Einreichungsprozess finden Sie auf unserer Website unter folgendem Link.

Vorgehen bei der Einreichung

  1. Füllen Sie das Kontaktformular aus und geben Sie darin Ihre Motivation an (Textfeld). Hängen Sie außerdem ein erstes Exposé als PDF an.
  2. Füllen Sie die Selbstauskunft vollständig aus, um uns weitere Informationen über sich selbst zu geben.

Selbstauskunft ausfüllen

Sobald Sie Ihre Arbeit eingereicht haben, wird sich die zuständige Betreuungsperson zeitnah per E-Mail bei Ihnen melden, um das weitere Vorgehen zu besprechen.

Vielen Dank für Ihre Mitarbeit und wir freuen uns auf Ihre Einreichung!