RAG 2.0

Erstellt von Johannes Eberhard, Geändert am Mi, 23 Apr um 2:57 NACHMITTAGS von Johannes Eberhard

Das neue Chunking

Unsere Plattform bietet Ihnen erweiterte Optionen beim Hochladen von Dateien, um den Prozess der Informations­extraktion und Text­aufteilung optimal an Ihre Bedürfnisse anzupassen.

 

Verfügbare Parsing-Modi:

 

  • Schnell – Sehr schnelle Extraktion von Kerndaten, ideal für große Datenmengen.
  • Normal – Erhält grundlegende Strukturinformationen für eine bessere Kontextanalyse.
  • Präzise – Bewahrt zusätzlich eingebettete Bilder zur umfassenderen Informationsgewinnung.
  • Präzise mit Bildbeschreibungen – Inklusive ausführlicher Bildbeschreibungen für maximale inhaltliche Tiefe und Barrierefreiheit.

 


Verfügbare Aufteilungs­methoden:

 

  • Rekursiv – Teilt den Text hierarchisch anhand einer Liste von Trennzeichen, um semantisch zusammenhängende Abschnitte zu bewahren.
  • HTML – Nutzt die HTML-Struktur des Dokuments, um Abschnitte basierend auf HTML-Tags wie Überschriften oder Absätzen zu erstellen.
  • Zeichenbasiert – Teilt den Text nach einer festen Anzahl von Zeichen, unabhängig von inhaltlichen oder strukturellen Merkmalen.
  • Markdown – Teilt den Text anhand vorhandener Markdown-Überschriften auf, um die logische Struktur des Dokuments zu erhalten.

War dieser Artikel hilfreich?

Das ist großartig!

Vielen Dank für das Feedback

Leider konnten wir nicht helfen

Vielen Dank für das Feedback

Wie können wir diesen Artikel verbessern?

Wählen Sie wenigstens einen der Gründe aus
CAPTCHA-Verifikation ist erforderlich.

Feedback gesendet

Wir wissen Ihre Bemühungen zu schätzen und werden versuchen, den Artikel zu korrigieren