Audio-Transkription

Erstellt von Johannes Eberhard, Geändert am Mo, 2 Jun um 3:57 NACHMITTAGS von Johannes Eberhard

POST /public-voice/audio/transcriptions
Transkribiert Audio-Dateien in Text (z. B. Sprache-zu-Text)

Parameter

  • Datei (erforderlich): Audio-Datei (MP3, WAV, etc.)
  • Prompt: Optionaler Kontexttext zur Verbesserung der Genauigkeit
  • Response Format: Ausgabeformat (Standard: json)
  • Timestamp Granularities: Zeitstempel pro Wort/Segment (z. B. ["word"])


Beispiel Request

curl -X 'POST' \
  'https://IHRE_INSTANZ.localmind.dev/localmind/public-voice/audio/transcriptions' \
  -H 'accept: application/json' \
  -H 'Content-Type: multipart/form-data' \
  -F 'file=@Aufzeichnung.m4a;type=audio/x-m4a' \
  -F 'language=' \
  -F 'response_format=json' \
  -F 'temperature=0'
Generic

Beispiel Response

{
  "text": "Das ist eine Testaufnahme.",
  "language": null,
  "task": "transcribe",
  "duration": 2.12,
  "words": null,
  "segments": [
    {
      "id": 0,
      "avg_logprob": null,
      "compression_ratio": null,
      "end": 2.12,
      "no_speech_prob": null,
      "seek": null,
      "start": 0,
      "temperature": null,
      "text": "Das ist eine Testaufnahme.",
      "tokens": null
    }
  ]
Generic

War dieser Artikel hilfreich?

Das ist großartig!

Vielen Dank für das Feedback

Leider konnten wir nicht helfen

Vielen Dank für das Feedback

Wie können wir diesen Artikel verbessern?

Wählen Sie wenigstens einen der Gründe aus
CAPTCHA-Verifikation ist erforderlich.

Feedback gesendet

Wir wissen Ihre Bemühungen zu schätzen und werden versuchen, den Artikel zu korrigieren