KI-Begriff 1 Min. Lesezeit

Tokenize

Tokenize bezeichnet den Vorgang, einen konkreten Text mithilfe eines Tokenizers in IDs umzuwandeln.


Tokenize ist die praktische Anwendung der Tokenisierung: Ein String wird durch den Tokenizer geschickt und liefert eine Liste numerischer IDs. Die Rückrichtung heißt Detokenize. APIs bieten häufig Hilfsfunktionen, um Texte vor dem Senden zu tokenisieren und somit Kosten oder Limits zu planen.

Gründe

  • Validierung: Prüfen, ob Eingaben innerhalb des Kontextfensters bleiben.
  • Debugging: Sichtbar machen, welche Subwords ein Modell tatsächlich sieht.
  • Optimierung: Prompt-Engineering reduziert Tokenanzahl und damit Gebühren.
← Zurück zum Glossar
EU Made in Europe

Chat with 100+ AI Models in one App.

Use Claude, ChatGPT, Gemini alongside with EU-Hosted Models like Deepseek, GLM-5, Kimi K2.5 and many more.

Kundensupport