Ein Tensor ist eine mehrdimensionale Datenstruktur, die Vektoren und Matrizen verallgemeinert und als Grundformat in Deep-Learning-Frameworks dient.
Tensoren speichern Daten samt Form (Rank, Dimensionen) und Datentyp. Frameworks wie PyTorch oder TensorFlow führen sämtliche Operationen auf Tensoren aus – von Matrixmultiplikationen bis zu Convolutions. Layout, dtype und Gerät (CPU, GPU) sind Teil der Tensor-Metadaten.
Wichtige Aspekte
- Shape: Bestimmt Batchgröße, Sequenzlänge, Kanäle usw.
- Broadcasting: Erlaubt Operationen zwischen unterschiedlich großen Tensoren.
- Speicherort: Bewegungen zwischen CPU- und GPU-Speicher kosten Zeit und sollten minimiert werden.