byteNative
KI & Automatisierung

Vector Databases

Semantische Suche und Wissensdatenbanken für KI-Anwendungen.

Was ist Vector Databases?

Vektordatenbanken speichern Inhalte nicht als bloßen Text, sondern als Embedding, also eine Reihe von Zahlen, die die Bedeutung eines Abschnitts festhält. Eine Suche vergleicht dann nicht Buchstaben, sondern den Abstand zwischen diesen Punkten und findet so inhaltlich ähnliche Treffer, auch wenn nicht ein Wort wörtlich übereinstimmt. Sie bilden das Rückgrat semantischer Suche und liefern bei Retrieval-Augmented Generation genau die Passagen, auf die sich das Modell stützt. Ob als eigenständiges System wie Qdrant oder als pgvector-Erweiterung direkt in Postgres, das Prinzip bleibt dasselbe.

Wofür wir es nutzen

Wir nutzen Vektordatenbanken überall dort, wo Suche nach Bedeutung statt nach exakten Worten gefragt ist, vor allem als Gedächtnis hinter einem RAG-Assistenten. Wenn schon ein Postgres im Spiel ist, greifen wir gern zu pgvector und halten alles in einer einzigen Datenbank, statt ein weiteres System zu betreiben. Das hält den Betrieb schlank und die Daten an einem Ort.

sql
select id, content
from documents
order by embedding <=> '[0.12, -0.04, 0.88]'
limit 5;
ähnlichkeitssuche mit pgvector über den cosine-abstand

Gut zu wissen

Embeddings aus verschiedenen Modellen sind nicht vergleichbar, ihre Zahlen leben in unterschiedlichen Räumen. Wechselst du das Embedding-Modell, musst du deinen gesamten Index neu berechnen, also plane den Modellwechsel bewusst und nicht nebenbei.

00KI & Automatisierung

Weitere Werkzeuge, mit denen wir im selben Bereich arbeiten.

Welche Technologie passt zu dir?

Das musst du nicht entscheiden, das ist unser Job. Erzähl uns einfach von deinem Vorhaben.