LLM
Ein LLM (Large Language Model) ist eine Form der Künstlichen Intelligenz, die darauf spezialisiert ist, menschliche Sprache zu verstehen und zu erzeugen. Es basiert auf Wahrscheinlichkeitsmodellen und kann Texte analysieren sowie neue Inhalte generieren.
Funktionsweise und Verwendung
LLMs basieren auf Deep Learning und neuronalen Netzen und werden meist durch Self-Supervised Learning mit sehr großen Datenmengen trainiert. Dabei wird das Modell mit extrem großen Datenmengen gefüttert und muss eigenständig Muster und Zusammenhänge erkennen. So lernt es die statistischen Wort- und Satzfolgen der menschlichen Sprache und kann so Vorhersagen darüber treffen.
Texte werden in kleinere Einheiten (Tokens) zerlegt und in Zahlen umgewandelt. Auf dieser Basis berechnet das Modell, welches Wort im jeweiligen Kontext am wahrscheinlichsten als nächstes folgt. So entstehen zusammenhängende und verständliche Antworten. Folglich sind solche Modelle nicht schlau im eigentlichen Sinne, sondern einfach gut darin Wahrscheinlichkeiten vorherzusagen.
Praxisbeispiele
- Automatisches Beantworten von Kundenanfragen im Chat
- Generieren von Texten wie E-Mails oder Artikeln
- Übersetzen von Texten in verschiedene Sprachen
- Zusammenfassen von langen Dokumenten oder Berichten
