Teuken-7B: Ein neues Sprachmodell für Europa

Die bekanntesten KI-Sprachmodelle (Large Language Models) kommen aus den USA: GPT von OpenAIGoogles Gemini oder Claude vom KI-Start-up Anthropic. All diese LLMs haben gemeinsam, dass sie proprietär sind. Das bedeutet, dass der Quellcode der Programme nicht öffentlich einsehbar und modifizierbar ist. Die Daten werden auf den Servern der Firmen verarbeitet. Das macht sie nicht besonders datenschutzfreundlich. Es gibt inzwischen auch einige offene Sprachmodelle, jetzt kommt ein weiteres aus Deutschland dazu.

Teuken-7B Screenshot

Was kann Teuken-7B?

Teuken-7B ist ein Open-Source-Sprachmodell, das von der Initiative OpenGPT-X entwickelt wurde. Das Forschungsprojekt wird geleitet von den beiden Fraunhofer-Instituten für Intelligente Analyse- und Informationssysteme (IAIS) und für Integrierte Schaltungen (IIS). Außerdem sind das Forschungszentrum Jülich und Unternehmen wie Aleph Alpha, der WDR und IONOS SE beteiligt.

Das Modell wurde darauf trainiert, besonders gute Ergebnisse in den 24 Landessprachen der EU zu liefern. Dadurch, dass das Modell offen ist, kann es auf dem eigenen Computer Texte generieren. Dadurch ist es datenschutzfreundlich. Die Qualität der Texte, die von offenen Sprachmodellen generiert werden, ist aber oft nicht so gut wie die von bekannten kommerziellen LLMs.

Wie nutze ich Teuken-7B?

Teuken-7B hat bislang keine Online-Schnittstelle, um das Modell auszuprobieren. Das macht es für Menschen mit wenig technischer Vorerfahrung ziemlich kompliziert.

Um Texte mit Teuken-7B auf dem eigenen Computer auszuführen, musst du das Modell über eine Programmierumgebung ansprechen. Wie das funktioniert, wird zum Beispiel hier erklärt.

Wem das zu kompliziert ist, dem rate ich abzuwarten. In den nächsten Monaten wird die Teuken-7B sicher über Tools wie HuggingChat erreichbar sein.

Wie viel kostet Teuken-7B?

Dadurch, dass Teuken-7B als Open-Source-Projekt entwickelt wurde, ist das Sprachmodell kostenlos.

Transparenz: Beim Schreiben dieses Artikels hat mich das KI-Sprachmodell GPT-4 unterstützt.