Das chinesische Start-up DeepSeek hat eine neue Version seines Large Language Models vorgestellt. Es will damit andere Unternehmen ausstechen.
2
Kommentare

© Vincent Feuray/AFP/Getty Images
Im Wettrennen mit dem US-Softwareunternehmen OpenAI hat das chinesische KI-Start-up DeepSeek eine neue Version
seines
Large Language Model (LLM) V3-0324 vorgestellt. Dieses Sprachmodell dient dazu, Sprache zu interpretieren und darauf
zu reagieren. Es bildet die Basis-Technologie nicht nur für R1 von DeepSeek, sondern auch für Chatbots wie
ChatGPT von OpenAI oder Gemini von Google.
Vorgestellt wurde die neue Version des Sprachmodells auf der Entwicklerplattform Hugging Face. Demnach soll es besser
programmieren können als ihr Vorgänger. Außerdem soll es Fortschritte
beim sogenannten Reasoning geben: So soll
eine KI durch eine Art “logisches Denken” qualitativ hochwertigere
Antworten finden.
Das chinesische KI-Start-up DeepSeek hatte im Januar für Schlagzeilen gesorgt,
weil die chinesische KI westlichen Konkurrenten wie ChatGPT oder
Gemini ebenbürtig ist. Das hatten viele nicht erwartet. Zudem kostete die Entwicklung dem Start-up
zufolge nur einen Bruchteil der bis dahin üblichen Summen, auch benötigt die DeepSeek-Software weniger
Rechenpower als die Rivalen.
Als Reaktion darauf hatten
KI-Entwickler weltweit auf mehr Tempo bei der Entwicklung gedrängt. Im
Februar stellten OpenAI und der chinesische Technologie-Konzern
Tencent binnen weniger Stunden verbesserte Versionen
ihrer jeweiligen KI vor.