9 Open Source LLMs, die man im Auge behalten sollte

Im vergangenen Jahr hat das Interesse an großen Sprachmodellen und LLM-Agenten stark zugenommen. Da sich große Sprachmodelle weiterhin in vielen Bereichen durchsetzen, werden sie sich verzweigen und domänenspezifischer werden, um komplexe Probleme zu lösen, für die allgemeine LLMs nicht gut geeignet sind.

Werfen wir also einen Blick auf einige interessante und neue Open-Source-LLMs und LLM-Agenten:

Open Interpreter:

Open Interpreter ist ein Projekt, das darauf abzielt, einen universellen Dolmetscher für große Sprachmodelle zu schaffen. Dies würde es LLMs ermöglichen, miteinander zu kommunizieren und auf Informationen aus einer Vielzahl von Quellen zuzugreifen, so dass sie Informationen gemeinsam nutzen und effizienter an Aufgaben zusammenarbeiten können.

Das Projekt befindet sich noch in der Anfangsphase, hat aber das Potenzial, die Art und Weise, wie Open-Source-LLMs eingesetzt werden, zu revolutionieren. Wenn es erfolgreich ist, könnte es dazu führen, dass LLMs in einer Vielzahl neuer Anwendungen eingesetzt werden, vom Kundendienst bis zur medizinischen Diagnose.

LLama2.c:

LLama2.c ist ein Fork des LLM-Projekts von Andrej Karpathy. Es soll effizienter und einfacher zu benutzen sein als der ursprüngliche LLM. LLama2.c ist in C geschrieben, während der ursprüngliche LLM in Python geschrieben ist. Dies macht LLama2.c schneller und speichereffizienter als den ursprünglichen LLM. LLama2.c enthält auch mehrere Funktionen, die die Benutzung erleichtern, wie z.B. eine Befehlszeilenschnittstelle und eine grafische Benutzeroberfläche.

Fooocus:

Fooocus ist ein Projekt, das darauf abzielt, ein großes Sprachmodell (LLM) zu erstellen, das sich auf bestimmte Aufgaben konzentrieren kann. Dies würde es ermöglichen, LLMs zur Lösung von Problemen einzusetzen, die für andere Methoden zu komplex sind. Beispielsweise könnte ein LLM, das sich auf die Aufgabe des Schreibens von Code konzentriert, zur Generierung von Code für komplexe Softwareanwendungen verwendet werden. Oder ein LLM, das sich auf die Aufgabe der Übersetzung von Sprachen konzentriert, könnte verwendet werden, um Dokumente von einer Sprache in eine andere zu übersetzen.

Das Fooocus-Projekt befindet sich noch in der Anfangsphase, aber es hat das Potenzial, die Art und Weise, wie wir LLMs einsetzen, zu revolutionieren. Indem wir LLMs auf spezifische Aufgaben konzentrieren, können wir sie zu viel leistungsfähigeren und nützlicheren Werkzeugen machen.

CodeLllama:

CodeLllama ist ein LLM-Agent, der darauf trainiert wurde, Code zu schreiben und Code in einer Vielzahl von Programmiersprachen zu erzeugen. Einige der Sprachen sind Python, Java und C++. Natürlich ist CodeLlama kein Ersatz für Programmierer, sondern kann dazu verwendet werden, Code für eine Vielzahl von Aufgaben zu generieren, wie z. B. die Erstellung von Webanwendungen, die Entwicklung von mobilen Anwendungen und das Schreiben von Skripten. Dadurch gewinnen die Entwickler wertvolle Zeit, um sich auf komplexere Projekte und die Planung zu konzentrieren.

Es kann auch verwendet werden, um Code für bestimmte Zwecke zu generieren, z. B. um Code zur Implementierung eines bestimmten Algorithmus oder zur Lösung eines bestimmten Problems zu generieren. CodeLlama ist ein leistungsstarkes Werkzeug, das sowohl von erfahrenen als auch von unerfahrenen Programmierern verwendet werden kann.

Llama-gpt:

Llama-gpt ist ein großer Sprachmodell-Agent, der darauf trainiert wurde, Text im Stil von GPT‑3 zu erzeugen. Er kann verwendet werden, um eine Vielzahl verschiedener Arten von Inhalten zu erstellen, wie z. B. Blogbeiträge, Artikel und Geschichten. Dies könnte für Autoren, Blogger und Vermarkter, die ihre Produktivität steigern wollen, hilfreich sein. Llama-gpt befindet sich noch in der Entwicklungsphase, wurde aber bereits für die Erstellung verschiedener Arten von Inhalten wie Blogbeiträge, Artikel und Geschichten verwendet. Es ist ein vielversprechendes Tool, das das Potenzial hat, die Art und Weise, wie Inhalte erstellt werden, zu revolutionieren.

OpenTF:

OpenTF ist ein Projekt, das darauf abzielt, eine Open-Source-Implementierung von TensorFlow zu schaffen. Dies würde es ermöglichen, TensorFlow auf einer breiteren Palette von Plattformen zu verwenden und würde auch eine größere Anpassung und Flexibilität bei der Verwendung von TensorFlow ermöglichen.

Zum Beispiel könnten Entwickler OpenTF verwenden, um ihre Versionen von TensorFlow zu erstellen, die für bestimmte Aufgaben oder Plattformen optimiert sind. Zusätzlich könnte OpenTF verwendet werden, um neue Features und Funktionalitäten zu schaffen, die derzeit in der proprietären Implementierung von TensorFlow nicht verfügbar sind. Das Projekt zielt darauf ab, eine Open-Source-Implementierung zu schaffen und würde es ermöglichen, TensorFlow auf einer breiteren Palette von Plattformen zu verwenden, einschließlich solcher, die von der aktuellen Iteration nicht unterstützt werden.

Vall-E‑X:

Vall-E‑X ist ein Projekt, das darauf abzielt, ein LLM zu schaffen, das die menschliche Sprache nachahmen kann. Es befindet sich noch in der Entwicklung, hat aber das Potenzial, die Art und Weise, wie wir mit Computern interagieren, zu revolutionieren. Derzeit interagieren wir mit Computern über eine Vielzahl von Schnittstellen, darunter Tastaturen, Mäuse und Touchscreens. Diese Schnittstellen sind jedoch nur begrenzt in der Lage, natürliche menschliche Sprache zu vermitteln.

Das Projekt hofft, diese Beschränkungen zu überwinden, indem es Menschen ermöglicht, mit Computern unter Verwendung natürlicher Sprache zu interagieren. Dies würde es uns viel leichter machen, Computern Anweisungen zu geben und ihnen Fragen zu stellen. Es würde uns auch ermöglichen, natürlichere Gespräche mit Computern zu führen. Vall-E‑X befindet sich noch in einem frühen Entwicklungsstadium, aber es hat das Potenzial, die Art und Weise, wie wir in Zukunft mit Computern interagieren, zu verändern.

AI Town:

AI Town ist ein Projekt, das darauf abzielt, eine virtuelle Welt zu schaffen, in der LLMs miteinander und mit Menschen interagieren können. Wir könnten zum Beispiel sehen, wie LLMs in einem sozialen Umfeld miteinander interagieren und wie sie auf verschiedene Aufforderungen und Fragen von Menschen reagieren. Diese Informationen könnten uns helfen, besser zu verstehen, wie LLMs lernen und denken, und wie sie in einer Vielzahl von Anwendungen eingesetzt werden können.

Darüber hinaus könnte KI Town zur Entwicklung neuer Formen der Unterhaltung und Bildung eingesetzt werden. Zum Beispiel könnten wir virtuelle Welten schaffen, in denen LLMs als Fremdenführer fungieren oder Bildungsinhalte vermitteln.

Seamless Communication:

Seamless Communication ist ein Projekt, das darauf abzielt, ein System zu schaffen, das automatisch zwischen verschiedenen Sprachen übersetzen kann. Dies würde es Menschen aus aller Welt ermöglichen, einfacher und möglicherweise in Echtzeit miteinander zu kommunizieren.

Dies sind nur einige der vielen neuen LLMs und LLM-Agenten, die derzeit entwickelt werden. LLMs haben das Potenzial, viele verschiedene Branchen zu revolutionieren, und wir sind gespannt, was die Zukunft für diese Technologie bereithält.

Quelle: medium.com

Akzeptieren
Name	YouTube
Anbieter	Google LLC
Zweck	Diese Webseite verwendet Youtube zu Marketingzwecken. Die Daten werden an einen Server in den USA übertragen und dort gespeichert. Die personenbezogenen Daten werden auf Grundlage des Art. 46 und/oder Art. 49 Abs. 1 lit. a) DSGVO übermittelt.
Laufzeit	Daten werden gelöscht, sobald sie für die Bearbeitung nicht mehr benötigt werden.
Weiterführende Infos	https://policies.google.com/privacy

Akzeptieren
Name	hellotrust
Anbieter	Keyed GmbH
Zweck	hellotrust speichert den Zustimmungsstatus des Benutzers für Cookies auf der aktuellen Domain.
Laufzeit	Daten werden gelöscht, sobald sie für die Bearbeitung nicht mehr benötigt werden.
Weiterführende Infos	https://hellotrust.de/datenschutz

Akzeptieren
Name	Google Analytics
Anbieter	Google LLC
Zweck	Diese Webseite verwendet Google Analytics zur Analyse der Websitebenutzung durch Nutzer. Die Daten werden an einen Server von Google in den USA übertragen und dort gespeichert. Die personenbezogenen Daten werden auf Grundlage des Art. 46 und/oder Art. 49 Abs. 1 lit. a) DSGVO übermittelt.
Laufzeit	Daten werden gelöscht, sobald sie für die Bearbeitung nicht mehr benötigt werden. In der Regel werden die Cookies von Google für eine Dauer von 2 Jahren gespeichert.
Weiterführende Infos	https://policies.google.com/privacy