Im ver­gan­ge­nen Jahr hat das Inter­esse an gro­ßen Sprach­mo­del­len und LLM-Agen­ten stark zuge­nom­men. Da sich große Sprach­mo­delle wei­ter­hin in vie­len Berei­chen durch­set­zen, wer­den sie sich ver­zwei­gen und domä­nen­spe­zi­fi­scher wer­den, um kom­plexe Pro­bleme zu lösen, für die all­ge­meine LLMs nicht gut geeig­net sind.

Wer­fen wir also einen Blick auf einige inter­es­sante und neue Open-Source-LLMs und LLM-Agenten:

Open Inter­pre­ter:

Open Inter­pre­ter ist ein Pro­jekt, das dar­auf abzielt, einen uni­ver­sel­len Dol­met­scher für große Sprach­mo­delle zu schaf­fen. Dies würde es LLMs ermög­li­chen, mit­ein­an­der zu kom­mu­ni­zie­ren und auf Infor­ma­tio­nen aus einer Viel­zahl von Quel­len zuzu­grei­fen, so dass sie Infor­ma­tio­nen gemein­sam nut­zen und effi­zi­en­ter an Auf­ga­ben zusam­men­ar­bei­ten können.

Das Pro­jekt befin­det sich noch in der Anfangs­phase, hat aber das Poten­zial, die Art und Weise, wie Open-Source-LLMs ein­ge­setzt wer­den, zu revo­lu­tio­nie­ren. Wenn es erfolg­reich ist, könnte es dazu füh­ren, dass LLMs in einer Viel­zahl neuer Anwen­dun­gen ein­ge­setzt wer­den, vom Kun­den­dienst bis zur medi­zi­ni­schen Diagnose.

LLama2.c:

LLama2.c ist ein Fork des LLM-Pro­jekts von Andrej Kar­pa­thy. Es soll effi­zi­en­ter und ein­fa­cher zu benut­zen sein als der ursprüng­li­che LLM. LLama2.c ist in C geschrie­ben, wäh­rend der ursprüng­li­che LLM in Python geschrie­ben ist. Dies macht LLama2.c schnel­ler und spei­cher­ef­fi­zi­en­ter als den ursprüng­li­chen LLM. LLama2.c ent­hält auch meh­rere Funk­tio­nen, die die Benut­zung erleich­tern, wie z.B. eine Befehls­zei­len­schnitt­stelle und eine gra­fi­sche Benutzeroberfläche.

Fooo­cus:

Fooo­cus ist ein Pro­jekt, das dar­auf abzielt, ein gro­ßes Sprach­mo­dell (LLM) zu erstel­len, das sich auf bestimmte Auf­ga­ben kon­zen­trie­ren kann. Dies würde es ermög­li­chen, LLMs zur Lösung von Pro­ble­men ein­zu­set­zen, die für andere Metho­den zu kom­plex sind. Bei­spiels­weise könnte ein LLM, das sich auf die Auf­gabe des Schrei­bens von Code kon­zen­triert, zur Gene­rie­rung von Code für kom­plexe Soft­ware­an­wen­dun­gen ver­wen­det wer­den. Oder ein LLM, das sich auf die Auf­gabe der Über­set­zung von Spra­chen kon­zen­triert, könnte ver­wen­det wer­den, um Doku­mente von einer Spra­che in eine andere zu übersetzen.

Das Fooo­cus-Pro­jekt befin­det sich noch in der Anfangs­phase, aber es hat das Poten­zial, die Art und Weise, wie wir LLMs ein­set­zen, zu revo­lu­tio­nie­ren. Indem wir LLMs auf spe­zi­fi­sche Auf­ga­ben kon­zen­trie­ren, kön­nen wir sie zu viel leis­tungs­fä­hi­ge­ren und nütz­li­che­ren Werk­zeu­gen machen.

CodeLllama:

CodeLllama ist ein LLM-Agent, der dar­auf trai­niert wurde, Code zu schrei­ben und Code in einer Viel­zahl von Pro­gram­mier­spra­chen zu erzeu­gen. Einige der Spra­chen sind Python, Java und C++. Natür­lich ist CodeLl­ama kein Ersatz für Pro­gram­mie­rer, son­dern kann dazu ver­wen­det wer­den, Code für eine Viel­zahl von Auf­ga­ben zu gene­rie­ren, wie z. B. die Erstel­lung von Web­an­wen­dun­gen, die Ent­wick­lung von mobi­len Anwen­dun­gen und das Schrei­ben von Skrip­ten. Dadurch gewin­nen die Ent­wick­ler wert­volle Zeit, um sich auf kom­ple­xere Pro­jekte und die Pla­nung zu konzentrieren.

Es kann auch ver­wen­det wer­den, um Code für bestimmte Zwe­cke zu gene­rie­ren, z. B. um Code zur Imple­men­tie­rung eines bestimm­ten Algo­rith­mus oder zur Lösung eines bestimm­ten Pro­blems zu gene­rie­ren. CodeLl­ama ist ein leis­tungs­star­kes Werk­zeug, das sowohl von erfah­re­nen als auch von uner­fah­re­nen Pro­gram­mie­rern ver­wen­det wer­den kann.

Llama-gpt:

Llama-gpt ist ein gro­ßer Sprach­mo­dell-Agent, der dar­auf trai­niert wurde, Text im Stil von GPT‑3 zu erzeu­gen. Er kann ver­wen­det wer­den, um eine Viel­zahl ver­schie­de­ner Arten von Inhal­ten zu erstel­len, wie z. B. Blog­bei­träge, Arti­kel und Geschich­ten. Dies könnte für Autoren, Blog­ger und Ver­mark­ter, die ihre Pro­duk­ti­vi­tät stei­gern wol­len, hilf­reich sein. Llama-gpt befin­det sich noch in der Ent­wick­lungs­phase, wurde aber bereits für die Erstel­lung ver­schie­de­ner Arten von Inhal­ten wie Blog­bei­träge, Arti­kel und Geschich­ten ver­wen­det. Es ist ein viel­ver­spre­chen­des Tool, das das Poten­zial hat, die Art und Weise, wie Inhalte erstellt wer­den, zu revolutionieren.

OpenTF:

OpenTF ist ein Pro­jekt, das dar­auf abzielt, eine Open-Source-Imple­men­tie­rung von Ten­sor­Flow zu schaf­fen. Dies würde es ermög­li­chen, Ten­sor­Flow auf einer brei­te­ren Palette von Platt­for­men zu ver­wen­den und würde auch eine grö­ßere Anpas­sung und Fle­xi­bi­li­tät bei der Ver­wen­dung von Ten­sor­Flow ermöglichen.

Zum Bei­spiel könn­ten Ent­wick­ler OpenTF ver­wen­den, um ihre Ver­sio­nen von Ten­sor­Flow zu erstel­len, die für bestimmte Auf­ga­ben oder Platt­for­men opti­miert sind. Zusätz­lich könnte OpenTF ver­wen­det wer­den, um neue Fea­tures und Funk­tio­na­li­tä­ten zu schaf­fen, die der­zeit in der pro­prie­tä­ren Imple­men­tie­rung von Ten­sor­Flow nicht ver­füg­bar sind. Das Pro­jekt zielt dar­auf ab, eine Open-Source-Imple­men­tie­rung zu schaf­fen und würde es ermög­li­chen, Ten­sor­Flow auf einer brei­te­ren Palette von Platt­for­men zu ver­wen­den, ein­schließ­lich sol­cher, die von der aktu­el­len Ite­ra­tion nicht unter­stützt werden.

Vall-E‑X:

Vall-E‑X ist ein Pro­jekt, das dar­auf abzielt, ein LLM zu schaf­fen, das die mensch­li­che Spra­che nach­ah­men kann. Es befin­det sich noch in der Ent­wick­lung, hat aber das Poten­zial, die Art und Weise, wie wir mit Com­pu­tern inter­agie­ren, zu revo­lu­tio­nie­ren. Der­zeit inter­agie­ren wir mit Com­pu­tern über eine Viel­zahl von Schnitt­stel­len, dar­un­ter Tas­ta­tu­ren, Mäuse und Touch­screens. Diese Schnitt­stel­len sind jedoch nur begrenzt in der Lage, natür­li­che mensch­li­che Spra­che zu vermitteln.

Das Pro­jekt hofft, diese Beschrän­kun­gen zu über­win­den, indem es Men­schen ermög­licht, mit Com­pu­tern unter Ver­wen­dung natür­li­cher Spra­che zu inter­agie­ren. Dies würde es uns viel leich­ter machen, Com­pu­tern Anwei­sun­gen zu geben und ihnen Fra­gen zu stel­len. Es würde uns auch ermög­li­chen, natür­li­chere Gesprä­che mit Com­pu­tern zu füh­ren. Vall-E‑X befin­det sich noch in einem frü­hen Ent­wick­lungs­sta­dium, aber es hat das Poten­zial, die Art und Weise, wie wir in Zukunft mit Com­pu­tern inter­agie­ren, zu verändern.

AI Town:

AI Town ist ein Pro­jekt, das dar­auf abzielt, eine vir­tu­elle Welt zu schaf­fen, in der LLMs mit­ein­an­der und mit Men­schen inter­agie­ren kön­nen. Wir könn­ten zum Bei­spiel sehen, wie LLMs in einem sozia­len Umfeld mit­ein­an­der inter­agie­ren und wie sie auf ver­schie­dene Auf­for­de­run­gen und Fra­gen von Men­schen reagie­ren. Diese Infor­ma­tio­nen könn­ten uns hel­fen, bes­ser zu ver­ste­hen, wie LLMs ler­nen und den­ken, und wie sie in einer Viel­zahl von Anwen­dun­gen ein­ge­setzt wer­den können.

Dar­über hin­aus könnte KI Town zur Ent­wick­lung neuer For­men der Unter­hal­tung und Bil­dung ein­ge­setzt wer­den. Zum Bei­spiel könn­ten wir vir­tu­elle Wel­ten schaf­fen, in denen LLMs als Frem­den­füh­rer fun­gie­ren oder Bil­dungs­in­halte vermitteln.

Seam­less Communication:

Seam­less Com­mu­ni­ca­tion ist ein Pro­jekt, das dar­auf abzielt, ein Sys­tem zu schaf­fen, das auto­ma­tisch zwi­schen ver­schie­de­nen Spra­chen über­set­zen kann. Dies würde es Men­schen aus aller Welt ermög­li­chen, ein­fa­cher und mög­li­cher­weise in Echt­zeit mit­ein­an­der zu kommunizieren.

Dies sind nur einige der vie­len neuen LLMs und LLM-Agen­ten, die der­zeit ent­wi­ckelt wer­den. LLMs haben das Poten­zial, viele ver­schie­dene Bran­chen zu revo­lu­tio­nie­ren, und wir sind gespannt, was die Zukunft für diese Tech­no­lo­gie bereithält.

Quelle: medium.com