Mistral, LLaMa & Co. - Use free AI giants locally

Подписаться 249 тыс.

Просмотров 40 тыс.

50% 1

Learn computer science for free on my website:_ bootstrap.academy
Huggingface models: huggingface.co/models?pipelin...
Open LLM Leaderboard: huggingface.co/spaces/Hugging...
The web interface: github.com/oobabooga/text-gen...
GPT4ALL: gpt4all.io/index.html
Featured article: www.bleepingcomputer.com/news...
Chapter:
00:00 Introduction
00:37 Overview
01:12 Hugging Face as a central platform
03:48 Important open source models
05:23 Strength of models
07:41 Fine-tuning models
12:23 Advantages and disadvantages
17:22 Security aspects
19:19 Data protection
21:04 Cost aspects
26:34 Implementation with GPT4All
32:12 Choosing the best model
34:14 Implementation with Text Generation WebUI
38:16 Conclusion
* All my social media portals *:
bio.link/themorpheus
Discord:
the-morpheus.de/discord.html
_Support me - Thank you!
www.patreon.com/user?u=5322110
www.paypal.me/TheMorpheus

Опубликовано:

30 июн 2024

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист

Посмотреть позже

Комментарии : 188

@TheMorpheusTutorials 3 месяца назад

Meine neue Website ist endlich auch fertig: Ihr findet dort auch die Möglichkeit einen NEWSLETTER von mir zu abonnieren. Das ist super praktisch, weil wir da nicht auf den RU-vid Algorithmus angewiesen sind, dass ich euch erreiche. Ein Mal die Woche kommt dann ein Update, nicht nur mit Videos, sondern auch mit Themen, die es vielleicht in kein Video geschafft haben! the-morpheus.de/

@sascha5866 3 месяца назад

Hey Morpheus Echt geile Webseite! sehr nice!

@Proveritas2023 3 месяца назад

🏆

@gren97 3 месяца назад

Die Seite ist echt hübsch geworden. Leider sind mir ein paar Dinge aufgefallen, die die Nutzung etwas negativ beeinflussen: - Titel lädt schnell, aber die Seite laggt beim initialisieren (vermutlich wegen dem threejs Ding) und ist unbenutzbar (hängt) und Buttons sind nicht anklickbar für ein paar Sekunden - Das threejs Ding sollte vielleicht (wenn möglich) nicht mit der Maus-Folge-Animation abbrechen, wenn man einen Button oder Text hovert (wirkt kaputt) - Haufenweise Warnings in der Konsole - paar Abstände wirken zu klein ("Zur Bootstrap Academy" Button Padding links und rechts und Abstand im Footer nach "Contact") - Fehlende Übersetzungen im Footer? - Bootstrap und jQuery? (Naja, ist dir überlassen xD)

@user-vt5gu2ie7z 3 месяца назад

Ich wäre dir so dankbar, wenn du mal so eine Huggingface-Reihe machen würdest und dabei die Basics abdeckst. Was ist ein Space, wie kann man so was erstellen etc...

@alexanderavantgarde3428 3 месяца назад

dem möchte ich mich anschließen

@btx47 3 месяца назад

Mega geil, bitte mehr Guides in der Form! Ist echt schwierig bei den Sachen noch durchzublicken. Für mich wäre sehr interessant, wie ich ein Basis Modell mit einem Datensatz von meinen Texten trainieren kann um nachher ähnlich Ergebnisse zu bekommen

@AlexejSailer 19 дней назад

Hey danke dir. Du machst sehr gute Arbeit! Extrem gut aufgearbeitet.

@oliversimon9800 3 месяца назад

Sehr gut, verdammt gut und hilfreich, bitte lege schnell mit Loras nach.

@mattmcwieg1676 2 месяца назад

Unglaublich gut erklärt. Super interessant das Thema Open Source KI. Sie können Seminare führen!!!

@Proveritas2023 3 месяца назад

Vielen Dank für deine großartige Arbeit, Wertschätzung ist unterwegs🏆

@romeojenny 3 месяца назад

Danke super Video, endlich mal wieder info zu Open Source Modellen.😊

@uff3511 3 месяца назад

Mega! Und gerne mehr in diese Richtung

@stone22121978 Месяц назад

Huggingface ist fast ERSCHLAGEND auf den ersten Blick und es war gerade mein erster Blick

@thortraxom108 3 месяца назад

Ein echtes Brett hast Du da geleistet. Hast like und Abo

@doxx9757 3 месяца назад

Sehr cooles Video. Hat mir sehr geholfen. Danke

@oll1398 3 месяца назад

Danke für das Video! Ich kann als Alternative für lokale LLM-Inferenz noch Ollama empfehlen. Einfach zum laufen zu bringen, einfache Handhabung, Python&JS Libs, API-Nutzung möglich, WebUI Support, klasse Website & Blog.

@DocMAX 3 месяца назад

Habe das auch. Sieht aus wie ChatGPT und man kann den Text auf Fullscreen setzen, was ich bei ChatGPT nicht gefunden habe. Achso und mit Bildern kann der auch umgehen (einfach hochladen im Chat).

@user-vt5gu2ie7z 3 месяца назад

Was auch sehr interessant wäre, wenn du mal zeigst, wie man solche Modelle von Huggingface für seine eigene Anwendungen Fine-Tuned in Python VS Studio.

@ProgrammierungLeichtGemacht Месяц назад

Tolles Video! 🙂 Yepp, die gleichen Gedankengänge hatte ich auch in Bezug auf lokal trainierte Modelle für eigene Applikationen, alles hat Vor- und auch Nachteile. 🙂 Ich bin soo froh, dass ich mir vor 2 Jahren einen Gaming-PC zusammengestellt habe, der eine gute Nvidia-Grafikkarte hat. Die Web-GUI ComfyUI für Stable Diffusion läuft bei mir richtig zügig. Ich hab's mal auf meinem Laptop über die CPU laufen lassen (als Test), die Generierung des Bildes mit den gleichen Parametern hat gleich mal 7 Minuten gedauert, anstelle von 5-7 Sekunden.

@philippvanderheide7494 3 месяца назад

Gerne mehr von sowas :)

@tedzards509 3 месяца назад

6:16 7B steht für 7 Milliarden, nicht Billionen oder Millionen.

@lars7898 3 месяца назад

Englische "Billions" genauer gesagt.

@herrspitz6964 3 месяца назад

@@lars7898 Es gibt keine deutschen "Billions" genauer gesagt. Milliarden oder Billionen oder Billiarden auf gut Deutsch gesagt.

@lars7898 3 месяца назад

@@herrspitz6964 Ich glaube es ist schon klar geworden, dass das B im Namen für eine englische Bezeichnung steht.

@alexanderavantgarde3428 3 месяца назад

Das war nur ein Versprecher, später im Video hat er es dann eh richtig gesagt.

@herrspitz6964 3 месяца назад

@@lars7898 Mir gehen Klugscheißer die auch noch falsch korrigieren auf den Sack.

@ASDF-py2ly 3 месяца назад

Super, Danke^^

@user-vt5gu2ie7z 3 месяца назад

Dankeeeeeeeeee

@tedzards509 3 месяца назад

4:16 AMD funktioniert für mich wunderbar, solange ich pytorch benutze. ROCm hat mich sehr positiv überrascht. Auf einer RX 6800 bekomme ich etwa 10% Token/s wie eine 3060 (Ti?), habe aber 4GB VRAM mehr.

@tedzards509 3 месяца назад

Achso ROCm läuft nur auf Linux, hab ich vergessen.

@Tri-Technology 3 месяца назад

@@tedzards509 Es geht ihm dabei darum, dass die meisten Modelle mit CUDA beschleunigt werden, was Nvidia GPUs vorbehalten ist.

@tedzards509 3 месяца назад

@@Tri-Technology die meisten Modelle von huggingface werden nit pytorch ausgeführt. Pytorch hat eine Beschleunigung für sowohl ROCm, als auch CUDA. Die modelle selber sind für nichts beschleunigt.

@viper5326 3 месяца назад

@@tedzards509 ist das vom Format abhängig (z.b. GGUF) oder steht bei jedem Modell ob das mit pytorch, Tensorflow oder Kerras läuft?

@ichbinder2323 2 месяца назад

Bitte mehr davon! Ich hab gleich mal ein bisschen probiert auf mein Mac. Du kannst gerne mehr machen zu den ai Themen zum selbst machen. Vielleicht auch wie man das dann in sein eigenen Code einbaut?

@user-rz1vq5ie4l 3 месяца назад

Guten Abend Cedric, ein schwieriges Terrain. Gruß, Enigma-pi.

@serotragtmantel3982 3 месяца назад

danke!

@TeegerTube 3 месяца назад

Alles sehr faszinierend. Ich stehe noch ganz am Anfang und bin ehrlich gesagt ein wenig überfordert. Das beginnt schon damit, dass ich keine Ahnung habe, auf was ich bei den Modells achten muss, wenn ich einen MacBook Air M1 habe und ob ich damit überhaupt ein vernünftiges Modell zum laufen bringen kann.

@Tri-Technology 3 месяца назад

Mit Apples M Chips ist es schwierig, da die meisten Modelle CUDA zur Beschleunigung nutzen und das nur mit Nvidia GPUs möglich ist und zudem die M-Chips auf ARM-Architektur basieren. Da müsstest du Mal konkret in Apple Foren schauen oder selbst versuchen, ob du die Modelle zum laufen bringen kannst.

@suschilocke2730 3 месяца назад

@@Tri-TechnologyDas ist nur bedingt richtig. Für Apple Silicon ist das GGUF Format wie gemacht. Apple hat tatsächlich den Vorteil, dass es über 'Unified-RAM' (geteilten Memory zw- CPU&GPU) verfügt und etwas schneller läuft als auf herkömmlichen CPUs. Ist natürlich trotzdem kein Vergleich zur Geschwindigkeit von NVIDIA-GPUs. Mit

@baumwollejr 3 месяца назад

Hey, wie immer ein mega Video und danke für den Überblick! 2024 soll das Jahr der Robotics und Agents werden...glaubst du mit den Open Sorce Modellen lassen sich: Sales, Accounting, Service, Controlling und co Agents erstellen? Falls ja, welche Remote Jobs sind dann noch sicher? OpenAI wird die Agents bringen und ich möchte nicht darüber diskutieren ob ein Wandel kommt, sondern wie er kommt und welche Folgen hat. Lieben Dank dir/euch!

@TheMorpheusTutorials 3 месяца назад

Agenten erstellen: ja Jobs: großes Thema, hab ich ein paar Mal angerissen, aber momentan laufen die qualitativ noch nicht alleine Werden aber noch mehr Videos dazu kommen

@MBison-oc5tc 3 месяца назад

super video! gerne mehr zu huggingface und wie man llm in python nutzen kann! ich suche verzweifelt nach einem modell dass texte clustern kann nach themen!!

@GehtGut 3 месяца назад

Danke für das tolle Video , wirklich sehr interessant. Du haust da Content raus was echt genial ist und auch weiter hilft. Hab mir Ollama installiert mit Docker und hab da auch ein recht gutes LLM Model gefunden "codellama" ... hat aber auch so seine Schwächen. Probier da immer für NodeRED etwas Code generieren zu lassen und das klappt mal mehr oder weniger gut. Gibt es da besserer Modelle oder andere Empfehlungen ? Hab einen Linux Rechner mit 64GB RAM und Nivdia mit 12 GB RAM.

@demngore 3 месяца назад

Super Video! Warum nutzt du nicht LM Studio für die Modelle? 🙂

@jonasgrafe6506 3 месяца назад

Sehr gutes Video. Eine Anleitung für Text to Speech und Text to Picture wäre cool.

@IPnator 3 месяца назад

Ich würde mir wünschen, dass ab und zu auch mal non-KI-Videos, also zu klassischer Informatik kommen. Ich hab allmählich genug von KI.

@TheMorpheusTutorials 3 месяца назад

Ich mir auch, ich versuche immer das gerade momentan wichtigste zu machen. Wenn du Vorschläge hast, schreib mir gerne

@IPnator 3 месяца назад

@@TheMorpheusTutorials Auf dem Tutorial-Kanal fehlen für meinen Geschmack Videos zu gewissen trendigen Frameworks (gerade in der Werbeentwicklung). Man könnte mit sowas wie Svelte(-Kit) oder NextJS starten und dabei auch erklären, was die grundsätzlich anders machen und welche Probleme sie z.B. gegenüber React lösen. Für meinen Geschmack muss man keine gesamte Playliste machen, ein längeres Video (≈1-2 Stunden) reicht und ist übersichtlicher, eine Playliste schreckt eher ab. Zwar hat der Kanal sehr ausführliche Playlisten zu diverse Themen, was mir dabei aber etwas fehlt sind Videos, die gerade für Einsteiger die Konzepte hinter "dem großen ganzen" verständlich machen und einordnen. Damit meine ich sowas wie den Weg von Daten, die man irgendwo in einem Formular eingibt (Frontend) mit einem Protokoll über ein Netzwerk zum Backend in die Datenbank und umgekehrt. Dabei dann auch immer darauf hinweisen, was es zu beachten gibt, dass alles möglichst sicher wird. Das würde dann viele Themen von Netzwerk, Frontend-Entwicklung, APIs und Datenbanken verbinden. Auch so trendige Themen wie "Wie optimiere ich meine Entwicklungsumgebung" oder einen Vergleich von Code Editoren und IDEs könnte ich mir vorstellen. Bei sehr viel Freizeit und Motivation würde die eine oder andere in die Jahre gekommene Playliste eine Überarbeitung vertragen oder könnte einfach durch ein längeres, ausführliches Video ergänzt werden, das für den durchschnittlichen Hobby-Zuschauer ausreicht und wer mehr braucht kann in die Playliste. Ich stelle sie mir in der Art wie die vom englischen Kanal "Programming with Mosh" vor, nur hat der A nicht zu allen Themen was und ist B auf Englisch (was für die meinen jedoch kein Problem sein dürfte). Bezüglich des Hauptkanals gefallen mir immer die Vergleichsvideos (Passwort-Manager, Browser, Clouds) ganz gut, aber auch die exposed-Videos, wo man irgendeinen Anbieter oder eine Technik runter macht (Opera, Fax) und zeigt wie es besser geht. Könnte man ja auch zu E-Mails machen. Bei den Vergleichen könnte man nach iOS gegen Android unter dem Gesichtspunkt der Sicherheit selbiges am Desktop machen. Ich persönlich liebe auch die Videos, wo man "Big Tech" runter macht, könnte man aus gegebenem Anlass ja bei Apple und deren Verhalten machen (DMA). Was ich auch sehr vermisse sind die IT-Trends, kann man ja vielleicht auch seltener, etwa zum Monatsende bringen, wenn sie sonst zu aufwändig sind. Was ich noch auf keinen RU-vid Kanal gesehen habe sind außerdem Videos dazu, wie ein IT-Nerd seinen Fernseher privatspäreschonend und werbefrei betreibt, dabei aber nicht auf Maus und Tastatur angewiesen ist und darüber hinaus eine Integration mit dem Heimnetz (Netzwerkspeicher, Medienserver) herstellt. Das ganze Thema Homelab inklusive von verglichen wie AdGuard Home gegen PiHole oder Plex gegen Emby gegen Jellyfin könnte man auch machen. Des weiteren könnte man Dienste wie Paperless NGX oder Photoprism vorstellen und einrichten. Ich hoffe mal der Text war nicht zu lang, allgemein sollten das einfach Anregungen sein, in welche Richtung es gehen könnte, Hauptsache keine KI mehr 😅

@IPnator 3 месяца назад

@@TheMorpheusTutorials Was mir gerade noch eingefallen ist: Videos, die Krankenkassen, Versicherungen, Energieanbieter, online bezahlen und online ausweisen unter der Lupe des IT Security (und Privacy) Profis kritisch beäugen und vergleichen, gerade bei Krankenkassen aufgrund der momentanen Digitalisierung (E-Rezept, elektronische Patientenakte) vielleicht interessant.

@Hofer2304 3 месяца назад

@@IPnatorSowohl Playlists als auch lange Videos haben ihre Berechtigung. Für Anfänger ist wahrscheinlich eine Playlist besser, da sie dann einfach ein Video mehrmals anschauen können. Wie funktioniert das bei einem langen Video? Wenn es gklut organisiert ist, kann ich zwar zum gewünschte Kapitel springen, aber wie schaue ich mir nur ein Kapitel an?

@IPnator 3 месяца назад

@@Hofer2304 RU-vid hat seit einigen Jahren diese Timestamps, mit denen kann man ein längeres Video in Kapitel aufteilen und so für Struktur sorgen. Innerhalb des Videos kann man dann auch ein einzelnes Kapitel wiederholt anschauen. Ich glaube aber, als Anfänger wiederholt man eher die letzten 10-30 Sekunden, anstatt das gesamte Kapitel, mache ich jedenfalls so.

@Syrabo 2 месяца назад

Diese Zensur merke ich bei Bildgeneratoren, die ich kenne: Sie bekommen kein Tracheostoma hin, vermutlich weil Schnitte am Hals unter NSFW fallen. Doch ist ein Luftröhrenschnitt eine klassisches medizinisches Ding.

@stefancho 3 месяца назад

Die amerikanischen Billionen sind deutsche Milliarden! Nicht Millionen. Kleines aber wichtiges Detail 😉

@7riX7er 3 месяца назад

Klappe zu und weiterschauen 😂🤓

@lcaainvalid1034 3 месяца назад

das hat mich auch kurz so verwirrt hahaha

@heizenbergone 3 месяца назад

70b Modelle passen quantisiert in 24GB VRAM im exl2 Format

@Gerald-iz7mv 3 месяца назад

Cooles video! Kannst du verschiedene llm serving frameworks vorstellen und benchmarken? Zb vllm, aphoridte, tgi, tensortRT-llm, openllm, sglang usw?

@Ano-Nymos 3 месяца назад

Theoretisch müssten Open-Source-Alternativen zu den jetzt angebotenen KI-Diensten (z.B. Audio-Filterung, Störgeräusche, evtl. sogar einzelne Stimmen heraus...) relativ schnell die gleiche Leistung erreichen, und damit solche teuren Abo-Dienste überflüssig machen. Dass die also jetzt versuchen noch Geld zu verdienen, ist klar. Wenn RU-vid diese Übersetzung in alle Sprachen wie bei Flawless-AI kostenlos einbaut, muss man als Creator vorher auch keine Dienstleister in Anspruch nehmen. Und natürlich spart es vorher 2, 4, 5, 8... Sprachen-Versionen zu erstellen und hochzuladen. Eine Art Sora für alle, kostenlos nutzbar (zu Hause), und unzensiert, damit könnten kleine Creator und solche die noch kein Video gemacht haben ohne Kosten einen guten Einstieg finden. Schönes Intro, Outro, Clips für alle Videos, alles ohne einen 3-4-stelligen Betrag auszugeben, oder Stock-Material zu nutzen.

@cengiz5471 3 месяца назад

Wow, danke für dieses unfassbar wertvolle Video, ich bin tatsächlich gewillt mich nochmal mit der ganzen Thematik mehr zu befassen.Mal schauen wie weit ich mit meiner AMD Hardware komme. hie geht's aber explizit nur um LLMs? Bildgenerierung ist da noch außenvor?

@rainerwahnsinn3265 3 месяца назад

Nein, leider nicht. Egal welche "KI" du nutzen möchtest, AMD steht weit hinten. Du kannst ja mal nach ROCm googlen. Das ist AMDs Antwort auf die schlechte nutzbarkeit der AMD karten. Wie und ob dir das weiter hilft kann ich leider nicht sagen.

@TheMorpheusTutorials 3 месяца назад

Bildgeneratoren: stable diffusion, hab ich auch ein paar Videos zu

@jdwjkdjnadsnjk9844 3 месяца назад

Kannst du vielleicht noch ein Video machen wie man etwas fein trainiert ?

@MeinDeutschkurs 3 месяца назад

Mac Studio ist super kompatibel.

@DakrWingDuck 2 месяца назад

Welches Model für text2Image Generierung würdest du empfehlen?

@user-ms1jc5lg1p 3 месяца назад

Ich verwende eigentlich immer die GGUF oder GGML Varianten mit 4_K_M Quantisierung, obwohl es auf CPU recht langsam ist, aber mit 32GB Arbeitsspeicher sind sehr viele möglich. Mit meiner Grafikarte (2GB) geht nicht so viel...

@Ochros 3 месяца назад

Gutes Video! Für ein besseren Kontext wäre es zu dem noch interessant zu wissen, was genau du für eine GPU etc. verwendest, damit man dass besser auf seinen eigenen Rechner umrechnen kann.

@TheMorpheusTutorials 3 месяца назад

Rtx 3090

@grakpan1233 2 месяца назад

Ich weiß nicht wann das Video aufgenommen wurde, nun gibt es schon 587.000 Modelle o.o Danke für das ausführliche Video!

@TheMorpheusTutorials 2 месяца назад

ich glaub du hast nen andren Filter drin^^ Ich hatte nur die Text Modell ;)

@M.Voelkel 3 месяца назад

Was heißt "Gaming-Rechner" in Bezug auf RAM, GPU (explizit schon genannte NVIDIA), CPU und den Anforderungen? Ab welcher Größe vom RAM, laufen welche Größen der LLM? Diese Fragen stellen sich mir ...

@verdooft 8 дней назад

Kommt auch drauf an, wie flott das sein soll. Ich lasse 70B Modelle (5_K_M quantisiert, GGUF) ohne Grafikkarte laufen, aber bei 64 GB RAM. Da geht es zwar in den Bereich Sekunden pro Token statt Tokens pro Sekunde, aber ich verwende auch nur eine energiesparsame Notebook-CPU.

@thacreepwalk 3 месяца назад

Gibt es auch eine Rubrik für LLMs die speziell für Coding gut trainiert wurden? Weil, ich sehe da nur Vision, Robotics, Audio usw... Dann wollte ich fragen, ob es dann auch wirklich große Rolle spielt, dass man sich auf eine Programmiersprache fokussiert oder fällt es ab einer bestimmten Größe nicht mehr so sehr ins Gewicht und dass sie dann alle bzw großen Teil der Programmiersprachen abdecken?

@romanbauer 2 месяца назад

👍

@paulmueller100x 3 месяца назад

Was hast du denn für eine Grafikkarte?

@crowATlinux 3 месяца назад

Also auf GPT4All läuft mein Mistral Modell mit meiner AMD 7900XTX unter Linux eigentlich flott?

@smaplessmap5355 3 месяца назад

Wie aktualisiert man denn lokale modell, die man schon selber fine getuned/angelernt hat?

@helidrones 2 месяца назад

Wenn Du Gemini fragst, dann sind Black Hats die Guten und White Hats für Deinen Stromausfall verantwortlich. Soviel zum Wert von Zensur, bzw. zur Frage, wer oder was bedient werden soll.

@Eliakl 3 месяца назад

Mich würde ein Video interessieren welche theoretischen und praktischen Möglichkeiten und Limitierungen es gibt den Grafikspeicher für LLMs zu erweitern (insbesondere fürs fine-tuning). Es gibt ja Technologien wie shared Memory oder resizable bar. Leider gibt es dazu aber kaum Infos zu LLMs. Wären für solche Anwendungen nicht auch Grafikkarten mit erweiterbarem RAM sinnvoll? Oder gibt es davon keine weil es technisch nicht umsetzbar ist? Vielen Dank auf jeden Fall für den spannenden content!

@viper5326 3 месяца назад

Es gibt keinen erweiterbaren VRAM bei Grafikkarten. Shared Memory ist zum Teil reservierter RAM für deine Integrierte Grafikeinheit deiner CPU (iGPU), wenn du denn sowas hast. Außertdem gibt es ja schon Lösungen, die auch auf der CPU laufen und eben deinen RAM statt GRafikkarte und deren VRAM nutzen, nur bocklangsam. Ich denke dass auch beides genutzt werden kann, wenn der VRAM nicht ausreicht aber ich weiß nicht inwiefern sich das überhaupt lohnt bzw. wie sehr das ganze über die CPU dann ausgebremst wird. Und resizable bar ist eine Option im Bios die du im besten Fall sowieso immer aktiv hast.

@lasse321 3 месяца назад

Kannst du das bitte mal auf einem Apple MacBook testen mit Apple Silicon Chip. Die „M“ Chips haben ihr RAM und ihren Grafik-RAM (sozusagen das VRAM) geteilt. Dadurch kann man relativ große Modelle ausführen und das auf einem kleinen Laptop ohne Nvidia Grafikkarte! Die Tokenerzeugung/Rechenleistung soll aber langsamer sein oder? Würde mich sehr interessieren welche Modelle man damit TO-GO auf dem Laptop dabei haben kann.

@poldiderbus3330 3 месяца назад

Ich bin ja etwas verunsichert, wann oder ob es sich lohnt eigene Hardware anzuschaffen. Der Privatsphärenaspekt wiegt schon groß für mich - aber wenn dann würde ich auch TTS / STT, ein-drei LLMs und Stable Diffusion laufen lassen wollen und können. Ich fürchte irgendwie, dass alles was ich mir heute anschaffen würde, in kürzester Zeit obsolete ist..

@rainerwahnsinn3265 3 месяца назад

Ich denke auch dass aktuell kein guter Zeitpunkt ist. Der Gerüchteküche zufolge fährt Nvidia die Produktion der 40er Serie inzwischen runter um beim Launch der 50er nicht auf Lagerbeständen sitzen zu bleiben. Ich denke aktuell lohnt es sich definitiv auf die 50er zu warten. Sei es nur um die 40er günstiger zu erwerben:)

@freeceleb 25 дней назад

Wie gut sollte die Grafikkarte für die lokale Installation denn mindestens sein, um es genauso sinnvoll nutzen zu können wie gehostete Tools? Reicht noch eine 3070 oder 3080 oder muss es schon eine 4090 sein? Mal etwas warten ist ja ok. Aber einen gewissen Speed braucht man ja.

@MBison-oc5tc 3 месяца назад

sind die meisten modelle nicht auf die englische sprache ausgerichtet?

@Hofer2304 3 месяца назад

Wie energiehungrig sind die KI-Modelle? Wie viel Energie wird, oder wurde, für ihr Training verwendet, wie viel Energie wird für ihre Anwendung benötigt?

@Tri-Technology 3 месяца назад

Ich meine, dass wurde in einem der ersten Videos von Morpheus zu LLMs und ChatGpt mal angesprochen. Genaue Zahlen wird man allerdings wohl nur bei der jeweiligen Entwicklungsfirma finden.

@davidkummer9095 3 месяца назад

Gibt es ein LLM das auf Bilderkennung spezialiesiert ist und auch noch Deutsch versteht?

@daaanny64 2 месяца назад

Mit welcher lokalen KI kann ich sensible Excel Dateien hochladen um eventuelle Muster erkennen zu lassen? LG

@marekbugla3628 2 месяца назад

Wie schlagen sich die Open source Modelle im Vergleich zu Premium KIs?

@mr.mythoclast4451 3 месяца назад

hab mir überlegt ne USV anzuschaffen, die bei Stromausfall meine sensiblen elektronischen Geräte dann sauber herunterfährt :D

@smaplessmap5355 3 месяца назад

Wie kann ich sicherstellen, das ein lokales modell nicht doch ggf. Nach big tech funkt?

@smartfusion8799 3 месяца назад

Wäre es möglich alte btc miner zum training zu benutzen?

@hairlessstyle3489 3 месяца назад

Was sagt ihr zum ollama launcher? Ist das sicher zum benutzen?

@Phonognomiks 3 месяца назад

AUTOGEN Video bitte 🙌🏻✌🏻👍🏻

@7riX7er 3 месяца назад

14:30 Wo war ich? Wir machen einfach da weiter wo ich war. 😅

@M.Voelkel 3 месяца назад

Ich knie vor dir nieder - erste Klasse ! 29.03.´24

@Cryptowski 2 месяца назад

Ist LM Studio nicht = gpt4ALL?

@Dani-gf7ni 2 месяца назад

Wie trainiert man eine ki?

@satomiller 2 месяца назад

👍🤔...🖖

@jsxjohannes 3 месяца назад

Könntest du mal ein Video über hugging face machen

@masteryoda5052 2 месяца назад

gpu: amd oder nvidia?

@richko 2 месяца назад

Hi! I'd like to chat with an uncensored AI but with updated information (dataset up to at least 2023), do u know any?

@masteryoda5052 2 месяца назад

Kriegt man das WebUI auf Linux installiert OHNE DOCKER?

@karlaschmidtke7727 2 месяца назад

Um 20 pdf mit 200 Seiten als knowledge zu benutzen, wie viel RAM und CPU sollte der Rechner dann haben?

@nerdtopiade 3 месяца назад

Ich benutze Lm- Studio etwas moderne ui als gtp4all . LM Studio sagt mir auch vor dem download wie gut oder schlecht das Model wahrscheinlich auf meinem rechner läuft .

@karlaschmidtke7727 2 месяца назад

Was heisst ui?

@nerdtopiade 2 месяца назад

@@karlaschmidtke7727 User Interface oder deutsch Benutzeroberfläche

@MichaelWDietrich 3 месяца назад

Wie mache ich eigentlich einen Security Check für eines dieser 69.000 Modelle. Denn tatsächlich kann ja ein NN das auf meiner GraKa läuft im Hintergrund auch bösartigen Code erzeugen und ausführen.

@suschilocke2730 3 месяца назад

Deswegen sollte man (sofern möglich) immer die Safetensor-Varianten der Modelle nutzen und 'trust-remote-code' auf false lassen.

@TalkLounge_ 3 месяца назад

14:08 Links unten sieht man deinen Standort, ich weiß nicht ob der öffentlich sein soll, sofern er denn überhaupt korrekt ist

@JungUndStabil 9 дней назад

Moin, kannst du oder hast du vlt ein Video, wie ich Lama3 opensource Downloaden kann, ich möchte diese Ki benutzen, damit sie mir das programmieren bei bringt. Ich hab bereits ein 2D Jump and run mit Hilfe von Copilot programmiert, möchte aber tiefer in die Materie einsteigen. Kann mir sonst einer Tipps geben, was ich bei udemy als erstes lernen sollte ? Ich würde gerne spiele entwickeln bzw Apps und ne eigenen KI programmieren, die mich dann lehrt und unterstützt Außerdem würde ich die KI mit Web scraping trainieren, natürlich auf Seiten, die das erlauben. Was soll und muss ich erlenen, bitte Tipps geben Schreibe aktuell Python mit einem Mac mini m2, hab ich genug Leistung für lama3 oder ähnliche Kis die ich lokal ausführen kann 😊

@Foreversun33 3 месяца назад

Kann man einer lokalen KI dann einfach sagen: Hey hier ist das Grundgesetz (GG), sind die politischen Entscheidungen so rechtens? Oder im Arbeitsrecht, was darf ich, was darf ich nicht -- einfach der KI fragen und Antworten bekommen ( Geld für Anwalt gespart ).

@Ph34rNoB33r 3 месяца назад

Kann man schon, einen guten Prompt vorausgesetzt. Die Ausgabe kann aber Fehler enthalten. Da gab es so einen US-Anwalt, der ChatGPT arbeiten lassen hat, und dann existierten die referenzierten Fälle gar nicht... (GG reicht da im Allgemeinen nicht als Kontext)

@Foreversun33 3 месяца назад

@@Ph34rNoB33r Und wenn man GG plus alle Abhängigkeiten übergibt?

@Ph34rNoB33r 3 месяца назад

@@Foreversun33 Das wird eine Menge Material. Und eine Menge Interpretation, die sich auch mit der Zeit ändern kann. Muss man dann alles noch überprüfen. Wenn ich irgendwo eine Beschwerdemail schreiben will ist das wahrscheinlich okay. Für einen Vertrag oder die Verteidigung vor Gericht eher nicht. Es kann unterstützen, aber keine Rechtsabteilung ersetzen, und das sehe ich vorerst auch nicht kommen.

@Foreversun33 3 месяца назад

Wenn man eine Richtung bekommt, und mit der anschließend zu einer Fachkraft, eventuell mit einer Zusammenfassung, wie die KI "geschlossen" hat, wäre doch schon mal was, als Annäherung.

@Foreversun33 3 месяца назад

@@Ph34rNoB33r Danke für deine Einschätzung.

@Tri-Technology 3 месяца назад

Mich würde mal interessieren wie man sich sicher sein kann, dass wenn man so ein LLM lokal ausführt, dass wirklich keine Daten abfließen. Theoretisch könnten die Entwickler doch auch Funktionen einbauen, dass man zwar seine eigene Hardware einsetzt und somit auch die Stromkosten selbst trägt aber die Prompts trotzdem bei bestehender Internetverbindung übertragen werden.

@firef4rtakasven453 3 месяца назад

Das ist ja der Vorteil an OpenSource, man kann ich den Quelltext schauen und nachvollziehen was da gemacht wird.

@Tri-Technology 3 месяца назад

@@firef4rtakasven453 Das schon aber meistens schaut man sich ja nur das an, was einen interessiert, weil man für den Rest gar keine Zeit hat.

@twiky1059 3 месяца назад

Traurige Loser Geräusche mit meiner 3080 😭 super viedeo, aber ich brauche eine neue GPU 🙃

@MeinDeutschkurs 3 месяца назад

7 Billion [en] ist 7 Milliarden [de]

@thomashaller4876 3 месяца назад

Weiss jemand wie sich das verhält mit Code Generation , Tokens und Fine Tuning für ein großes Projekt ? Kann man das Model für ein spezielles Projekt feintunen ? Also man muss dann nicht mehr den gesamten Projekt source code als Tokens übergeben, sondern das Model weiss schon inherent dass ich an diesem Projekt (zB Linux Kernel) arbeite. Logisch, es ist nach Änderungen am Code verwirrt, aber vielleicht kann man diese als Diffgrams übertragen - bis zu dem Punkt dasein neues Fine Tuning geschehen sollte. Wäre das deutlich effizienter und man könnte ein größeres Projekt mit einem kleineren Model verarbeiten ?

@wolfganggosejacob779 2 месяца назад

Ein Abschnitt, in dem du auf die Bandbreite der Grafikkarten eingeht, wäre sinnvoll gewesen. ok Nvidia ist geklärt, deinen, nicht ausreichenden Speicher mit 24 GB hättest du erwähnt und wenn ich Nvidia mit 24 GB eingebe, geht der kostenlose Spaß bei 1900 Euro los. Das wäre dann eine RTX 4090 mit 450 Watt. Hier wäre ein Einblick in die Notwendigkeiten und zu überspringenden Hürden nicht nur sinnvoll gewesen. Auch ein Blick auf die Entwicklungen am Grafikkartenmarkt und ob es da immer noch hoch und runter geht oder drunter und drüber wäre mehr als passend. 1900, da muss Oma noch ein paar Pullover stricken.

@karlaschmidtke7727 2 месяца назад

Hast du eigentlich Informatik studiert?

@TheMorpheusTutorials 2 месяца назад

Ja, am Kit in Karlsruhe

@chrisbraeuer9476 3 месяца назад

Also ich hab noch kein os model gefunden das auch nur mit 3.5 mithalten kann.

@MrNihilius 3 месяца назад

Stromausfall? Unsere Netze sind doch sicher sagen die Klimaexperten **zwinkersmiley**

@lutzmuller5703 3 месяца назад

Das gesamte Projekt hat einen Haken: Es funktioniert nur, wenn der Benutzername in Windows keine Umlaute enthält. Ich habe den Chat GP4 von der genannten Website heruntergeladen und installiert. Dann stellte ich fest, dass er sich auch nicht im Verzeichnis des Benutzernamens installieren lässt, egal wohin, wegen der besagten Umlaute. Danach, als ich ihm ein Verzeichnis unterhalb des Benutzernamens zugewiesen habe, verweigert er die Installation aller Module.

@zerion777 3 месяца назад

Habs bis zum Schluss geschaut. "Das war mal wieder was ruhigeres"......ne ich fand es ehr hektisch und etwas, nicht unstrukturiert, aber hin improvisiert. Ich glaube, vorbereitete Script-Videos gefallen mir besser. Ich könnte es aber auch nicht besser. Auf Arbeit geht es mir genauso, wenn ich "spontan" einfach mal irgendwo durchführen oder einen Überblick geben soll. Wo fängt man an, wo hört man auf. Die Gedanken überholen sich etc.

@Phonognomiks 3 месяца назад

„Open Devin“ Video bitte

@TheMorpheusTutorials 3 месяца назад

Ja hab's probiert, war leider komplett broken und nicht ausführbar

@TT-pi8ww 3 месяца назад

ich werde mir dafür keine überteuerte Nvidia Karte kaufen. Für die Kosten kann ich jahrelang GPT und Gemeni nutzen, ohne eigenen Stromverbrauch. Die sind außerdem monatlich kündbar. Mal abwarten was Apple dieses Jahr bringt. Vielleicht ändert das nochmal alles.

@overlord09931 3 месяца назад

Schade, dass so wenig mit AMD Grafikkarten unter Windows funktioniert. Es ist eine Qual, oder es geht nicht. Bei mir trifft Letzteres zu. Ich hoffe, es wird irgendwann so einfach wie mit Nvidia Karten. 😫

@anorak6366 3 месяца назад

Benutzt lieber ollama hat bei mir besser funktioniert und wenn ihr noch eure eigenen dateien benutzen wollt das die ki die könnt ihr noch anzthingllm mit ollama benutzen ollama geht sogar mit 8gb ram und 4 kern 2.8Ghz habs getestet auf only cpu

@AniWorld_HD Месяц назад

Benutzer lieber Kobold , da kann man wenigsten mit Tensorflow und rocm über AMD gpu rendern

@wirtschaftswissenschaften 3 месяца назад

Also wenn es 69 000 Modelle mittlerweile gibt und sogar kostenlos dann verstehe ich den Hype an der Börse nicht. Dass da noch kein crash da ist an der Börse wundert mich.

@jaredbibleboy 3 месяца назад

warum sollte es denn crashen? high demand

@herr-a5460 3 месяца назад

Die Börsenkurse steigen nicht wegen den verschiedenen Modellen, sondern wegen der enormen Nachfrage nach der Hardware, auf der diese Modelle laufen. Siehe Nvidia.

@wirtschaftswissenschaften 3 месяца назад

@@herr-a5460 Mein Kommentar bezog sich auf den aktuellen KI Hype an der Börse und da es Über 69 000 Modelle gibt die man auch noch kostenlos bekommt ergibt es keinen Sinn wenn die Unternehmen dann keinerlei Gewinne erzielen weil man es kostenlos bekommt. Erinnert alles somit an die Dotcom Blase als das Internet auf den Markt kam.

@cfo3049 3 месяца назад

@@herr-a5460 Falsch, Börsenkurse steigen weil mehr Aktien gekauft als verkauft werden, nicht mehr und nicht weniger. Oder wie erklärst du dir den hype um GME letztes Jahr?!

@LukasBiosphere 3 месяца назад

Also eher KI-Hardware. ansonsten steigen eigentlich nur Microsoft und Meta halbwegs. Die "KI-Player" Amazon und Alphabet haben nichtmal ihr 2021hoch überwunden. Und Adobe kann vom KI-hype auch nicht profitieren

@Argentum-futurum 2 месяца назад

"Man braucht eine nvidia Grafikkarte" 😂 Mistral Dolphin läuft auf meiner 7900XT hervorragend! Auch die 10 neue Top Open Source LLMs jede Woche, die du nicht alle reviewen kannst, sehe ich nicht. Bishen weniger übertreiben bitte.

@tbaum9 3 месяца назад

Hehe, 69

@chris_loth 3 месяца назад

nicht genug kapas? "dann bring halt botnetz und ki zusammen" (lol)

@ChaosAT 2 месяца назад

7 Billion sind 7 Milliarden auf deutsch nicht Millionen

@cybercrazy1059 3 месяца назад

KI-Modelle für Medizin trainieren. Das wäre doch was sinnvolles.

@gorgep1242 2 месяца назад

Hey. Soweit ich weiß gibt es die doch. Weiß natürlich nicht ob das der Anwendungsfall ist den du gern hättest aber KI die Krebs mitlerweile oft zuverlässiger erkennt als Fachärzte. KI für die Forschung bei neuen Medikamenten. KI zur berechnung vom Proteinfaltung für diverse Anwendungszwecke. Aufjedenfall ein spannender Bereich.

@cybercrazy1059 2 месяца назад

@@gorgep1242 Mich würde dieser Bereich sehr interessieren. Besonders cool wäre wenn es auch davon open-source gibt, damit jeder mit forschen und mit machen kann. Vielleicht erklärt uns Morpheus demnächst wie man KI-Modelle trainiert oder feintunt

@dfas1602 3 месяца назад

irrerführender Titel, nicht präzise und eigentlich eine Falschaussage. Jeder, der ein bisschen im Thema ist, weiß wie immens die Unterschiede zwischen den Open Source Modellen und den proprietären sind.