Тёмный
No video :(

Primeras pruebas con LLM en Orange PI 5 Plus - Tiny llama, Phi, Zephyr, Nous Hermes 

La Hora Maker
Подписаться 16 тыс.
Просмотров 2,7 тыс.
50% 1

En este video vamos a hacer las primeras pruebas con LLM en la placa SBC Orange PI 5 Plus equipada con el chip RK3588. Probaremos distintos modelos en orden creciente de tamaño, comenzando por Tiny Llama 1.1B, Phi 2.7, Zephyr 7B y Nous Hermes 13B. En el video hemos mantenido el tiempo de generación, así que ha quedado un video bastante largo.
Os invito a considerar este video como una primera aproximación a la Orange Pi, ya que hemos visto que sin estar equipado con ventilador externo, la placa hace Thermal Throttling. Encontramos un apaño manual, pero en futuros videos contaremos con un disipador y ventilador adaptado.
También es importante considerar que la aproximación es bastante burda, ya que sólo hemos utilizado la CPU con ocho cores de la placa Orange Pi 5 Plus. La placa también dispone de GPU y NPU, para acelerar estos procesos, que exploraremos en futuros videos.

Опубликовано:

 

29 авг 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 23   
@joselorenzo8772
@joselorenzo8772 3 месяца назад
Muy buenas! gran trabajo de pruebas si señor! deseando ver test con ventilación integrada y aceleración! ❤
@royotech
@royotech 6 месяцев назад
Excelente video. Tan bueno que se aguanta hasta el final aún que tenga muy poco audio.
@royotech
@royotech 6 месяцев назад
Me parece muy buena idea centrarse en los modelos de 7B de parametros. Puedes probar algun Mixtral disponible. Que son los que mejor se acercan a ChatGPT 3.5 turbo. Hay uno llamado MiQu de Mixtral. Gracias Cesar... que viva España
@JorgeLamaVarela
@JorgeLamaVarela 6 месяцев назад
Gracias por currarte estos test
@LaHoraMaker
@LaHoraMaker 6 месяцев назад
Verás cuando lo ponga a correr con el ventilado pro instalado :)
@JorgeLamaVarela
@JorgeLamaVarela 6 месяцев назад
Estaría interesante ver una tabla comparativa de cuántos tokens por segundo se generan, comparando esta placa contra el mac mini y la nvidia que tienes @@LaHoraMaker
@hakertube
@hakertube 2 месяца назад
me interesa ver como se ejecutan modelos con la npu hace poco descubri que ffmpeg ya tiene soporte para aceleracion por hardware y la diferencia fue brutal paso de x2 a x10 ojala pase lo mismo con llm :)
@jtrujillo33
@jtrujillo33 Месяц назад
Excelente video! Gracias por la información, pero más importante es justamente las pruebas en GPU y si es que se llegara en NPU.. Estoy en el mismo punto, hice las mismas pruebas, y quisiera saber si tiene pensado el video de esta otra parte? Me parece la piedra angular para esta serie de la Orange Pi, gracias! Espero su mensaje
@mariron42
@mariron42 4 месяца назад
Puesde seguir haciendo videos de LLM en arm? Me llama mucho la atención este tema, en un futuro quiero tener mi mini servidor arm
@LaHoraMaker
@LaHoraMaker 4 месяца назад
Tengo pendiente retomar las grabaciones con la Orange Pi. Mi intención es probar nuevos modelos de visión de pequeño formato tipo Moondream2
@PelochusMaximus
@PelochusMaximus 5 месяцев назад
Buenas César! Buen video, hay pocos como estos y hacen falta. Sabes cuando (o si llegaras a) hacer el video usando la GPU y la NPU de la Orange Pi 5? Ahora mismo estoy tratando yo de conseguirlo, pero solo en NPU. Me gustaria ver una comparacion de rendimiento entre ambas. Un saludo!
@yosoyjose
@yosoyjose 6 месяцев назад
buenas cesar, los últimos dos vídeos te quedaron con el audio un poco bajo, aún así se puede entender todo saludos
@LaHoraMaker
@LaHoraMaker 6 месяцев назад
Gracias por el apunte! Estos dos últimos vídeos los he montado en el Mac entre idas y venidas. Justo al ir a exportar me he dado cuenta que Davinci en Mac no tiene la opción de normalizar el audio, mientras que la versión de Windows si. Aun así, revisaré la configuración de la mezcladora de audio y vídeo (intuyo que le cambie la configuración de la entrada de micro cuando fui a Leon)
@terranovich8471
@terranovich8471 6 месяцев назад
Ollama noto que demora y a veces responde vacío, sería genial que probaras con LM Studio a ver como te va.
@LaHoraMaker
@LaHoraMaker 6 месяцев назад
¿Sobre qué sistema estás probando Ollama? ¿Con qué modelo?
@terranovich8471
@terranovich8471 6 месяцев назад
@@LaHoraMaker Windows utilizando CMD, con el modelo QWEN 1.5-7B 5_0k
@EirikRenV
@EirikRenV 6 месяцев назад
¿cuanto de RAM sería necesario para cada modelo? Tengo una de 8gb de RAM y me gustaría analizar posibles aplicaciones de IA
@LaHoraMaker
@LaHoraMaker 6 месяцев назад
Si miras en Ollama library, dentro de cada modelo en la sección de Tags, te aparece el tamaño de cada uno de los modelos. Por ejemplo en el caso de Mistral: ollama.com/library/mistral/tags El modelo por defecto require 4.1 Gb, más algo de tamaño para el contexto de la pregunta. Creo que 7 billones de parámetros será lo máximo que se podrá correr (de momento) en una Orange Pi de 8 Gb.
@JulianAndresSanchezjurado
@JulianAndresSanchezjurado 2 месяца назад
Me surge la pregunta entonces, un micropc o un pc para este tipo de tareas?
@royotech
@royotech 6 месяцев назад
Cesar y se instala listo como servidor, lo puedo poner en una intranet?
@lagallinaturuleta1302
@lagallinaturuleta1302 14 дней назад
Algo que todavía por más que he buscado no he encontrado, es el uso de un Orange PI 5 para emular un android. Actualmente estoy teniendo que dejar mi ordenador encendido para emular un android con bluestacks, pero estoy valorando comprarme uno de los modelos orange PI 5 con Genymotion u otro software para dejarlo encendido todo el día. ¿Sabrías un poco al respecto? ¿Lo desrecomendarías por alguna razón? Gracias de antemano y saludos
@NioxML
@NioxML 2 дня назад
por que emular? Podes instalar android 12 nativo de la pagina oficial
@brado9232
@brado9232 5 месяцев назад
"promosm" 🤤
Далее
버블티로 체감되는 요즘 물가2
00:15
Просмотров 2 млн
Orange Pi 5 Pro. Smaller, faster, Smoother
17:38
Просмотров 16 тыс.
Review Orange Pi 5 plus
29:32
Просмотров 17 тыс.
Orange Pi 5 Plus Case and Coolers test. Geekworm
13:11
버블티로 체감되는 요즘 물가2
00:15
Просмотров 2 млн