Тёмный

Limpia y prepara webs y PDF para tus LLM - Dos formas sencillas de convertirlos en Markdown 

La Hora Maker
Подписаться 15 тыс.
Просмотров 3,5 тыс.
50% 1

En este video os mostraré cómo poder limpiar el contenido de una web o un pdf, convirtiendolo a formato markdown para que pueda ser ingestado de forma más sencilla en vuestros sistemas LLM, RAG, etc.
Estaremos mostrando el servicio/API Reader de Jina.ai y Marker.
Repositorios:
- Reader Jina: github.com/jina-ai/reader
- Marker: github.com/VikParuchuri/marker

Наука

Опубликовано:

 

17 июл 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 12   
@LaHoraMaker
@LaHoraMaker 12 дней назад
¿Tienes algún caso de uso interesante en el que necesites limpiar datos de webs o PDFs? ¿Qué otras herramientas estas usando?
@guillerf10
@guillerf10 12 дней назад
Estoy probando RAGFLOW y tengo pendiente R2R
@gmag11
@gmag11 11 дней назад
Tan interesante como siempre César. Hace poco vi otra herramienta parecida: Dhravya Markdowner. Tiene servicio en web también
@ivanngv
@ivanngv 7 дней назад
Muchas gracias!! apenas estaba llegando a los pdf.. ahorita estaba trabajando con archivos de excel. Estoy desarrollando un evaluado de trabajos para mis clases.. Normalmente mis alumnos me mandan muchos archivos que no cumplen con los requisitos o esta vacíos...asi que estoy usando api para que chequen los trabajos y les de un auto evaluación y me pueda yo concentrar en revisar y dar retroalimentación
@user-xt5ou4gp7v
@user-xt5ou4gp7v 12 дней назад
Impecable Cesar, marker lo uso y anda muy bien, en varios casos mejor que PyPdf2, a jina no lo conocia, gracias por tus aportes
@peduwankenove3319
@peduwankenove3319 12 дней назад
Quiero, desarrollar un asistente, que me ayude gestionar mi pequeña granja avicola ecológica. Datos veterinarios, legales, productivos, bienestar animal, bioseguridad, trazabilidad,... De momento aprendiendo, gracias a ti 🎉🎉🎉😊
@martinVas-se6gs
@martinVas-se6gs 11 дней назад
Excelentísimo Cesar, mil mil gracias por todo su aporte, tanto ahira en inteligencia artificial, como igual lo eres en anteriores oportunidades con oos Makers, Cesar cuando nos regalas un video para enteenar un llms como Biomistral en el area medica, ya que este se dice que es el mejor hasta el momento en medicina, pero no hemos podido hacerlo trabajar en español y seria magnífico alimentarlo con PDFs, con esta última herramienta que describes en el video. Un gran gran abrazo y felicitaciones por tu enorme entrega🙏
@damianquijano1706
@damianquijano1706 12 дней назад
Creo que este tema del preprocesamiento de los input , por ejemplo para los RAG, es de enorme importancia, pero en cambio poco se difunde a pesar que da para muchos videos o tutoriales. Además existe mucha innovación, pues se incorporan las IA para que asistan al preprocesamiento. Me parece muy acertado el esfuerzo del autor, de este tema hay muy poco en el internet.
@javaboy6581
@javaboy6581 12 дней назад
Por fin vuelves maestro! Cuánto te eché de menos!
@yassechchorfi8637
@yassechchorfi8637 10 дней назад
Alguien me puede explicar cómo este canal no está en lo más alto entre buscando cobre y encontre diamante/gran trabajo señor /
@fblua
@fblua 12 дней назад
¡Excelente! Como siempre, gracias y en deuda por compartir tu conocimiento libremente. Igualmente, cadena de favores: ACTIVA. Todo vuelve! Saludos desde Argentina.
@ParaElbife-mb8oh
@ParaElbife-mb8oh 12 дней назад
Una ves obtenido ese archivo como lo ingresamos de la manera más fácil en nuestro llm en local, perdón pero mis conocimientos sobre el tema son limitados si me baje y use el llmStudio con algún modelo como llama 3 y phi3 pero hasta ahí...
Далее
🏟️👋 Welcome to your new home, Kylian Mbappé!
00:14
КАК ДУМАЕТЕ КТО ВЫЙГРАЕТ😂
00:29
DAD LEFT HIS OLD SOCKS ON THE COUCH…😱😂
00:24
Por qué Excel es una habilidad blanda
17:22
Просмотров 133 тыс.