En este video os mostraré cómo poder limpiar el contenido de una web o un pdf, convirtiendolo a formato markdown para que pueda ser ingestado de forma más sencilla en vuestros sistemas LLM, RAG, etc.
Estaremos mostrando el servicio/API Reader de Jina.ai y Marker.
Repositorios:
- Reader Jina: github.com/jina-ai/reader
- Marker: github.com/VikParuchuri/marker
17 июл 2024