안녕하세요, 도움이 되셨다니 다행입니다! ChromaDB 대신 FAISS를 쓴 이유는 의존성 문제 때문입니다. Streamlit에 배포 시에, ChromaDB가 의존성 문제로 인해서 에러가 나는 경우가 많아서, FAISS로 진행했습니다. 아마 sqlite3 관련 에러가 날텐데, 아래 코드를 streamlit 파일에 포함하시면 ChromaDB로도 무리 없이 진행가능하실겁니다. __import__('pysqlite3') import sys sys.modules['sqlite3'] = sys.modules.pop('pysqlite3')
안녕하세요, 강의가 도움이 되셨다니 다행입니다. 여러 pdf 파일을 처리할 때는, PDFLoader를 통해 문서를 로드할 때 for문을 통해 여러개 가져와주시면 되겠습니다. 아래 코드를 참고해주세요 import os from langchain_community.document_loaders import PyMuPDFLoader pdf_directory = "example_data/" documents = [] for filename in os.listdir(pdf_directory): if filename.endswith(".pdf"): loader = PyMuPDFLoader(os.path.join(pdf_directory, filename)) documents.extend(loader.load())
강의 좋게 봐주셔서 감사합니다. OpenAI의 API를 활용하시려면, 처음 가입 시에 주어지는 무료 크레딧 이후부터는 결제가 필요합니다. 무료 크레딧을 다 쓰신 경우에는 Claude도 무료 크레딧을 제공하니 claude 모델 활용하셔도 좋구요. 계속 무료로 사용하시려면 오픈소스 LLM을 사용하셔야 합니다.
좋은 정보 감사합니다. 다만, 약간의 숨은 문제가 있는 것 같습니다. 바로 처리 비용 토큰입니다. PDF에 비해 훨씬 많은 토큰 비용이 발생할 수 있지 않을까요? 예를 들어 샘플 테스트 결과를 보면: - PDF 3페이지: 약 375~450 토큰 - 이미지 3개 (1484.57KB): 약 592,344 토큰 이처럼 토큰 처리 비용이 상당히 발생합니다. 이 부분에 대해 계속 고민 중인데, 혹시 해결 방안이 있으시면 알려주시면 감사하겠습니다.^^
Rag 가뭔가 해서 봤더니 제일 중요한게 OCR 기술 이네?(일단 입력 값이 정확해야 나중에 뭘 해도 하니까)이거는 파인리더가 제일 잘하는데?ocr 에좀 관심 있어서 좀 아는데 걔들 맨날 자랑하는게 표인식 잘한다는 거,이런 rag 에 구글이나 파인리더 ocr 기술 쓸 수 있나요? 그렇게 rag에 OCR 기술이 중요하다면ocr도 API화해서 장사를 해도 괜찮을 것 같다
@@AI-km1yn 우선 답변 감사합니다! 업무용 노트북에서 세팅 한번 해보려고 했는데 Windows OS다보니 poppler-utils 설치하는데 이슈가 있더라구요. 어떻게 해결하긴 했는데 PDF 2장짜리 파일 돌리는데도 엄청 오래걸리더라구요. 아무래도 임베딩 자체를 로컬에서 직접 돌리다보니 원활하게 동작하려면 PC 성능이 많이 따라줘야 할까요?ㅎㅎ..
좋은 지식 나눠주셔서 너무 감사합니다!! 에이전트가 정확한 답을 내기위해 상호 소통을 하게되면 사용자가 답변을 받기에 걸리는 시간(응답속도)은 더 떨어질 것으로 보이는데요. 맞을까요?? 맞다면 챗봇같은 서비스에서 정확도 못지않게 응답속도도 중요한 요소일것 같은데, 이를 개선할 수 있는 방법은 어떤것이 있나요??(+강의에 이 내용이 담겨있나요?)
저도 상품을 만들고자 노력했으나, 좋은 상품을 만들기 위해 필요한 역량이 꽤 많고, 전 아직 많이 부족하다는 생각이 들었습니다 ㅎㅎ 백엔드 프론트엔드 이런 영역이 괜히 나뉘어있는 것이 아니구나 다시 한번 느꼈구요. 요즘 AI가 코딩을 도와줘서 1인 SaaS 사업가가 늘어나고 있는데, 사실 기본적인 실력이 없다면 AI의 조언도 못 알아듣기 때문에 혼자 수익화 가능한 상품 만드는 것은 거의 불가능하다고 생각합니다.