Тёмный

LLM 챗봇, 랭체인의 핵심 Retriever 

모두의AI
Подписаться 9 тыс.
Просмотров 12 тыс.
50% 1

Опубликовано:

 

26 окт 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 71   
@AI-km1yn
@AI-km1yn Год назад
Retrieval 실습 코드는 다음주 강의 영상에서 배포하도록 하겠습니다 :)
@danny04278
@danny04278 11 месяцев назад
다음주가 막강의인가요?
@simon91982
@simon91982 6 месяцев назад
좋은 강의 너무 감사합니다!! 혹시 알려주시는 내용들은 어떤 자료를 보고 만드시는 걸까요? langchain 공식문서를 참고하시나요?
@pd7225
@pd7225 Год назад
고품질 강의 너무 감사합니다! 이해가 너무 잘되네요!
@minseongpark5131
@minseongpark5131 11 месяцев назад
매일 기다리고 있습니다. 감사합니다.
@nbright3700
@nbright3700 Год назад
드뎌 나왔네요. 기다렸습니다. 잘 따라하겠습니다. 감사합니다.
@AI-km1yn
@AI-km1yn Год назад
기다려주셔서 감사합니다!
@jeongjunahn4555
@jeongjunahn4555 11 месяцев назад
우리나라에서 이런 고퀄영상을 보게될줄이야.....강의 감사합니다!
@AI-km1yn
@AI-km1yn 11 месяцев назад
좋은 말씀 감사합니다!
@최우성-j2l
@최우성-j2l 11 месяцев назад
정말 큰 도움이 되었어요 감사합니다
@김지현-w2o
@김지현-w2o 10 месяцев назад
한 호흡에 모든 영상들 다 봤습니다. 며칠동안 머리속에 단편적으로 흩어진 조각들이 반나절만에 연결되었습니다. 명강의입니다!! 로컬모델 강의도 기대됩니다!
@AI-km1yn
@AI-km1yn 10 месяцев назад
좋은 말씀 감사합니다!
@airplaiii
@airplaiii 4 месяца назад
RAG 검색하다 영상 정주행 중입니다. 잘 봐써용
@holysantaa
@holysantaa Год назад
모닝공부 감사합니다
@kimchi_taco
@kimchi_taco 11 месяцев назад
빅테크에서 llm만드는 개발자인데요, 유저가 어떻게 llm을 쓰는지 빠르게 이해할수 있어서 정말 도움이 많이 됬습니다. 중간중간 정말 chatgpt api콜 할때 랭체인이 프롬프트를 어떻게 만들었는지 print해주시면 조금더 좋았을것 같습니다.
@AI-km1yn
@AI-km1yn 11 месяцев назад
감사합니다!
@TWS-pk3co
@TWS-pk3co 11 месяцев назад
선생님 좋은 영상 감사합니다!! 학교 수업보다 알차고 실용적인것 같습니다 ^^bb
@TWS-pk3co
@TWS-pk3co 11 месяцев назад
표에 문자 정보가 담긴 PDF 파일은 읽어 드리는게 어렵겠죠..?
@AI-km1yn
@AI-km1yn 11 месяцев назад
artifex.com/blog/table-recognition-extraction-from-pdfs-pymupdf-python 이 사이트 참고하시면 좋을 것 같습니다.
@TWS-pk3co
@TWS-pk3co 11 месяцев назад
@@AI-km1yn 감사합니다 해결했습니다! 리트리버로 벡터 DB를 load 해서 사용하니 속도도 빠르네요 대신 원래 되던 ChatMessageHistory 랑 schema 의 SystemMessage는 안돼는것 같습니다.
@jeongjunahn4555
@jeongjunahn4555 11 месяцев назад
강의는 여러번 반복하여 보고 있습니다. 혹시 openai 말고 로컬 모델(koalpaca 등등)을 활용하여 RAG 구성하는 것도 영상에 담아주시면 감사하겠습니다!!!
@AI-km1yn
@AI-km1yn 11 месяцев назад
넵 로컬 모델도 찍어보겠습니다!
@holysantaa
@holysantaa Год назад
나중에 여러 영상 하나의 긴 영상으로 다시 만들어주셔도 다시 정독하겠습니다
@AI-km1yn
@AI-km1yn Год назад
Chainlit 강의까지 마친 후에 최종 통합본 제작해보겠습니다 :) 감사합니다
@tosi2519
@tosi2519 8 месяцев назад
유료급강의 감사합니다.
@AI-km1yn
@AI-km1yn 8 месяцев назад
시청해 주셔서 감사드립니다.
@동글-v9s
@동글-v9s 10 месяцев назад
잘 봤습니다 센세 감사합니다!
@박정찬-c1p
@박정찬-c1p Год назад
선생님, Agent 특히 DB관련 agent 강의도 제발 부탁드립니다. 선생님만 저를 이해시키는데 성공하셨어요.😂😂😂
@AI-km1yn
@AI-km1yn Год назад
이번주 올라갈 웹구축 강의 이후부터 에이전트 강의를 MS의 오토젠과 함께 해볼 예정입니다. 혹시 DB관련 에이전트라 함은 SQL 구문 생성을 통한 데이터 추출 에이전트를 말씀하시는걸까요?
@박정찬-c1p
@박정찬-c1p Год назад
네, 맞습니다. 오라클과 크로마를 같이 쓰는걸 시도 중입니다!
@AI-km1yn
@AI-km1yn 11 месяцев назад
번외편으로 한번 생각해보겠습니다!
@danny04278
@danny04278 11 месяцев назад
다음강의 보고싶습니당
@AI-km1yn
@AI-km1yn 11 месяцев назад
이번 강의 코드 작성에 시간이 너무 많이 걸렸습니다ㅠㅠ 이번주 평일 중으로 업로드 예정이니 조금만 기다려주세요!
@danny04278
@danny04278 11 месяцев назад
@@AI-km1yn ㅠㅠ
@슈퍼우먼-l9z
@슈퍼우먼-l9z 2 месяца назад
아우 내 스타일이야 😂😂😂
@kanrf5808
@kanrf5808 11 месяцев назад
안녕하세요. 좋은 강의 잘 보고 있습니다. 궁금한게 있는데요, 혹시 전 강의에서 다뤘던 retrieval-vectorstores와 다른점이 query할때 LLM릏 쓰냐 안 쓰냐 차이인가요?
@AI-km1yn
@AI-km1yn 11 месяцев назад
넵 그렇게 이해하셔도 될 것 같습니다. Vectorstore의 .as_retriever는 임베딩 검색으로 유사한 청크 찾기, retrieval chain은 llm으로 유사한 청크 기반 답변하기까지 포함한다고 보시면 되겠습니다
@jaehunhwang2497
@jaehunhwang2497 Год назад
질문인데요. Map re-rank documents chain의 경우, Score가 질문과 chunk된 문서 사이의 유사도이고, 그 유사도를 따라 답을 결정한다면, 굳이 유사도 1위~k위 사이의 답변을 다 받아볼 필요가 있을까요? 어차피 복수개의 답변 중 유사도 1위의 문서를 기반으로 답을 정할 터이니, 가장 유사도 높은 해당 문서 하나로 답을 내는 것이랑 무엇이 다른가라는 질문이 생기네요....
@AI-km1yn
@AI-km1yn Год назад
제가 설명을 제대로 못드린것 같네요. 우선 혼란스럽게 해드려 죄송합니다 ^^; Map rerank는 유사도 기준으로 뽑힌 청크들에 대해 각각 LLM이 답변을 생성함과 동시에 답변의 품질 점수를 매깁니다. 그리고 각 청크의 답변중 가장 높은 점수의 답변을 출력하는 개념입니다. 어떻게보면 청크 각각에 대한 LLM의 답변을 인간이 검토하는 대신 LLM이 한번 검토하고 제일 좋은 답변만 출력한다고 보시면 될것같습니다. 다음 영상에서 한번 짚겠습니다.
@simon91982
@simon91982 6 месяцев назад
@@AI-km1yn 영상에선 '질문과 context의 유사도'라고 하신 것 같은데, '질문과 답변의 유사도'가 맞는거죠?
@JJ-ir9wz
@JJ-ir9wz 10 месяцев назад
우선 강의 자료 너무 유익하고 이해가 잘 되어서 여기까지 완강했습니다. 좋은 자료 만들어주신 것에 대한 감사하다는 말씀 먼저 드립니다. 앞으로도 langchain과 관련된 자료가 올라오면 가장 먼저 찾아볼 것 같습니다^^ 관련되어서 질문 드립니다. Q1. auto-gpt 라는 걸 알게 되었는데 이 auto-gpt를 실제 써보지는 않았지만, 여태까지 설명해주신 RAG 기반으로 Chain들을 연결하여 만든 프로그램이라고 생각하면 될까요? 내부 구조가 궁금합니다. 간략하게나마 설명해주시면 감사드리겠습니다!
@AI-km1yn
@AI-km1yn 10 месяцев назад
안그래도 ms가 발표한 auto gen이라는 프레임워크가 말씀하신 바와 유사하여 다음주 내로 강의 영상 업로드 예정입니다. *auto gpt는 langchain의 agent 기능을 통해 구현된 것으로, llm이 자체적인 작업 수행 루프를 돌면서 사용자의 작업 요청을 수행하는 프레임워크입니다. 예를 들어, "자산 계획을 세워줘" 라는 요청을 LLM에게 보내면 LLM이 스스로 이 작업 수행을 위해 필요한 도구를 탐색하고 계획을 세워 최대한 작업 수행을 하고자 노력합니다. 이 과정에서 LLM이 할 수 있는 역할은 매우 다양한데, Auto gen 강의에서 더 자세히 알려드리겠습니다 :)
@박수호-n5l
@박수호-n5l 8 месяцев назад
좋은 영상 감사합니다! Map re-rank 도 LLM을 통해 결과를 받는과정이 병렬로 수행되나요?
@mingyukang6592
@mingyukang6592 Год назад
올려주시는 강의로 열공하고 있습니다. 몇가지만 질문드립니다. (1) 논문처럼 한 페이지가 2단으로 구성된 PDF도 그냥 올리면 잘 분리하는지 궁금합니다. (2) 하나의 문서가 아니라 여러개의 문서를 vector로 변환한 상태에서 검색을 하려고 할 때에는 어떤 chain methods를 적용하면 되는것일까요? (3) 업로드하려고 하는 문서가 Q&A로 이루어져있는 문서인 경우 chunk를 임의의 숫자를 입력하는 것이 좋을지? 줄바꿈(' ') 또는 ' '으로 구분가능한 'recursive character text splitter'를 활용하는게 좋을까요?
@AI-km1yn
@AI-km1yn Год назад
시청해주셔서 감사합니다. 아래에 답글 남깁니다. (1) pdf 파일을 불러들이는 documentloader의 종류에 따라서 성능이 다를 수 있습니다. 예를 들어 제 강의에서는 PyPDF라는 PDF라이브러리를 통해 불러왔는데, 내가 가진 파일에 더 적합한 pdf 라이브러리가 있다면 그걸 쓰면 됩니다. 2단형식의 경우 PyMuPDF가 잘 작동한다네요 ^^ (2) 여러 문서의 경우에도 모두 벡터 변환후 크로마 객체에 담으면 검색이 가능합니다. 다음 시간에 Directoryloader로 여러 문서 불러와서 rag를 구성하는 실습도 진행해보겠습니다. (3) QA 형식의 글은 Openai api로 파인튜닝하시면 더 좋은 챗봇을 만드실수도 있습니다만, RAG로 구성하신다면 말씀하신대로 RecursiveCharacterSplitter 이용하시면 됩니다. 그리고 이 스플리터는 어떤 순서로 splitting할지 구분자 순서를 리스트 형태로 지정해줄수있는데요, 예를 들어 [Q, A, /n/n, /n] 이런식으로 구분자 순서를 지정해주시면 Q를 기준으로 먼저 자르고 사이즈가 안맞으면 A, 그다음 문단, 줄바꿈 순서대로 문장을 분할합니다. 이렇게 되면 최대한 QA가 한 묶음으로 청킹되도록 만들수있습니다. 코드는 RecursiveCharacterTextSplitter의 seperators 매개변수 검색해보시면 확인하실수있습니다.
@홍승민-z3x
@홍승민-z3x 10 месяцев назад
글 또 남겨요. 생성형 가지고 노는 유튜버 중에 가장 진보된 자료 입니다. 아무도 이런 이야기를 안해요. 생성형 백단에서 뭐가 가장 중요한지~ 그냥 좋다고~~ 응용 어플 방법만 디립따 자극식으로 떠들고~~ 그래서 인지 케인님이 안 유명해 졌으면 합니다. 그래야 승자독식을 하지~
@AI-km1yn
@AI-km1yn 10 месяцев назад
항상 좋은 말씀 감사합니다ㅎㅎㅎ
@jaehunhwang2497
@jaehunhwang2497 Год назад
개인적으로 메시지를 어떻게 드려야 할 지 몰라서 댓글로 남기게 되네요. 이번 비디오에서 OPENAI_API_KEY가 공개된 채로 영상이 찍혔어요. 해당 키를 deactivate 하셔야 할 것 같아요. 강의 무척 감사히 잘 듣고 있습니다. 감사드려요.
@AI-km1yn
@AI-km1yn Год назад
Deactivate 했습니다. 감사합니다!!
@user-ze7kj8xh4e
@user-ze7kj8xh4e 9 месяцев назад
영상 잘만드셨네요
@ydc6238
@ydc6238 11 месяцев назад
강의 정말 잘 보고 잇습니다! 번외 질문이지만 langchain에서 document를 기반으로 예제 질문을 생성하는 방법(모듈)이 있을까요?
@AI-km1yn
@AI-km1yn 11 месяцев назад
Summarize chain의 Map reduce chain 프롬프트를 살짝 변경하면 가능할것같습니다. 요약 체인에 맵리듀스를 넣으면 들어간 문서에 대해 청크별 요약을 만들고 그거 합쳐서 최종 요약을 만드는데, 청크별 요약 대신 예제 질문 뽑아달라고 하고 마지막 최종 요약 대신 요약예제 목록 합쳐달라고 하면 될것같습니다. Langchain 깃헙의 map reduce 파이썬 파일을 한번 뜯어보시면 이해하실수있습니다.
@ydc6238
@ydc6238 11 месяцев назад
@@AI-km1yn 코멘트 정말감사합니다. 다음영상도 기대중입니다!
@danny04278
@danny04278 11 месяцев назад
저번시즌에 허깅페이스에서 오늘은 오픈ai로 넘어갔는데 정확히 허깅페이스와 오픈ai가 하는 역할차이를 잘 모르겠어요 허깅페이스는 임베딩만 하고 대답해주는 엔진만 open ai쓰는건가요? 대답해주는 엔진도 허깅페이스로 바꿀 수있죠?
@AI-km1yn
@AI-km1yn 11 месяцев назад
대답하는건 GPT같은 LLM이 필요한데, Openai의 gpt 모델이 가장 성능이 좋아서 그걸 썼습니다 허깅페이스에도 이런 모델들이 있지만 성능이 떨어져 쓰지 않았습니다
@홍승민-z3x
@홍승민-z3x Год назад
영상 내리지 마여~~ 저는 꼭 다시 할거 임돠- 몰랐을땨는 그런가 보다 하고 따라 했는데. 조금 알고나니, 아 예 처음부터 다시 해야 하더라고요. 알고 나니 다시 처음부터~~ 뭐 이런 거라. 시간이 더 필요 함돠.
@홍승민-z3x
@홍승민-z3x Год назад
또 글남겨요, 이거 무조건 폭팔합니다. 지각 변동이고요. 다른 글에서도 저는 이것 어떠한 방식이든 한다고 했는데요, 선생님 정말 대단 하셔요. 이런분이 국내 몇명일까? 생각해 봅니다. 제 생각에 10명?? 이건 좀 오바니, 50명 안된다고 생각 합니다.
@AI-km1yn
@AI-km1yn Год назад
말씀 감사합니다.
@ryjun93
@ryjun93 7 месяцев назад
호들갑… 격하게 동의합니디👍👍👍👍👍
@juhyeokhan4923
@juhyeokhan4923 Год назад
강의 정말 잘 보고 있습니다. 감사합니다. 저도 현재 LangChain을 공부를 하다 궁금한 점 질문 드리고 싶어 댓글 달게 되었습니다! 1. 가끔 가다가 LangChain에 대해서 Document가 제대로 정리가 안되어 있다거나, Wrapper 함수 등 코드 중에서 불필요한 것들이 존재한다는 점에서 비판적인 시각을 가지고 있는 글들이 존재하는 데, LangChain에 대해서 공부해오시면서, 이런 점들을 실제로 느끼시는 지 여쭤보고 싶습니다. 2. 만약에 그렇게 느끼신다면, 최근에, 이런 In-context Learning이나 Orchestration Framework 관련해서 관심을 가지시는 것이 있는지 궁금하네요!
@AI-km1yn
@AI-km1yn Год назад
시청해주셔서 감사합니다. 아래 답글 남깁니다. 1. 제대로 정리 안된 기술문서, Wrapper 함수 문제: 이 문제 같은 경우에는 현재 랭체인 외의 오픈소스 프레임워크중 더 나은 것이 없고 이미 많은 앱들이 이 프레임워크 하에서 짜여졌기 때문에 어쩔수없는 부분도 있는 것 같습니다. 기술 문서가 제대로 안돼있는점은 매우 공감합니다만 내부 구조나 함수가 전혀 어렵지 않고 쉽게 파악 가능하다는 점에서 아쉬운 정도인 것 같습니다. Wrapper함수는 종종 커스터마이징하기 어렵다는 측면에서 비판을 받던데 커스터마이징 수요가 있을 정도의 고도화된 챗봇을 만든다면 커스텀 체인 함수를 구성하는게 낫긴합니다. 다만 랭체인에서 이미 짜여진 틀이 꽤 훌륭하고 여기서 조금씩 커스텀하면 많은 부분이 해결되어, 큰 문제는 아닌 것 같습니다. 2. 최근엔 Auto gen이라고 MS에서 자율 에이전트 프레임워크를 발표한 것에 관심이 많은데요, 이와 관련해서 랭체인의 에이전트와 비교하고 딥다이브해보는 강의도 찍을 예정입니다 :)
@danny04278
@danny04278 11 месяцев назад
이 코드대로 하면 임베딩을 한건가요? 아니면 텍스트 스플리터에서 리트리버를 통해 값을 바로뽑는건가요?
@노재성-f9u
@노재성-f9u Год назад
주말쯤에 새 동영상 올리실 거 같아 기다리고 있었습니다. 좋은 강의 감사합니다. Chainlit까지 빨리 봤으면 좋겠네요. 언제쯤 될까요?
@AI-km1yn
@AI-km1yn Год назад
다음주 내로 업로드해보겠습니다. 감사합니다
@user-qx3lb3vt9o
@user-qx3lb3vt9o 10 месяцев назад
혹시 아직 retrieval 실습 코드 배포 안하신게 맞을까요? 제가 못찾는건가 해서요!
@AI-km1yn
@AI-km1yn 10 месяцев назад
오늘 올리도록 하겠습니다. 감사합니다
@박윤희-f7w
@박윤희-f7w 6 месяцев назад
이미 chunk에 score가 있는데.... 각 chunk 별 생성된 답변으로 다시 score를 계산하는 건가요?
@홍승표-h4r
@홍승표-h4r 8 месяцев назад
openai api를 쓰면 돈을 지불해야하는 건가요?
@AI-km1yn
@AI-km1yn 8 месяцев назад
넵 사용량에 따라 지불해야하는대, 기본 무료 크레딧이 있으니 일반 사용자분들은 대부분 충당 가능하실겁니다
@yankeecanoa
@yankeecanoa Месяц назад
기업의 보안문서들로 rag를 구성할때는 chatgpt api를 사용하는건 보안적인 부분에서 비추이고, 허깅페이스에서 다른 llm모델로 사내구축을 해야하는건가요?? ​@@AI-km1yn
Далее
자연어로 데이터 추출하기 - SQL_Agent
30:19
랭체인의 핵심, Retrieval-Text Embeddings
21:29
오픈소스 LLM으로 RAG 시스템 만들기
26:24
Просмотров 40 тыс.
[SK TECH SUMMIT 2023] RAG를 위한 Retriever 전략
19:16