EP05. Retrieval 평가지표에 대한 이해(recall, precision, f1 score, NDCG, mAP, mRR) [

Подписаться 28 тыс.

Просмотров 2,1 тыс.

50% 1

✅ AutoRAG 프로젝트
프로젝트: github.com/Mar...
🤖 디스코드 채널
/ discord
📘 랭체인 튜토리얼 무료 전자책(wikidocs)
wikidocs.net/b...
✅ 랭체인 한국어 튜토리얼 코드저장소(GitHub)
github.com/ted...
📍"테디노트의 RAG 비법노트" 강의 오픈기념 특별 20% 할인 쿠폰 제공
링크: bit.ly/4e1h8zO
*쿠폰 코드 : PRDTEA240528_teddy
*사용 기간 : 5/29(수) ~ 6/12(수) 23:59까지
🙏멤버십 가입링크
/ @teddynote
[꼭 읽어주세요!]
- 월 2900원씩 납부되기 때문에 가입하시는 것을 권장하지 않습니다🙅🏻
- 멤버십 회원 분들께는 "1주일 실습코드 선공개", "멤버십 회원 분들을 위한 라이브 Q&A(예정)" 혜택을 제공해 드리고 있습니다.
#rag
---
📍 "테디노트의 RAG 비법노트" 랭체인 강의: fastcampus.co....
📘 랭체인 한국어 튜토리얼(무료 전자책): wikidocs.net/b...
📝 테디노트(깃헙 블로그) : teddylee777.gi...
💻 GitHub 소스코드 저장소: github.com/ted...

Опубликовано:

28 сен 2024

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист

Посмотреть позже

Комментарии : 6

@joonlab98 3 месяца назад

오늘도 좋은 영상 잘 보겠습니다:) ------------------------------------------------------------ ⏰ Timestamp 00:00 Intro 00:10 리콜 개념 설명 00:43 프리시전 개념 설명 01:19 리콜과 프리시전의 중요성 - 래그 관점 02:29 리콜, 프리시전, F1 score 03:02 NDCG, mAP, mRR - 순서를 고려하는 지표 04:18 NDCG, mAP, mRR - 실제 프로젝트 활용 05:41 프리시전을 올리는 방법

@joonlab98 3 месяца назад

* 3줄 요약 : 🔎 리콜은 정답 중에 몇 개를 맞췄는지, 프리시전은 뽑은 것 중에 몇 개를 맞췄는지를 의미함. 🤔 RAG는 질문에 답하기 위한 정보가 리트리브된 단락에 포함되어 있어야 하므로 정답 단락을 잘 찾아올수록 좋음. 📌 리콜만 높이고 싶으면 F1 score는 안 쓰셔도 되고 둘 다 균형점을 찾고 싶으면 F1 score를 쓰시면 됨.

@joonlab98 3 месяца назад

* 심화 요약 : ## RAG 검색 시스템 평가 지표 이해하기 ### Retrieval 지표 RAG 검색 시스템은 주어진 질문에 답하기 위해 관련 정보를 검색하고, 이를 기반으로 답변을 생성함. Retrieval 과정의 성능을 평가하는 지표는 다음과 같음. 1. **Retrieval Precision**: 검색된 단락 중 정답 단락의 비율을 의미함. LLM의 context length가 작을수록, 즉 참고할 수 있는 정보가 적을수록 중요함. 2. **Retrieval Recall**: 정답 단락 중 검색된 단락의 비율을 의미함. 검색 시스템이 정답을 얼마나 잘 찾아오는지 평가할 때 중요하며, 일반적으로 recall이 높을수록 좋음. 단, recall이 높으면 precision이 낮아질 수 있음. 3. **Retrieval F1**: Precision과 Recall의 조화 평균으로, 두 지표를 동시에 고려하여 Retrieval 성능을 종합적으로 평가함. 4. **NDCG**: 검색 결과의 순서를 고려하여 정답 단락이 상위에 위치할수록 높은 점수를 부여함. 5. **mAP**: 여러 개의 질문에 대한 평균 Precision을 계산하여 Retrieval 성능을 평가함. 예를 들어 mAP가 0.5이면 평균적으로 다섯 개의 단락을 뽑았을 때 그 안에 정답이 있다는 것을 의미함. 6. **mRR**: 검색 결과에서 첫 번째로 등장하는 정답 단락의 순위를 기반으로 평가함. 정답 단락이 상위에 위치할수록 높은 점수를 얻음. ### Retrieval 지표 선택 가이드 * **Recall**: 정답 단락을 빠짐없이 가져오는 것이 중요할 때 유용함. 즉, 답변의 완전성을 중시하는 경우 Recall을 우선시해야 함. * **Precision**: 정확한 정보만을 가져오는 것이 중요할 때 유용함. 즉, 답변의 신뢰성을 중시하는 경우 Precision을 우선시해야 함. * **F1**: Recall과 Precision의 균형을 맞추고 싶을 때 유용함. * **NDCG, mAP, mRR**: Retrieval 결과의 순서를 고려하여 Retrieval 성능을 더 정확하게 평가하고 싶을 때 유용함. 특히, 다수의 단락을 Retrieval하는 경우 유용함. ### Precision 향상 노하우 Precision을 높이기 위해 설계된 단계는 Passage Filter 단계임.