AI 이미지 검색 엔진 만들기 - 벡터 데이터베이스 설명과 Chroma DB 튜토리얼

빵형의 개발도상국

Подписаться 56 тыс.

Просмотров 27 тыс.

50% 1

Видео Поделиться Скачать Добавить в

Опубликовано:

26 окт 2024

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист

Посмотреть позже

Комментарии : 44

@하이젠버그-b3b 8 месяцев назад

2019년에 db 없이 직접 구현했는데 이게 나왔네요. Cos distance는 수학적으로는 다차원에서는 각도가 아니라 벡터에서 같은 성분 정도를 의미합니다.

@나뚜루-z6n Год назад

몇달전에 벡터베이스 관련해서 찾아보았는데, 오늘 관련영상으로 떴네요. 참 유익한 영상입니다. 감사합니다

@alphaseekerr Год назад

요즘에 관심이 있었던 부분인데 알려주셔서 감사합니다

@sw-ln1hh Год назад

저도 요즘 랭체인 따라해보면서 벡터 디비 정의가 모호했는데 감사합니다.

@aidoer 9 месяцев назад

enumrate의 i는 기본적으로 정수형 리턴이고 collection ids에 리스트는 문자형라 그렇네요ㅎㅎ 추가로 임베딩이후에 tolist로 보내야 db에 들어가는거 같아요. 강의하다가 발견했습니다!

@박상현-e2z Год назад

빵형 또 해냈군요!

@이재훈-u2z8n Год назад

정말 궁금했던 내용이었는데.. 감사합니다. ^^

@EnsignerTV Год назад

와 정말 세세하게 리뷰해주셔서 감사합니다!!

@bds1092 Год назад

좋은 영상 고맙습니다.

@아이니아 Год назад

와 벡터 데이터베이스 재밌네요

@masteroffantasy Год назад

유익했습니다

@LimPotato Год назад

안녕하세요! 영상 잘 보고 있습니다😆 다름이 아니라 이전에 올리셨던 영상 중에 한가지를 따라해보고 있는 와중에 궁금한 점이 몇가지 생겨서 그런데 혹시 여쭤봐도 될까요…?

@hayouongpark Год назад

정말 유익합니다.. 갓 빵형 DB진화 부분이 너무 와닿는 부분인데 혹시 참고할 자료나 논문같은게 있을까요?

@bbanghyong Год назад

한번 찾아볼게요! 댓글 감사해요!

@assethotorch2395 Год назад

Chroma pinecone faiss 속도비교 중이였는데! 좋은 영상 감사합니당!

@bbanghyong Год назад

속도 비교 결과 어떻던가요?! 궁금궁금

@assethotorch2395 Год назад

@@bbanghyong 답변이 늦어서 죄송합니다! 저는 langchain + openai 조합으로 활용했고 동일한 질의와 동일 document set 기준으로 체감상 Pinecone > chroma >>> faiss-cpu 였습니다. chroma 에서 7초인게 faiss-cpu는 40초 넘어가더라고요.. (여담이지만 chatpdf는 도대체 어떻게 만들었길래 그렇게 빠른건지 궁금해졌습니다..) 느낌상 일단 당분간 pinecone이 1대장인 것 같습니다만 더 다양한 vectordb가 여러 종류가 있는 것으로 알고 있어서 찾아봐야할 것 같습니다!! 좋은 영상 감사합니다!!

@dongyeong Год назад

영상 너무 잘 보았습니다 혹시 발표 자료를 받을 수있을까요..?

@bayumartin8607 Год назад

와.. 감사합니다

@구민-q8r 10 месяцев назад

혹시 IDE에서 위 영상을 개발하는 영상이 따로 있을까요? 아니면 혹시 깃코드 라도 받아 볼 수 있을까요?

@heejuneAhn Год назад

기존에 XXX retrieval 이라고 하던 거랑 거의 차이 가 없네요. 가장 간단한 구현은 kd-tree 를 사용하는 것이죠.

@hobeom 9 месяцев назад

차원이 많이 커져도 kd-tree가 효율적인가요?

@김보겸-i6e 3 месяца назад

pdf문서를 임배딩한후 백터데이터에 저장후 pc에 보관가능한가요, 그리고 새로운 pdf등의 자료를 임배딩한 후 보관했던 백터데이터에 추가로 저장이 가능한지요?

@hanshine_lee Год назад

유익한 영상 감사드립니다.! 혹시 LLM 모델과 벡터 데이터베이스를 연동하여, 챗봇으로 벡터 데이터베이스 결과를 조회하는 방법도 한번 영상으로 만들어주실수 있을까요?

@김민수-b6m7e 5 месяцев назад

벡터화를 한다는게 임베딩이랑 동일한 의미일까요?

@민민민-c3e 5 дней назад

네

@hyuckpackers Год назад

혹시 그렇다면 별도의 추론 모델 없이 Kaggle 오픈데이터를 벡터디비로 변환 뒤에 추정하고자 하는 이미지를 벡터디비화해서 근접거리를 추정해서 이미지를 추론한다는 내용일까요?

@gren3637 4 месяца назад

정확히는 추론 돼 있는 모델을 사용하기 때문레 추론이 필요없는 거죠

@우성이-j4u Год назад

크로마 db 는 무료인가요? api 를 써도...? pinecone 은 유료인것 같은데.. faiss 등 간단한 비교도 알려주시면 ㅜㅜ

@bbanghyong Год назад

Api는 유료일거에요 아마도.. 나중에 faiss도 준비해보겠습니다!!

@meguru420 Год назад

와 이 개념은 넘사벽이네요 ai개발자분들 다들 천재군요

@yhskrrrrrrr Год назад

지구똑똑이들은 거의 ai에 매진해있으니 ㅋㅋ

@u_luana.j Год назад

학교수업때 잠깐 배운거라 기억이 잘 안나서 그런데 쿼리할 때 O(n) 이면 문제가 되진 않나요?? 얼핏 봐서는 거리를 n개 다 비교하는 알고리즘 같아서요

@하이젠버그-b3b 8 месяцев назад

메트릭스 연산이 가능해서 gpu를 사용도 가능해서 기존 O(n)이 무색해지긴합니다. 이런 db 나오기전에 교수님등 설득 시키는 것이 힘들었습니다

@India_Love_Tube Год назад

선생님 궁금한게 있습니다! 사진 데이터베이스를 구글에서 어떠한 것을 검색할 때 나오는 이미지 데이터로는 못하나요?

@bbanghyong Год назад

크롤링으로 다운로드받고 다시 저장해서 해야할거에요

@noel-min Год назад

안녕하세요! 영상 잘 봤습니다. 기존에 검색엔진으로 자주사용하던 Elastic Search vector기반의 유사도 판단으로 ranking을 매기고, 검색결과를 return해주는걸로 알고있는데, Elastic Search와는 어떤 차이가 있을까요?

@jal4796 5 месяцев назад

query_result = collection.query( query_embeddings=[test_embedding], n_results=3, ) query_result InvalidDimensionException: Embedding dimension 384 does not match collection dimensionality 3 해당 오류 어떻게 해결할 수 있을까요?

@Yacktalkun Год назад

구글db에 합성곱신경망이 있나보군요

@트롤의신-h4p Год назад

저 실례가 안되시면 신경망 관련해 AI를 개발하고자 하는데 자문을 구하싶어 댓글을 남겨 봅니다 괜찮으시다면 댓글 남겨 주셨으면 합니다

@bbanghyong Год назад

kairess87@gmail.com 으로 문의주세요!

@미싱하는직장인 Год назад

collection.add( embeddings=embeddings, metadatas=metadatas, ids=ids ) 이 부분에서 계속 에러가 나는데 왜 그러는 걸까요?? ㅜㅜ --------------------------------------------------------------------------- ValueError Traceback (most recent call last) in () ----> 1 collection.add( 2 embeddings=embeddings, 3 metadatas=metadatas, 4 ids=ids 5 ) 2 frames /usr/local/lib/python3.10/dist-packages/chromadb/api/types.py in validate_embeddings(embeddings) 282 ) 283 if not all([isinstance(e, list) for e in embeddings]): --> 284 raise ValueError( 285 f"Expected each embedding in the embeddings to be a list, got {embeddings}" 286 ) ValueError: Expected each embedding in the embeddings to be a list, got [array([ 7.8607005e-01, -8.9359832e-01, -3.2043481e-01, -9.9920589e-01, 이런식으로 뜹니다만...ㅜㅜ 아시는분 도와주시면 감사하겠습니다!!