@@bbanghyong 답변이 늦어서 죄송합니다! 저는 langchain + openai 조합으로 활용했고 동일한 질의와 동일 document set 기준으로 체감상 Pinecone > chroma >>> faiss-cpu 였습니다. chroma 에서 7초인게 faiss-cpu는 40초 넘어가더라고요.. (여담이지만 chatpdf는 도대체 어떻게 만들었길래 그렇게 빠른건지 궁금해졌습니다..) 느낌상 일단 당분간 pinecone이 1대장인 것 같습니다만 더 다양한 vectordb가 여러 종류가 있는 것으로 알고 있어서 찾아봐야할 것 같습니다!! 좋은 영상 감사합니다!!
query_result = collection.query( query_embeddings=[test_embedding], n_results=3, ) query_result InvalidDimensionException: Embedding dimension 384 does not match collection dimensionality 3 해당 오류 어떻게 해결할 수 있을까요?
collection.add( embeddings=embeddings, metadatas=metadatas, ids=ids ) 이 부분에서 계속 에러가 나는데 왜 그러는 걸까요?? ㅜㅜ --------------------------------------------------------------------------- ValueError Traceback (most recent call last) in () ----> 1 collection.add( 2 embeddings=embeddings, 3 metadatas=metadatas, 4 ids=ids 5 ) 2 frames /usr/local/lib/python3.10/dist-packages/chromadb/api/types.py in validate_embeddings(embeddings) 282 ) 283 if not all([isinstance(e, list) for e in embeddings]): --> 284 raise ValueError( 285 f"Expected each embedding in the embeddings to be a list, got {embeddings}" 286 ) ValueError: Expected each embedding in the embeddings to be a list, got [array([ 7.8607005e-01, -8.9359832e-01, -3.2043481e-01, -9.9920589e-01, 이런식으로 뜹니다만...ㅜㅜ 아시는분 도와주시면 감사하겠습니다!!