RAG용 PDF를 준비합니다. | 데이터 과학을 향하여
PDF를 텍스트로 변환하는 것은 가능했지만 결코 쉬운 일은 아닙니다.
최근에 RAG에서 사용할 그래프 데이터 저장소를 만들었습니다. 즉, 우리는 GraphRAG를 구축했습니다.
Graph RAG는 널리 사용되는 벡터 스토어 지원 RAG와 같은 다른 RAG 앱에 대한 환상적인 대안입니다. 그들은 추론을 테이블에 가져옵니다. 예를 들어 의미론적 유사성 검색(정보를 검색하기 위해 벡터 저장소에서 사용되는 기술)을 사용하면 작년에 XYZ, Inc.의 CFO가 누구였는지 물어볼 수 있습니다. XYZ, Inc.의 작년 연례 보고서에는 CFO가 명시적으로 언급되어 있었기 때문입니다. 하지만 다음과 같은 질문을 생각해 보세요. XYZ, Inc.의 이사 두 명은 누구일까요? 같은 학교에서 공부한 적이 있나요? 학교 이름을 언급하지 않으면 검색 프로세스에서 관련 정보를 가져올 수 없습니다. 하지만 그래프 RAG는 그렇게 할 수 있습니다.
그러나 여기서 중요한 문제는 검색을 위한 그래프를 구성하는 방법입니다. 최근에 별도의 게시물에서 이 문제를 다루었습니다. 한걸음 더 뒤로 물러서서 생각해보면 우리는 연례행사를 어떻게 준비해야 할까요?
Post Comment