자연어 검색 도구 구축을위한 4 단계

자연어 검색 도구 구축을위한 4 단계

“우리는 문제가 있습니다. PDF를 통한 선별에 대한 현재 검색 방법은 매우 수동적이고 시간이 많이 걸립니다. 더 쉬운 방법이 있습니까?”

개발자로서, 이것은 저를 정말로 흥분시키는 질문 중 하나입니다. 나는 번거롭고 아카이브 프로세스를 효율적이고 직관적 인 검색 경험으로 바꾸는 방법을 찾는 임무를 맡았습니다. 그것은 사람들의 삶을 더 쉽게 만들 수있는 방법이며, 그들이 일하는 조직 때문에 전 세계의 도움이 필요한 사람들에게 인도 주의적 지원을 제공하는 데 더 효과적이 될 수 있도록 도와줍니다. 나는 더 나은 프로젝트를 진행하고 있다고 상상할 수 없었다.

빠른 행동을위한 유엔의 유산 잠금 해제

[1945년이래유엔은국제평화및안보노력을안내하는결의안및기타문서를제작했습니다그러나이풍부한지식에접근하는것은국제적십자사(ICRC)와같은조직을포함하여여전히어려운과제입니다현재ICRC의영구관찰자임무의대표는유엔인도주의법과인도주의문제에관한회원국및기타이해당사자들에게조언합니다국가가관련결의안및기타유엔제품을협상할때유엔결의안에서기존의인도주의언어에기대어우선순위를부여할수있습니다이를위해서는종종PDF를통해문서내에서관련컨텐츠를찾기위해서는빠르게진행되는인도주의외교의세계에적합하지않은시간집약적인수동프로세스입니다

라이브, 액세스 가능하며 확장 가능한 검색 플랫폼

이를 해결하기 위해 사용자가 자연어 쿼리를 입력하고 관련 UN 해상도를 즉시 검색 할 수있는 단일 페이지 응용 프로그램 (SPA)을 구축했습니다. 이 솔루션은 현재 Resolutions.projectrefuge.io에서 실시되며 기술이 중요한 정보에 대한 액세스를 단순화 할 수있는 방법의 강력한 예가됩니다.

작동 방식

  1. 텍스트 추출 및 구조화
    Amazon Textract를 사용하여 수십 년 동안 유엔 안전 보장 이사회 결의안과 대통령 진술과 6 년간의 유엔 총회 결의안에서 원시 텍스트를 추출했습니다. 그런 다음 Go 스크립트는 Regex 매칭을 사용 하여이 텍스트를 구문 분석하여 개별 해상도로 분할하여 쉽게 인덱싱했습니다.
  2. MongoDB Atlas를 사용한 검색 준비 데이터베이스
    MongoDB에서 Node.js 스크립트를 조정하여 구문 분석 해상도를 MongoDB Atlas 데이터베이스에 포함시킵니다. 이 단계에서는 컨텐츠가 빠르고 관련된 검색을 위해 구성되어 있는지 확인합니다.

  3. vue.js로 구축 된 사용자 인터페이스
    프론트 엔드는 vue.js로 만든 직관적 인 스파입니다. 사용자는 단순히“무력 충돌에서 인도 주의적 접근에 대한 해상도”와 같은 시맨틱 검색 쿼리를 입력하고 몇 초 만에 결과를받습니다.

  4. AWS에서 호스팅 된 백엔드
    백엔드는 AWS Lambda 및 API 게이트웨이에 의존하여 확장 성 및 원활한 성능을 보장합니다. 전체 응용 프로그램은 AWS Amplify의 하위 도메인으로 호스팅되어 신뢰성을 쉽게 액세스 할 수 있습니다.

다음을 보여주는 참조 아키텍처 다이어그램 : Amazon Textract를 사용한 텍스트 추출 및 구조화, 나는 수십 년 동안 유엔 안전 보장 이사회 결의안과 대통령 진술과 6 년간의 유엔 총회 결의안에서 원시 텍스트를 추출했습니다. 그런 다음 Go 스크립트는 Regex 매칭을 사용 하여이 텍스트를 구문 분석하여 개별 해상도로 분할하여 쉽게 인덱싱했습니다. MongoDB Atlas를 사용한 검색 준비 데이터베이스 I MongoDB의 Node.js 스크립트를 조정하여 구문 분석 해상도를 MongoDB Atlas 데이터베이스에 포함시킵니다. 이 단계에서는 컨텐츠가 빠르고 관련된 검색을 위해 구성되어 있는지 확인합니다. vue.js로 구축 된 사용자 인터페이스 프론트 엔드는 vue.js로 만든 직관적 인 스파입니다. 사용자는 단순히“무력 충돌에서 인도 주의적 접근에 대한 해상도”와 같은 시맨틱 검색 쿼리를 입력하고 몇 초 안에 결과를받습니다. AWS에서 호스팅 된 백엔드는 AWS Lambda 및 API 게이트웨이에 의존하여 확장 성 및 원활한 성능을 보장합니다. 전체 응용 프로그램은 AWS Amplify의 하위 도메인으로 호스팅되어 신뢰성을 쉽게 액세스 할 수 있습니다.

이 코드는 ProjectRefuge/Resolutions-Search-Template에서 공개적으로 제공됩니다. 이 이니셔티브는 다른 조직이 고유 한 요구에 대한 솔루션을 조정하고 확장 할 수있게합니다.

더 넓은 의미 : 충격을위한 청사진

이 프로젝트의 의미는 UN 결의안으로 ICRC의 사용 사례를 훨씬 뛰어 넘습니다. 약간의 수정으로 도구는 법률 및 정책 문서 모음을 색인하고 검색 할 수 있습니다. 이 접근법은 더 나은 의사 결정과보다 효과적인 조치를 위해 기술을 활용하기위한 조직의 청사진입니다. 비영리 단체의 경우 코드를 소유하고 맞춤형 솔루션을 구축 할 수있는 힘을 보여줍니다. 개발자에게는 오픈 소스가 어떻게 인도주의 및 공공 정책 부문의 진전을 가속화 할 수 있는지를 상기시켜줍니다.

오픈 소스와 함께 구축하십시오

Resolutions.projectrefuge.io와 같은 프로젝트는 정보에 액세스하고 사용하는 방법을 변화시킬 수있는 오픈 소스의 잠재력을 강조합니다. 비영리 단체 인 경우 비영리 단체가 자신의 솔루션을 구축하는 데 도움이되는 도구와 리소스를 발견 할 수 있도록 Github를 탐색하십시오. 영향력있는 작업에 기여하기를 간절히 원한 개발자는 Good First Issue 프로그램을 탐색하여 기술과 가치에 맞는 프로젝트를 찾을 수 있습니다.

마지막으로, ICRC와 같은 인도주의 행위자들과 함께 기술과 인도주의 공간을 연결하는 다른 기회를 식별하기 위해 노력할 때 계속 지켜봐 주시기 바랍니다. 우리는 함께 지식이 더 접근 가능하고 도구가 협력을 염두에두고 구축되는 미래를 구축 할 수있어, 최첨단 기술로 인도 주의적 노력이 지원되도록합니다.

좋은 코드를 코딩하고 지속적인 영향을 미칩니다.

개발자 기술을 잘 빌려주고 싶다면 모든 사람에게 더 나은 미래에 기여하는 오픈 소스 프로젝트의 선별 된 플랫폼 인 Good First Issue를 확인하십시오.

작성자가 작성했습니다

Ryan Fallon

출처 참조

Post Comment

당신은 놓쳤을 수도 있습니다