구글, 데이터 세트 검색 엔진 개발

과학자나 데이터 저널리스트에게 유용

인터넷입력 :2018/09/06 10:03

구글이 보다 효율적으로 데이터를 수집할 수 있는 검색 엔진인 '데이터 세트(data set) 검색'을 공개했다.

데이터 세트는 컴퓨터상의 데이터 처리에서 한 개의 단위로 취급하는 데이터의 집합을 말한다.

5일(현지시간) 구글은 블로그를 통해 과학자나 데이터 저널리스트에게 유용할 것으로 예상되는 데이터 세트 검색 엔진 베타버전을 선보인다고 밝혔다.

구글 데이터셋 검색

구글에 따르면 이 검색 엔진은 기존의 구글 학술검색 엔진과 비슷한 원리로 움직인다. 데이터 세트가 포함된 데이터 관련 기관 및 저작권자 개인 웹사이트, 디지털 라이브러리 등에서 데이터 세트를 찾아준다.

이 과정에서 구글은 이들 데이터 제공업체들의 정보가 보다 잘 표출될 수 있도록 업체들을 위한 표준 가이드라인도 만들었다. 가이드라인에는 데이터 세트의 원작자, 게시 시기, 데이터 수집 방법, 데이터 사용 언어 등에 대한 정보가 포함됐다.

관련기사

데이터 세트 검색 엔진에 대한 표준 가이드라인을 준수하는 데이터 제공자들이 많아질수록 데이터셋의 다양성과 범위는 계속해서 증가할 것이라고 구글은 설명했다.

구글은 향후 다양한 언어를 추가 지원할 예정이라고 밝혔다. 현재 해당 엔진으로 영문 데이터 세트는 검색되나 한국어 검색 결과는 찾아보기 어렵다.