사이버이메지네이션

  • webPonent
  • One-source Multi-use
  • 웹표준, 웹접근성
  • 고급 Javascript / css
  • 웹 아키텍쳐
  • UI/UX
  • 제품 사용 설명/ 팁
  • 참관 / 사용기
  • 이슈통계

nutch크롤링 1

OPEN Source를 이용한 검색엔진 개발(2)

지난 포스팅에 OPEN Source를 이용한 검색엔진에 대한 기본적인 내용을 공유 하였고 이번 회차에서는 검색엔진의 수집, 색인, 검색에 대한 내용에 대해 상세히 공유 하도록 하겠습니다. 수집 – 검색엔진의 목적에 맞게 사용자가 필요로 하는 정보를 준비하는 과정 - 다양한 형태로 존재하는 비정형 데이터(정보)를 필요에 따라 추출 - 가장 많이 사용되는 웹 페이지 크롤링과 DBMS에 저장된 데이터를 수집하는 과정을 통해 예를 들어 설명 1. 크롤링 웹 페이지를 그대로 가져와서 데이터를 추출해 내는 행위. 크롤링을 하는 소프트웨어를 크롤러라고 부름 - 검색 엔진에서는 웹 상의 다양한 정보를 자동으로 검색하고 색인하기 위해 사용. - 일일이 해당 사이트의 정보를 검색하는 것이 아닌 끊임없이 새로운 웹 페이지를..

유용한 정보 2019.03.22
이전
1
다음
더보기
프로필사진

금융권 웹시스템 개발 전문회사 사이버이메지네이션의 경험과 노하우를 공유하는 기술블로그입니다

  • CyberImagination BLOG (219)
    • CyberI 제품소개 (33)
      • API 서버 (9)
      • 웹콘텐츠관리 (4)
      • UI컴포넌트 (9)
      • 텍사노미 (1)
      • News (10)
    • 프론트엔드 (67)
    • 백엔드 (24)
    • 앱 개발 (8)
    • 빅데이터 (21)
    • 유용한 정보 (62)
    • 기타 (2)

최근글과 인기글

  • 최근글
  • 인기글

방문자수Total

  • Today :
  • Yesterday :

Copyright © CyberImagination. All rights reserved.

  • 사이버이메지네이션
  • 솔루션사이트
  • 기술지원사이트

티스토리툴바