PDF 파일, 워드문서, 압축 파일 일괄 검색하기
우리가 구글이나 네이버 검색창에 단어나 문장을 입력하여 검색하면 각 포털의 검색 엔진은 입력한 텍스트를 포함하고 있는 자료들을 뒤져서 입력한 문장에 가장 근접한 자료들을 결과로 내놓습니다. 그렇지만, 검색이란 기본적으로는 텍스트를 찾는 것이기 때문에 이미지 속에 있는 글자를 검색하기에는 한계가 있습니다(일부에서 OCR 기술을 이용해서 검색에 활용하는 기술이 적용되고는 있습니다). 또한, 파일이 프로그램 제작사의 입맛에 따라 별도의 형식으로 저장되어 순수 텍스트 형태가 아닌 이진 파일 형태라면 검색은 더욱 어려워 집니다. 포털 검색을 사례로 든것은 검색이라는 것이 텍스트 기반이라는 전제를 설명하기 위한 것이고, 텍스트 검색 과정에서 텍스트 중간 중간에 특수 문자가 끼어 있는 이진 파일(PDF문서등) 문제와..
무료 소프트웨어/시스템 도구
2018. 12. 28. 16:13