구글데스크탑서치 와 같은 리눅스용 서치엔진?
글쓴이: jaeswith / 작성시간: 월, 2005/07/04 - 5:47오후
구글 데스크탑 서치와 같은 리눅스용 서치 엔진은 없을까요?
물론 예전에 들어보니, beagle 이라는게 있다고는 합니다만.
제가 원하는건, 그런 서치 엔진을 제 홈페이지에 달아두고 싶다는 거지요.
논문들을 왕창 넣어두고, 웹을 통해서 검색을 하고 싶거든요.
그렇게 되면, 연구실 전체에서 그 논문저장소를 같이 공유해서 쓰게 되고,
검색도 쉽고 여러모로 쓸모가 있을것 같은데요.
beagle은 정말 데스크탑에만 사용되는거니까요.
이런 용도로 사용가능할지 모르겠습니다.
그리고 혹자는 웹에 파일들을 올려놓고,
구글이 긁어가기까지 기다리면 안 되냐고 하시는데,
외부로 알려지면, 안 좋을 자료들이 있을 수 있으니까요.
구글 자체에 크롤링 되는건 없었으면 합니다.
그래서 결국은 비공개 웹서버에 서치엔진을 달자는 건데요.
저도 이런 분야에는 문외한이라, 어떤 키워드로 찾아야 할지 모르겠습니다.
혹시 아시는 좋은 솔루션이나 방법이 없을까요?
답해주실 분들께, 미리 감사의 말씀 전합니다.
Forums:
자랩(http://lab.zagia.com/)의 어렵군입니다잠시 말씀
자랩(http://lab.zagia.com/)의 어렵군입니다
잠시 말씀드려 보면..
많은 분들이 빠른 데이터 검색기능을 필요로 하고 있습니다
그러나 국내외 검색관련 기술이나 솔루션이 심한 경쟁으로 인해 오픈되어 있지 않아 비용이 만만치 않습니다
구글의 데스크탑검색엔진은 말 그대로 PC 전용 검색엔진입니다
컴퓨터가 쉬고 있는 동안 스스로 알아서 PC에 저장되어 있는 문서 등을 색인하여 검색하도록 하는 것이죠
웹검색엔진은 테스크탑검색엔진과 거의 비슷할 것입니다
네트웍으로 연결된 웹(www)에 저장된 데이터를 검색하는 차이가 있겠죠
영어권의 경우 오픈된 검색엔진이 여럿 있습니다
특히 php와 mysql을 이용한 검색엔진들이죠
그러나 성능면에서는 뛰어나지 않습니다
구글이나 네이버를 생각해서는 안되죠
한글 처리는 당연히 안됩니다
그러다 보니 우리에게는 거의 무용지물입니다
그리고 hwp, doc, xls, ppt, pdf 등 복합문서를 검색하기 위해서는 별도의 필터링이 필요한데, 이는 아주 고가의 필터를 요구합니다
그래서인지 큰 포털이나 자본있는 기업의 인트라넷이 아니면 이런 기술이 적용되지 못하고 있죠
자랩에서는 말씀하시는 로컬 웹검색엔진을 구현 중에 있습니다
리눅스에서 PHP로 제작되구요
한글 처리가 가능하게끔 이루어질 것입니다
다만 사용료가 문제가 됩니다
대부분 개인 사용자들은 무료를 원하겠지만, 그래서는 제작업체가 발전할 수 없습니다
기존의 검색엔진 제작업체에서 이러한 제품을 만들지 않는 이유이기도 합니다
여하간 도움이 되셨길 바랍니다
off topic 이지만... 자랩 광고(?) 글은 이제 그만 올리셨음
off topic 이지만... 자랩 광고(?) 글은 이제 그만 올리셨음 좋겠군요...
뭐 공개 형태소 분석기라느니 뭐니 그렇게 얘기는 하지만 막상 홈페이지에 가서...
얻을 수 있는 정보는 거의 없고 거의 데모정도만 있는 듯 하던데요...
가끔씩 이런 글이 올라올 때마다... 자랩을 한 번 참고해보세요 식으로 광고 아닌 광고를 하는게 그다지 좋아보이지 않습니다...
오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다...
http://mytears.org ~(~_~)~
나 한줄기 바람처럼..
Re: 구글데스크탑서치 와 같은 리눅스용 서치엔진?
어차피 사내 네트워크를 이용한 비공개 서버라면
그냥 개인용 wiki 같은데로 리스트업해서 쓰는게 낳지않을려나여?
그거도 귀찮으면 그냥 html파일에 파일이름 리스트업해서
올려놓고 ctrl+f 로 알아서 찾으라고 하면 ~
(내가 생각해도 좀 무성의한 답변이얌~-_-)
정말 필요하다고 생각되는데..
구글데스크탑의 리눅스 판이 필요하다고 생각되는 진짜이유이네요
특히나 xls,hwp,pdf,doc,txt,html 등등... 다양한 포맷으로 나오는 정보를 사내에서 공유하기 위해서는
구글데스크탑 윈도우즈 버전의 플러그인 만으로는 한계가 있네요
Offtopic Relay 2
Offtopic Relay 2 :)
저희도 메타검색이다, 검색엔진이다, 여러가지 검색관련 엔진개발을 노력하고 있고,
요즘은 일단 메타검색개발을 하고 있느라 자랩이라는걸 여기서 알아내고 들어가봤지만.....
어디에 공개를 하고 있는건가요? 제가 무지해서 공개링크를 찾지 못한듯 합니다만.....
저도 구글의 좋은 프로그램들이 어느정도 오픈되어줬으면 합니당 ㅜ.,ㅜ
그 프로그램들 다 파는것들은 아니지 않아요? 어딘가에 막 팔아요??
비글을 사용해보질 않아서 저도 역시 특정 디렉토리에 논문들을 박아 넣고 파일리스트를
뽑아오는것밖에 생각할 수 없군요...
만약 파일 내용도 어느정도 검색할 필요가 있는것이라면 역시 구글같은걸 찾아봐야겠지요..
아참...그리고 메타검색 혹은 검색엔진들에 관한 정보들 어디서 얻을 수 있을까요?
메타검색이라고 무조건 php file함수로 열거나 소켓으로 열어서 긁어다가 뿌려주는것은
아무래도 가라나 꽁수인듯 한데, 제대로된 알고리즘을 알수가 있어야죠... 흑...
내 마음속의 악마가 자꾸만 나를 부추겨.
늘 해왔던 것에 만족하지 말고 뭔가 불가능해 보이는 것을 하라고 말야.
내 마음속의 악마가 자꾸만 나를 부추겨.
늘 해왔던 것에 만족하지 말고 뭔가 불가능해 보이는 것을 하라고 말야.
댓글 달기