자바 키워드 검색후 검색결과 링크추출

프로젝트 2014. 10. 21. 21:51

package ds;

import java.io.IOException;

import java.net.URLEncoder;

import org.jsoup.*;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;

public class test

{

public static void main(String[] args)

{

// TODO Auto-generated method stubI

try

{

String str = "한글";

String utf8= URLEncoder.encode(str,"UTF-8");//쿼리문에들어갈 한글인코딩

String url = "http://search.naver.com/search.naver?where=nexearch&query="+utf8+"&display=10&start=1&target=webkr&sm=top_hty&fbm=1&ie=utf8";

&display=10&start=1&target=webkr

Document doc = Jsoup

.connect(url)

.header( //헤더

"Accept",

"image/gif, image/xxbitmap, image/jpeg, image/pjpeg,application/xshockwaveflash, application/vnd.msexcel,application/vnd.mspowerpoint, application/msword, */*").get();

Elements links = doc.getElementsByTag("a"); //a태그 몽땅

for (Element link : links)

{

System.out.println(link.text()); //a태그에 텍스트

System.out.println(link.attr("abs:href")); //a태그 속성 href값

}

} catch (IOException e)

{

// TODO Auto-generated catch block

e.printStackTrace();

}

이렇게하면 현재 페이지에 모든 HTML 문서를 가져와서 파싱 할 수 있고,

브라우저를 통하지않고 검색해서 결과를 얻을 수 있다. 아직 진행중

저작자표시 비영리 변경금지

'프로젝트' 카테고리의 다른 글

웹크롤러.exe 와 실행영상 (0)	2014.11.27
jsoup (0)	2014.11.21
Matcher 메서드 사용방법과 그룹 개념이해 (0)	2014.09.29
URL 긁어 오기 (0)	2014.09.26
Http 헤더 정리 (0)	2014.09.23

왕왕왕왕

왕

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31