import java.io.*;
import java.net.*;
import java.util.regex.*;

public class asd {

 public static void main(String[] args) {
  // TODO Auto-generated method stub
  URL url = null;
  URLConnection con = null;
  try {
   url = new URL("http://www.naver.com");
   con = url.openConnection();

   BufferedReader br;
   BufferedWriter bw;
   BufferedWriter bw1;
   BufferedReader br1;
   int count = 0;
   int i = 0;
   String l;
   String[] regex = { "<img[^>]*src=[\"']([^>\"']+)[\"']?[^>]*>",
     "<a\\s+href\\s*=\\s*\"?(.*?)[\"|>]" };

   br1 = new BufferedReader(
     new InputStreamReader(con.getInputStream()));
   bw1 = new BufferedWriter(new FileWriter("text.txt"));
   //while(i != 1){
   while((l = br1.readLine()) != null) {
     //l = br1.readLine();
     
     // if(l == null) {i=1; count=1; break;}
     java.util.regex.Pattern p = java.util.regex.Pattern
       .compile(regex[0]);
     java.util.regex.Pattern p1 = java.util.regex.Pattern
       .compile(regex[1]);
     Matcher mc = p.matcher(l);
     Matcher mc1 = p1.matcher(l);
     
     while (mc.find()) {
      System.out.println(mc.group(1));
      bw1.write("IMG"+mc.group(1) + "\r\n");
      
     }
     while (mc1.find()) {
      System.out.println(mc1.group(1));
      bw1.write("URL"+mc1.group(1) + "\r\n");
      
     }
   //}
   }
   bw1.close();
   br1.close();

  } catch (Exception e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  }

 }

}

'프로젝트' 카테고리의 다른 글

Cygwin 설치 2편  (0) 2014.09.18
Cygwin 설치 1편  (0) 2014.09.18
루씬 다운로드 1일차  (0) 2014.09.16
정규표현식 펌  (0) 2014.07.22
자바 웹크롤러 - 웹페이지 긁어오기  (0) 2014.07.07
블로그 이미지

왕왕왕왕

,

정규표현식 펌

프로젝트 2014. 7. 22. 10:26

정규표현식 펌

'프로젝트' 카테고리의 다른 글

Cygwin 설치 2편  (0) 2014.09.18
Cygwin 설치 1편  (0) 2014.09.18
루씬 다운로드 1일차  (0) 2014.09.16
웹크롤러 소스중  (1) 2014.07.23
자바 웹크롤러 - 웹페이지 긁어오기  (0) 2014.07.07
블로그 이미지

왕왕왕왕

,

package crawler;

import java.io.*;
import java.net.*;
import java.util.regex.Pattern;
import java.util.regex.Matcher;
import java.util.*;

 

 

public class test {

 public static void main(String[] args) {
  // TODO Auto-generated method stub

  URL url;


  try {
   url = new URL("http://www.naver.com");


   BufferedReader br;
   BufferedWriter bw;
   String l;
 
   br = new BufferedReader(new InputStreamReader(url.openStream(),"utf-8"));
   bw = new BufferedWriter(new FileWriter("text11.txt"));


   while ((l = br.readLine()) != null) {
    Pattern p = Pattern.compile("<img[^>]*src=[\"']?([^>\"']+)[\"']?[^>]*>");
    Matcher mc = p.matcher(l);
 
    while(mc.find()){
     bw.write(mc.group(1));
    }
    
    
   }
   br.close();
   bw.close();
 
   
  
  } catch (Exception e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  }

 

 }

}

'프로젝트' 카테고리의 다른 글

Cygwin 설치 2편  (0) 2014.09.18
Cygwin 설치 1편  (0) 2014.09.18
루씬 다운로드 1일차  (0) 2014.09.16
웹크롤러 소스중  (1) 2014.07.23
정규표현식 펌  (0) 2014.07.22
블로그 이미지

왕왕왕왕

,

제어판 - 프로그램 추가/제거

 

 

체크한부분 체크해주고

 

 

 

 

 

 

제어판에 관리도구 - IIS관리자 더블클릭 저화면에서 팝업후 FTP사이트추가 누름

 

 

 

 

순서대로 따라해 멍충아

존나쉬우니까 너도할수있음

 

방화벽 - 고급설정 들어가면

인바운드 규칙 누르고 저기 세부분이 원래 회색으로 비활성화 되있음

그냥 블록잡아서 규칙사용하면됨

개쉬움...

 

여기까지 서버구축은 완료했는데

고정아이피쓰는사람이면 그냥 자기 아이피쓰면되겠음..

 

근데 문제는 대부분 유동아이피라는거다

 

iptime - 192.168.0.1 주소창에 치면

관리 할수 있는 사이트로 이동함

 

고급기능

특수기능,NAT/라우터 관리 건드릴거임

 

특수기능 - DDNS설정에가서

서비스공급자:iptime DDNS

호스트이름 - 아무거나.iptime.org (iptime.org는 꼭써줘야되)

사용자계정 - 자기 이메일 아무거나

사용자암호 - 아무거나

 

다쓰고 추가하면 끝

 

NAT/라우터관리

DMZ/Twin ip 설정 - DMZ 누르면 끝

 

다하고나서 시스템요약정보가면

 

외부ip주소가 나옴 이게 이제 자기 고정ip로 사용하면됨

블로그 이미지

왕왕왕왕

,

우분투 ftp

리눅스 2014. 6. 24. 21:36

우분투에서 가장 많이 사용하고 있다는 vsftpd

 

vsftpd 설치

$ apt-get install vsftpd

 

폴더로 이동

$ cd /etc

 

vsftpd.conf 를 수정해야 하는데 vi편집기가 키보드 오류가 잘나기때문에 vim 설치

$ apt-get install vim

 

편집하기

$ vim vsftpd.conf

 

아래처럼 수정(괄호내용이 다를 수 있음, (no, yes, yes), # 제거)

============================================================================================================

# Allow anonymous FTP? (Beware - allowed by default if you comment this out).

anonymous_enable=NO

#

# Uncomment this to allow local users to log in.

local_enable=YES

#

# Uncomment this to enable any form of FTP write command.

write_enable=YES

============================================================================================================

anonymous_enable : 비권한자의 권한 부여 여부

local_enable : 계정사용자 접속여부

write_enable : 업로드 가능 여부

저장 후 종료는 esc -> :wp -> enter

 

접속 제한 사용자 수정(root)

$ vim ftpusers

에서 root 제거

 

ftp 실행하기

$ /etc/init.d/vsftpd restart

 

 

접속해보기

아이피 확인 

$ ifconfig

 

$ ftp localhost (혹은 x.x.x.x ip주소)

connected to localhost.

220 (vsFTPd 3.0.2)

Name (lovalhost:xx): xx

331 Please specify the password.

Password:

230 Login successful.

Remote system type in UNIX.

Using binary mode to teansfer files.

ftp> exit

'리눅스' 카테고리의 다른 글

리눅스 기본명령어  (1) 2014.08.31
apt-get  (0) 2014.06.05
리눅스 파티션  (0) 2013.12.02
diskpart 파티션  (0) 2013.12.02
vi 편집기 여러줄 주석처리  (0) 2013.11.22
블로그 이미지

왕왕왕왕

,

<frameset>

웹페이지를 여러영역으로 나눌 때 사용한다.

 

rows - 페이지를 상하(픽셀이나%)로 나눌 때 사용한다.

cols - 페이지를 좌우(픽셀이나%)로 나눌 때 사용한다.

border - 나누어진 프레임의 테두리(0이나 숫자)를 지정한다. 기본값은 1이다.

bordercolor - 테두리 색(색상이나 색상코드)을 지정한다.

frameborder - 프레임을 구분하는 테두리를 화면에 표시할지 여부(yes,no)를 지정한다.

                   기본값은 yes이다. no의 경우 border 값을 0으로 해야 한다.

 

 

프레임분할 예

<frameset rows=" 50, 30, * ">

화면을 상하로 3등분하는데 크기는 50픽셀, 30 픽셀, 나머지로 분할한다.

</frameset>

 

<frameset rows=" 50%, 50% ">

화면을 상하로 50%씩 분할한다.

</frameset>

 

<frameset rows=" *, 2* ">

화면을 상하 2개로 분할하는데 아래가 위의 2배가 되도록 분할한다.

</frameset>

 

 

<frame>

<frameset>태그로 나누어진 영역들에 대하여 파일을 지정하는 태그이다.

 

name - 프레임의 이름을 지정한다. target 속성을 사용할 때 필요하다.

src - 프레임에 해당하는 파일(파일 경로와 파일 이름)을 지정한다.

noresize - 프레임을 고정하여 크기가 바뀌지 않게 지정한다.

scrolling - 프레임에 스크롤 막대가 표시되지 않게 지정(yes,no,auto)한다. 기본값은 auto이다.


<frame src = "about:blank"> - 빈페이지


frameset 에서 작성

<frame src = "frame1.htm" name = "f1"> 


frame2.htm 에서 작성

<a target = "f1" href = "www.naver.com">네이버바로가기</a>

이렇게 하면 frame2.htm에서 하이퍼링크(네이버바로가기)를 클릭했을때 frame1.htm에서 화면을 표시해준다.

 

<iframe>

다른 웹 페이지를 자신의 웹 페이지에 포함시키는 태그이다.  다른사이트를 자신의 웹페이지에 포함시키려고한다면 이 태그를 이용하면 된다.

 

name - 프레임의 이름을 지정한다. target 속성을 사용할 때 필요하다.

src - 프레임에 해당하는 파일(파일 경로와 파일 이름)을 지정한다.

scrolling - 프레임에 스크롤 막대가 표시되지 않게 지정(yes,no,auto)한다. 기본값은 auto이다.

align - 프레임의 정렬 방식(left,right,center)을 지정한다.

width - 프레임의 너비(픽셀)를 지정한다.

height - 프레임의 높이(픽셀)를 지정한다.

frameborder - 프레임을 구분하는 테두리를 표시할지 여부(0이나 숫자)를 지정한다.

bordercolor - 테두리 색(색상이나 색상코드)을 지정한다.


블로그 이미지

왕왕왕왕

,

 

 <table>태그

 표 를 만들 때 사용한다. 웹페이지 전체를 구성하기도함
   
    align - 정렬
    bgcolor - 배경색
    background - 배경이미지
    border - 테두리 두께
    bordercolor - 테두리색 

    bordercolordark  - 테이블의 그림자 
    cellpadding - 셀안쪽여백(픽셀)
    cellspacing - 셀과 셀사이 여백 (픽샐)
    width - 너비(픽셀)

    height - 높이 (픽셀)
    frame - 표바깥쪽 테두리 (above,below, border, box, ihs,rhs,hsides,vsides,void)
    rules - 표안쪽 테두리 (all,cols,rows,group,none)

    hspace/vspace - 테이블과 주변 글들과의 여백 지정

     

 

<table>

  <caption>표 제목</caption>

   <tr>  <-- 행구분

    <th>열의 제목</th>
    <td>셀의 내용</td>
   </tr>

<table>
 

 <tr>태그

 표에서 행을 관리할 때 사용한다.


 align - 행의정렬
 bgcolor - 행의 배경색
 valign - 행의 세로정렬방식(top,middle,bottom)
 height - 행의 높이
 rowspan - 행의 병합(개수)

<th>와 <td> 태그

표에서 열을 관리할 때 사용한다 특히 <th>태그는 열의 제목을 표시할 때 사용한다. 기본적으로 굵게,중앙 정렬이 적용된다. <td>태그는 열을 구분지을 때 사용한다.

 

align - 셀의 정렬방식(left,right,center)을 지정한다. 기본값을 left이다.

valign - 셀에서 세로 정렬방식(top,middle,bottom)을 지정한다. 기본값을 middle이다.

background - 셀의 배경 이미지(이미지파일)를 지정한다.

bgcolor - 셀의 배경색(색상이나 색상코드)을 지정한다.

colspan - 셀의 병합(열의 개수)을 지정한다.

nowrap - 셀에서 중 바꿈이 되지 않도록 지정한다.

width - 셀의 너비(픽셀)를 지정한다.

 

<table> 태그 내에서 사용하는 태그들에는 다음과 같은 것들이 있다.

 

<caption> - 표의 제목이나 간단한 설명을 표시할 때 사용한다.

<col> - 모든 행에 대해 해당 열의 속성을 지정할 때 사용한다.

<colgroup> - 여러 열을 하나의 그룹으로 묶어서 속성을 한번에 지정하는 태그로 span속성을 사용해서 몇개의 열을 묶을지 표시하는 것이 가는 하다.

<thead> - 표 내부에서 또 다른 그룹을 지정한 경우 머리글을 지정해 준다.

<tfoot> - 표 내부에서 또 다른 그룹을 지정한 경우 바닥글을 지정해 준다. <tbody>태그보다 우선해서 적는다.

<tbody> - 표 내부에서 또 다른 그룹을 지정한 경우 본문을 지정해 준다.


블로그 이미지

왕왕왕왕

,

      <img>태그

 GIF,JPEG,PNG정도로 제한 로컬 경로는 바람직하지 못하다.
 http://서버의_IP_주소:8080/파일이름.확장자  웹경로로 사용하기에 적합하다.

 

  src 이미지 경로를 지정
  alt 이미지에 대한 설명텍스트
  align 이미지 정렬방식 left,right,top,middle,bottom
  border 이미지주위 테두리(숫자) 0일경우 테두리없음
  height 이미지높이(픽셀)
  width 이미지 너비(픽셀)
  hspace 좌우여백(픽셀)
  vspace 상하여백(픽셀)

 

 


<embed>태그
 src 경로
 autostart 웹페이지 열었을때 사운드 파일을 자동재샐여부 true,false
 hidden 미디어 플레이어를 화면에서 감출지 여부 true false
 width 미디어 플레이어를 화면에 보여줄 경우 너비를 지정
 height 미디어 플에이어를 화면에 보여줄 경우 높이를 지정
 loop 재생하는 반복횟수지정 true 무한반복 false 한번만 재생 
 
 <a>태그

 href 연결할 문서의 경로

<a href = "http://www.naver.com"> 네이버사이트로 접속

<a href = "aa.htm"> aa.htm 파일로 연결 

<a href = "a.gif"><img src = "a.gif"> a.gif 이미지 파일로 연결 

<a href = "mailto:a@naver.com"> 해당 메일 주소로 아웃룩 익스프레스 실행 

 

 name 동일문서 내 특정위치로 이동

<a name = "#top"> top이라는 이름으로 책갈피 설정


 

      target 링크된 내용이 열릴대상(_blank, _parrent,_self,_top)

  <a href = "aa.htm" target = _blank> aa.htm 파일을 새 창에서 보여줌

<a href = "aa.htm" target = _self> aa.htm 파일을 현재 창에서 보여줌

<a href = "aa.htm" target = _win1> aa.htm 파일을 win1 창에서 보여줌

 

      title 링크에 마우스를 올리면 설명문 보여줌

  <a href = "aa.htm" title = "설명문"> 링크에 마우스를 올리면 설명문 보여줌

 

 

 

블로그 이미지

왕왕왕왕

,