게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
[ java] jsoup크롤링 질문
게시물ID : programmer_21836짧은주소 복사하기
작성자 : 김폽
추천 : 0
조회수 : 676회
댓글수 : 1개
등록시간 : 2017/12/07 10:19:54
jsoup으로 크롤링해서 가져오는데요 페이지가 좀 많고 계속 늘어납니다. url에서 pageNum=1부분에서 숫자만 늘려주면 다음페이지로 넘어가기때문에
접근이 어려운건아닌데 한페이지에 크롤링해서 가져오는 데이터가 한줄에 3개씩 총 50줄인데요 이걸 arrayList 3개에 크기 제한없이 50줄씩 담고싶은데
다음페이지로 넘어가면 51번째부터 누적시켜 받아야하는데 어떻게 해야할지 모르겠어서요

arraylist말고 map이나 다른 알고리즘 추천해주셔도 돼요. 
페이지에 있는 데이터는 하루에도 몇개씩 계속 올라와서 페이지의 수나 배열의 크기가 정해지지 않은 것으로 사용해야 할거같아요

public void db() throws IOException{
for(int page=1;page<54;page++){
Document doc = Jsoup.connect("http://forestfire.nifos.go.kr/mBfireList.action?pageNum="+page).get();
for(int i=0;i<50;i++){
address.add(doc.select(".title a").get(i).text());
sinho.add(doc.select(".name").get(i).text());
date.add(doc.select(".date").get(i).text());
}
}
for(int i=0;i<address.size();i++){
// System.out.println(address.get(i));
// System.out.println(sinho.get(i));
// System.out.println(date.get(i));
System.out.println(address.get(i)+" "+sinho.get(i)+" "+date.get(i));
}
}

전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호