게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
뷰티풀수프로 크롤링을 도전하고 있는데 인코딩 문제가 생겼습니다.
게시물ID : programmer_9553짧은주소 복사하기
작성자 : bluebanana
추천 : 0
조회수 : 5765회
댓글수 : 3개
등록시간 : 2015/04/26 13:05:17
스크린샷 2015-04-26 오후 1.00.09.png



뷰티풀수프4를 이용해서 가져와서 그중에 어떤 text를 제가 만드는 리스트에 하나씩 넣어서 데이터 구조를 만들어보고 있습니다.


6시, 7시, 8시... 이런 텍스트를 긁어서 제가 만든 리스트에 넣었는데요.


#-*-coding:utf-8

import urllib
from bs4 import BeautifulSoup

# Url을 가지고 lxml 구조로 치환한다
preHtml = urllib.urlopen('~~~~~~~~~~주소~~~~~~~~~')
preSoup = BeautifulSoup(preHtml, "lxml")


# '123'이라는 클래스를 가진 td 중 첫번째꺼 추출
index = preSoup.findAll("td", "123")

schedule = []

for aa in index:
timeTitle = aa.text
schedule.append(timeTitle)




print schedule

을 해보면
뭔가.. utf가 아닌 저런 글씨로 떠요.
그래서  그중에 

print schedule[1].encode('utf-8')

이렇게 해보면 제대로 뜨고요


어떻게하면 넣을때부터 인코딩이 utf-8로 넣을수 있나요?
전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호