뷰티풀수프4를 이용해서 가져와서 그중에 어떤 text를 제가 만드는 리스트에 하나씩 넣어서 데이터 구조를 만들어보고 있습니다.
6시, 7시, 8시... 이런 텍스트를 긁어서 제가 만든 리스트에 넣었는데요.
#-*-coding:utf-8
import urllib
from bs4 import BeautifulSoup
# Url을 가지고 lxml 구조로 치환한다
preHtml = urllib.urlopen('~~~~~~~~~~주소~~~~~~~~~')
preSoup = BeautifulSoup(preHtml, "lxml")
# '123'이라는 클래스를 가진 td 중 첫번째꺼 추출
index = preSoup.findAll("td", "123")
schedule = []
for aa in index:
timeTitle = aa.text
schedule.append(timeTitle)
print schedule
을 해보면
뭔가.. utf가 아닌 저런 글씨로 떠요.
그래서 그중에
print schedule[1].encode('utf-8')
이렇게 해보면 제대로 뜨고요
어떻게하면 넣을때부터 인코딩이 utf-8로 넣을수 있나요?