게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
[python] 파싱하는데 한글이 깨지는 현상에 대해서..
게시물ID : programmer_7672짧은주소 복사하기
작성자 : 검은늑대
추천 : 0
조회수 : 5032회
댓글수 : 7개
등록시간 : 2015/01/17 21:27:10
옵션
  • 본인삭제금지






법제처 사이트에서 판례를 파싱하려고 하는데,



KakaoTalk_20150117_211427922.png
<파이썬 코드>

passing 함수가 문제인지.. 
한글이 무참하게 깨져버리고 말더군요.
복사 붙여넣기 해서 넣은 html에서는 잘 작동되었는데, 
사이트를 직접 파싱하니까 한글이 깨집니다..
어떤 문제가 있는지 인코딩 문제가 의심되어 법제처 사이트의 코딩을 보니
UTF-8이었습니다.



KakaoTalk_20150117_211508692.png
<깨진 한글 결과>





KakaoTalk_20150117_211518942.png
<파싱하려던 웹페이지 소스>




전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호