게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
ouget - 오늘의 유머를 분석해 보자
게시물ID : programmer_20971짧은주소 복사하기
작성자 : REGENTAG
추천 : 11
조회수 : 742회
댓글수 : 13개
등록시간 : 2017/07/07 23:49:47
옵션
  • 창작글
Rust 공부를 할 겸 해서 만든 프로그램입니다.

다운로드 링크
실행파일 : https://github.com/Regentag/ouget/blob/master/dist/ouget.zip?raw=true
  * zip파일의 압축을 풀면 ouget.exe와 ouget32.exe가 있습니다.
  * ouget.exe 는 64비트용, ouget32.exe는 32비트용 실행파일입니다.

소스코드 : https://github.com/Regentag/ouget/blob/master/dist/ouget-src.zip?raw=true
  * Rust 언어로 개발되었습니다. Rust 1.18 버전에서 컴파일됩니다.

Github 리파지토리 : https://github.com/Regentag/ouget

용도
오늘의 유머 각 게시판의 글 목록을 지정한 만큼 CSV로 다운받습니다.
CSV 파일은 Excel을 비롯한 스프레드시트 프로그램에서 바로 열어 데이터로 사용하거나,
다른 데이터 분석 소프트웨어에 사용할 수 있습니다.

예시: 오유 베스트오브베스트 게시판의 목록을 CSV로 다운받아 LibreOffice Calc로 연 화면입니다.
게시판은 bestofbest이지만, 베오베, 베스트 게시판은 각 글이 원래 어느 게시판에 등록되었는지도 확인할 수 있습니다.
ouget-csv-spreadsheet.png

일단 목록을 받으면 여러가지 분석이 가능하지요.
아래 그림은 피벗 테이블 기능을 사용해서 2017년 7월 6일 하루동안 베오베에 올라온 글의 게시판별 개수를 센 것입니다.
ouget-20170706-bestofbest.png


이건 위의 표를 그래프로 나타낸 것이구요. 모 게시판의 비중이 참 높군요(...)
ouget-20170706-bestofbest-chart.png


ouget 프로그램을 써서 누구나 오유를 쉽게(?) 분석할 수 있습니다.

사용법
ouget은 cmd 창에서 실행되는 명령줄 프로그램입니다.
ouget --help 를 실행하면 도움말을 보여줍니다.
ouget-help.png

-f 옵션은 저장할 CSV 파일 이름을 지정합니다. 지정하지 않으면 a.csv에 저장됩니다.
-b 옵션은 다운받을 시작 페이지를 지정합니다. 지정하지 않으면 기본값으로 1페이지입니다.
-e 옵션은 다운받을 끝 페이지를 지정합니다. 지정하지 않으면 기본값으로 1페이지입니다.
-t 옵션은 다운받을 대상 게시판을 지정합니다. 지정하지 않으면 기본값으로 bestofbest입니다.
-u 옵션은 CSV 에 게시글 URL과 작성자 개인페이지 URL을 표시할지 지정합니다. yes를 지정하면 포함합니다. 기본값은 no입니다.

실행할 때 아무 옵션도 지정하지 않으면 모두 기본값이 적용되어 베오베의 1페이지를 다운받습니다.

게시판의 테이블명은 오유 접속 시 브라우저의 주소를 보면 확인할 수 있습니다.
ouget-table.png
빨간 밑줄 친 부분이 게시판의 테이블명입니다. 위 화면은 베스트 게시판의 주소입니다.


다음 화면은 bestofbest 게시판의 9페이지부터 18페이지까지의 목록을 다운받아 bob.csv에 저장하는 예시입니다. CSV 파일에 각 게시글의 url과 작성자 개인페이지의 url을 포함합니다.
ouget-example-1.png


주의사항 : 지나치게 많은 페이지를 한번에 다운받으면 오유 서버에 부하를 많이 줄 수 있습니다. 주의하세요.

이런 프로그램을 유용하게 쓸 일이 있으려나요? ㅎㅎ

전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호