* Rust 언어로 개발되었습니다. Rust 1.18 버전에서 컴파일됩니다.
용도
오늘의 유머 각 게시판의 글 목록을 지정한 만큼 CSV로 다운받습니다.
CSV 파일은 Excel을 비롯한 스프레드시트 프로그램에서 바로 열어 데이터로 사용하거나,
다른 데이터 분석 소프트웨어에 사용할 수 있습니다.
예시: 오유 베스트오브베스트 게시판의 목록을 CSV로 다운받아 LibreOffice Calc로 연 화면입니다.
게시판은 bestofbest이지만, 베오베, 베스트 게시판은 각 글이 원래 어느 게시판에 등록되었는지도 확인할 수 있습니다.
일단 목록을 받으면 여러가지 분석이 가능하지요.
아래 그림은 피벗 테이블 기능을 사용해서 2017년 7월 6일 하루동안 베오베에 올라온 글의 게시판별 개수를 센 것입니다.
이건 위의 표를 그래프로 나타낸 것이구요. 모 게시판의 비중이 참 높군요(...)
ouget 프로그램을 써서 누구나 오유를 쉽게(?) 분석할 수 있습니다.
사용법
ouget은 cmd 창에서 실행되는 명령줄 프로그램입니다.
ouget --help 를 실행하면 도움말을 보여줍니다.
-f 옵션은 저장할 CSV 파일 이름을 지정합니다. 지정하지 않으면 a.csv에 저장됩니다.
-b 옵션은 다운받을 시작 페이지를 지정합니다. 지정하지 않으면 기본값으로 1페이지입니다.
-e 옵션은 다운받을 끝 페이지를 지정합니다. 지정하지 않으면 기본값으로 1페이지입니다.
-t 옵션은 다운받을 대상 게시판을 지정합니다. 지정하지 않으면 기본값으로 bestofbest입니다.
-u 옵션은 CSV 에 게시글 URL과 작성자 개인페이지 URL을 표시할지 지정합니다. yes를 지정하면 포함합니다. 기본값은 no입니다.
실행할 때 아무 옵션도 지정하지 않으면 모두 기본값이 적용되어 베오베의 1페이지를 다운받습니다.
게시판의 테이블명은 오유 접속 시 브라우저의 주소를 보면 확인할 수 있습니다.
빨간 밑줄 친 부분이 게시판의 테이블명입니다. 위 화면은 베스트 게시판의 주소입니다.
다음 화면은 bestofbest 게시판의 9페이지부터 18페이지까지의 목록을 다운받아 bob.csv에 저장하는 예시입니다. CSV 파일에 각 게시글의 url과 작성자 개인페이지의 url을 포함합니다.
주의사항 : 지나치게 많은 페이지를 한번에 다운받으면 오유 서버에 부하를 많이 줄 수 있습니다. 주의하세요.
이런 프로그램을 유용하게 쓸 일이 있으려나요? ㅎㅎ