페이지가 여러개일 경우 최종몇개까지 있는지 확인하는 과정이 있어야 할 것이고, 왠만해서는 주소값에 그 페이지 번호만 바꾸면 그 페이지로 이동할 수 있을 거에요. 그러면 동일한 코드를 페이지번호만 바꾼 url에서 따온 html 파일을 파싱한 것에 적용하면 뭐 주루루룩 알아서 모든 페이지에 대해 크롤링을 할 수 있겠죠.
gradle도 결국은 빌드시스템 소프트웨어인데요 gradle 4.0인가 부터 compile대신 implementation으로 명령어가 확 바뀌었습니다. 사실 거의 같은 역할 및 의미를 가지는데 빌드접근방식이 어쨋든 4.0들어가면서 바뀌엇고 그 바뀌면서 implementation과 api 같은 명령어들이 새로히 등장하였죠.
네네 그렇죠 지금 보니 신간 안에서도 장르 선택해야 이제 리스트 형식으로 책들이 나열 되는 군요
물론 페이지 개수는 저마다 다를 수 있으니 염두해두시고 각 페이지마다 크롤링하면서 파이썬 코드에 변수로 저장해두고 나중에 일괄적으로 엑셀파일로 작성해버리면 될 것 같네요. 아니면 최소 csv 형식으로라도 파일저장하면 엑셀이 알아서 읽어들일때 행/열 알아서 구분자 맞춰서 표로 표시해줄테니 이 방법 써도 괜찮을거구요.
다만 조금 귀찮을 수 있는 부분으로는 신간 업데이트를 얼마나 하시는지 모르지만, 관장님에게 리스트 보내드릴때 그 이전에 보내드린 것은 제외하고 나서 꼭 보내야 되는 것이라면 그 이전에 제출한 자료와 비교해서 현재 리스트내의 중복 아이템들을 제거하고 파일로 저장하는 코드도 작성하면 되겠네요.
충분히 가능하다고 봅니다. 어렵게 생각할거 없어요 일단 가장 기본적인 기능 하나만 해놓으시고 거기서 조금 씩더 자동화할 구석들 붙이는 건 또 금방이자 쏠쏠한 재미를 줄겁니다.
"새로 나온 책들 제목, 저자, 출판사 가격 등의 정보를 인터넷에서" 이라고 했는데 입력값이 제목/저자/출판사보다는 isbn 코드? 가 원하는 결과를 찾기에는 제일 적합할 것 같다는 생각이 드네요. 같은/비슷한 제목을 가진 책들이 여러권 나왔을때 또 그 안에서 내가 맞는 것을 찾는 로직을 집어넣을 수 는 있지만, 그래도 귀찮고 또 예외케이스가 많이 나올수 있으니까요.
어쨋든, 로직이 계속 사용될 수 있게 제일 잘 찾아지는 사이트 하나를 정해두고 거기에서 검색 및 크롤링을 해오시는게 제일 좋을 것 같습니다.
화이팅!
ide는 visual code, pycharm 추천드립니다.
그리고 윈도우 환경에서 작업하시는 것이면.. 초기 세팅하고 하는게 귀찮으실 수 있을 것 같네요 ㅠㅠ
2018년에 불거진 김진표 의원의 종교인과세 논란의 경우, 김진표 의원이 의도적으로 종교인편에 든 것은 아니라는 해명을 하였습니다.
해명인터뷰: https://youtu.be/GnYfD7nt50M?t=40m59s
시간 설정 되어 있으니 링크 시작부분부터 보시면 좋습니다.
정리하자면, - 대선 기간에 종교인들이 종교인과세 시작시기에 대한 질문을 함(심상정은 답변거부) - 4명의 대선 후보 모두 1년정도 과세에 대한 법을 제대로 준비하고 시행하자고 의견이 공통적임 - 조세쪽 행정을 했던 김진표에게 이 임무가 주어짐. 법안은 만듬 - 문재인 대통령 당선 - 문프가 김진표 의원 불러서 노역시킴 - 김진표 의원이 바뻐서 1년동안 유예하자는 법안을 제출을 못함 - 바쁜거 끝나고 8월에 그전에 준비해둔 법안 드디어 제출 - 타이밍이 애매해서 sns에서는 김진표 의원이 의도적으로 종교인과세 유예한다고 잘못 인식 - 결론: 김진표 의원 불쌍...
정리하자면, - 대선 기간에 종교인들이 종교인과세 시작시기에 대한 질문을 함(심상정은 답변거부) - 4명의 대선 후보 모두 1년정도 과세에 대한 법을 제대로 준비하고 시행하자고 의견이 공통적임 - 조세쪽 행정을 했던 김진표에게 이 임무가 주어짐. 법안은 만듬 - 문재인 대통령 당선 - 문프가 김진표 의원 불러서 노역시킴 - 김진표 의원이 바뻐서 1년동안 유예하자는 법안을 제출을 못함 - 바쁜거 끝나고 8월에 그전에 준비해둔 법안 드디어 제출 - 타이밍이 애매해서 sns에서는 김진표 의원이 의도적으로 종교인과세 유예한다고 잘못 인식 - 결론: 김진표 의원 불쌍...