https://www.wikitree.co.kr/articles/217101
식신로드, 역대 서울지역 '만점 식당' 20선
케이블채널 Y-STAR '식신로드' 출연자들이&숟가락 평가에서&5점 만점
www.wikitree.co.kr
위 링크에서 식당이름, 전화번호, 주소를 튜플로 리스트에 저장하는 과제
step
1. 필요한 모듈, 패키지 import
2. url로 get() 요청
3. soup객체 할당
4. 일정한 패턴을 찾아서 select
5. 리스트에 저장
4. select
- 전화번호
식당 전화번호 위에서 우클릭 > 검사
전화번호와 주소 모두 p태그로 쓰여있고 딱히 눈에 띄는 패턴이 없다.
그래서 p태그를 모두 불러왔다
서울 지역 맛집이므로 전화번호가 모두 02로 시작함을 알 수 있다.
수 많은 tmp 문자열 중에 02가 들어있는 문자열을 찾아보자.
전화번호만 나오는 걸 확인했으니 print대신 list를 만들어 append해준다.
- 주소
위에서 봤듯이 주소도 p태그로 쌓여있다.
전화번호를 찾기위해 '02'가 포함 된 문자열만 찾았던 걸 응용해서
주소는 '구'가 포함 된 문자열을 가져왔다.
'구'가 포함 된 문자열은 모두 가져오다 보니 주소가 아닌 문자열도 보인다.
여기서 다시 주소만 골라내기 위해 결과에서 '동'이 포함 된 문자열을 한 번 더 찾는다.
완벽한 주소만 보여진다.
이제 print문 대신 리스트에 넣어준다.
거슬리는 '\xa0'를 replace를 이용해 고쳐준다.
diner리스트에 diner_name, diner_contact, diner_address를 튜플 형태로 넣어준다.
'학원 > 실습' 카테고리의 다른 글
[실습] 식신로드 서울지역 만점식당 크롤링(3) - 지도에 나타내기 (0) | 2020.06.10 |
---|---|
[실습] 식신로드 서울지역 만점식당 크롤링(1) - 식당이름 (0) | 2020.06.09 |