2014. 3. 21. 16:34

웹페이지 파싱 툴 – 6(Naver Music)

336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

안녕하세요.

오늘 보여드릴 기능은 반복되는 형태의 데이터 추출 입니다.

캡쳐된 화면으로 설명을 같이 드리겠습니다.

대상 사이트 입니다.

음악 사이트의 최신 음원 순위 입니다.

이곳을 통해서 목록을 갖어 옵니다.

임창정의 흔한 노래는 105번째 이며, 소유의 썸은 119번째 순으로 놓여 있습니다.

2개의 곡 사이의 119-105 = 14 의 차이가 나는 걸로 생각 하시면 됩니다.

 

 

여기서 위의 텍스트 박스에 있는 14,2 는 105번째 기준으로

14개씩 증가 하며 2개의 아래 항목을 저장 하라 입니다.

저장된 값은 이러 합니다.

위의 값을 보면 아시겠지만,

 

189 이후 소녀시대의 경우 제목을 받아 오질 못합니다.

그 이유는 14개씩 증가 할 경우 밀리는 경우(항목이 없거나, 항목이 많거나)가 있어서 입니다.

 

그래서 보정 로직이 들어 가야 합니다.

의외로 로직은 간단 합니다.

  • 고정된 값을 지정한다.
  • 14개 더한 값이 고정된 값과 다를 경우 보정 로직 한다
  • 보정 로직이 적용된 기준 값으로 다시 시작

 

이런 순서로 반복되는 값을 정확하게 찾을수 있습니다.

"관심음악 설정" 이란 고정 값을 지정한 후 실행한 결과 입니다.

여기서 -3은 위로 3개의 항목을 저장하라 입니다.

즉, 관심음악 설정(1), 임창정(2),흔한노래(3) 총 3개의 항목을 고정값 기준으로 저장하는겁니다.

총 1~50위까지 잘 받아 오네요.

감사 합니다.