2014. 7. 30. 14:03

github html 페이지 파싱.

336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

안녕하세요.

오늘 보여드릴 자료는 HTML PARSER를 활용한 자료 입니다.

HTML PARSING을 하다 보면 많은 자료를 상대 해야 하는데요.

그 중 제가 관심이 있는 오픈소스를 대상으로 툴 진행을 합니다.

개중에 활동이 저조한 커뮤니티가 있는데요 일일이 확인하기도 힘들죠. 

이거는 그중에 하나 입니다.

해당 페이지 주소 입니다.

제가 관심이 있는건 언제 업데이트가 이뤄지었냐 인데요.

요소 검사를 보니 이렇게 태그가 나오네요.

파싱된 root html 을 인자로 하는 재귀 함수를 하나 만들어봅니다.

내용은 이러 하며, tr, td를 만날 때 탭,엔터를 넣어 주는 것 외에 틀별한건 없습니다.

VS디버그 창에서 결과를 보면,

이렇게 되며 실제 파싱된 텍스트는 이러 합니다.

날짜가 이상하게 나오길래 html을 보니 아래와 같습니다.

아마 웹 브라우저에서 따로 실행되는 코드가 있나 보네요.


github파싱자료.txt


'파싱된 자료' 카테고리의 다른 글

닷넷 리페어툴.  (0) 2023.07.30
로또 589-605회 추가  (0) 2014.07.08
일베 글 파싱 결과  (0) 2014.03.16
네이버 아파트 목록 파싱  (1) 2014.03.16
로또 1- 589회차 번호  (0) 2014.03.16